Prévia do material em texto
Análise de dádos
O gráfico que mostra a relação gráfica existente entre duas variáveis
numéricas, como custos e vendas, por exemplo, é chamado de:
a) Pictograma
b) Gráfico de linha*
c) Gráfico de dispersão
d) Histograma
e) Gráfico de setores
(ENADE - 2015 - ADAPTADO) Projeções futuras baseadas em teorias
probabilísticas são frequentemente utilizadas na contabilidade. Os setores
públicos e privados fazem previsões orçamentárias anuais e, até mesmo,
plurianuais para estimarem suas receitas e fixarem suas despesas. Nesse
contexto, considere a seguinte situação hipotética: uma empresa que atua
no ramo de locação de automóveis, pretendendo projetar seu orçamento
para o próximo semestre, deve analisar a tabela a seguir, fornecida pelo
departamento de estatística, que evidencia a quantidade de automóveis
que a empresa locou no primeiro semestre de 2015. Os dados foram
obtidos por meio de pesquisa cadastral feita com 100 clientes escolhidos
de forma aleatória.
Quantidade de vezes
que aluga carro no
semestre (xi)
Frequência de
clientes (fi)
1 10
2 20
3 20
4 40
5 10
Total 100
Nessa situação, os valores da , da e do
são, respectivamente, iguais a:
a) 3,0 ; 3,5 ; 2,50
b) 3,2 ; 4,0 ; 1,17
c) 3,2 ; 4,0 ; 3,00*
d) 3,0 ; 4,0 ; 1,17
e) 3,2 ; 3,5 ; 2,50
Uma urna contém 15 bolas numeradas de 1 a 15. Uma bola é extraída ao
acaso da urna. Assinale a probabilidade de uma bola maior ou igual a 10
ser sorteada da urna.
a) 3/5
b) 1/5
c) 1/3
d) 1/4
e) 2/5*
O tempo de duração de uma consulta médica segue uma distribuição
exponencial com média de 15 minutos. A probabilidade de que uma
consulta dure mais de 15 minutos é de:
𝑃(𝑋 > 𝑥) = 𝑒𝛼𝑥
obs: usar 4 casas decimais.
a) 0,1525*
b) 0,4125
c) 0,3275
d) 0,4548
e) 0,3679
Seja uma população infinita com desvio padrão de 12. Retirando-se uma
amostra de 36 dados, o erro padrão da distribuição é de:
a) 3
b) 1*
c) 2
d) 5
e) 4
Para testar se a proporção de falhas em um processo de manufatura é
da ordem de 7%, um engenheiro de qualidade selecionou uma amostra de
32itens produzidos através desse processo e obteve o seguinte intervalo
de confiança para sua proporção real de falhas: IC95%: (7,5%; 14,5%).
Com base no resultado obtido pelo engenheiro, é correto afirmar que:
a) há probabilidade de 47,5% de que a proporção real de falhas do
processo seja inferior a 7%.
b) certamente a proporção real de falhas do processo é superior a
7%.
c) há uma probabilidade de 5% da real proporção de falhas do
processo superar os 7%.
d) com uma confiança de 95% podemos concluir que a proporção
real de falhas desse processo é superiora 7%. *
e) a chance de que a proporção real de falhas desse processo seja
superior a 7,5% é de 95%.
Uma fábrica de biscoito anuncia que em média um pacote de biscoito tem
220 cal, com desvio padrão de 20cal. Uma revista de nutrição resolveu
fazer o teste usando 16 pacotes de biscoito, obtendo 210 cal de média. Qual
é a conclusão ao nível de significância de 5 %? Obs1: O valor crítico para
5% é 1,96 desvios (Z tabelado); Obs2: Para o cálculo do Valor da Estatística
de Teste: (média da amostra - média da população) / (desvio padrão /
raiz quadrada da amostra).
a) Como Z = -3, H0 será rejeitada
b) Como Z = -2, H0 será rejeitada *
c) Como Z = -5, H0 será rejeitada
d) Como Z = -6, H0 será rejeitada
e) Como Z = -4, H0 será rejeitada
Qual dos valores do coeficiente de correlação (r) dados abaixo,
representa a melhor associação de uma variável em relação a outra
variável?
a) 2,50
b) 1,18
c) -0,55
d) -0,77 *
e) 0,68
A produção mensal de uma fábrica de automóveis tem distribuição
aproximadamente normal, com média de´500 unidades/mês e desvio
padrão de 50 unidades. Determine a probabilidade de que, em um mês,
a produção seja de no máximo 460 unidades. (Tabela Z para 0,8 =
0,2881).
a) 28,81%
b) 50%
c) 71,19%
d) 21,19%
e) 78,81% *
Em um grupo de 200 adultos, 130 são do sexo masculino.
Das mulheres desse grupo, 40% são casadas. Entre essas 200 pessoas,
94 delas não são casadas. Ao escolher aleatoriamente 1 desses
adultos, qual é a probabilidade de que ele seja um homem, sabendo
que o adulto sorteado é casado?
a) 13/20
b) 14/53
c) 14/39
d) 3/5
e) 39/53 *
Colocando, aleatoriamente, as 9 letras da palavra PETROBRAS
em fila, a probabilidade de que as 2 letras R fiquem juntas é:
a) 2/9!
b) 8/9 *
c) 8/9!
d) 1/9
e) 2/9
Assume-se que uma distribuição de Bernoulli tenha dois possíveis
resultados n = 0 e n = 1, no qual n = 1 (sucesso)
ocorre com probabilidade p, e n = 0 (falha) ocorre com
probabilidade q = 1 - p. Sendo 0 3
A probabilidade de que X seja maior do que $2,50 é:
a) 0,45
b) 0,60
c) 0,65
d) 0,50
e) 0,55 *
Suponha uma variável aleatória X normalmente distribuída com média
100 e variância 25.
A probabilidade de que X seja maior do que 110 e aproximadamente igual
a:
a) 34,46%
b) 4,56%
c) 97,72%
d) 47,72%
e) 2,28% *
Assinale a alternativa correta sobre aleatorização:
a) Ela necessária para obter boas previsões
b) Não é possível obter causalidade sem dados experimentais
c) Ela garante que para obter o efeito causal apenas precisamos
subtrair valores esperados entre quem recebeu a intervenção e
quem não recebeu *
d) Ela é crucial dentro da abordagem estrutural
e) Não é possível fazer uma análise utilizando regressão linear sem
ela
Considere o conjunto de dados a seguir:
60 80 80 85 85 85 85 90 90 90 90
90 100 100 100 100 100 100
O box plot correspondente a esse conjunto de dados é:
(A)
(B)
(C)
(D)
(E) *
A tabela a seguir apresenta a distribuição de
frequências associada à duração de chamadas
telefônicas, em minutos, em uma determinada
região.
Frequência Duração (em min)
2 ¬ 5 3
5 ¬ 8 7
8 ¬ 11 6
11 ¬ 14 10
14 ¬ 17 10
17 ¬ 20 1
TOTAL 30
A mediana e o terceiro quartil, calculados com base na tabela acima são,
respectivamente:
a) 11 e 14,45
b) 11 e 13,5
c) 15 e 22,5
d) 10,5 e 12,95 *
e) 10,5 e 13,5
Uma amostra aleatória \(X1,...,X_{144}\) é obtida de uma distribuição com
variância desconhecida dada por \(Var[X_i]=σ^2\). Para a amostra
observada, temos \(\overline X=55.2\) e a variância amostral é
\(S^2=34.5\). Encontre um intervalo de confiança de 99% para
\(θ=E[X_i]\). Saiba também que: \(z_{0.005}=2.58\). Ao final, utilize
somente a parte inteira (i.e. antes da vírgula) dos valores mínimos e
máximos do intervalo de confiança, por exemplo, se você obter [1.5 , 3.7]
marque [1, 3]. Assinale a alternativa correta.
a) [50, 53]
b) [53, 56]
c) [54, 57] *
d) [52, 55]
e) [55, 58]
(UFU-MG/2019 - Adaptada). Considere as seguintes variáveis.
I. Tamanho de um objeto (pequeno, médio ou grande).
Il. Volume de água em um rio.
III. Número de clientes numa fila.
IV. Grau de instrução.
V. Comprimento de um inseto.
VI.Classe Social.
Com relação à classificação dos dados requeridos como variáveis de
pesquisa, é correto afirmar que:
a) as variáveis II e III são quantitativas discretas
b) a variável III não é considerada uma variável
c) a variável IV é qualitativa ordinal
d) as variáveis III e V são quantitativas contínuas
e) as variáveis I, IV e VI são qualitativas *
Em uma urna com bolas numeradas, as probabilidades são usadas para
calcular a chance de selecionar uma bola específica ou uma combinação
específica de bolas.
Considere uma caixa contendo 8 bolas vermelhas, 4 bolas azuis e 3 bolas
amarelas. Se uma bola é retirada aleatoriamente da caixa, qual é a
probabilidade de ser uma bola vermelha?
a) 8/24
b) 8/12
c) 2/3
d) 4/15
e) 8/15 *
O gráfico a seguir mostra, em percentuais, a distribuição do número de
mulheres de 15 anos ou mais de idade, segundo o número de filhos, no
brasil:
Selecionando aleatoriamente 1 filho dessa população, a probabilidade de
que ele seja filho único é, aproximadamente:
a) 17/71
b) 17/55
c) 17/224 *
d) 17/100
e) 17/1000
A distribuição de Poisson é uma das distribuições de probabilidade mais
importantes e amplamente utilizadas na teoria estatística e em diversas
áreas da ciência e engenharia. Considerando X ~ Poisson (0,2), e sabendo
que 𝑒−0,2 é 0,82, aproximadamente, indique a alternativa correta com
relação ao seguinte cálculo:
𝑃(𝑋 = 1)𝑋(𝐸(𝑋)2
𝑃(𝑋 = 2)𝑋4
a) 0,3
b) 0,5
c) 0,1 *
d) 0,4
e) 0,2
Um fabricante de chocolates produz barras de chocolate que são
embaladas em caixas. A quantidade de chocolate em cada barra segue
uma distribuição contínua. Qual das alternativas abaixo melhor
representa a natureza da variável aleatória nesse contexto?
a) Peso exato de uma barra de chocolate selecionada ao acaso. *
b) Quantidade de calorias em cada barra de chocolate.
c) Número de barras de chocolate em uma caixa.
d) Data de validade das caixas de chocolate.
e) Sabor do chocolate (amargo, ao leite, branco etc.).
Verifique quais afirmações são verdadeiras e assinale a alternativa
correta:
I - Se o p-valor de um teste de hipóteses for igual a 0.015, a hipótese
nula será rejeitada a 5% de significância, mas não a 1%.
Il - O p-valor de um teste de hipóteses é a probabilidade de a hipótese
nula ser rejeitada.
III - O poder de um teste de hipótese é a probabilidade de rejeitar
corretamente uma hipótese nula falsa.
a) apenas I é correta
b) I e II são corretas
c) apenas III é correta
d) I e III são corretas *
e) II e III são corretas
Assinale a definição correta de independência plena:
a) Corr( X, Y ) = 0
b) Cov( Y, X ) = 0
c) E[ Y | X ]=E [ Y ]
d) fX,Y(x, y) = fX(x)fY(y) *
e) E[ E [ Y | X ] ] = E [ Y ]
O histograma a seguir representa a distribuição de frequências das
áreas cultivadas das fazendas de uma determinada região, em hectares.
Não existem observações coincidentes com os extremos das classes.
A média e o desvio padrão, respectivamente, em hectares, das áreas
cultivadas, aproximadamente, são:
a) 9 e 36
b) 9 e 16
c) 36 e 16
d) 9 e 4 *
e) 36 e 4
As probabilidades são usadas para calcular a chance de selecionar uma
bola específica ou uma combinação específica de bolas de uma urna com
bolas coloridas. Uma caixa contém 5 bolas vermelhas, 3 bolas verdes e 2
bolas azuis. Duas bolas são retiradas sucessivamente, sem reposição. Qual
é a probabilidade de ambas as bolas serem vermelhas?
a) 5/28 *
b) 1/4
c) 1/5
d) 5/14
e) 10/28
Ao analisar estatísticas e resultados anteriores, os analistas esportivos usam
probabilidades para prever o resultado de um jogo ou o desempenho de uma
equipe em um campeonato. Em uma competição de basquete, a probabilidade
de um jogador acertar um arremesso de três pontos é de 40%. Qual é a
probabilidade de ele errar um arremesso de três pontos?
a) 10%
b) 20%
c) 40%
d) 60% *
e) 90%
Companhias de seguros usam cálculos de probabilidade para estimar o
risco de sinistros e determinar os prêmios de seguro adequados para os
clientes. Uma seguradora oferece um seguro residencial contra roubo.
Dados históricos mostram que, em média, a cada 100 residências
seguradas, 5 são roubadas em um determinado período. Qual é a
probabilidade de uma residência segurada ser roubada?
a) 1%
b) 2%
c) 3%
d) 4%
e) 5%*
O RStudio é uma ferramenta robusta e versátil para análise estatística e
programação. Ele é caracterizado por sua capacidade de expandir suas
funções por meio de pacotes. Sobre o RStudio é CORRETO afirmar que:
a) Ao instalar o RStudio o usuário deverá criar todos os seus pacotes
por meio de programação avançada.
b) Os pacotes no RStudio são exclusivamente para armazenamento de
dados, não incluindo funções ou códigos.
c) Para usar um pacote no RStudio, basta instalá-lo, não sendo
necessário carregá-lo em uma sessão.
d) O RStudio já vem com um conjunto-padrão de pacotes e, se
necessário, outros pacotes podem ser baixados e instalados para
expandir suas funcionalidades. *
e) A função install.packages() é usada para carregar pacotes
previamente instalados em uma sessão do RStudio
Uma empresa de pesquisa de mercado está interessada em analisar a
satisfação dos consumidores em relação a um novo produto lançado no
mercado. Para isso, eles decidem coletar dados de uma amostra
representativa dos consumidores. A amostra será selecionada de forma
aleatória, garantindo que todos os possíveis consumidores tenham a
mesma chance de serem incluídos. Qual é o objetivo de selecionar uma
amostra representativa da população nessa pesquisa de satisfação dos
consumidores?
a) Obter uma pequena parte da população que seja mais fácil de analisar
estatisticamente.
b) Garantir que os consumidores insatisfeitos sejam incluídos na amostra,
pois são mais propensos a fornecer feedback.
c) Economizar tempo e recursos, coletando dados apenas de uma parte da
população.
d) Assegurar que a amostra reflita as características e opiniões da
população como um todo. *
e) Reduzir o viés de seleção, incluindo apenas os consumidores que são mais
favoráveis ao produto.
Um estudante está se preparando para um exame de múltipla escolha. Em
cada questão, ele pode marcar a resposta correta ou errada.
Considerando a distribuição de Bernoulli, qual das alternativas abaixo
melhor representa a natureza da variável aleatória X nesse contexto?
a) Número total de questões no exame.
b) Cor da caneta usada para marcar as respostas.
c) Probabilidade de o estudante acertar uma questão específica. *
d) Identificação única de cada questão no exame.
e) Média aritmética das respostas corretas do estudante.
Seja X1, X2, ... , X25 uma sequência de 25 variáveis aleatórias independentes
e de distribuição normal com média igual a 40 e desvio padrão igual a
20. A variável aleatória Y é definida como: Y = X1 + X2 + ... + X25. Assinale
a opção que corresponde à aproximação do Teorema Central do Limite
para a probabilidade de que Y seja maior que 1100.
a) 2,28%
b) 15,87% *
c) 42,07%
d) 57,93%
e) 84,13%
Um estudo foi realizado para analisar a quantidade de chuva em
milímetros que ocorre em uma determinada região durante um período
de tempo.
Qual das alternativas abaixo melhor representa a natureza do desvio
padrão nesse estudo?
a) Número de dias de chuva durante o período de tempo.
b) Cor das capas de chuva utilizadas pelas pessoas na região.
c) Porcentagem de umidade do ar durante os dias de chuva.
d) Volume exato de chuva em milímetros registrado em um dia
específico.
e) Raiz quadrada do erro quadrático médio das medições de chuva. *
Verifique quais afirmações são verdadeiras e assinale a alternativa
correta:
I - Se um intervalo de confiança de 95% para a média amostral,
calculado a partir de uma amostra aleatória, excluir o valor 0, pode-se
rejeitara hipótese nula de que a média populacional seja igual a 0 ao
nível de significância de 5%.
Il - Suponha que o objetivo seja testar a hipótese nula de que a média
populacional u é igual a 0. Se esta hipótese é rejeitada em um teste
monocaudal contra a hipótese alternativa de que u > 0, ela também será
rejeitada em um teste bicaudal contra a hipótese alternativa de que u #
0, adotando-se o mesmo nível de significância.
III - O Erro Tipo II é definido como a probabilidade de rejeitar a
hipótese nula quando ela é verdadeira.
a) Apenas I é correta
b) I e II são corretas *
c) I e III são corretas
d) II e III são corretas
e) Apenas III é correta
O segundo passo para um desenho de pesquisa utilizando a abordagem
estrutural é:
a) Formulação da pergunta
b) Estimação dos parâmetros
c) Coleta de dados
d) Formulação do modelo econométrico
e) Determinação da variável de interesse dentro do modelo
econômico que irá guiar a análise *
Assinale a principal e mais comum preocupação de modelos de forma
reduzida:
a) Prever o valor de uma variável dada a outra.
b) Maximizar o 𝑅2 da regressão linear
c) Minimizar o erro quadrático médio.
d) Testar o funcionamento de modelos econômicos levando dados
para dentro deles.
e) Medir o impacto causal de uma variável em outra. *
Em um grupo de 200 adultos, 130 são do sexo masculino. Das mulheres
desse grupo, 40%são casadas. Entre essas 200 pessoas, 94 delas não são
casadas. Ao escolher aleatoriamente 1 desses adultos, qual é a
probabilidade de que ele seja um homem, sabendo que o adulto sorteado
é casado?
a) 13/20
b) 39/53 *
c) 14/39
d) 3/5
e) 14/53
Um torneio será disputado por 4 tenistas (entre os quais A e B) de mesma
habilidade, isto é, em qualquer jogo entre 2 dos 4 jogadores, ambos têm a
mesma chance de ganhar. Na primeira rodada, eles se enfrentarão em 2
jogos, com adversários definidos por sorteio. Os vencedores disputarão a final.
A probabilidade de que o torneio termine com A derrotando B na final é:
a) 1/4
b) 1/8
c) 1/12
d) 1/6
e) 1/2 *
Supondo os pesos das pessoas normalmente distribuídos com média 70
kg e variância 5𝑘𝑔2, qual é a probabilidade de o peso total de um grupo
de 5 pessoas ser superior a 355kg?
a) 32%
b) 48%
c) 24%
d) 8%
e) 16% *
Os tempos de vida de um certo tipo de componente eletrônico são
exponencialmente distribuídos com média de 2000 horas. A probabilidade
de que um componente dure mais de 2000 horas é igual a:
a) 1 − 𝑒−3
b) 𝑒−3
c) 1 − 𝑒−2
d) 𝑒−1 *
Um estudante marca, ao acaso, as respostas de um teste de 10 questões
de múltipla escolha, com 4 alternativas por questão. O número mais
provável de acertos é:
a) 2,5 *
b) 2,0
c) 3,0
d) 1,5
e) 3,5
A tabela a seguir apresenta a distribuição dos equipamentos de uma
grande empresa:
A B C
ATIVO 50 30 100 180
INATIVO 60 10 20 90
TOTAL 110 40 120 270
Qual é a probabilidade de que um equipamento selecionado
aleatoriamente esteja inativo ou seja do tipo A?
a) 14/27 *
b) 6/27
c) 20/27
d) 6/11
e) 9/11
A variável aleatória X tem função de densidade f(x) = 6x(1-x), se 0 0
0, 𝑡 ≤ 0
Assinale a opção que dá o desvio padrão da distribuição de X
a) 900 horas
b) 1000 horas *
c) 32 horas
d) 800 horas
e) 500 horas