Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Prévia do material em texto

Estatística II 
Lista 1 – Amostragem e distribuições de amostragens 
1. (PS 2010.1) O número total de amostras de tamanho 2, extraídas de uma população de tamanho 6, 
utilizando amostragem com reposição, é: 
(A) 15 
(B) 16 
(C) 30 
(D) 36 
(E) 64 
Memória de Cálculo: 
 amostra (n) = 2 
 população (N)= 6 
 
Cálculo: 
 
 
 
Resposta: Utilizando amostragem com reposição é 36 
 
2. (P2 2010.2) A fim de orientar os condutores de veículos sobre a necessidade do uso de cadeirinha 
no banco traseiro para o transporte de crianças com até quatro anos de idade, a Polícia Rodoviária 
Federal na Br320 parava um a cada 50 veículos para verificação do uso das mesmas e/ou fazer os 
devidos esclarecimentos sobre a sua necessidade de uso. Tal procedimento caracteriza uma amostra: 
(A) estratificada. 
(B) conglomerada. 
(C) sistemática. 
(D) casual simples. 
(E) não probabilística. 
Memória de Cálculo: 
A Polícia Rodoviária Federal na Br320 parava um a cada 50 veículos e a polícia tinha uma ordem 
certa para parar os carros, ou seja, um padrão. A única amostragem com ordenação do sistema de 
referência (essa sendo o número oito) é a sistemática 
Resposta: Amostragem sistemática 
 
3. (PS 2012.1) O peso dos brasileiros segue uma distribuição normal com média de 70 kg e desvio-
padrão de 10 kg. Toma-se um grande número de amostras de 100 pessoas aleatoriamente escolhidas 
e calcula-se o peso médio das pessoas em cada amostra. A média e o desvio-padrão das médias das 
amostras serão próximos, respectivamente, de: 
(A) 70 kg e 10 kg. 
(B) 70 kg e 0,10 kg. 
(C) 70 kg e 1 kg. 
(D) 0,70 kg e 10 kg. 
(E) 0,70 kg e 0,10 kg. 
Memória de Cálculo: 
 Média = 70 kg 
 Desvio- padrão= 10 kg 
 Amostra (n) = 100 
 
Cálculo: 
 
 
 
√ 
 
 
√ 
 
 
 
 
 
Resposta: A média é 70 kg e o Desvio-padrão (erro padrão) é 1kg 
 
4. (PS 2012.2) O colégio XTX tem um total de 5.000 alunos matriculados. Sabemos que a altura média 
dos alunos é de 175 cm e a variância é de 25 cm2. Retiramos uma amostra aleatória, de tamanho n = 
100.Nesse caso, o valor aproximado do desvio-padrão da média amostral é: 
(A) 0,25. 
(B) 0,05. 
(C) 0,005. 
(D) 0,5. 
(E) 0,025. 
Memória de Cálculo: 
 Média = 175 cm 
 Variância = 25 cm ² 
 Amostra (n) = 100 
 População = 5.000 
 
Cálculo: 
 √ √ 
 
 
 
√ 
 
 
√ 
 
 
 
 
 
Resposta: O valor aproximado do desvio-padrão da média amostral é 0,5 
 
5. (PS 2018.2) Um levantamento sobre o faturamento diário de um restaurante da cidade utilizou uma 
amostra de 30 dias, escolhidos aleatoriamente. O resultado foi o seguinte: Média = R$4.320,00. Desvio 
padrão = R$980,00. É correto dizer que o desvio padrão das médias amostrais (erro padrão) é, 
aproximadamente, de: 
(A) R$566,00. 
(B) R$716,00. 
(C) R$49,00. 
(D) R$289,00. 
(E) R$179,00. 
Memória de Cálculo: 
 Média = R$4.320,00 
 Desvio-padrão = R$980,00 
 Amostra (n) = 30 
 
 
Cálculo: 
 
 
 
√ 
 
 
√ 
 
 
 
 
 
Resposta: O desvio padrão das médias amostrais (erro padrão) é, aproximadamente, de R$178,00. 
 
6. (FGV PS 2010,2) Numa pesquisa, se o analista desejar diminuir o erro padrão da estimativa, ela 
necessariamente pode esperar que: 
(A) O intervalo de confiança aumente 
(B) A hipótese inicial do teste de hipótese seja rejeitada 
(C) A média da amostra aumente 
(D) O tamanho da amostra aumente 
(E) O valor de Z (a/2) diminua 
 
Memória de Cálculo: 
A medida que cresce o tamanho da amostra o erro-padrão decresce em um fator igual a raiz do 
tamanho da amostra. 
Resposta: Se o analista desejar diminuir o erro padrão da estimativa o tamanho da amostra terá que 
aumentar. 
 
7. (PS 2014.2) A altura dos indivíduos em uma população tem média 1,70m e desvio-padrão 0,10. Qual 
é, aproximadamente, a probabilidade de que uma amostra de 100 pessoas tenha média entre 1,68 e 
1,72? 
(A) 0,954. 
(B) 0,854. 
(C) 0,754. 
(D) 0,654. 
(E) 0,554. 
Memória de Cálculo: 
 Média = 1,70 
 Desvio-padrão = 0,10 
 Amostra (n) = 100 
 
Cálculo: 
 
 
√ 
 
 
√ 
 
 
 
 
 
 
 
 
 
 
 
 
 
Z = 2 = 4772 
 
 
 
 
 0 
0,0228 
2,28% 
0,0228 x 0,0228 = 0,0456 
1 - 0,0456 = 0,9544 
Resposta: A probabilidade é de 
0,9544 
 
 
0,9544 
95,44% 
0,0228 
2,28% 
0,5-0,4772=0,0228 
8. (P2 2012.2) Uma empresa atuante no ramo de papel celulose planta árvores para reparar o dano 
ambiental inerente a sua atividade econômica. A empresa sabe que o tempo necessário para uma 
muda de árvore se tornar uma árvore adulta segue uma distribuição contínua com média de 10 anos e 
desvio padrão de 3 anos. Se a empresa plantar 200 mudas de árvore, a probabilidade de que o tempo 
médio para que as árvores se tornem adultas exceda 10,5 anos é: 
(A) menor que 1%. 
(B) entre 1% e 5%. 
(C) entre 5% e 10%. 
(D) entre 10% e 20%. 
(E) maior que 20%. 
Memória de Cálculo: 
 Média = 10 
 Desvio-padrão = 3 
 Amostra (n) = 200 
 
Cálculo: 
 
 
√ 
 
 
√ 
 
 
 
 
 
 
 
 
 
 
Z = 2,38 = 4913 
 
 
 
 0 
0,0087
0,87% 
0,0087 x 100 = 0,87% 
Resposta: A probabilidade de que o 
tempo médio para que as árvores se 
tornem adultas exceda 10,5 anos é 
menor que 1 % 
 
 
0,5-0,4913=0,0087 
9. (PS 2008.2) O número de minutos para a realização de uma prova de Estatística II, na Faculdade 
Mundial, tem variância de 144 minutos. Uma amostra de 36 provas acusou um tempo médio de 100 
minutos. Aproximadamente, com que confiança se pode afirmar que o tempo médio de realização da 
prova está acima de 104 minutos? 
(A) 48%. 
(B) 35%. 
(C) 24%. 
(D) 8%. 
(E) 2%. 
Memória de Cálculo: 
 Média = 100 
 Variância = 144 
 Amostra (n) = 36 
 
Cálculo: 
 
 
√ 
 
√ 
√ 
 
 
 
 
 
 
 
 
 
 
Z = 2 = 4772 
 
 
 
 
 0 
0,0228 
2,28% 
0,0228 x 100 = 2,28 
Resposta: Aproximadamente 2,28% 
de confiança se pode afirmar que o 
tempo médio de realização da prova 
está acima de 104 minutos. 
 
 
0,5-0,4772=0,0228 
10. (PS 2010.1) Sabe-se que os preços de um determinado produto têm distribuição normal no 
mercado, com desvio padrão igual a R$ 60,00. Uma amostra aleatória de 100 mercados revelou um 
valor médio de R$ 290,00 para esse produto. Qual é a probabilidade deste valor não ultrapassar o 
verdadeiro, mas desconhecido, valor médio do mercado em mais do que R$ 12,00, em valor absoluto? 
(A) 19,146% 
(B) 38,292% 
(C) 47,725% 
(D) 90,000% 
(E) 95,450% 
Memória de Cálculo: 
 Média = R$290,00 
 Desvio padrão = R$60,00 
 Amostra (n) = 100 
 
Cálculo: 
 
 
√ 
 
 
√ 
 
 
 
 
 
 
 
 
 
 
 
 
 
Z = 2 = 4772 
 
 
 
 
 0 
0,0228 
2,28% 
0,0228 x 2 = 0,0456 
1 – 0,0456 = 0,9544 x 100 = 95,44% 
Resposta: A probabilidade deste valor 
não ultrapassar o verdadeiro é 
aproximadamente 95,450% 
 
 
0,5-0,4772=0,0228 
0,0228 
2,28% 0,9544 
95,44% 
0,5-0,4772=0,0228 
11. (P2 2012.2) O Teorema do Limite Central diz que a média de variáveis aleatórias segue uma 
distribuição aproximadamente normal. Para que esse teorema seja válido, é necessário que as 
variáveis: 
(A) sejam normalmente distribuídas. 
(B) não sejam discretas. 
(C) sejam independentes. 
(D) tenham os mesmos valores esperados e desvios-padrão. 
(E) tenham a mesma distribuição. 
Memória de Cálculo: 
A alternativa correta é a C, pois uma variável aleatória representa uma variável que está sendo 
manipulada em um experimento, diferente da variável dependente a independente não depene de 
outro fator. Para que tenha uma distribuição normal tem que ser independente, caso fosse 
dependente seria uma exponencial. 
Resposta: É necessário que as variáveis sejam independentes. 
 
12. (FGV PS 2014.2) O Teorema do Limite Central, quando tem suas premissas satisfeitas, diz que o 
estimador da média populacional possui variância: 
(A) 
 
 
 
(B) 
 
√ 
 
(C)√
 
 
 
(D) 
√ 
√ 
 
(E) 
 
Memóriade Cálculo: 
O Teorema do Limite central que o estimador da média amostral segue uma distribuição normal 
com esperança igual à média populacional e variância igual à variância populacional dividida pelo 
tamanho da amostra. 
Resposta: Variância= 
 
 
 
 
13. (PS 2016.2) Os modelos matemáticos se dividem em: 
(A) determinísticos e aleatórios. 
(B) algébricos ou agrupados em partes. 
(C) alfabéticos ou nominais. 
(D) exponenciais ou alfanuméricos. 
(E) complexos ou conjugados. 
Memória de Cálculo: 
Um modelo matemático pode ser uma representação ou interpretação simplificada da realidade 
com uma estrutura de conceitos mentais ou experimentais. 
Existem os determinísticos que também são conhecidos como probabilísticos, que tem por teoria 
que existe um conjunto de entrada conhecido e que resulta em uma única saída. E o outro é o 
aleatória, que contém um conjunto de entrada conhecido e que podem dar saídas diferentes. 
Resposta: Determinístico e aleatórios. 
 
14. (ENADE 2012) Uma operadora turística, que atua no mercado de viagens, no Estado do Mato 
Grosso, encomendou uma pesquisa ao Instituto de Pesquisas Turísticas com o objetivo de identificar 
os destinos brasileiros preferidos pelos consumidores da classe C, residentes no próprio Estado, no 
último ano. Para que os dados coletados sejam merecedores de crédito, é necessário que o Instituto 
estabeleça um plano de ação para a pesquisa que inicie com a definição: 
(A) do universo de indivíduos da classe C do Estado do Mato Grosso e, em seguida, com a 
determinação da amostragem, a fim de identificar os principais destinos brasileiros preferidos. 
(B) da variável de estudo “destinos brasileiros” e, em seguida, com sua aplicação no universo de 
indivíduos da classe do Estado do Mato Grosso. 
(C) das técnicas para estratificação da camada de indivíduos da classe C do Estado do Mato Grosso e, 
em seguida, com o sorteio dos destinos brasileiros que serão contemplados na pesquisa. 
(D) do problema que norteará a investigação sobre indivíduos da classe C do Estado do Mato Grosso 
e, em seguida, com a seleção da amostragem probabilística, constituída pelos destinos brasileiros 
preferidos pelo público estudado. 
(E) da amostragem por área, constituída pelos indivíduos da classe C localizados geograficamente no 
Estado do Mato Grosso e, em seguida, com a seleção das 20 cidades mais populosas do Estado. 
Memória de Cálculo: 
Para que a pesquisa seja confiável é preciso que seja feito uma ordem, como eles querem saber 
quais os destinos brasileiros preferidos pelos consumidores da Classe “C” que residem no Mato 
Grosso, precisam identificar os consumidores da Classe “C” que residem no estado em questão, 
ou seja, a população e após isso verificar os destinos preferidos- amostras. 
 
Resposta: Para que os dados coletados sejam merecedores de crédito, é necessário que o Instituto 
estabeleça um plano de ação para a pesquisa que inicie com a definição: do universo de indivíduos da 
classe C do Estado do Mato Grosso e, em seguida, com a determinação da amostragem, a fim de 
identificar os principais destinos brasileiros preferidos. 
 
 
15. (P2 2010.1) Para a fabricação de aparelhos de ar-condicionado, uma fábrica recebe de um 
fornecedor um dos componentes em lotes de 10.000 peças. Para a aceitação de cada lote, retira-se 
aleatoriamente do lote uma amostra de 100 peças e verifica-se o seu comprimento médio. O lote é 
aceito se esse comprimento estiver entre 7 e 9 cm. Sabendo-se que o comprimento das peças é uma 
variável aleatória cuja média é igual a 8 cm e variância é igual a 25 cm2, qual é aproximadamente a 
probabilidade de aceitação de cada lote? 
(A) 30% 
(B) 68% 
(C) 69% 
(D) 80% 
(E) 95% 
Memória de Cálculo: 
 Média = 8 cm 
 Variância = 25 cm² 
 Amostra (n) = 100 
 
Cálculo: 
 
 
√ 
 
√ 
√ 
 
 
 
 
 
 
 
 
 
 
 
 
 
Z = 2 = 4772 
 
 
 
 
 0 
0,0228 
2,28% 
0,0228 x 0,0228 = 0,0456 
1 - 0,0456 = 0,9544 x 100 =95,44% 
Resposta: A probabilidade é de 95% 
 
 
0,9544 
95,44% 
0,0228 
2,28% 
0,5-0,4772=0,0228 
16. (P2 2016.1) A média amostral é um estimador não viesado (ou não tendencioso) da média 
populacional, porque: 
(A) a variância do estimador da média amostral é igual à média populacional. 
(B) o valor esperado do estimador da média amostral é igual à média populacional. 
(C) a média amostral é igual à média populacional. 
(D) a média sempre é aproximadamente igual à média populacional. 
(E) a variância do estimador da média amostral é igual à variância da média populacional. 
Memória de Cálculo: 
Um estimador é não viesado (ou não tendencioso) se seu valor esperado for o próprio parâmetro que 
se pretende estimar, isto é, . 
Resposta: O valor esperado do estimador da média amostral é igual à média populacional. 
 
17. (PS 2012.1) O comprimento de um parafuso segue uma distribuição uniforme entre 1 e 3 
centímetros. A média dos comprimentos de uma amostra de 900 parafusos escolhida aleatoriamente 
segue uma distribuição: 
(A) uniforme com média de 2 centímetros. 
(B) uniforme com desvio-padrão de 2 centímetros. 
(C) normal com média de 2 centímetros. 
(D) normal com desvio-padrão igual a 2 centímetros. 
(E) Poisson com desvio-padrão igual a 2 centímetros. 
Memória de Cálculo: 
 Média = 8 cm 
 Amostra (n) =900 
 
Cálculo: 
 
 
 
 
 
 
 
 
Resposta: Normal, pois a amostra é maior que 30 e a média igual a 2 centímetros. 
 
Q1=1 Q3=3 
 
 
 
 
18. (PS 2016.2) Lançam-se 100 moedas não viesadas e independentes. As faces das moedas são 
numeradas com 0 e 1. O número X é a média dos números das faces voltadas para cima. A respeito do 
resultado dos 100 lançamentos, é correto afirmar que: 
(A) a média dos resultados dos lançamentos segue uma distribuição aproximadamente normal, com o 
valor esperado de 0,5 a variância 1/40 
(B)os resultados dos lançamentos têm moda 0,5 
(C) os resultados dos lançamentos seguem uma distribuição aproximadamente normal 
(D) a probabilidade de nenhuma moeda cair com 1 voltando para cima de 1/200 
(E) a média dos resultados dos lançamentos segue uma distribuição aproximadamente normal, com 
valor esperado de 0,5 e variância de 1/400 
Memória de Cálculo: 
 N = 100 moedas 
 n = 2 
 0 a 1 
 
Cálculo: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
A alternativa que corresponde a 0,0025 na variância é a alternativa E, que dividindo 1/400 obtemos o 
mesmo resultado. 
 
Resposta: A respeito do resultado dos 100 lançamentos, é correto afirmar que a média dos resultados 
dos lançamentos segue uma distribuição aproximadamente normal, com valor esperado de 0,5 e 
variância de 1/400. 
 
 
 
19. (PS 2010.1) Um processo industrial de encher latas de leite fornece, em média, 5% de latas com 
volume abaixo das especificações. Extraída uma amostra de 150 latas da produção de um dia, a 
probabilidade de a proporção de latas com volume abaixo das especificações estar entre 4% e 10% é 
aproximadamente de: 
(A) 31% 
(B) 41% 
(C) 51% 
(D) 61% 
(E) 71% 
Memória de Cálculo: 
 Média = 5% 
 n = 150 
 4% a 10% 
 
Cálculo: 
 
 
 
√ 
 
 
 
 
 
 
√ 
 
 
 
 
 
 
 
 
0,2123 + 0,4974 = 0,7097 x 100 =70,97% = 71% 
 
 
Resposta: A probabilidade é de aproximadamente 71% 
 
 
 
 
 
 
20. (P2 2018.2) O peso de uma pessoa segue uma distribuição normal com média de 70kg e desvio-
padrão 6kg. Em um elevador com capacidade para 9 pessoas, a probabilidade de o peso total das 
pessoas ultrapassar 675kg é aproximadamente: 
(A) 0,006%. 
(B) 26%. 
(C) 0,6%. 
(D) 16%. 
(E) 6%. 
Memória de Cálculo: 
 Média =70 kg 
 n = 9 
 Desvio padrão = 6 kg 
 675/9=75 
 
Cálculo: 
 
 
 
√ 
 
 
√ 
 
 
 
 
 
 
Z = 2,5 = 4938 
 
 
 
 
 0 
0,0062 
0,62% 
0,0062 x 100 = 0,62% 
Resposta:A probabilidade de o peso 
total das pessoas ultrapassar 675kg é 
aproximadamente de 0,6% 
 
 
0,5-0,4938=0,0062 
Estatística II 
Lista 2 – Estimativa do intervalo de confiança 
1. (P2 2008.1) O número de atendimentos em certo serviço municipal é verificado durante 36 dias, 
apresentando média igual e 20,6 e desvio-padrão igual a 9. O erro máximo de estimativa que podemos 
aceitar, considerando um nível de confiança de 95%, é dado por: (Utilize 1,96 e assuma distribuição 
normal dos dados.) 
(A) 1,96. 
(B) 2,94. 
(C) 1,64. 
(D) 3,50. 
(E) 4,00. 
Memória de Cálculo: 
 n= 36 dias 
 Média =20,6 
 Desvio- padrão=9 
 Nível de Confiança = 95% =1,96 
Cálculo: 
ε = Z
σ
√n
= 1,96
9
√36
= 2,94 
Resposta: O erro máximo de estimativa que podemos aceitar, considerando um nível de confiança de 
95%, é 2,94. 
 
2. (PS 2014.1) Uma determinada empresa necessita realizar um estudo estatístico para descobrir qual 
o intervalo de confiança de seu faturamento. O funcionário responsável pela análise selecionou uma 
amostra aleatória de 196 clientes e o resultado obtido foi de uma média amostral de R$ 1.280,00, com 
um desvio padrão igual a R$ 325,00. Considerando-se que a confiança utilizada para o intervalo de 
confiança foi de 99%, a margem de erro (erro amostral, erro de amostragem dessa estimação da média 
aritmética do faturamento) é de aproximadamente: 
(A) 33,7 
(B) 59,8 
(C) 110,25 
(D) 25,67 
(E) 35,67 
Memória de Cálculo: 
 n= 196 clientes 
 Média =1.280,00 
 Desvio- padrão= 325,00 
 Nível de Confiança = 99% =2,57 
Cálculo: 
ε = Z
σ
√n
= 2,57
325
√196
≅ 59,67 = 59,8 
Resposta: A margem de erro é 59,8 
 
3. (P2 2014.2) Analise o seguinte intervalo de confiança para o gasto mensal, em R$, com alimentação 
fora do domicílio: IC (μ; 95%) = [876,16; 1123,84] 
Sabe-se que o tamanho da amostra utilizada para estimar esse intervalo foi de 25 pessoas. Diante 
dessas informações, a margem de erro desse IC é: 
(A) 54,23. 
(B) 68,75. 
(C) 85,84. 
(D) 105,43. 
(E) 123,84. 
Memória de Cálculo: 
 IC (μ; 95%) = [876,16; 1123,84] 
Cálculo: 
1.123,84 − 876,16 = 247,
68
2
= 123,84 
Resposta: A margem de erro é 123,84 
 
4. (PS 2014.1) O gerente de controle da qualidade de uma fábrica de lâmpadas precisa estimar a 
média aritmética da vida útil de uma grande remessa de lâmpadas. O desvio-padrão do processo 
corresponde a 100 horas. Uma amostra aleatória contendo 64 lâmpadas indicou uma média aritmética 
de 350 horas para a vida útil da amostra. Qual o intervalo de confiança para a média aritmética da 
população relativa à vida útil das lâmpadas nessa remessa com o IC de 95%? 
(A) [350; 355] 
(B) [325,5; 374,5] 
(C) [330; 340] 
(D) [355; 359,9] 
(E) [350; 380] 
Memória de Cálculo: 
 n= 64 lâmpadas 
 Média =350 h 
 Desvio- padrão= 100 h 
 Nível de Confiança = 95% =1,96 
Cálculo: 
ε = x + Z
σ
√n
= 350 + 1,96 
100
√64
= 374,5 
ε = x − Z
σ
√n
= 350 − 1,96 
100
√64
= 325,5 
Resposta: O intervalo de confiança para a média aritmética é 325,5 ;374,5 
 
 
5. (PS 2012.2) Suponha que X represente a duração da vida de uma peça de equipamento. Admita que 
100 peças sejam ensaiadas, fornecendo uma duração de vida média de 501,2 horas. Suponha que σ 
seja conhecido e igual a 4 horas. Assinale a alternativa que contenha o intervalo de confiança de 95% 
para essa média. 
(A) (498,41; 502,98). 
(B) (502,41; 503,98). 
(C) (500,41; 501,98). 
(D) (488,41; 492,98). 
(E) (468,41; 498,98). 
Memória de Cálculo: 
 n= 100 peças 
 Média =501,2 h 
 Desvio- padrão= 4 h 
 Nível de Confiança = 95% =1,96 
Cálculo: 
ε = x + Z
σ
√n
= 501,2 + 1,96 
4
√100
= 501,98 
ε = x − Z
σ
√n
= 501,2 − 1,96 
4
√100
= 500,41 
Resposta: O intervalo de confiança é 500,41 ; 501,98 
 
6. (PS 2010.1) Uma grande empresa deseja estimar o tempo médio de acesso a sites de 
relacionamento por parte de seus funcionários, durante o período de expediente da empresa. Uma 
pesquisa foi realizada com 36 funcionários que se dispuseram a dar a informação solicitada, obtendo-
se um tempo médio semanal de 50 minutos e uma variância de 64. Considerando-se uma distribuição 
aproximadamente normal para este tempo e um nível de confiança de 
95%, a estimativa do intervalo de confiança é: 
(A) (57,5; 52,5) 
(B) (47,5; 62,5) 
(C) (67,5; 82,5) 
(D) (47,5; 52,5) 
(E) (57,5; 72,5) 
Memória de Cálculo: 
 n= 36 funcionários 
 Média = 50m 
 Variância = 64 = 8 
 Nível de Confiança = 95% =1,96 
Cálculo: 
ε = x + Z
σ
√n
= 50 + 1,96 
8
√36
≅ 52,62 
ε = x − Z
σ
√n
= 50 − 1,96 
8
√36
≅ 47,40 
 
Resposta: O intervalo de confiança é 52,5 ; 47,5 
 
7. (PS 2014.1) Considere as seguintes informações: 
· a média correspondente a uma amostra é 75; 
· o desvio-padrão da população é igual a 24; 
· o número de elementos da amostra é 36. 
Suponha que a população seja distribuída nos moldes de distribuição normal. 
Nesse caso, a estimativa aproximada do intervalo de confiança de 95% da média aritmética da 
população, μ, é: 
(A) [60,20; 86,24] 
(B) [67,16; 82,84] 
(C) [68,09; 79,08] 
(D) [70,20; 75,94] 
(E) [66,00; 85,00] 
Memória de Cálculo: 
 n= 36 
 Média = 75 
 Desvio-padrão = 24 
 Nível de Confiança = 95% =1,96 
Cálculo: 
ε = x + Z
σ
√n
= 75 + 1,96 
24
√36
= 82,84 
ε = x − Z
σ
√n
= 75 − 1,96 
24
√36
= 67,16 
Resposta: O intervalo de confiança é 67,16 ; 82,84. 
 
8. (PS 2014.2) Se a média de uma amostra é 75, o desvio-padrão da amostra igual a 24 e o número de 
elementos é 36, qual a estimativa aproximada do intervalo de confiança de 95% da média aritmética da 
população, μ? Suponha que a média segue uma distribuição normal. 
(A) [60,20; 86,24] 
(B) [67,16; 82,84] 
(C) [68,09; 79,08] 
(D) [70,20; 75,94] 
(E) [66,12; 85,13] 
 
Memória de Cálculo: 
 n= 36 
 Média = 75 
 Desvio-padrão = 24 
 Nível de Confiança = 95% =1,96 
Cálculo: 
ε = x + Z
σ
√n
= 75 + 1,96 
24
√36
= 82,84 
ε = x − Z
σ
√n
= 75 − 1,96 
24
√36
= 67,16 
Resposta: O intervalo de confiança é 67,16 ; 82,84. 
 
9. (PS 2014.2) Se a média X = 125, σ = 24 e n = 36, construa uma estimativa para o intervalo de 
confiança de 95% para a média aritmética da população μ. 
(A) 117,16 = μ = 132,84. 
(B) 140,00 = μ = 153,00. 
(C) 110,25 = μ = 120,45. 
(D) 132,96 = μ = 145,67. 
(E) 112,86 = μ = 146,76. 
Memória de Cálculo: 
 n= 36 
 Média = 125 
 Desvio-padrão = 24 
 Nível de Confiança = 95% =1,96 
Cálculo: 
ε = x + Z
σ
√n
= 125 + 1,96 
24
√36
= 132,84 
ε = x − Z
σ
√n
= 125 − 1,96 
24
√36
= 117,16 
Resposta: O intervalo de confiança é 117,16 ; 132,84 
 
10. (PS 2010.2) Um levantamento sobre o valor diário das vendas realizadas pelos vendedores de uma 
determinada cadeia de lojas de eletrodomésticos considerou as vendas efetuadas por seis vendedores 
da loja de Ipanema e por oito vendedores da loja da Tijuca. O resultado obtido foi o seguinte: 
 Loja da Ipanema Loja da Tijuca 
 
Venda média diária R$ 12.830,00 R$ 14.120,00 
 
Desvio padrão R$ 2.350,00 
 
R$ 2.870,00 
Considere que o valor das vendas diárias seja normalmente distribuído e que as variâncias 
populacionais do valor das vendas diárias das duas lojas sejam aproximadamente iguais. Assim sendo, 
com 95% de confiança, e considerando que o erro de estimação do intervalo de confiança assim 
determinado para o valor médio das vendas diárias da loja de Ipanema seja de R$ 2.466,57, o limite 
superior desse intervalo de confiança é de: 
(A) R$ 18.871,85 
(B) R$ 29.918,93 
(C) R$ 14.710,39 
(D) R$ 15.177,61 
(E) R$ 15.296,57 
Memória de Cálculo: 
 Média = 12.830 
 Desvio-padrão = 2.466,57 
Cálculo: 
R$ 12.830,00 + R$ 2.466,57= R$15.296,57 
Resposta: O limite superior desse intervalo de confiança é de R$15.296,57 
 
11. (PS 2008.1) A renda mensal de um bacharel em Administração é normalmente distribuída com 
desvio padrão de R$ 475,00. Uma amostra aleatória de 121 bacharéis forneceu uma média da rendamensal de R$ 2.800,00. 
Construa um intervalo de 95% de confiança para estimar o salário médio da população. 
(A) ICμ : [2.700,00; 2.900,00] 
(B) ICμ : [2.750,00; 2.850,00] 
(C) ICμ : [2.743,11; 2.856,89] 
(D) ICμ : [2.715,36; 2.884,64] 
(E) ICμ : [2.678,73; 2.921,27] 
Memória de Cálculo: 
 n= 121 
 Média = 2.800 
 Desvio-padrão = 475 
 Nível de Confiança = 95% =1,96 
Cálculo: 
ε = x + Z
σ
√n
= 2.800 + 1,96 
475
√121
= 2.884,64 
ε = x − Z
σ
√n
= 2.800 − 1,96 
475
√121
= 2.715,36 
Resposta: O intervalo de confiança é 2.715,36 ; 2.884,64 
 
12. (PS 2008.2) Em um estudo sobre o tempo que os alunos de Administração dedicam ao estudo da 
disciplina Estatística II, segundo uma amostra aleatória de 36 discentes, obteve-se média de 2,4 
horas/dia, e desvio-padrão de 1,3 hora/dia. Supondo uma distribuição aproximadamente normal, o 
intervalo de 98% de confiança para o tempo médio de dedicação aos estudos, de todos os alunos de 
Administração, será: 
(A) [1,9; 2,9] horas/dia. 
(B) [2,9; 3,4] horas/dia. 
(C) [1,9; 3,4] horas/dia. 
(D) [2,9; 3,6] horas/dia. 
(E) [3,6; 4,8] horas dia. 
Memória de Cálculo: 
 n= 36 
 Média = 2,4 h/d 
 Desvio-padrão = 1,3 h/d 
 Nível de Confiança = 98% =2,32 
Cálculo: 
ε = x + Z
σ
√n
= 2,4 + 2,32
1,3
√36
= 2,9 
ε = x − Z
σ
√n
= 2,4 − 2,32 
1,3
√36
= 1,9 
Resposta: O intervalo de confiança é 1,9; 2,9 
 
13. (PS 2014.1) A vida útil média de uma amostra de 225 peças mecânicas é de 1060 horas. 
Sabendo que o desvio padrão é igual a 8 horas, determine o intervalo de confiança (aproximado) para 
a verdadeira duração média dessa população de peças, considerando um nível de confiança de 99%. 
(A) IC: (1057,47; 1063,23) 
(B) IC: (1058,62; 1061,38) 
(C) IC: (1056,17; 1063,83) 
(D) IC: (1055,37; 1065,63) 
(E) IC: (1059,77; 1063,23) 
Memória de Cálculo: 
 n= 225 
 Média = 1060 
 Desvio-padrão = 8 
 Nível de Confiança = 99% =2,57 
Cálculo: 
ε = x + Z
σ
√n
= 1060 + 2,57
8
√225
= 1.061,38 
ε = x − Z
σ
√n
= 1060 − 2,57 
8
√225
= 1.058,62 
Resposta: O intervalo de confiança é 1.058,62 ; 1.061,38 
 
14. (P2 2012.2) A respeito dos intervalos de confiança, é correto afirmar que: 
(A) quanto menor o grau de confiança, maior é o comprimento do intervalo. 
(B) quanto menor for o tamanho da amostra, menor será o comprimento do intervalo. 
(C) quanto menor a variância da população, menor o comprimento do intervalo. 
(D) quanto maior o tamanho da amostra, menor a media amostral, já que a média amostral se obtém 
dividindo o total pelo tamanho da amostra. 
(E) ao dobrar o tamanho da amostra, o comprimento do intervalo de confiança cai a metade. 
 
Resposta: A variância é o desvio-padrão ao quadrado, portanto quando menor a variância, menor o 
desvio-padrão e menor o comprimento do intervalo. 
 
 
15. (PS 2010.1) Mantendo constantes os valores do desvio padrão populacional, o grau de confiança e 
a média da amostra, foram construídos intervalos de confiança para a média populacional utilizando 
tamanhos de amostras (n) diferentes. Usando n = 10 e n = 100, os intervalos de 95% de confiança da 
média populacional μ foram, respectivamente, (93,80; 106,20) e (98,04; 101,96). Diante do exposto, a 
influência do tamanho da amostra na amplitude (diferença entre o limite superior e o inferior) do 
intervalo de confiança é: 
 
(A) Quanto maior o tamanho da amostra, menor é a amplitude do intervalo de confiança da média, pois 
o erro amostral diminui. 
(B) Quanto menor o tamanho da amostra, menor é a amplitude do intervalo de confiança da média, 
pois o erro amostral diminui. 
(C) Quanto maior o tamanho da amostra, menor é a amplitude do intervalo de confiança da média, pois 
o erro amostral aumenta. 
(D) Quanto menor o tamanho da amostra, menor é a amplitude do intervalo de confiança da média, 
pois o erro amostral aumenta. 
(E) Quanto menor o tamanho da amostra mais precisa será a amplitude do intervalo de confiança para 
a média, pois o erro amostral aumenta. 
 
Resposta: 
Amostra 10 = 106,20 – 93,80 = 12,4 
Menor a amostra maior a amplitude, maior o erro amostral. 
 
Amostra 100 = 101,96 – 98,04 = 3,92 
Maior a amostra menor a amplitude, menor o erro amostral. 
 
16. (P2 2008.1) O grau de acidez do azeite produzido em certa região admite uma distribuição normal. 
Em uma amostra de tamanho 25, foi registrada uma acidez média de 1 grau e desvio-padrão de 0,33 
grau. Com esses valores, alguém sugeriu um intervalo para a verdadeira acidez como 0,815 ≤ μ ≤ 
1,185. Sendo assim, pode-se dizer que o intervalo de confiança associado a esse intervalo é de: 
(A) 97%. 
(B) 93%. 
(C) 95%. 
(D) 99%. 
(E) 91%. 
Memória de Cálculo: 
 n= 25 
 Média = 1 
 Desvio-padrão = 0,33 
 0,815 ≤ μ ≤ 1,185. 
Cálculo: 
Fazendo a prova real: 
ε = x + Z
σ
√n
= 1 + 2,57
0,33
√25
= 1,185 
ε = x − Z
σ
√n
= 1 − 2,57
0,33
√25
= 0,815 
Resposta: O intervalo de confiança é 0,815 ; 1,185. 
 
18. (FGV PS 2008.2) Um provedor de acesso à internet está monitorando a duração do tempo das 
conexões de seus cliente, com o objetivo de dimensionar seus equipamentos. São desconhecidas a 
média e a distribuição de probabilidade desse tempo, mas o desvio-padrão, por analogia a outros 
serviços, é considerado igual a √50 minutos. Uma amostra de 500 conexões resultou num valor médio 
observado de 25 minutos. Pode-se afirmar que: 
(A) a média de tempo de conexão está entre (24,45; 25,55) com grau de confiança de 95% 
(B) a média de tempo de conexão está entre (24,45; 25,55) com grau de confiança de 92% 
(C) a média de tempo de conexão está entre (24,45; 25,55) com grau de confiança de 99% 
(D) a média de tempo de conexão está entre (24,45; 25,55) com grau de confiança de 94% 
(E) a média de tempo de conexão está entre (24,45; 25,55) com grau de confiança de 96% 
 
Memória de Cálculo: 
 n= 500 
 Média = 25 
 Desvio-padrão = raiz 50 
Cálculo: 
Fazendo a prova real: 
ε = x + Z
σ
√n
= 25 + 1,75
√50
√500
= 25,55 
ε = x − Z
σ
√n
= 25 − 1,75
√50
√500
= 24.45 
Resposta: O intervalo de confiança é 24,45 ; 25,55. 
 
17. (PS 2012.1) Uma pesquisa com clientes de uma loja de roupas indicou um gasto médio na amostra 
de R$200,00. Sabe-se que o desvio padrão populacional do gasto é de R$72,00. O limite inferior do 
intervalo de confiança foi igual a R$176,48. Com base nessas afirmações, é CORRETO concluir que: 
 
(A) a amostra apresentava 36 clientes. 
(B) o gasto médio na população é de R$200,00. 
(C) o grau de confiança utilizado foi de 95% e o tamanho da amostra foi 49. 
(D) é impossível que a média da população seja superior a R$223,52. 
(E) se o grau de confiança utilizado foi de 95%, então o tamanho da amostra foi 36. 
Memória de Cálculo: 
 Média = 200 
 Desvio-padrão = 72 
 Limite inferior 176,48 
Cálculo: 
Fazendo a prova real: 
ε = x − Z
σ
√n
= 200 − 1,96
72
√36
= 176,48 
 
Resposta: É correto concluir que se o grau de confiança for 95% o tamanho da amostra é 36. 
 
18. (PS 2012.1) Em uma pesquisa realizada com o objetivo de estimar se a renda média de 
agricultores aumentou a partir da implantação de uma determinada política pública, coletaram-se dados 
de uma amostra de 5000 agricultores. Com um grau de confiança de 95%, chegou-se ao seguinte 
intervalo de confiança para a diferença de renda média dos agricultores que foram beneficiados pela 
política e os que não foram: [50,4; 76,6]. Dessa forma, entende-se que: 
 
(A) com 95% de confiança, a renda média da população de agricultores após a implementação da 
política pública está entre R$50,4 e R$76,6. 
(B) 95% da população de agricultores alcançaram, após a implementação da política pública, uma 
renda média entre R$50,4 e R$76,6. 
(C) com 95% de confiança, a renda média da amostra de agricultores após a implementação da política 
pública está entre R$50,4e R$76,6. 
(D) 95% da amostra de agricultores alcançaram, após a implementação da política pública, uma rendamédia entre R$50,4 e R$76,6. 
(E) com 95% de confiança, a diferença de renda média da população de agricultores que foram 
beneficiados pela política pública e aqueles que não foram está entre R$50,4 e R$76,6. 
 
Memória de Cálculo: 
 n= 5.000 
 Desvio-padrão = 72 
 Grau de confiança =95% =1,96 
Resposta: O enunciado diz que com um grau de confiança de 95% o intervalo de confiança para a 
diferença de renda média dos agricultores que foram beneficiados pela política e os que não foram é de 
[50,4; 76,6]. 
 
19. (P2 2014.2) Assinale a alternativa que contém a correta interpretação de um intervalo de confiança 
para a média de uma população, considerando um grau de confiança de 95%. 
(A) Com um determinado grau de confiança, o valor da média amostral estará entre -3 e 3 desvios-
padrões. 
(B) Se um número grande de intervalos for construído, com base em amostragem aleatória de 100 
observações, então 95% deles irão conter o valor da média populacional. 
(C) Com uma determinada variância, o valor da média amostral estará entre os limites inferior e 
superior do intervalo de confiança. 
(D) Com um determinado coeficiente de determinação, o valor da média amostral estará entre -3 e 3 
desvios padrões. 
(E) Com uma determinada margem de erro, o valor da média amostral estará entre o primeiro quartil e 
terceiro quartil da distribuição. 
 
Resposta: A porcentagem é um número decimal multiplicado por 100, portanto se uma amostra 100 
com o grau de confiança de 95% então 95% terão o valor da média populacional. 
 
20. (PS 2016.1) Uma determinada empresa realizou uma pesquisa de mercado em um hipermercado a 
fim de apresentar uma conclusão sobre o gasto médio familiar da população da cidade A com produtos 
alimentícios no mês. Os dados foram obtidos a partir de uma amostra de 121 clientes, apresentando 
média de R$1.081,00 e desvio-padrão de R$112,00. Supondo um nível de significância de 5%, conclui-
se que o intervalo de confiança é de: 
(A) 𝐼𝐶 (μ; 95%) = 1193,00 ± 1,9600 (10,22). 
(B)𝐼𝐶 (μ; 95%) = 1081,00 ± 1,658 (10,18). 
(C) 𝐼𝐶 (μ; 95%) = 1081,00 ± 1,980 (10,22). 
(D) 𝐼𝐶 (μ; 95%) = 1081,00 ± 1,658 (10,22). 
(E) 𝐼𝐶 (μ; 95%) = 1081,00 ± 1,980 (10,18). 
Memória de Cálculo: 
 n= 121 
 Média = 1.081 
 Desvio-padrão = 112 
 Significância 5%= valor de confiança 95% 
Cálculo: 
ε = x ± Z
σ
√n
= 1.081 ± 1,96
112
√121
= 1.081 ± 1,96(10,18) 
Resposta: O intervalo de confiança é 𝐼𝐶 (μ; 95%) = 1081,00 ± 1,980 (10,18). 
 
 
21. (PS 2014.1) No Brasil, o custo elevado da assistência médica é uma questão de grande 
importância para um grande número de famílias. Uma amostra de 25 famílias, selecionadas 
aleatoriamente a partir de uma área, mostrou que essas famílias gastam em média R$ 143,00 por mês 
com assistência médica. Além disso, o desvio padrão amostral foi de R$ 28,00.O intervalo de confiança 
de 95% para a média aritmética dos gastos mensais com assistência médica incorridos por todas as 
famílias nessa área é: 
(A) R$ 131,44 até R$ 154,55 
(B) R$ 125,05 até R$ 179,05 
(C) R$ 145,04 até R$ 173,47 
(D) R$ 65,04 até R$ 89,75 
(E) R$ 36,73 até R$ 198,75 
Memória de Cálculo: 
 n= 25 
 Média = 143 
 Desvio-padrão = 28 
 Valor de confiança 95%=1,96 
Cálculo: 
ε = x + Z
σ
√n
= 143 + 1,96
28
√25
≅ 154 
ε = x − Z
σ
√n
= 143 − 1,96
28
√25
≅ 132 
 
Resposta: O intervalo de confiança é R$131,44 ; R$154,55 
22. (PS 2008.2) Foi selecionada, ao acaso, dentre a quantidade de mercadorias entregues dentro do 
prazo, uma amostra de 25 mercadorias. Essa amostra forneceu média x = 350 com variância s2 = 900. 
O intervalo de confiança de 95% para a média da população de todas as mercadorias entregues dentro 
do prazo é, aproximadamente: 
(A) ICμ = (337,62; 362,38). 
(B) ICμ = (327,62; 371,38). 
(C) ICμ = (347,62; 381,38). 
(D) ICμ = (357,62; 391,38). 
(E) ICμ = (332,62; 356,38). 
Memória de Cálculo: 
 n= 25 
 Média = 350 
 Desvio-padrão = 30 
 Valor de confiança 95%=1,96 
Cálculo: 
ε = x + Z
σ
√n
= 350 + 1,96
30
√25
≅ 361,76 
ε = x − Z
σ
√n
= 350 − 1,96
30
√25
≅ 338,24 
 
Resposta: O intervalo de confiança é 337,62 ; 362,38 
 
23. (PS 2016.1) Seja uma amostra {9, 8, 12, 7, 9, 6, 11, 10, 9} extraída de uma população normal. Qual 
o intervalo de confiança para a média ao nível de 95%? 
(A) [3,17; 9,11]. 
(B) [7,30; 10,20]. 
(C) [7,57; 10,43]. 
(D) [7,23; 10,05] 
(E) [6,27; 8,13]. 
Memória de Cálculo: 
 n= 9 
 Média = 9 
 Desvio-padrão = 1,87 
 Valor de confiança 95%=1,96 
 
 
Cálculo: 
ε = x + Z
σ
√n
= 9 + 1,96
1,87
√9
≅ 10,22 
ε = x − Z
σ
√n
= 9 + 1,96
1,87
√9
≅ 7,77 
 
 
 
Resposta: O intervalo de confiança 7,57; 10,22 
 
24. (PS 2010.1) Uma concessionária de veículos deseja estimar o valor médio pago por proprietários 
de veículos novos, quando da primeira revisão de seus veículos. Uma amostra aleatória de 10 veículos 
novos acusou um valor médio de R$ 850 e um desvio padrão de R$ 250, para a primeira revisão. 
Considerando que esses valores têm distribuição normal, a estimativa do intervalo de confiança com 
99% para a média populacional será aproximadamente igual a: 
(A) (550,50; 1200,30) 
(B) (593,05; 1106,95) 
(C) (450,50; 1300,30) 
(D) (520,50; 900,30) 
(E) (500,50; 1000,30) 
Memória de Cálculo: 
 n= 10 
 Média = 850 
 Desvio-padrão = 250 
 Valor de confiança 99%= 
Cálculo: 
 
ε = x + Z
σ
√n
= 850 + 3,250
250
√10
≅ 1.106,93 
ε = x − Z
σ
√n
= 850 − 3,250
250
√10
≅ 593,06 
 
Resposta: O intervalo de confiança é 593,06;1.106,93 
 
 
26. (PS 2010.1) A fim de verificar se os postos de gasolina de uma cidade estavam cobrando valores 
aproximados sobre o litro da gasolina, um fiscal tomou uma amostra de 10 postos, obtendo um valor 
médio de R$ 2,55 e desvio padrão de R$ 0,146 por litro. Utilizando um nível de confiança de 99%, o 
intervalo de confiança para o valor médio do litro de gasolina para a cidade, em reais, é: 
(A) (2,28; 2,82) 
(B) (2,31; 2,79) 
(C) (2,40; 2,70) 
(D) (2,43; 2,67) 
(E) (2,52; 2,58) 
Memória de Cálculo: 
 n= 10 
 Média = 2,55 
 Desvio-padrão = 0,146 
 Valor de confiança 99%=2,32 
Cálculo: 
ε = x + Z
σ
√n
= 2,55 + 2,32
0,146
√10
≅ 2,66 
ε = x − Z
σ
√n
= 2,55 − 2,32
0,146
√10
≅ 2,4 
Resposta: O intervalo de confiança é 2,4 ; 2,7 
 
27. (PS 2010.2) Numa pesquisa sobre aproveitamento médio nas disciplinas de um curso de 
graduação em Administração de Empresas, foram calculados os estimadores da população, a variância 
e a média por meio do processo de Esperança Matemática (média probabilística ou média ponderada 
pela probabilidade) a partir de uma amostra de 25 alunos. De posse dessas duas estatísticas e 
considerando que o aproveitamento nas disciplinas seja uma variável aleatória normalmente 
distribuída, um analista que desejar construir um intervalo de confiança para a média populacional do 
aproveitamento médio deverá, necessariamente, utilizar: 
(A) a tabela T-Student, pois o tamanho da amostra é menor que 30. 
(B) a tabela T-Student, pois não se conhece o desvio padrão. 
(C) a tabela Z (Normal), pois a variância populacional é conhecida e a população é normalmente 
distribuída. 
(D) a tabela T-Student, pois a média populacional só pode ser estimada por meio dela. 
(E) a tabela Z (Normal), pois a média populacional só pode ser estimada por meio dela. 
Resposta: Antes de usar a Tabela T, tem que verificar se n<30, se o desvio-padrão é desconhecido e 
se a população é aproximadamente normal. E a variância torna uma estimativa melhor. Portanto a 
alternativa que corresponde é a C. 
 
28. (PS 2010.2) Considere que um analista queira estimar um parâmetro populacional ou testá-lo a 
partir de uma amostra de tamanho “n” retirada dessa população. Nesse caso, ele deverá utilizar: 
(A) a tabela Z (Normal) toda vez que “n” for menor que 30 elementos e a variância populacional for 
desconhecida. 
(B) a tabela T-Student toda vez que “n”for maior que 30 elementos e a variância populacional for 
conhecida. 
(C) a tabela T-Student toda vez que “n” for menor que 30 elementos e a variância populacional for 
conhecida. 
(D) a tabela Z (Normal) toda vez que “n” for menor que 30 elementos, a variância populacional for 
conhecida e a população normalmente distribuída. 
(E) a tabela T-Student ou a tabela Z (Normal), indiferentemente, se “n” for maior que 30 elementos. 
Resposta: Tem que verificar se n<30, se o desvio-padrão é desconhecido e/ ou a variância conhecida 
e se a população é aproximadamente normal. 
 
29. (PS 2014.1) Com relação à distribuição normal e à distribuição t de Student, pode-se afirmar que: 
(A) a distribuição t é construída a partir de uma amostra menor que a distribuição normal. 
(B) as distribuições t e normal não podem ser utilizadas para variáveis independentes. 
(C) a distribuição t não está distribuída simetricamente em torno da média, enquanto a distribuição 
normal tem tal característica. 
(D) a distribuição t é construída a partir da variância amostral. 
(E) as distribuições t e normal não são diferentes. 
Resposta: À medida que crescem o tamanho da amostra e os graus de liberdade, S (amostral) passa 
a ser uma melhor estimativa para σ, e a distribuição t gradualmente se aproxima da distribuição normal 
padronizada, até que as duas passem a ser praticamente idênticas. 
 
 
30. (PS 2010.2) Suponha que um fabricante de calçados queira realizar uma pesquisa sobre o gasto 
mensal com sapatos realizado por famílias da classe média de determinada cidade. A confiança 
desejada é de 95% e o erro máximo suportado na estimação do gasto mensal com sapatos é de R$ 
10,00. Considerando que esse fabricante sabe, por pesquisas anteriores, que o desvio padrão do gasto 
mensal com sapatos é de R$ 40,00, o tamanho da amostra para a realização da pesquisa deverá ser 
de: 
(A) 60 
(B) 62 
(C) 50 
(D) 70 
(E) 40 
Memória de Cálculo: 
 Desvio-padrão = 40 
 Variância=1.600 
 Erro = 10 
 Valor de confiança 95%=1,96 
Cálculo: 
𝑛 = (
𝑍. 𝜎
ε
)
2
= (
1,96 𝑥 40
10
)
2
≅ 62 
Resposta: O tamanho da amostra é 62. 
 
31. (PS 2008.1) Uma professora de Estatística resolveu escrever um artigo e para isso deve calcular o 
tempo médio de horas dormidas por seus alunos e os demais alunos da universidade onde trabalha. 
Como o total de alunos é 5.590, ela tomará uma amostra aleatória de n alunos. Devido à experiência 
que possui, a professora está supondo um erro máximo de estimativa de = 0,7 hora e um desvio-
padrão de 2,3 horas. Considerando que a variável de estudo é normalmente distribuída, quantos alunos 
(n) ela deverá pesquisar, dado que o nível de significância desejado é de 0,05? 
(A) n = 40 alunos. 
(B) n = 42 alunos. 
(C) n = 38 alunos. 
(D) n = 44 alunos. 
(E) n = 46 alunos. 
Memória de Cálculo: 
 Média = 2,55 
 Erro = 0,7 
 Desvio-padrão = 2,3 
 Significância= 0,05 = 0,95 = 1,96 
Cálculo: 
𝑛 = (
𝑍. 𝜎
ε
)
2
= (
1,96 𝑥 2,3
0,7
)
2
≅ 42 
Resposta: O tamanho da amostra é 42. 
 
32. (PS 2012.2) Uma pesquisa é planejada para determinar o valor de venda de um novo 
empreendimento. Para isso, é preciso conhecer qual a renda média do público-alvo. A gerência da 
empresa deseja ter 95% de confiança de que a média da amostra está no máximo com uma margem 
de erro +/- $ 100 da média real da renda da população. Um estudo-piloto indica que o desvio padrão é 
$ 3.061,23. Qual o tamanho da amostra necessário? 
(A) 36. 
(B) 3.600. 
(C) 6.000. 
(D) 2.520. 
(E) 60. 
Memória de Cálculo: 
 Erro = 100 
 Desvio-padrão = 3.061,23 
 Confiança= 95%=1,96 
Cálculo: 
𝑛 = (
𝑍. 𝜎
ε
)
2
= (
1,96 𝑥 3.061,23
100
)
2
≅ 3.600 
Resposta: O tamanho da amostra é 3.600. 
 
33. (P2 2010.2) Numa pesquisa sobre retornos de capital, uma amostra de ativos financeiros revelou 
desvio padrão de 1,54 pontos percentuais, e com esse valor foi estimado um intervalo de confiança 
com 95% de certeza e um erro padrão de estimativa de 0,3 pontos percentuais. Se o analista desejar 
que o erro padrão dessa estimativa decresça para 0,2 pontos percentuais, supondo que a população 
de ativos seja infinita, ele deverá aumentar o tamanho da amostra de ativos financeiros para: 
(A) 228 ativos. 
(B) 248 ativos. 
(C) 540 ativos. 
(D) 76 ativos. 
(E) 46 ativos. 
Memória de Cálculo: 
 Erro = 0,2 
 Desvio-padrão = 1,54 
 Confiança= 95$ = 1,96 
Cálculo: 
𝑛 = (
𝑍. 𝜎
ε
)
2
= (
1,96 𝑥 1,54
0,2
)
2
≅ 228 
Resposta: O tamanho da amostra deverá ser de 228. 
 
34. (P2 2010.2) Considerando as solicitações domiciliares de pizzas, é necessário reduzirmos pela 
metade a amplitude da estimativa intervalar, que atualmente é de 24min a 26min, a uma confiança de 
98% e um desvio padrão de 10% da média atual. Nesse caso, a quantidade de solicitações domiciliares 
de pizzas a serem investigadas é: 
(A) 34 
(B) 36 
(C) 126 
(D) 136 
(E) 116 
Memória de Cálculo: 
 Média = 20 === 24min a 26min 
 Erro = 2 
 Desvio-padrão = 10 
 Confiança=98%=2,32 
Cálculo: 
𝑛 = (
𝑍. 𝜎
ε
)
2
= (
2,32 𝑥 10
2
)
2
≅ 135 
 
Resposta: A quantidade de solicitações domiciliares de pizzas a serem investigadas é 136. 
 
35. (PS 2018.2) Uma amostra de 35 elementos foi coletada com o intuito de construir um intervalo de 
confiança para a média de uma variável em uma população. O desvio-padrão dessa variável na 
população é 0,2kg. Sabendo que a média amostral encontrada foi de 2,1kg, o intervalo de confiança 
com 95% de confiança é: 
(A) 2,04 < x < 2,16. 
(B) 2,03 < x < 2,17. 
(C) 1,98 < x < 2,02. 
(D) 1,95 < x < 2,05. 
(E) 2 < x < 3. 
Memória de Cálculo: 
 n= 35 
 Média = 2,1 
 Desvio-padrão = 0,2 
 Grau de confiança = 95% =1,96 
Cálculo: 
ε = x + Z
σ
√n
= 2,1 + 1,96
0,2
√35
≅ 2,17 
ε = x − Z
σ
√n
= 2,1 − 2,32
0,2
√35
≅ 2,03 
Resposta: O intervalo de confiança é 2,03 ; 2,17. 
 
36. (PS 2014.2) Em uma pesquisa que teve por objetivo investigar as intenções de voto no candidato A 
e B para o segundo turno da eleição da Presidência da República, a margem de erro foi de 5%. Se 
esse instituto desejar reduzir a margem de erro dessa pesquisa, deverá: 
(A) aumentar o tamanho da amostra. 
(B) aumentar o nível de confiança da pesquisa. 
(C) reduzir o nível de significância da pesquisa. 
(D) diminuir a proporção encontrada na amostra. 
(E) aumentar a proporção encontrada na amostra. 
Resposta: Quanto maior a amostra menor o erro, e quanto menor a amostra maior o erro. 
37. (ENADE 2008) Uma empresa realizou uma avaliação de desempenho de um sistema web. Nessa 
avaliação, foram determinados o desvio padrão e a média do tempo de resposta do referido sistema, 
tendo como base 10 consultas realizadas. Constatou-se que o tempo de resposta do sistema web 
possui distribuição normal. Para um nível de confiança de 95%, identificou-se o intervalo de confiança 
para a média do tempo de resposta das consultas. Com relação a essa avaliação de desempenho, 
julgue os itens abaixo. 
I- Com a medição do tempo de resposta do sistema para 10 consultas adicionais, é possível que a 
média e o desvio padrão do tempo de resposta para o conjunto das 20 consultas aumente ou 
diminua. 
II- Com a medição do tempo de resposta do sistema para 15 consultas adicionais, com nível de 
confiança de 95%, o intervalo de confiança para o conjunto das 25 consultas é maior que o intervalo 
de confiança para o conjunto das 10 consultas iniciais. 
III- Na medição do tempo de resposta das 10 consultas iniciais, o intervalo de confiança com nível de 
confiança de 99% é maior que o intervalo de confiança com nível de confiança de 95%. 
Assinale a opção correta: 
(A) Apenas um item está certo. 
(B) Apenas os itens I e II estão certos. 
(C) Apenas os itens I e III estão certos. 
(D) Apenas os itens II e III estão certos. 
(E) Todos os itens estão certos. 
Resposta: 
A alternativa I está correta, pois aumentou a amostra, e consequentementeo intervalo de confiança irá 
aumentar e diminuir proporcionalmente. 
A alternativa II está incorreta pois a amostra é maior, portanto o intervalo de confiança será menor. 
A alternativa III está correta, pois o nível de confiança é maior. 
38. (ENADE 2012) Pesquisa realizada pelo Instituto X em todo o território nacional objetivou identificar 
quantos consumidores brasileiros utilizam e realizam compras pela Internet. A pesquisa ouviu 2 mil 
consumidores em todo o país, com margem de erro de 2,2 pontos percentuais para mais ou para 
menos. O universo dessa pesquisa foi representado por amostras estratificadas de forma proporcional 
à população de cada unidade da federação. As pessoas entrevistadas foram selecionadas com base 
em cotas proporcionais, segundo as seguintes variáveis: população economicamente ativa, faixa etária 
e localização. Com base nessas informações, avalie as afirmações a seguir. 
I. O universo da pesquisa foi de 2 mil consumidores. 
II. O objetivo das cotas foi garantir a representatividade do universo estudado. 
III. A margem de erro diminuiria se a pesquisa tivesse entrevistado 5 mil consumidores. 
IV. As entrevistas foram realizadas com a mesma quantidade de consumidores em cada estado. 
É correto apenas o que se afirma em: 
(A) I e II. 
(B) I e IV. 
(C) II e III. 
(D) I, III e IV. 
(E) II, III e IV. 
Resposta: 
A alternativa I está incorreta, pois 2 mil é a amostra a populacional seria o todos os consumidores do 
país. 
A alternativa II está incorreta, pois fizeram é uma amostra estratificada. 
A alternativa III está correta, pois maior a amostra menor a margem de erro. 
A alternativa IV está incorreta, pois não há informações suficientes para essa afirmação, e é difícil 
terem a quantidades iguais dos consumidores em diferentes estados. 
FUNDAMENTOS DOS TESTES DE HIPÓTESES 
1. (PS 2008.2) Se quisermos realizar um estudo para decidir se o valor esperado da espessura de uma 
peça produzida por uma determinada máquina mudou, sendo necessário fazer uma parada de 
manutenção, e outro estudo para verificar se a proporção de itens defeituosos diminuiu, devemos 
realizar testes de hipóteses, respectivamente: 
 
(A) unilateral inferior e bilateral. 
(B) bilateral e unilateral inferior. 
(C) unilateral inferior e unilateral superior. 
(D) unilateral superior e unilateral inferior. 
(E) bilateral e unilateral superior. 
Resposta: Os testes bilaterais ou bicaudal tem como primazia: 
{
 
 
 
Portanto como a espessura de uma peça produzida mudou, ela ficou diferente a média anterior. Já o 
segundo estudo temos testes unilateral inferior, tendo como característica: 
 
{
 
 
 
Como ele quer saber se a proporção de itens defeituosos diminuiu portanto torna inferior (menor). 
 
2. (P2 2012.2) Uma companhia de seguros iniciará uma campanha extensa de propaganda para 
vender apólices de seguro de vida, caso verifique que a quantia média segurada por família é inferior a 
R$ 10.000,00. Com base no enunciado, quais seriam as hipóteses nula (H0) e alternativa (Ha) deste 
teste de hipótese? 
 
(A) H0 : μ ≥ R$ 10.000; Ha : μ < R$ 10.000 
(B) H0 : μ ≤ R$ 10.000; Ha : μ < R$ 10.000 
(C) H0 : μ ≥ R$ 10.000; Ha : μ > R$ 10.000 
(D) H0 : μ ≥ R$ 10.000; Ha : μ ≠ R$ 10.000 
(E) H0 : μ = R$ 10.000; Ha : μ ≠ R$ 10.000 
 
Memória de Cálculo: 
 
{
 
 
 
{
 
 
 
 
Resposta: As hipóteses nula (H0) e alternativa (Ha) deste teste de hipótese H0 : μ ≥ R$ 10.000; Ha : μ 
< R$ 10.000. 
 
3. (PS 2014.2) Num tribunal, partimos do pressuposto de que um réu é considerado inocente até que 
se prove o contrário. Baseando-se nessa ideia, o veredito pode: 
I. Inocentar um réu, se o mesmo é culpado, ou seja, cometer um erro do tipo I. 
II. Declarar culpado um réu, se o mesmo é inocente, ou seja, cometer um erro do tipo I. 
III. Inocentar um réu, se o mesmo é culpado, ou seja, cometer um erro do tipo II. 
IV. Declarar culpado um réu, se o mesmo é inocente, ou seja, cometer um erro do tipo II. 
Dessa forma, serão VERDADEIROS somente os itens: 
 
(A) I e II. 
(B) I e III. 
(C) II e III. 
(D) II e IV. 
(E) III e IV. 
Memória de Cálculo: 
 
I. Esta errada pois o Erro tipo 1 ocorre se você rejeita a hipótese nula ( ele é culpado), quando ela é 
verdadeira e não deve ser rejeitada. Portanto ele é culpado e não pode ser inocentado seria um erro do 
tipo 2. 
II. Esta correta, pois o Erro do tipo 1 ocorre se você rejeita a hipótese nula (ele é inocente), quando ela 
é verdadeira e não deve ser rejeitada. Portanto ele é inocente e não pode ser culpado 
III. Está correta, pois o Erro tipo 2 ocorre se você não rejeita a hipótese nula (ele ser inocente), quando 
ela é falsa e deve ser rejeitada. Portanto ele é culpado e não pode ser inocentado 
IV. Esta correta, pois será Erro do tipo 2. 
 
Resposta: serão VERDADEIROS somente os itens II e IV. 
 
4. (P2 2010.1) Qual das alternativas corresponde à definição do Erro Tipo II? 
 
(A) Erro cometido quando se rejeita H0 e ela é verdadeira. 
(B) Erro cometido quando se aceita H0 e ela é verdadeira. 
(C) Erro cometido quando se rejeita H1 e ela é falsa. 
(D) Erro cometido quando se aceita H0 e ela é falsa. 
(E) Erro cometido quando se aceita H1 e ela é verdadeira. 
Resposta: ocorre se você não rejeita a hipótese nula (H0), quando ela é falsa e deve ser rejeitada. 
 
5. (PS 2012.2) É INCORRETO afirmar que o ERRO TIPO II, presente nos testes de hipóteses: 
 
(A) tem probabilidade representada pela letra grega beta. 
(B) torna-se mais provável quanto menos provável for o ERRO TIPO I. 
(C) ocorre quando não rejeitamos a hipótese nula sendo ela de fato falsa. 
(D) ocorre quando rejeitamos a hipótese nula sendo ela de fato verdadeira. 
(E) este tipo de erro diminui com o aumento do tamanho da amostra. 
Resposta: O erro do tipo 1 é o que está destacado que ocorre quando rejeitamos a hipótese nula 
sendo ela de fato verdadeira. 
 
6. (FGV OS 2008.01) Uma empresa brasileira afirma que o faturamento médio de uma de suas filiais 
sediadas na região Sul é de 230 mil reais e a distribuição normal. O desvio–padrão do faturamento e 
todas as empresas da região é igual a 30 mil reais. Uma análise dos dados de uma amostra de 16 
empresas encontrou um faturamento médio igual a R$195.000,00. Deve-se testar se a média desse 
faturamento é inferior a 230 mil reais. As hipóteses a serem testadas são: 
{
 
 
 
O valor calculado da estatística de teste é: 
(A) 4,67 
(B) 0,46 
(C) -4,67 
(D) -1,17 
(E) 0,04 
Memória de Cálculo: 
 Média = 195.000,000 
 Desvio-padrão = 30.000 
 Amostra (n) = 16 
 
Cálculo: 
 
 
√ 
 
 
√ 
 
 
 
 
 
 
 
Resposta: O valor calculado da estatística de teste é -4,67.
7. (PS 2012.2) Uma empresa de liga de materiais está estudando a possibilidade de uso de uma 
nova liga de níquel-cromo-ferro. O objetivo é obter um metal forte o suficiente para satisfazer as 
especificações do consumidor de uma nova máquina que faz estampas. As especificações 
requerem que o número médio de ciclos antes de uma falha, μ, obtido nos testes de vibração, 
exceda 500.000. A partir de testes prévios com outros materiais, sabe-se que o desvio-padrão na 
resistência está em torno de 50.000 ciclos antes de uma falha. Foi realizado teste de resistência 
em 100 peças feitas com este material. A média da amostra calculada a partir de dados 
experimentais foi igual a 519.500 ciclos antes de uma falha. 
Nesse caso, qual o valor observado do teste? 
 
(A) Valor z observado do teste é 3,90. 
(B) Valor z observado do teste é 2,40. 
(C) Valor z observado do teste é 2,33. 
(D) Valor z observado do teste é 1,96. 
(E) Valor z observado do teste é 1,64. 
Memória de Cálculo: 
 Média = 519.500,00 
 Desvio-padrão = 50.000 
 Amostra (n) = 100 
 
Cálculo: 
 
 
√ 
 
 
√ 
 
 
 
 
 
 
 
Resposta: O valor calculado da estatística de testeé 3,9 (positivo) pois fala exceder que é na 
parte superior da curva Z. 
 
8. (PS 2014.2) Uma amostra aleatória contendo 64 lâmpadas indicou uma média de 350 horas 
para a vida útil da amostra e desvio padrão de 100 horas. Considerando um nível de 
significância de 5%, existem evidências de que a média populacional da vida útil seja diferente 
de 375 horas? 
 
(A) Não, uma vez que o Z observado = 2,00 > Z crítico = -1,96, logo não se rejeita a hipótese 
nula. 
(B) Não, uma vez que o Z observado = - 2,00 < Z crítico = 1,96; logo não se rejeita a hipótese 
nula. 
(C) Sim, uma vez que o Z observado = - 2,00 < Z crítico = -1,96; logo se rejeita a hipótese nula. 
(D) Sim, uma vez que o Z observado = -2,50 < Z crítico = -1,68, logo se rejeita a hipótese nula. 
(E) Não, uma vez que o Z observado = -2,50 > Z crítico -1,96, logo não se rejeita a hipótese nula. 
 
Memória de Cálculo: 
 Média = 350h 
 Desvio-padrão = 10h 
 Amostra (n) = 64 
 Nível de significância = 5% =95% confiança= 1,96 
 Média populacional= 375h 
 
Cálculo: 
 
 
√ 
 
 
√ 
 
 
 
 
 
 
 
Resposta: Sim, uma vez que o Z observado = - 2,00 < Z crítico = -1,96; logo se rejeita a 
hipótese nula. 
 
9. (PS 2008.1) Em um teste vocacional, a distribuição das notas dos candidatos é normalmente 
distribuída com média 160 pontos e desvio-padrão de 30 pontos. Uma nova turma de 49 
candidatos apresentou uma média igual a 140 pontos. Ao nível de 5% de significância, teste se a 
nova turma tem desempenho inferior e assinale a alternativa correta. 
 
(A) Rejeita-se H0 e considera-se que a nova turma tem desempenho inferior. 
(B) Aceita-se H0 e considera-se que a nova turma tem desempenho inferior. 
(C) Rejeita-se H0 e considera-se que a nova turma tem desempenho superior. 
(D) Aceita-se H0 e considera-se que a nova turma tem desempenho superior. 
(E) Rejeita-se H0 e H1 e considera-se que a nova turma tem desempenho inferior. 
Memória de Cálculo: 
 Média = 160 
 Desvio-padrão = 30 
 Amostra (n) = 49 
 Nível de significância = 5% =95% confiança= 1,96 
 Média populacional= 140 
 
Cálculo: 
 
 
√ 
 
 
√ 
 
 
 
 
 
 
 
 
Resposta: Rejeitar H0 se ZESTAT > + 1,96 === ZESTAT 4,67 > + 1,96, portanto rejeita H0 
 
 0 
1,96 
4,67 
10. (PS 2016.1) A indústria TML avaliou a vida média de 100 televisores em 1.570 dias, com 
desvio-padrão de 120 dias. Sabe-se que a duração dos televisores dessa indústria tem 
distribuição normal com média de 1.600 dias. Ao testar se houve alteração, com um nível de 
significância de 5% na duração média dos televisores, é correto recomendar: 
 
(A) não se rejeita H0 ao nível de significância de 5%. 
(B) a amostra é insuficiente para uma conclusão estatisticamente significativa. 
(C) rejeita-se H0 ao nível de significância de 5%. 
(D) rejeita-se H1 ao nível de significância de 5%. 
(E) não é possível aplicar esse teste por falta de dados. 
Memória de Cálculo: 
 Média = 1.570 
 Desvio-padrão = 120 
 Amostra (n) = 100 
 Nível de significância = 5% =95% confiança= 1,96 
 Média populacional= 1.600 
 
Cálculo: 
 
 
√ 
 
 
√ 
 
 
 
 
 
 
 
 
Resposta: Rejeitar H0 se ZESTAT > + 1,96 === ZESTAT 2,5 > + 1,96, portanto rejeita H0 ao nível 
de significância de 5%. 
 
 
 0 
1,96 
2,5 
11 (PS 2012.2) Na indústria cerâmica, avalia-se sistematicamente a resistência de amostras de 
massas cerâmicas, após o processo de queima. Dessas avaliações, sabe-se que certo tipo de 
massa tem resistência mecânica aproximadamente normal, com média 53 MPa e variância 16 
MPa2. Após a troca de alguns fornecedores de matérias-primas, deseja-se verificar se houve 
alteração na qualidade. Uma amostra de 15 corpos de prova de massa cerâmica acusou média 
igual a 50 MPa. Qual é a conclusão ao nível de significância de 5%? 
(A) Como consequência do resultado de teste estatístico, há evidência de redução na resistência 
média da massa cerâmica. 
(B) Como consequência do resultado de teste estatístico, não há evidencia de redução na 
resistência média da massa cerâmica. 
(C) Usando a tabela normal padrão, encontramos área na cauda superior igual a 0,019. Logo, há 
evidencia de redução na resistência média da massa cerâmica. 
(D) Não podemos realizar um teste de hipótese com esses dados. 
(E) Como consequência do resultado de teste estatístico, provamos heterocedasticidade nas 
amostras testadas. 
 
Memória de Cálculo: 
 Média = 53 
 Desvio-padrão = 4 
 Amostra (n) = 15 
 Nível de significância = 5% =95% confiança= 1,96 
 Média populacional= 50 
 
Cálculo: 
 
 
√ 
 
 
√ 
 
 
 
 
 
 
 
 
Resposta: Rejeitar H0 se ZESTAT > + 1,96 === ZESTAT 2,9 > + 1,96, portanto rejeita H0 ao nível 
de significância de 5%. Portanto houve uma redução de 53 para 50, rejeita H0. 
 
 0 
1,96 
2,9 
12. (PS 2010.1) Um laboratório que fabrica comprimidos analgésicos anuncia que seu remédio 
para dor de cabeça leva em média 10 minutos para aliviar a dor, com desvio padrão de 3 
minutos. Um médico sustenta que o tempo é maior e seleciona aleatoriamente 25 pacientes. 
Pede a eles que tomem tais comprimidos quando tiverem dor de cabeça, anotando o tempo (em 
minutos) até o alívio da dor. Após a coleta de todas as respostas, ele verifica um tempo médio de 
alívio da dor de 13 minutos. Admitindo a distribuição normal dos tempos, para um nível de 
significância de 5%, assinale a alternativa correta. 
 
(A) rejeita-se H0 e o laboratório tem razão. 
(B) aceita-se H0 e o laboratório tem razão. 
(C) rejeita-se H0 e o laboratório não tem razão. 
(D) aceita-se H0 e o laboratório não tem razão. 
(E) rejeita-se H0 e o laboratório realiza outra amostra para aumentar a confiança na inferência. 
Memória de Cálculo: 
 Média = 10 
 Desvio-padrão = 3 
 Amostra (n) = 25 
 Nível de significância = 5% =95% confiança= 1,96 
 Média = 13 
 
Cálculo: 
 
 
√ 
 
 
√ 
 
 
 
 
 
 
 
 
Resposta: Rejeitar H0 se ZESTAT > + 1,96 === ZESTAT 5,00 > + 1,96, portanto rejeita H0 ao nível 
de significância de 5%. Rejeitando a hipótese nula temos que o laboratório não tem razão no seu 
tempo de efeito do remédio. 
 
 0 
1,96 
5,00 
13. (P2 2008.1) Uma grande construtora nacional afirma que seus funcionários recebem um 
salário médio igual a, no mínimo, R$ 1.450,00, com desvio-padrão igual a R$ 700,00. Uma 
amostra com 500 funcionários apresentou uma média de R$ 1.390,00. Considerando que os 
dados são normalmente distribuídos, o que se pode afirmar? 
 
(A) Há evidência suficiente na amostra para rejeitarmos H0 a um nível de significância de 1%. 
(B) Há evidência suficiente na amostra para rejeitarmos H0 a um nível de significância de 5%. 
(C) Não há evidência suficiente na amostra para rejeitarmos H0 a um nível de significância de 
5%. 
(D) Há evidência suficiente na amostra para rejeitarmos H0 a um nível de significância de 2,5%. 
(E) Há evidência suficiente na amostra para rejeitarmos H0 a um nível de significância de 2%. 
Memória de Cálculo: 
 Média = 1.450 
 Desvio-padrão = 700 
 Amostra (n) = 500 
 Nível de significância = 5% =95% confiança= 1,96 
 Média = 1.390 
 
Cálculo: 
 
 
√ 
 
 
√ 
 
 
 
 
 
 
 
0,5 - 0,4750 = 0,025 x 100 = 2,5 % 
0,5 - 0,4719 = 0,0281 x 100 = 2,81% 
Resposta: Rejeitar H0 se ZESTAT > + 1,96 === 2, 81% > 2,5 %, portanto rejeita H0 ao nível de 
significância de 5%. 
 
 0 
1,96 
5,00 
14. (PS 2012.2) Um fornecedor afirma que seu tempo médio de entrega é menor do que 30 
horas. Um estudo com 36 entregas registrou tempo médio de 28,5 horas. Sabe-se que o tempo 
de entrega segue uma distribuição normal com desvio-padrão de 3,5 horas. O valor-p e a 
conclusão para um nível de significância α = 1% são respectivamente: 
 
(A) 2,57; há evidência de que o tempo médio de entrega seja menor que 30 horas. 
(B) 0,0102; há evidência de que o tempo médio de entrega seja menor que 30 horas.(C) 0,0051; há evidência de que o tempo médio de entrega seja menor que 30 horas. 
(D) 0,0102; não há evidência de que o tempo médio de entrega seja menor que 30 horas. 
(E) 0,0051; não há evidência de que o tempo médio de entrega seja menor que 30 horas. 
Memória de Cálculo: 
 Média = 30 
 Desvio-padrão = 3,5 
 Amostra (n) = 36 
 Nível de significância = 1% =99% confiança= 2,57 
 Média = 28,5 
 2,4377 
 
Cálculo: 
 
 
√ 
 
 
√ 
 
 
 
 
 
 
 
0,4949==== Unilateral = 0,50 – 0,4949 = 0,0051 (Valor p) 
 
Z = 2,33 
 
Resposta: Se o valor-p for maior ou igual a α, não rejeitar a hipótese nula; 5,57>2,33. 
 
 
 
 
15. (P2 2012.1) Com relação a testes de hipótese, é correto afirmar que o nível de significância 
de um teste é: 
 
(A) a probabilidade de se cometer o erro tipo I. 
(B) a probabilidade de se cometer o erro tipo II. 
(C) a probabilidade de não se cometer o erro tipo I. 
(D) o mesmo que valor p. 
(E) a probabilidade de não se cometer um erro do tipo II. 
 
Resposta: Probabilidade de vir a cometer um Erro do Tipo 1, representado por alfa, é 
identificado como o nível de significância do teste estatístico . 
 
 
 
 
16. (P2 2016.1) O menor nível de significância a qual se pode rejeitar uma hipótese nula de um 
teste é o: 
 
(A) erro do tipo I. 
(B) nível de significância. 
(C) beta estimado. 
(D) valor-p. 
(E) grau de confiança. 
Resposta: Se o valor-p for menor do que α, rejeitar a hipótese nula. 
 
 
17. (PS 2012.1) Um professor constata que um de seus alunos faltou nas últimas cinco aulas e 
conclui que o aluno deve ter abandonado o curso. Na aula seguinte, porém, o aluno reaparece e 
diz que não havia abandonado o curso, mas que tinha viajado para resolver assuntos familiares. 
Considere que o professor tenha tratado essa situação como um teste estatístico de hipóteses, 
utilizando o número de faltas como base para a estatística de teste. Nesse contexto, é 
INCORRETO afirmar que: 
 
(A) a hipótese nula do professor era que o aluno estava cursando o curso. 
(B) o professor cometeu um erro tipo II. 
(C) se o valor-p do teste for maior do que o nível de significância, então o professor deve concluir 
que o 
aluno continua matriculado no curso. 
(D) no teste realizado pelo professor, a hipótese nula é rejeitada sempre que o número de faltas 
consecutivas 
de um aluno exceder um certo limite. 
(E) a hipótese alternativa do professor era que o aluno havia abandonado o curso. 
Resposta: O Erro tipo 2 ocorre se você não rejeita a hipótese nula (o aluno está cursando o 
curso), quando ela é falsa e deve ser rejeitada. Contudo o erro cometido pelo professor foi o 
erro tipo 1 que ocorre se você rejeita a hipótese nula (o aluno está cursando o curso), quando ela 
é verdadeira e não deve ser rejeitada. Ele não rejeitou. 
 
18. (PS 2012.1) É INCORRETO afirmar que: 
 
(A) o valor p é o menor nível de significância ao qual se pode rejeitar H0 . 
(B) se a hipótese nula foi rejeitada, não é possível cometer um erro do tipo II. 
(C) a probabilidade de cometer um erro tipo II é igual ao nível de significância. 
(D) só é possível cometer um erro do tipo II se H0 não for rejeitada. 
(E) se o valor p é menor que o nível de significância, rejeita-se H0 . 
 
Resposta: A probabilidade e cometer um erro do tipo I é igual ao nível de significância 
 
19. (P2 2012.2) O coordenador de um curso de administração de uma grande universidade do 
Rio de Janeiro quer saber se o Coeficiente de Rendimento Acumulado (CRA) de seus alunos é, 
em média, superior ao CRA dos alunos do curso de administração de uma de suas principais 
concorrentes. Para tal, ele calculou o CRA médio de uma amostra de 100 alunos de seu curso, 
obtendo um valor de 7,8. Ele pretende comparar este valor com o CRA médio de todos os alunos 
do curso de administração de sua principal concorrente, que, segundo informações divulgadas 
em seu site, é de 8,1. Nesse caso, que tipo de teste é mais adequado para se utilizado pelo 
coordenador? 
 
(A) ANOVA. 
(B) Comparação de médias para amostras dependentes. 
(C) Comparação de médias para amostras independentes. 
(D) Teste de Hipóteses para a média de uma população. 
(E) Regressão Linear Simples. 
 
Resposta: O teste de hipóteses é uma técnica que nos permite aceitar ou rejeitar a hipótese 
estatística, a partir dos dados da amostra dessa população, com a média de 8,1 com uma 
amostra de 100 alunos do curso comparando 7,8 de CRA. 
 
 
20. (PS 2018.2) A montadora automotiva Y avaliou se o peso das portas dos carros estava de 
acordo com a especificação. A norma dizia que cada porta deveria pesar 2Kg. Para fazer a 
avaliação, o gerente selecionou 35 portas aleatórias e as pesou, encontrando uma média de 
peso de 2,1Kg. Sabe-se que o desvio padrão do peso das portas é 0,2Kg e o nível de 
significância usado no teste foi 5%. A opção que retrata corretamente o teste de hipótese 
realizado para descobrir se a média da amostra é maior que a suposta média descrita na norma 
é: 
 
(A) Z = 1,64 Ho: rejeita. Z crítico = 2,96 Ha: não rejeita. 
(B) Z = 2,96 Ho: rejeita. Z crítico = 1,64 Ha: não rejeita. 
(C) Z = 1,64 Ho: não rejeita. Z crítico = 2,96 Ha: rejeita. 
(D) Z = 2,96 Ho: não rejeita. Z crítico = 1,64 Ha: rejeita. 
(E) Z = 1,60 Ho: não rejeita. Z crítico = 1,64 Ha: rejeita. 
Memória de Cálculo: 
 Média = 2 Kg 
 Desvio-padrão = 0,2 Kg 
 Amostra (n) = 35 
 Nível de significância = 5% =95% confiança= 1,96 
 Média = 2,1 Kg 
 2,4377 
 
Cálculo: 
 
 
√ 
 
 
√ 
 
 
 
 
 
 
0,5 - 0,05 = 0,45 = 1,64 
 
Resposta: Rejeitar H0 se ZESTAT > + 1,96 === 2,96 > 1,96, portanto rejeita H0 ao nível de 
significância de 5%. 
Não Rejeitar Ha se ZESTAT < 1,96 === 1,64 < 1,96, portanto não rejeita H0 ao nível de 
significância de 5%. 
 
 
TESTE DE HIPÓTESE PARA VARIÁVEL RESPOSTA QUANTITATIVA 
1. (PS 2016.1) O desvio-padrão é a medida mais comum da dispersão estatística representado 
pelo símbolo sigma, σ. Ele mostra o quanto de variação ou “dispersão” existe em relação à 
média. Se no teste de hipóteses for apresentado o desvio-padrão da amostra, o teste mais 
adequado é o: 
(A) Teste t. 
(B) Teste Z. 
(C) Teste de qui-quadrado. 
(D) Teste t ou F. 
(E) Teste F. 
 
Resposta: O teste t para corrigir problemas conectados com amostras de pequeno tamanho. 
Antes de utilizar a distribuição t para construir um intervalo de confiança, deve-se verificar se n < 
30, se σ é desconhecido e se a população é aproximadamente normal. 
 
2. (PS 2016.1) A distribuição t de Student é uma distribuição de probabilidade estatística, 
publicada por um autor que se chamou de Student, pseudônimo de William Sealy Gosset, que 
não podia usar seu nome verdadeiro para publicar trabalhos enquanto trabalhasse para a 
cervejaria Guinness. Sobre essa aplicação, pode-se afirmar que: 
(A) se a população não for distribuída nos moldes da distribuição normal, você ainda pode utilizar 
o teste t para amostras somente com n=10. 
(B) se a população não for distribuída nos moldes da distribuição normal, você ainda pode utilizar 
o teste t caso para qualquer tamanho da amostra. 
(C) se a população não for distribuída nos moldes da distribuição normal, você ainda pode 
utilizar o teste t para amostras somente com n=20. 
(D) se a população não for distribuída nos moldes da distribuição normal, você ainda pode 
utilizar o teste t caso o tamanho da amostra seja grande o suficiente para que o teorema do 
Limite Central possa ser aplicado. 
(E) se a população não for distribuída nos moldes da distribuição normal, você ainda pode utilizar 
o teste t para amostras somente com n=15. 
 
Resposta: À medida que o tamanho da amostra (ou seja, o número de valores em cada uma 
das amostras) vai se tornando grande o suficiente, a distribuição de amostragens da média 
aritmética passa a ser distribuída aproximadamente nos moldes da distribuição normal. Isso é 
verdadeiro independentementedo formato da distribuição dos valores individuais dentro da 
população. Portanto o teste T ainda pode ser feito. 
 
3. (PS 2008.2) Um exame de padrão de inteligência tem sido usado por vários anos com média 
de 80 pontos, sendo os dados normalmente distribuídos. Um grupo de 25 estudantes é 
ensinado, dando-se ênfase à resolução e testes. Se esse grupo obtém média de 83 pontos e 
desvio-padrão de 7 pontos no exame, pode-se concluir que: 
(A) há razões para se acreditar que a ênfase dada mudou o resultado do teste ao nível de 
significância de 1%. 
(B) não há razões para se acreditar que a ênfase dada mudou o resultado do teste ao nível de 
significância de 10%. 
(C) há razões para se acreditar que a ênfase dada mudou o resultado do teste ao nível de 
significância de 5%. 
(D) não há razões para se acreditar que a ênfase dada mudou o resultado do teste ao nível de 
significância de 5%. 
(E) não há razões para se acreditar que a ênfase dada mudou o resultado do teste ao nível de 
significância de 2,5%. 
 
 
Memória de Cálculo: 
 
 Média = 80 
 n= 25 
 Média populacional = 83 
 Desvio Padrão = 7 
 
Prova Real: Z = 5 % de nível de significância = 95% = 1,96 
 
Cálculo: 
 
 
√ 
 
 
√ 
 
 
Resposta: Portanto com o nível de significância de 5% podemos afirmas a alternativa C. 
 
4. (PS 2014.1) Os órgãos ambientais estão levando a sério a fiscalização quanto ao uso de 
agrotóxicos na produção agrícola e estão desconfiados de que a quantidade de inseticidas 
aplicados na lavoura pelos agricultores da região supera a quantidade preconizada de 5 
litros/ha/safra. Para verificar se a suspeita do fiscalizador procede, um grupo de engenheiros 
agrônomos fez um levantamento utilizando a informação de aplicação de inseticidas por 25 
agricultores, selecionados aleatoriamente. Da amostra, forma observados média de 5,5 
litros/ha/safra e desvio padrão de 0,5 litro/ha/safra. Utilizando um nível de significância de 5%, o 
que se pode afirmar a partir do teste de hipótese proposta? 
(A) Rejeita-se H0 ao nível de significância de 5% (tcrítico = 1,7111; tcalculado = 5), ou seja, o 
órgão fiscalizador tem razão em sua desconfiança. 
(B) Não se rejeita H0 ao nível de significância de 5% (tcrítico = 2,064; tcalculado = 3,5), ou seja, o 
órgão fiscalizador tem razão em sua desconfiança. 
(C) Rejeita-se H0 ao nível de significância de 5% (tcrítico = 2,492; tcalculado = 4,5), ou seja, o 
órgão fiscalizador não tem razão em sua desconfiança. 
(D) Rejeita-se H0 ao nível de significância de 5% (tcrítico = 2,797; tcalculado = 5), ou seja, os 
agrônomos têm razão em sua desconfiança. 
(E) Não se rejeita H0 ao nível de significância de 5% (tcrítico = 1,711; tcalculado = 2), ou seja, os 
agrônomos não têm razão em sua desconfiança. 
 
Memória de Cálculo: 
 
 Média = 5 
 n= 25 
 Média populacional = 5,5 
 Desvio Padrão = 0,5 
 Nível de significância 5% = 95% = 1,96 
 
Cálculo: 
 
 
 
√ 
 
 
Resposta: A única alternativa que corresponde ao Tcrítico e Tcalculado é a alternativa A, 
portanto Rejeita-se H0 ao nível de significância de 5% (tcrítico = 1,7111; tcalculado = 5), ou seja, 
o órgão fiscalizador tem razão em sua desconfiança. 
 
 
5. (PS 2010.2) Um estudo sobre o tempo gasto, por dia, por um trabalhador para se deslocar no 
percurso residência-trabalho-residência foi realizado em duas cidades diferentes: A e B. O 
resultado, em minutos, foi o seguinte: 
 
 
Cidade A Cidade B 
Tamanho da amostra 15 12 
Tempo médio gasto 32 28 
Desvio padrão 8 5 
 
Considere que o tempo de deslocamento é uma variável normalmente distribuída. Em relação 
ao tempo gasto para deslocamento no percurso citado na cidade A, aceitando-se 5% de risco, 
podemos rejeitar a hipótese de que o tempo médio gasto no citado percurso seja, no máximo, 
igual a 30 minutos? 
(A) Não, porque a estatística de teste = 1,51 é menor que a estatística crítica = 1,96. 
(B) Não, porque a estatística de teste = 1,96 é maior que a estatística crítica = 1,51. 
(C) Sim, porque a estatística de teste = 1,51 é menor que a estatística crítica = 2,06. 
(D) Não, porque a estatística de teste = 0,97 é menor que a estatística crítica = 1,761. 
(E) Não, porque a estatística de teste = 2,17 é maior que a estatística crítica = 1,96. 
 
Memória de Cálculo: 
 
 n= 15 
 Desvio Padrão = 8 
 Nível de significância 5% = 95% = 1,96 
 
Cálculo: 
 
 
Resposta: A única que tem o Tcrítico correspondendo à 1,7613 é a alternativa D, portanto é a 
alternativa correta. 
 
 
6. (PS 2016.1) Após ser observado um aumento do índice de acidentes em uma determinada 
cidade do estado de São Paulo, o departamento de trânsito iniciou uma pesquisa para verificar a 
velocidade média dos veículos em diferentes locais. Como parte desse trabalho, uma viatura 
policial local procurou estimar a velocidade média (km/h) ao longo de uma avenida principal. 
Com um radar oculto, mediu-se a velocidade de uma amostra aleatória de 30 veículos resultando 
em uma média amostral de 62km/h e desvio-padrão de 4km/h. A placa de sinalização da avenida 
principal alerta aos motoristas que a velocidade máxima permitida é de 60km/h. Considerando 
um grau de significância (confiança) de 99%, essa amostra oferece evidência suficiente para 
concluir que a média da população é superior a 60km/h: 
(A) rejeita-se H0 ao nível de significância de 1% e o intervalo de confiança é de 62 ± 2,739 
(0,730). 
(B) rejeita-se H0, uma vez que no nível de significância de 1% a amostra fornece evidências para 
concluir que a média verdadeira seja superior a 60km/h. 
(C) rejeita-se H0 ao nível de significância de 1% e o intervalo de confiança é de 62 ± 2,750 
(0,730). 
(D) aceita-se H0, uma vez que ao nível de significância de 1% a amostra não fornece evidências 
para concluir que a média verdadeira seja superior a 60km/h. 
(E) rejeita-se H0 ao nível de significância de 1%, não é possível calcular a estatística do teste. 
 
Memória de Cálculo: 
 
 Média = 62 
 n= 30 
 Média populacional = 60 
 Desvio Padrão = 4 
 Nível de significância 1% = 99% = 2,57 
 
Cálculo: 
 
 
 
√ 
 
 
Resposta: Rejeitar H0 se ZESTAT 2,73 > 2,57, a única alternativa que corresponde a rejeição é 
alternativa B, pois a A e C são a mesma e a última diz que não pode ser calculado o teste e isso 
é falso. 
 
7. (PS 2010.2) Uma empresa do ramo farmacêutico deve testar um lote de certo medicamento 
que ultimamente originou queixas de náuseas por parte dos pacientes que o utilizam de forma 
continuada. A especificação padrão sugerida pela OMS (Organização Mundial da Saúde) para 
esse medicamento é que a média do componente “X” por comprimido seja de 4,3 mg. Uma 
amostra de 25 comprimidos foi colhida de certo lote e revelou média de 4,39 mg e desvio padrão 
de 0,23 mg. Supondo que o teste seja conduzido com um nível de significância de 5%, e 
considerando que a estatística de teste tt = 1,96 e a estatística crítica tcr = 1,711, a empresa 
deverá: 
(A) aceitar as queixas dos pacientes e destruir o lote do medicamento. 
(B) rejeitar a queixa dos pacientes e destruir o lote do medicamento. 
(C) aceitar a queixa dos pacientes e não destruir o lote do medicamento. 
(D) rejeitar a queixa dos pacientes e não destruir o lote do medicamento. 
(E) não destruir o lote em nenhuma hipótese. 
 
Memória de Cálculo: 
 Média =4,3 
 n= 25 
 Média populacional = 4,39 
 Desvio Padrão = 0,23 
 Nível de significância 5% = 95% = 1,96 
 
 
Resposta: Tt >Tcr = 1,96 > 1,711, portanto não rejeita Ho, isso se da a aceitação das queixas os 
pacientes e destruir o lote do medicamento. 
 
 
8. (PS 2016.1) Paula seleciona ao acaso 18 funcionários de determinada empresa e mede a taxa 
de batimento cardíaco durante o repouso de cada um deles. A taxa amostral média é de 64 
batimentos cardíacos por minuto, com desvio-padrão amostral de 2,5 batimentospor minuto. 
Supondo que a taxa de batimento cardíaco tenha uma distribuição normal, Paula deveria então 
usar, com 10% de significância, qual cálculo da estatística de teste para a taxa média de 
batimento cardíaco? 
(A) Uma vez que a população é normalmente distribuída e o desvio-padrão populacional é 
desconhecido, deve-se utilizar a estatística de teste z. 
(B) Uma vez que a população é normalmente distribuída e o desvio-padrão populacional é 
desconhecido, deve-se utilizar a estatística de teste F. 
(C) Uma vez que a população é normalmente distribuída e o desvio-padrão populacional é 
conhecido, deve-se utilizar a estatística de teste t. 
(D) Uma vez que a população é normalmente distribuída e o desvio-padrão populacional é 
conhecido, deve-se utilizar a estatística de teste z. 
(E) Uma vez que a população é normalmente distribuída e o desvio-padrão populacional é 
desconhecido, deve-se utilizar a estatística de teste t. 
 
Resposta: Antes de utilizar a distribuição t para construir um intervalo de confiança, deve-se 
verificar se n < 30, se σ é desconhecido e se a população é aproximadamente normal, no 
exercício o n=18 (menor que 30) o desvio padrão populacional desconhecido e a distribuição é 
normal. 
 
 
 
9. (PS 2010.1) Um gerente de banco afirma que, em sua agência, o tempo médio de espera é de 
10 minutos, com desvio padrão de 3 minutos. Uma amostra forneceu média do tempo de espera 
de 12 minutos sendo a estatística p (p-value) igual a 0,0014. Nessas condições, pode-se afirmar 
que, para a condução deste teste ao nível de significância de 5%, utilizou-se a tabela: 
(A) t de Student, e o tamanho da amostra foi de 28 clientes. 
(B) Z (Normal), e o tamanho da amostra foi de 20 clientes. 
(C) t de Student, e o tamanho da amostra foi de 34 clientes. 
(D) Z (Normal), e o tamanho da amostra foi de 42 clientes. 
(E) t de Student, e o tamanho da amostra foi de 42 clientes. 
 
Memória de Cálculo: 
 
 Média = 12 
 n= 30 
 Média populacional = 10 
 Desvio Padrão = 3 
 Nível de significância 5% = 95% = 1,96 
 Erro padrão 
 
Cálculo: 
Prova real: 
 
 
 
√ 
 
 
Resposta: Fazendo a prova real usando a tabela Z (normal) temos que o tamanho da amostra é 
20 a um valor p de 0,0014. 
 
10. (P2 2018.2) Ana é uma estatística e está realizando um teste de hipóteses envolvendo a 
média de uma determinada variável aleatória. Com isso em vista, é correto afirmar que, em 
termos práticos, a distribuição “t” poderá ser aproximada por uma distribuição normal quando o 
tamanho de amostra (n) for: 
(A) ≥10. 
(B) ≥30. 
(C) <30. 
(D) <20 
(E) ≥1. 
 
Resposta: Para valores grandes do tamanho da amostra, n maior ou igual a 30, a distribuição 
das médias amostrais se comporta como uma distribuição normal. 
 
 
TESTE DE HIPÓTESE PARA COMPARAÇÃO DE MÉDIAS DE DUAS POPULAÇÕES COM 
AMOSTRAS INDEPENDENTES E DADOS EMPARELHADOS 
 
1. (P2 2012.1) Se desejamos testar a igualdade de médias de duas populações diferentes com 
um tamanho de amostra pequena e variância populacional desconhecida, deveremos: 
(A) utilizar a distribuição t-student. 
(B) realizar antes um teste para checar a igualdade da variância de duas populações para só 
então decidirmos se poderemos usar a t-student ou não. 
(C) usar a estatística F, mas não a t-student. 
(D) usar a distribuição qui-quadrado. 
(E) usar a distribuição normal padronizada. 
Resposta: Utiliza-se o teste t de variância agrupada para determinar a existência de diferença 
significativa entre as médias aritméticas de duas populações. 
 
2. (P2 2016.1) Um pesquisador está interessado em investigar se existe diferença entre a idade 
média dos egressos do mestrado profissional e mestrado acadêmico no Brasil. O teste 
estatístico que o pesquisador deve utilizar para esse propósito é o: 
(A) Teste de independência. 
(B) Teste de qui-quadrado. 
(C) Teste F. 
(D) Teste Z. 
(E) Teste de hipótese para comparação de médias de duas populações com amostras 
independentes. 
Resposta: Por se tratar de duas populações diferentes esse o mestrado profissional e mestrado 
acadêmico no Brasil, são independentes contudo seu H0 = mestrado profissional = mestrado 
acadêmico no Brasil. 
 
 
3. (PS 2016.1) Os gastos médios com cinema da população do Rio de Janeiro são maiores que 
os da população de São Paulo. Supondo que seja realizado um teste de comparação para 
amostras independentes, as hipóteses nula e alternativa são respectivamente: 
(A) 𝐻𝑜: μ𝑆𝑃 − μ𝑅𝐽 = 0; 𝐻𝑎: μ𝑆𝑃 − μ𝑅𝐽 >0. 
(B) 𝐻𝑜: μ𝑆𝑃 = μ𝑅𝐽; 𝐻𝑎: μ𝑆𝑃 ≠ μ𝑅𝐽. 
(C) 𝐻𝑜: μ𝑆𝑃 ≥ μ𝑅𝐽; 𝐻𝑎: μ𝑆𝑃 < μ𝑅𝐽. 
(D) 𝐻𝑜: μ𝑆𝑃 < μ𝑅𝐽; 𝐻𝑎: μ𝑆𝑃 ≥ μ𝑅𝐽. 
(E) 𝐻𝑜: μ𝑆𝑃 > μ𝑅𝐽; 𝐻𝑎: μ𝑆𝑃 < μ𝑅𝐽 
Resposta: Os gastos médios do Rio de Janeiro são maiores do que os gastos médios de São 
Paulo, por se tratar de amostras independentes dizemos que é maior ou igual, já a hipótese 
alternativa é que os gastos médio do Rio de Janeiro são menores do que o de São Paulo, caso 
as hipóteses não fossem iguais, diríamos que RJ diferente de SP. 
4. (PS 2014.1) Suponha uma amostra de tamanho n1 = 8, com média aritmética da amostra 
correspondente a 42 e desvio padrão igual a 4, e uma outra amostra independente, de 
tamanho n2 = 15, extraída de uma outra população, com uma média aritmética de amostra 
correspondente a 34 e um desvio padrão igual a 5. Qual o valor aproximado da estatística do 
teste t (estat.) de variância agrupada, para testar a hipótese nula de que µ1 = µ2? 
(A) t = 2,5485 
(B) t = 1,9673 
(C) t = 2,5246 
(D) t = 4,002 
(E) t = 3,8959 
Memória de Cálculo: 
 N1= 8 
 Média 1 = 42 
 Desvio padrão 1 = 4 
 N2= 15 
 Média 2 = 34 
 Desvio-padrão = 5 
Cálculo: 
 
( ) ( ) 
 
 
 
( ) ( ) 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
( ) ( )
 √
 
 
 
 
 
 
( ) 
 √
 
 
 
 
 
 
 
 √
 
 
 
 
 
 
 
Resposta: o valor aproximado da estatística do teste t (estat.) de variância agrupada, para testar 
a hipótese nula de que µ1 = µ2 é t = 3,8962. 
5. (P2 2012.2) Considere o seguinte teste de hipótese: 
H0 : µ1 = µ2 
Ha : µ1 ≠ µ2 
Em que: 
µ1 = escolaridade média de todos os residentes no estado de São Paulo. 
µ2 = escolaridade média de todos os residentes no estado do Rio de Janeiro. 
Para testar essas hipóteses, coletou-se uma amostra aleatória e independente de indivíduos de 
ambos os estados. A tabela a seguir resume os resultados dessa pesquisa: 
Estatística descritiva SP RJ 
Média 7,0 6,2 
Desvio-padrão 1 1 
N 61 61 
Diante das informações fornecidas, considerando a existência de homogeneidade de variâncias 
entre as amostras coletadas e um nível de significância de 5%, aponte o resultado do teste de 
hipótese. 
(A) Não se rejeita a hipótese nula, uma vez que a estatística de teste t foi de aproximadamente 
4,42 e o t crítico foi de 1,98. 
(B) Rejeita-se a hipótese nula, uma vez que a estatística do teste t foi de aproximadamente 4,42 
e o t crítico foi de 1,98. 
(C) Não se rejeita a hipótese nula, uma vez que a estatística do teste t foi de aproximadamente 
1,35 e o t crítico foi de 1,98. 
(D) Rejeita-se a hipótese nula, uma vez que a estatística do teste t foi de aproximadamente 1,35 
e o t crítico foi de 2,00. 
(E) Rejeita-se a hipótese nula, uma vez que a estatística do teste t foi de aproximadamente 3,35 
e o t crítico foi de 1,98. 
Memória de Cálculo: 
 N1= 61 
 Média 1 = 7 
 Desvio padrão 1 = 1 
 N2= 61 
 Média 2 = 6,2 
 Desvio-padrão = 1 
Cálculo: 
 
( ) ( ) 
 
 
 
( ) ( ) 
 
 
 
 
 
 
 
 
 
( ) ( )
 √
 
 
 
 
 
 
( ) 
 √
 
 
 
 
 
 
 
 √
 
 
 
 
Resposta: Rejeita-se a hipótese nula, uma vez que a estatística do teste t foide 
aproximadamente 4,42 e o t crítico foi de 1,98. 
 
 
 
6. (PS 2014.1) A Secretaria de Ação Social de um município no estado de Minas Gerais 
pretende lançar um programa de qualificação de jovens para o mercado de trabalho. Então, 
resolveu pesquisar se a idade de jovens do sexo masculino que ingressam no mercado de 
trabalho é maior que a idade de jovens do sexo feminino. Para isso, foram coletadas duas 
amostras aleatórias, a primeira composta por 99 jovens do sexo masculino, com idade média 
de 17,6 anos e desvio padrão de 1,92 ano. E a segunda amostra com 120 jovens do sexo 
feminino com idade média de 16,5 anos e desvio padrão de 1,80 ano. Com 95% de 
confiança, é possível afirmar que a idade média dos jovens do sexo masculino em relação 
aos jovens do sexo feminino é estatisticamente: 
(A) maior, uma vez que a estatística t observável é 3,3426 e o t crítico é 1,645. 
(B) menor, uma vez que a estatística t observável é – 3,1986 e o t crítico é – 1,645. 
(C) igual, uma vez que a estatística t observável é 1,3395 e o t crítico é 1,960. 
(D) maior, uma vez que a estatística t observável é 4,3671 e o t crítico é 1,645. 
(E) menor, uma vez que a estatística t observável é – 3,1986 e o t crítico é – 1,960. 
Memória de Cálculo: 
 N1= 99 
 Média 1 = 17,6 
 Desvio padrão 1 = 1,92 
 N2= 120 
 Média 2 = 16,5 
 Desvio-padrão = 1,8 
Cálculo: 
 
( ) ( ) 
 
 
 
 
( ) ( ) 
 
 
 
 
 
 
 
 
 
 
 
( ) ( )
 √
 
 
 
 
 
 
 
( ) 
 √
 
 
 
 
 
 
 
 √
 
 
 
 
 √
 
 
 
 
Resposta: é possível afirmar que a idade média dos jovens do sexo masculino em relação aos 
jovens do sexo feminino é estatisticamente maior, uma vez que o t estudado é 4,36. 
 
7. (PS 2016.1) Uma fabricante de lâmpadas afirma que a vida útil de suas lâmpadas (em horas) 
é maior que a do concorrente (o líder de mercado). Você realiza um estudo com 14 dessas 
lâmpadas e 16 do líder de mercado selecionados aleatoriamente. Os resultados do fabricante 
são: 𝑥1 = 1.275; 𝑠1 = 45; 𝑛1 = 14; e do concorrente são 𝑥2 = 1.250; 𝑠2 = 30; 𝑛2 = 16. Ao um 
nível de significância de 5%, há evidência suficiente para confirmar a alegação do fabricante? 
Assuma que as variâncias são desconhecidas, mas supostamente iguais. 
(A) Rejeita-se a hipótese nula e há evidência para aceitar alegação do fabricante. 
(B) Aceita-se a hipótese nula e não há evidência para aceitar alegação do fabricante. 
(C) Rejeita-se a hipótese alternativa e não há evidência para aceitar alegação do fabricante. 
(D) Rejeita-se a hipótese alternativa e há evidência para aceitar alegação do fabricante. 
(E) Rejeita-se a hipótese nula e não há evidência para aceitar alegação do fabricante. 
Memória de Cálculo: 
 N1= 14 
 Média 1 = 1.275 
 Desvio padrão 1 = 45 
 N2= 16 
 Média 2 = 1.250 
 Desvio-padrão = 30 
Cálculo: 
 
( ) ( ) 
 
 
 
( ) ( ) 
 
 
 
 
 
 
 
 
( ) ( )
 √
 
 
 
 
 
 
( ) 
 √
 
 
 
 
 
 
 
 √
 
 
 
 
 
 
 
 
Resposta: T estudado > t crítico, portanto rejeita a hipótese nula, ou seja e há evidência para 
aceitar alegação do fabricante. 
 
 
8. (P2 2012.1) Um estudo direcionado a medir o valor da hora-aula dos professores 
universitários utilizou duas regiões metropolitanas. Na região A, aferiu um valor médio de R$ 
85,00 com desvio-padrão de R$ 20,00. Na região B, o valor da hora-aula foi de R$ 65,00 com 
desvio-padrão de R$ 10,00. Foram entrevistados 40 professores na região A e 50 na região 
B. Utilizando um nível de significância α = 0,01, é correto afirmar que: 
(A) há indícios de que as médias populacionais das regiões A e B são diferentes. 
(B) não há indícios de que as médias populacionais das regiões A e B são diferentes. 
(C) não é possível afirmar se as médias populacionais são iguais. 
(D) as médias amostrais são iguais. 
(E) a estatística de teste a ser utilizada é nula. 
Memória de Cálculo: 
 N1= 40 
 Média 1 = 85 
 Desvio padrão 1 = 20 
 N2=50 
 Média 2 = 65 
 Desvio-padrão = 10 
Cálculo: 
 
( ) ( ) 
 
 
 
( ) ( ) 
 
 
 
 
 
 
 
 
 
( ) ( )
 √
 
 
 
 
 
 
( ) 
 √
 
 
 
 
 
 
 
 √
 
 
 
 
Resposta: t estudado < t crítico, portanto aceita a hipótese nula, afirmando que são diferentes. 
 
9. (PS 2014.1) Um laboratório de análises químicas quer verificar se compostos químicos de 
marcas comerciais possuem tempos médios de reação (minutos) diferentes, quando 
submetidos a duas temperaturas (50 e 60 0C). Dos testes estatísticos apresentados a seguir, 
o indicado para tal situação é: 
(A) Comparação de médias para amostras pareadas. 
(B) ANOVA. 
(C) Teste de hipótese para igualdade de variância. 
(D) Comparação de médias para amostras independentes. 
(E) Regressão linear simples. 
Resposta: O laboratório deseja realizar uma análise onde compara as marcas em reação em 
duas temperaturas diferentes, ou seja, os dados da primeira temperatura de todas as marcas 
estarão pareados. 
10. (PS 2012.2) Qual a condição para que o valor crítico de um Teste t para 95% de confiança 
seja menor (em módulo) que o valor crítico de um Teste Z, nas mesmas condições de 
confiança, média e desvio-padrão? 
(A) Que as amostras sejam pareadas. 
(B) Que a distribuição de Student contenha poucas amostras. 
(C) Que o desvio-padrão seja menor que a media. 
(D) Que as variâncias sejam equivalentes. 
(E) Não existe possibilidade de o valor crítico para o Teste t ser menor (em módulo) que o do 
Teste Z. 
Resposta: Para qualquer valor do gl para o teste T não existe a possibilidade de ser menor em 
módulo que o do teste Z, pois o Z é só 1,96. 
11. (P2 2014.2) Uma pesquisa teve por objetivo verificar se a renda dos trabalhadores aumentou 
após sua participação em uma política pública de qualificação profissional. O estatístico que 
testou tal hipótese apresentou os seguintes resultados: 
· Foi coletada a renda de 25 trabalhadores antes e após a participação na política pública. 
· O desvio-padrão da diferença entre as médias foi de R$65,30. 
· A estatística do teste t foi de 10,9. 
· O grau de confiança do teste foi de 95%. 
Com base nas informações disponíveis, é correto afirmar que, na amostra, após a participação 
na política pública, a renda dos trabalhadores: 
(A) incrementou, em média, R$142,35. 
(B) incrementou, em média, R$342,89. 
(C) incrementou, em média, R$711,77. 
(D) diminuiu, em média, R$150,77. 
(E) diminuiu, em média, R$334,77. 
Cálculo: 
 
 
√ 
 
 
√ 
 
Resposta: é correto afirmar que, na amostra, após a participação na política pública, a renda 
dos trabalhadores incrementou, em média, R$142,35. 
 
 
 
12. (PS 2016.1) Uma empresa de engenharia de alimentos quer verificar se compostos químicos 
de marcas comerciais possuem tempo médio de reação (minutos) diferentes, quando 
submetidos a duas temperaturas (50 e 60ºC). Dos testes estatísticos apresentados a seguir, 
o teste indicado para a análise é: 
(A) Comparação de médias para amostras independentes. 
(B) Regressão linear simples. 
(C) Comparação de médias para amostras pareadas. 
(D) ANOVA. 
(E) Teste de hipótese para igualdade de variância. 
Resposta: A empresa deseja realizar uma verificação onde compara compostos químicos em 
reação em duas temperaturas diferentes, ou seja, os dados da primeira temperatura de todas os 
compostos químicos estarão pareados. 
 
 
13. (PS 2016.1) Como controle de qualidade na usina sucroalcooleira são realizados diversos 
testes físico-químicos e microbiológicos da matéria-prima, do produto em processo edo 
produto final. De acordo com a Portaria n. 152 de 6 de dezembro de 2013 do MAPA 
(Ministério da Agricultura, Pecuária e Abastecimento), o controle da pol (porcentagem 
aparente de sacarose ºZ) do açúcar tipo branco cristal deve ser de no mínimo 99,5ºZ. Para 
observar a variabilidade da pol do açúcar, um estudante de graduação coletou dados do 
laboratório industrial de duas usinas (A e B) da região noroeste do Estado de São Paulo, 
conforme consta na Tabela 1. Sabe-se que para a determinação da média e desvio-padrão, 
foram coletados os resultados de 30 análises de cada unidade industrial realizada ao longo 
de um dia da safra. 
Tabela 1 – Resultados obtidos dos laboratórios industriais das usinas A e B 
 
Usina A Usina B 
N 31 31 
Média da Pol do açúcar branco cristal (ºZ) 99,7 99,6 
Desvio-padrão 0,3 0,4 
 
Com 5% de significância, pode-se concluir que: 
(A) aceita-se H1 ao nível de significância de 5%, as variâncias são significativamente iguais. 
(B) rejeita-se H0 ao nível de significância de 5%, conclui-se que as variâncias são diferentes na 
população. 
(C) rejeita-se H0 ao nível de significância de 2,5%, conclui-se que as variâncias são diferentes na 
população. 
(D) não se rejeita H0 ao nível de significância de 2,5%, conclui-se que as variâncias são iguais na 
população. 
(E) não se rejeita H0 ao nível de significância de 5%, conclui-se que as variâncias são iguais na 
população. 
Memória de Cálculo: 
 N1= 31 
 Média 1 = 99,7 
 Desvio padrão 1 = 0,3 
 N2=31 
 Média 2 = 99,6 
 Desvio-padrão = 0,4 
 
Cálculo: 
 
( ) ( ) 
 
 
 
( ) ( ) 
 
 
 
 
 
 
 
 
 
( ) ( )
 √
 
 
 
 
 
 
( ) 
 √
 
 
 
 
 
 
 
 √
 
 
 
 
 
Resposta: T estudado < T crítico, portanto não rejeita H0 a um nível de significância de 5% 
 
O ENUNCIADO ABAIXO SERÁ UTILIZADO PELAS SEIS PRÓXIMAS QUESTÕES. 
(P2 2018.2) A diretoria de marketing de uma cadeia de lojas de produtos para o público feminino 
deseja descobrir se os valores médios das compras realizadas nas suas lojas A, B e C podem 
ser considerados iguais. Para realizar o estudo, foi tirada, de cada loja, uma amostra aleatória de 
50 compras. O resultado foi o seguinte: 
 
Loja Valor médio Desvio padrão 
A R$ 140,00 R$ 38,00 
B R$ 185,00 R$ 54,00 
C R$ 192,00 R$ 58,00 
 
15. De acordo com os dados, o erro padrão do valor das compras realizadas na loja B é de, 
aproximadamente: 
(A) R$1,08. 
(B) R$10,98. 
(C) R$0,36. 
(D) R$7,64. 
(E) R$4,41. 
Cálculo: 
 
 
√ 
 
 
√ 
 
Resposta: o erro padrão do valor das compras realizadas na loja B é de, aproximadamente 
7,64. 
16. Considerando que as variâncias populacionais dos valores das compras realizadas nas lojas 
A e B sejam conhecidas, num teste de igualdade entre as médias dessas lojas a estatística 
de teste será, aproximadamente, de: 
(A) 8,67. 
(B) 0,74. 
(C) 1,82. 
(D) 10,41. 
(E) 4,82. 
 
Cálculo: 
 
( ) ( ) 
 
 
 
( ) ( ) 
 
 
 
 
( ) ( )
 √
 
 
 
 
 
 
( ) 
 √
 
 
 
 
 
 
 
Resposta: num teste de igualdade entre as médias dessas lojas a estatística de teste será, 
aproximadamente de 4,82. 
17. No caso de um teste de hipóteses de igualdade de variâncias, a estatística de teste a ser 
usada segue a distribuição: 
(A) poisson. 
(B) binomial. 
(C) normal. 
(D) F. 
(E) student 
Resposta: Utilizamos o teste F, para teste de hipóteses que são homocedasticidade, ou seja, 
igualdade de variância. 
18. Num teste de hipóteses de igualdade das variâncias dos valores das compras realizadas nas 
lojas A e C, o valor da estatística de teste é, aproximadamente, de: 
(A) 1,01. 
(B) 2,33. 
(C) 0,96. 
(D) 5,28. 
(E) 3,54. 
Cálculo: 
 
 
 
 
 
 
 
 
 
Resposta: o valor da estatística de teste é, aproximadamente, de 2,33. 
19. Caso não seja conhecido, o estimador do desvio padrão populacional do valor das compras 
realizadas na loja B será igual a: 
(A) R$54,00. 
(B) R$2.916,00. 
(C) R$0,30. 
(D) R$7,40. 
(E) R$3,40. 
Resposta: R$ 54, pois o exercício já disponibiliza essa informação. 
20. A diretoria encomendou um teste de hipóteses para verificar se o valor médio das compras 
realizadas na loja A pode ser considerado igual a R$150,00. Nesse caso, a estatística de 
teste é, aproximadamente, de: 
(A) -1,86. 
(B) 0,40. 
(C) 3,15. 
(D) -3,15. 
(E) 2,15. 
Cálculo: 
 
 
 
√ 
 
Resposta: a estatística de teste é, aproximadamente, de -1,86. 
O ENUNCIADO ABAIXO SERÁ UTILIZADO PELAS CINCO PRÓXIMAS QUESTÕES. 
(PS 2018.2) Uma chocolateria possui uma loja em dois shoppings da cidade, as lojas A e B. Um 
levantamento sobre o faturamento diário dessas lojas utilizou amostras de 25 dias, escolhidos 
aleatoriamente, e o resultado foi o seguinte: 
 Loja A Loja B 
Faturamento médio R$ 4.380,00 R$ 3.950,00 
Desvio padrão R$ 840,00 R$ 761,00 
Tamanho da amostra 25 25 
 
21. Caso a chocolateria queira fazer um teste de hipóteses para comparação de variâncias 
populacionais do faturamento diário das lojas A e B, encontrará estatística de teste de, 
aproximadamente: 
(A) 0,32. 
(B) 1,22. 
(C) 1,98. 
(D) 1,10. 
(E) 2,12. 
Cálculo: 
 
 
 
 
 
 
 
Resposta: encontrará estatística de teste de, aproximadamente 1,22. 
22. Tendo-se em conta que as variâncias amostrais dos faturamentos diários das lojas A e B 
possam ser consideradas iguais, a estimativa agrupada da variância populacional será de, 
aproximadamente: 
(A) 802.400. 
(B) 342.630. 
(C) 807.000. 
(D) 669.000. 
(E) 642.361. 
Cálculo: 
 
 
 
 
 
 
Resposta: a estimativa agrupada da variância populacional será de, aproximadamente 642,361. 
23. É correto dizer que, no caso de a variância populacional não ser conhecida, o estimador da 
variância populacional do faturamento diário da loja B é igual a: 
(A) 308.774. 
(B) 28. 
(C) 761. 
(D) 147. 
(E) 579.121 
Cálculo: 
 
Resposta: o estimador da variância populacional do faturamento diário da loja B é igual a 
579.121. 
24. O gerente da loja B precisa saber se o faturamento diário da sua loja pode ser considerado, 
pelo menos, igual a R$4.200,00. Nesse caso, a estatística de teste a ser obtida no teste de 
hipóteses a ser feito é de, aproximadamente: 
(A) 2,58. 
(B) -3,12. 
(C) -0,15. 
(D) -1,64. 
(E) 1,96. 
Cálculo: 
 
 
 
√ 
 
Resposta: a estatística de teste a ser obtida no teste de hipóteses a ser feito é de, 
aproximadamente -1,64. 
 
25. (PS 2018.2) Um levantamento sobre o faturamento diário de um restaurante da cidade 
utilizou uma amostra de 30 dias, escolhidos aleatoriamente. O resultado foi o seguinte: 
Média = R$4.320,00. 
Desvio padrão = R$980,00. 
É correto dizer que o desvio padrão das médias amostrais (erro padrão) é, aproximadamente, 
de: 
(A) R$566,00. 
(B) R$716,00. 
(C) R$49,00. 
(D) R$289,00. 
(E) R$179,00. 
Cálculo: 
 
 
√ 
 
 
√ 
 
Resposta: É correto dizer que o desvio padrão das médias amostrais (erro padrão) é, 
aproximadamente de 178,92. 
ANÁLISE DE VARIÂNCIA (ANOVA) 
 
1. (P2 2016.1) Se o objetivo for comparar as vendas médias dos vendedores (selecionados 
aleatoriamente) de cinco lojas de uma determinada rede de supermercados, o teste mais 
adequado é: 
(A) Teste de qui-quadrado. 
(B) Regressão linear simples. 
(C) Análise de correlação. 
(D) Análise de variância (ANOVA). 
(E) Comparação de médias para amostras emparelhadas. 
 
Resposta: Utilizado para examinar diferenças entre mais de dois grupos. Os grupos envolvidos 
são classificados de acordo com níveis de um fator de interesse. 
 
 
 
2. (PS 2016.1) A distribuição F de Snedecor,também conhecida como distribuição de Fisher, é 
frequentemente utilizada na inferência estatística para estudar: 
(A) a análise de variância. 
(B) a análise da hipótese nula. 
(C) a análise da média. 
(D) a análise do desvio-padrão. 
(E) a análise da hipótese alternativa. 
 
Resposta: Teste F para a proporcionalidade entre duas variâncias (Fisher-Snedecor). Usado para 
testar se duas populações independentes apresentam a mesma variabilidade., aotestar 
variâncias, consegue-se detectar diferenças na variabilidade em duas populações 
independentes. 
 
 
 
3. (PS 2014.2) Suponha que se esteja interessado em avaliar o desempenho de 4 treinadores – 
mensurado numa escala de 1 a 5, em que 1 é péssimo e 5 excelente – que passaram por um 
determinado clube de futebol por meio da opinião de 24 jornalistas esportivos, todos com 
critérios homogêneos de análise. Como resultado, obteve-se a tabela de ANOVA a seguir: 
 
Os valores de A, B, C, D, E e F são nessa ordem: 
(A) 4; 24; 201,45; 266,75; 3,26; 20,56. 
(B) 4; 24; 268,6; 333,90; 85,3; 0,7872. 
(C) 3; 23; 201,45; 266,75; 3,26; 20,56. 
(D) 3; 23; 201,45; 266,75; 32,65; 2,05. 
(E) 4; 24; 201,45; 266,75; 32,65; 2,05. 
 
Memória de Cálculo: 
Fonte 
Graus 
de liberdade 
Soma 
dos quadrados 
Média dos quadrados 
(Variância) 
F 
Entre grupos c – 1 SQE MQE = SQE/c – 1 FESTAT = MQE/MQD 
Dentro dos grupos n – c SQD MQD = SQD/n – c 
 
Total n – 1 STQ 
 
Cálculo: 
 
 
𝑛 
 
 
 
 
 
 
 
 
 
 
 
 𝑛 
 (𝑛 ) 
 ( ) 
 
 
Resposta: 
Fonte 
Graus 
de liberdade 
Soma 
dos quadrados 
Média dos quadrados 
(Variância) 
F 
Entre grupos 3 201,45 67,15 20,56 
Dentro dos grupos 20 65,3 3,26 
 
Total 23 266,75 
 
 
4. (PS 2012.1) Considere as seguintes situações: 
I. Foi coletada a renda de uma amostra probabilística de 500 habitantes de uma cidade em dois 
anos consecutivos, mas não se tratam dos mesmos habitantes nos dois anos. 
II. Foi coletada a produtividade de uma amostra probabilística de 50 trabalhadores e, após 12 
meses da implementação de uma nova técnica de produção, novamente se coletou a 
produtividade destes 50 trabalhadores. 
III. Foi coletada a variável ativo total de uma amostra probabilística de empresas de cinco 
setores de atividades diferentes em um determinado ano. 
 
Diante dessas amostras aleatórias que foram selecionadas acima, assinale qual tipo de teste de 
hipótese para comparação de médias é o mais adequado para cada caso, respectivamente: 
 
(A) Comparação de médias para amostras independentes; Comparação de médias para 
amostras independentes; e ANOVA. 
(B) Comparação de médias para amostras dependentes; Comparação de médias para amostras 
dependentes; e ANOVA. 
(C) ANOVA; Comparação de médias para amostras dependentes; e ANOVA. 
(D) Comparação de médias para amostras independentes; Comparação de médias para 
amostras dependentes; e ANOVA. 
(E) Comparação de médias para amostras independentes; Comparação de médias para 
amostras dependentes; e Comparação de médias para amostras independentes. 
 
Resposta: 
 
I. Utilizando subscritos para diferenciar entre a média aritmética da primeira população, µ1 e a 
média aritmética da segunda população, µ2,, portanto comparação de médias para 
amostras independentes. Por ter a mesma quantidade de amostra contudo serem de 
populações diferentes. 
II. Outra situação que envolve dados correlacionados entre populações é quando temos 
amostras combinadas. Nesse caso, os itens ou indivíduos são colocados em pares, 
conjuntamente, de acordo com alguma característica de interesse. As amostras 
dependentes são também chamadas de amostras emparelhadas, amostras pareadas ou 
amostras associadas. Por se tratar da mesma população e mesma amostra são 
dependetes. 
III. Os grupos envolvidos são classificados de acordo com níveis de um fator de interesse, por 
se tratar de cinco setores diferentes é ANOVA. 
 
 
5. (PS 2014.1) A anemia é uma doença que afeta muitas pessoas e que pode ter diversas 
origens. Pretendendo-se avaliar possíveis diferenças entre alguns tratamentos de estados 
anêmicos, planejou-se um experimento com 120 indivíduos anêmicos, divididos aleatoriamente 
em três grupos de 40, aos quais se atribuiu cada um dos tratamentos. O primeiro tratamento era 
constituído apenas por uma dieta rica em ferro; o segundo tratamento combinava um dieta rica 
em ferro e vitamina C; e o último consistiu numa dieta baseada em um complexo vitamínico. 
Visando observar possíveis diferenças entre os tratamentos, foi realizada uma Análise de 
Variância (ANOVA), com base nos valores de hemoglobina (em gramas por decilitro) das 120 
pessoas submetidas aos tratamentos, após um período de três meses. 
 
Com base na tabela apresentada, qual é o valor aproximado, respectivamente, da estatística do 
teste F e da fração da variabilidade explicada deste experimento? 
(A) 0,7334 e 0,0124. 
(B) 0,7334 e 0,9876. 
(C) 0,4848 e 0,9876. 
(D) 0,4848 e 0,0124. 
(E) 0,9876 e 0,7334. 
 
Memória de Cálculo/ Resposta: 
Fonte 
Graus 
de liberdade 
Soma 
dos quadrados 
Média dos quadrados 
(Variância) 
F 
Entre grupos c – 1 =2 
SQE=122,925-
121,403=1,522 
MQE = 1,522/2=0,761 
FESTAT = 
0,761/1,038=0,733 
Dentro dos 
grupos 
n – c =117 SQD=121,403 
MQD = 
121,403/117=1,038 
Fração=SQE/SQD=0,0124 
Total n – 1 =119 STQ=122,925 
 
 
 
O ENUNCIADO A SEGUIR SERÁ UTILIZADO PELAS PRÓXIMAS DUAS QUESTÕES 
(PS 2016.2) Um Teste de n médias, realizado com o auxílio da função ANOVA, disponível na 
Planilha Eletrônica EXCEL, apresentou o seguinte relatório: 
 
 
6. Considerando os valores apresentados no relatório apresentado, é correto afirmar que os 
valores das Médias dos Quadrados (MQ) para as Fontes de Variação “Entre Grupos” (assinalado 
como XXX) e “Dentro dos Grupos” (assinalado como YYY) são respectivamente: 
(A) 212,667 e 4,789. 
(B) 312,759 e 4,789. 
(C) 436.287 e 6,908. 
(D) 212,667 e 5,874. 
(E) 360,887 e 6,223. 
 
Memória de Cálculo/Resposta: 
Fonte 
Graus 
de liberdade 
Soma 
dos quadrados 
Média dos quadrados 
(Variância) 
F 
Entre grupos c – 1 =3 SQE=638 MQE = 638/3=212,67 
FESTAT = 
212,67/4,789=44,41 
Dentro dos 
grupos 
n – c =76 SQD=364 MQD = 364/76= 4,789 Fração=SQE/SQD=1,75 
Total n – 1 =79 STQ=1.002 
 
 
7. Em face do relatório apresentado, é correto afirmar que o teste considerou: 
(A) 3 amostras de tamanho 18. 
(B) 4 amostras de tamanho 19. 
(C) 2 amostras de tamanho 40. 
(D) 4 amostras de tamanho 20. 
(E) 3 amostras de tamanho 20. 
 
Cálculo: 
 
𝑛 
 
 
 
 
 
 
8. (P2 2016.1) O Presidente da República estava interessado em testar as seguintes hipóteses: 
𝐻0 : 𝜇 𝑃 = 𝜇𝑅𝐽 = 𝜇 𝐺 
𝐻𝑎: 𝑝𝑒𝑙o 𝑚𝑒𝑛𝑜𝑠 𝑢𝑚𝑎 𝑑𝑎𝑠 𝑚é𝑑𝑖𝑎𝑠 é 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑑𝑎𝑠 𝑑𝑒𝑚𝑎𝑖𝑠 
 
Em que 𝜇 𝑃, 𝜇𝑅𝐽 𝑒 𝜇 𝐺 são, respectivamente, a rentabilidade média (em milhões de R$) das 
empresas do setor elétrico de SP, RJ e MG. O A amostra aleatória de 63 empresas (21 de cada 
estado) produziu o seguinte resultado: 
 
 
Em um teste unicaudal e considerando um nível de significância de 5%, pode-se concluir que as 
empresas do setor elétrico têm: 
(A) diferenças de rentabilidade média (Fobservado= 3,15 e Fcrítico = 3). 
(B) em média a mesma rentabilidade média (Fobservado= 3 e Fcrítico = 3,15). 
(C) diferenças de rentabilidade média (Fobservado= 3,92 e Fcrítico = 3). 
(D) em média a mesma rentabilidade média (Fobservado= 2 e Fcrítico = 2,75). 
(E) em média a mesma rentabilidade média (Fobservado= 2 e Fcrítico = 3,34). 
 
Memória de Cálculo/Resposta: 
Fonte 
Graus 
de 
liberdade 
Soma 
dos quadrados 
Média dos 
quadrados 
(Variância) 
F 
Entre grupos c – 1 =2 SQE=1.000 MQE = 1.000/2=500 
FESTAT = 
500/166,67= 3 
Dentro dos 
grupos 
n – c =60 SQD=10.000 
MQD = 
10.000/60=166,67 
Total n – 1 =62 STQ=11.000 
 
 
 
 
 
9. (P2 2014.2) As hipóteses nula e alternativa de um determinadoteste de hipótese são: 
H0: μ1 = μ2 = μ3 
Ha: pelo menos uma das médias é diferente das demais 
 
Aproximadamente, quantas vezes a variância entre grupos deve ser maior que a variância dentro 
do grupo para que tal hipótese nula seja rejeitada sabendo-se que o tamanho da amostra é 63 
observações? 
(A) 2,56. 
(B) 2,71. 
(C) 2,86. 
(D) 3,01. 
(E) 3,16. 
 
Cálculo / Resposta: 
Fonte 
Graus 
de 
liberdade 
Soma 
dos quadrados 
SEntre grupos c – 1 =2 SQE>SQD 
Dentro dos 
grupos 
n – c =60 SQD<SQE 
Total 63 – 1 =62 
[(c-1) /n] x 100 
(2/63) x 100= 
3,16 
 
10. (PS 2012.1) Observando o comportamento dos funcionários da linha de produção de 
sapatos, um gerente queria testar se os funcionários que tomam café durante o dia apresentam 
melhor desempenho em termos de unidades produzidas do que aqueles que não tomam café. 
Diante disso, resolveu fazer uma pesquisa para testar essa hipótese. O gerente anotou a 
quantidade de copos de café que uma amostra de 40 funcionários selecionada aleatoriamente 
tomou durante o dia e a respectiva quantidade de pares de sapatos produzidos. Essa amostra foi 
separada em 4 grupos: 1 = não bebeu café; 2 = tomou um copo de café; 3 = tomou 3 copos de 
café; 4 = tomou 4 copos de café. Admita que as premissas de normalidade, homocedasticidade 
e independência estão sendo respeitadas. 
 
Ao completar a tabela apresentada, pode-se concluir a respeito do teste de hipótese realizado 
por meio da ANOVA, considerando um nível de significância de 5%, que: 
(A) rejeita-se a hipótese nula desse teste, uma vez que o F observado (ou calculado) é 6,70 e 
maior que o F crítico. 
(B) rejeita-se a hipótese nula desse teste, uma vez que o F observado (ou calculado) é 2,87 e 
menor que o F crítico que é 6,70. 
(C) nada se pode concluir a respeito desse teste de hipótese, pois os graus de liberdade não 
foram apresentados no problema. 
(D) a fração da variabilidade explicada pelos grupos nesse teste foi de 64,1%. 
(E) rejeita-se a hipótese nula desse teste, uma vez que o F observado (ou calculado) é 10,5 e 
menor que o F crítico que é 3,5. 
 
Memória de Cálculo/Resposta: 
Fonte 
Graus 
de 
liberdade 
Soma 
dos 
quadrados 
Média dos quadrados 
(Variância) 
F 
Entre 
grupos 
c – 1 =3 SQE=1.495,5 MQE = 1.495,5/3=498,5 FESTAT = 498,5/74,35=6,7 
Dentro dos 
grupos 
n – c =36 SQD=2.676,5 MQD = 2.676,5/36=74,35 Festat>Fcrítico=6,7>3,804 
Total n – 1 =39 STQ=4.172,0 
 
 
 
 
 
11. (P2 2012.2) Um estudo teve por objetivo avaliar a capacidade dos consumidores de lembrar 
as marcas líderes de cerveja. Para isso, foi realizado um experimento com três grupos distintos: 
para o primeiro grupo foram expostas cinco marcas menos conhecidas, para o segundo grupo, 
10 marcas menos conhecidas, e para o terceiro grupo não foi mostrado nenhuma marca. Após 
esses estímulos, foi solicitado que os participantes escrevessem num papel quais marcas eles 
lembravam, além daquelas a que foram expostos. Para cada participante, foi computado o 
número de marcas líderes que se lembraram dentre as sete marcas líderes consideradas no 
estudo. Em cada grupo, 30 indivíduos participaram do experimento. 
 
A partir dos resultados estatísticos e considerando um nível de significância de 5%, pode-se 
concluir que: 
(A) Expor os participantes a marcas menos conhecidas não afetou a capacidade de lembrar as 
marcas líderes, uma vez que se rejeita a hipótese nula do teste. 
(B) Expor os participantes a marcas menos conhecidas afetou a capacidade de lembrar as 
marcas líderes, uma vez que se rejeita a hipótese nula do teste e a fração de variabilidade 
explicada no estudo é de 20,7%. 
(C) Expor os participantes a marcas menos conhecidas afetou a capacidade de lembrar as 
marcas líderes, uma vez que se rejeita a hipótese nula do teste e a fração de variabilidade 
explicada no estudo é de 80,7%. 
(D) Expor os participantes a marcas menos conhecidas não afetou a capacidade de lembrar as 
marcas líderes, uma vez que não se rejeita a hipótese nula do teste. 
(E) Expor os participantes a marcas menos conhecidas afetou a capacidade de lembrar as 
marcas líderes, uma vez que se rejeita a hipótese nula do teste e a fração de variabilidade 
explicada no estudo é de 19,2%. 
 
Resposta: MQE > MQD, portanto Expor os participantes a marcas menos conhecidas afetou a 
capacidade de lembrar as marcas líderes, a fração da variabilidade explicada no estudo é de 
80,7%. (236/293) 
 
 
 
12. (PS 2012.2) Sobre os testes de hipóteses e as distribuições de probabilidade, é 
INCORRETO afirmar que: 
(A) diferentes hipóteses são testadas com o uso de diferentes estatísticas de teste que, por sua 
vez, apresentam distintas distribuições de probabilidade. 
(B) quando testamos hipóteses sobre a média de uma população, vimos que podemos usar as 
estatísticas z ou t, que seguem as distribuições normal e t de Student, respectivamente. 
(C) quando testamos hipóteses sobre variâncias, usamos a estatística F, que segue a 
distribuição F de Fisher- Snedecor. 
(D) qualquer teste é aplicável, desde que a amostra seja maior que 30. 
(E) a distribuição F é assimétrica (ao contrário das distribuições t e Normal). 
 
Resposta: O único teste de hipótese e as distribuições de probabilidade é o teste T, se as 
populações não forem normalmente distribuídas, o teste t de variância agrupada pode, ainda 
assim, ser utilizado se os tamanhos de amostras forem grandes o suficiente (geralmente ≥ 30 
para cada uma das amostras). 
 
 
13. (P2 2016.1) Um pesquisador obteve, a partir da análise de variância (ANOVA) que comparou 
o desempenho das empresas de três estados do Brasil, um valor da estatística do teste F de 5,5. 
Pode-se dizer a respeito desse valor que: 
 
(A) não se pode rejeitar a hipótese nula, uma vez que o valor da estatística do teste F é superior 
ao F crítico obtido pela tabela. 
(B) nada se pode concluir desse valor, uma vez que o tamanho da amostra e os graus de 
liberdade não foram fornecidos. 
(C) a variância do erro do modelo é inferior à variância do desempenho médio das empresas 
entre os estados analisados. 
(D) a variância dos erros do modelo é superior à variância do desempenho médio das empresas 
entre os estados analisados. 
(E) a fração da variabilidade explicada é superior a 50%. 
 
Resposta: A primeira amostra, extraída da primeira população, é definida como a amostra que 
apresenta a maior variância de amostra. A segunda amostra, extraída da segunda população, é 
definida como a amostra com a menor variância de amostra. Se o teste F der maior que 5 
significa que a Segunda amostra é maior que a primeira. 
 
ENUNCIADO A SEGUIR SERÁ UTILIZADO PELAS PRÓXIMAS DUAS QUESTÕES 
(P2 2016.1) Uma empresa tem três tipos de embalagem para um mesmo produto. Diante disso, 
um experimento foi conduzido para compreender se a embalagem do produto influencia a 
propensão de compra desse produto. Para isso, foi solicitado que 20 pessoas consumissem o 
produto com a embalagem A, 20 pessoas com a embalagem B e 20 pessoas com a embalagem 
C. As pessoas foram aleatoriamente selecionadas para cada uma das condições. Após o 
consumo, as pessoas responderam a seguinte pergunta: “Você compraria esse produto 
novamente?”. A resposta foi dada em uma escala de 0 (não compraria de maneira nenhuma) a 
10 (certamente compraria). Os resultados do experimento encontram-se a seguir: 
 
 
 
14. Supondo que todas as premissas do teste estatístico foram respeitadas e um nível de 
significância de 5%, pode-se afirmar que a hipótese de que as médias: 
 
(A) amostrais são iguais não foi rejeitada, ou seja, a embalagem influencia na propensão de 
compra dos produtos. 
(B) populacionais são iguais não foi rejeitada, ou seja, a embalagem não influencia na propensão 
de compra dos produtos. 
(C) populacionais são iguais foi rejeitada, ou seja, a embalagem influencia na propensão de 
compra dos produtos. 
(D) amostrais são iguais não foi rejeitada, ou seja, a embalagem não influencia na propensão de 
compra dos produtos. 
(E) amostrais sãoiguais foi rejeitada, ou seja, a embalagem influencia na propensão de compra 
dos produtos. 
 
Resposta: F observado > F crítico, portanto a hipótese nula é rejeitada, e quanto menor entre 
os grupos maior a influência dos valores estudados, ou seja, a embalagem influencia na 
propensão de compra dos produtos. 
 
15. Qual é a fração da variância da propensão a consumir o produto explicada pela embalagem? 
(A) 0,0%. 
(B) 12,0%. 
(C) 10,7%. 
(D) 3,2%. 
(E) 89,2%. 
 
Cálculo: 
 𝑟𝑎 𝑜 𝑑𝑎 𝑣𝑎𝑟𝑖𝑎 𝑖𝑙𝑖𝑑𝑎𝑑𝑒 𝑑𝑎 𝑝𝑟𝑜𝑝𝑒𝑛𝑠 𝑜 
 
 
 
16. (PS 2012.1) O prefeito de um município com quatro bairros estava interessado em 
implementar um programa de distribuição de leite. Entretanto, não tinha verba suficiente para 
atender a todos os bairros. Diante dos recursos disponíveis, decidiu beneficiar os dois bairros 
com menor renda per capita média (R$). Coletaram-se amostras independentes e aleatórias de 
famílias em cada bairro. Os resultados do teste de hipótese (realizado por meio de uma ANOVA) 
são apresentados a seguir: 
 
 
Com base nas tabelas apresentadas, é CORRETO afirmar que: 
 
(A) ao rejeitar a hipótese nula desse teste, pode-se concluir que os bairros 1 e 4 possuem renda 
per capita média na população menor que os demais bairros. 
(B) esse teste de hipótese não é válido, uma vez que há fortes indícios de que não respeita a 
premissa de homocedasticidade. 
(C) esse teste de hipótese não é válido, uma vez que não respeita a premissa de normalidade. 
(D) a fração da variabilidade explicada total pelo bairro é de 35,1%. 
(E) não se rejeita a hipótese nula desse teste, ou seja, estatisticamente não se pode rejeitar que 
a renda per capita média desses bairros são iguais na população. O prefeito terá que utilizar 
outro critério para escolher os bairros beneficiados. 
 
Resposta: Em estatística, o termo técnico mais comum para representar igualdade de variâncias 
é homocedasticidade, e não há igualdade nas variâncias. 
 
 
17. (PS 2012.1) Em um modelo de ANOVA para comparação de médias de três grupos, a fração 
da variabilidade explicada observada foi de 0%. A partir disso, é possível concluir que: 
(A) as médias dos três grupos na população são iguais entre si. 
(B) as médias dos três grupos na amostra observada são iguais entre si. 
(C) as variâncias dos três grupos na população são iguais entre si. 
(D) as variâncias dos três grupos na amostra são iguais entre si. 
(E) a soma de quadrados entre grupos é igual à soma de quadrados total. 
 
Resposta: A fração da variabilidade explicada for mais próxima de 100% maior a diferença entre 
elas, quando menor a fração menor a diferença. 
 
O ENUNCIADO ABAIXO SERÁ UTILIZADO PELAS DUAS PRÓXIMAS QUESTÕES. 
(P2 2018.2) Saulo é analista de sistemas e recebeu a tarefa de realizar um teste de hipóteses de 
igualdade de n médias (mais de duas). Para isso, pretende utilizar um modelo ANOVA. 
 
18. Para que um modelo ANOVA seja considerado válido, é necessário que as seguintes 
premissas básicas sejam observadas: 
(A) única e exclusivamente normalidade. 
(B) única e exclusivamente independência. 
(C) apenas normalidade e independência. 
(D) independência, normalidade e heterocedasticidade. 
(E) independência, normalidade e homocedasticidade. 
 
Resposta: As observações são independentes, ou seja, cada elemento amostral (aluno) deve 
ser independente; Os grupos comparados apresentam a mesma variância; Os erros são 
independentes e provenientes de uma distribuição normal com média igual a zero e variância 
constante. 
 
19. Nesse caso, como hipótese alternativa do teste, o ANOVA mostrará a Saulo que: 
(A) pelo menos uma das médias é diferente das demais. 
(B) obrigatoriamente, (n-1) médias são diferentes entre si. 
(C) não existem médias diferentes entre si. 
(D) pelo menos n médias são diferentes das demais. 
(E) pelo menos duas das médias são diferentes das demais. 
 
Resposta: No entanto, ao analisar a variação entre os grupos e dentro dos grupos, chega-se a 
conclusões sobre possíveis diferenças entre médias aritméticas dos grupos, pois esse será a hipótese 
nula. 
 
 
 
 
O ENUNCIADO ABAIXO SERÁ UTILIZADO PELAS TRÊS PRÓXIMAS QUESTÕES. 
(PS 2018.2) Maria é analista e está testando a performance de 4 diferentes gasolinas, A, B, C e 
D, utilizando para isso amostras de 6 carros diferentes entre si. Seguindo um modelo ANOVA, 
ela testará se, em média, o número de quilômetros rodados por litro de gasolina é igual em cada 
marca. 
 
20. Neste teste, a variabilidade total apresentada pelo modelo ANOVA será igual: 
(A) à variabilidade entre as amostras mais a variabilidade dentro das amostras. 
(B) a 2 vezes a diferença das variabilidades entre e dentro das amostras. 
(C) a 4 vezes a variabilidade entre as amostras. 
(D) à variabilidade entre as amostras menos a variabilidade dentro das amostras. 
(E) a 6 vezes a variabilidade dentro da amostra. 
 
Resposta: Variabilidade total = Variabilidade entre + Variabilidade dentro 
 
21. Utilizando o modelo ANOVA, Maria descobriu que a variabilidade entre as 4 amostras de 6 
carros cada (SQE) era igual a 526,3, e a variabilidade dentro das amostras (SQD) era igual a 
301,7. Assim, é correto afirmar que a parcela da variabilidade total explicada pela gasolina é de, 
aproximadamente: 
(A) 36%. 
(B) 32%. 
(C) 18%. 
(D) 96%. 
(E) 64% 
 
Cálculo: 
 
 
 
 
 
 
 
 
 
 
22. Ao desenvolver o modelo ANOVA a um risco α = 0,05, Maria obteve os seguintes valores: 
valor-p = 0,00037; F = 38,49. Assim, é correto se afirmar que: 
(A) pelo menos uma média é diferente das outras, uma vez que o valor de F = 38,49 é maior do 
que α = 0,05. 
(B) as 4 médias são iguais, pois o valor p = 0,00037 é menor do que o α = 0,05. 
(C) as 4 médias são iguais, uma vez que o valor de F = 38,49 é maior do que o valor-p = 
0,00037. 
(D) pelo menos 3 médias são diferentes, pois o valor-p encontrado é > 0. 
(E) pelo menos uma média é diferente das outras, uma vez que o valor-p = 0,00037 é menor do 
que α = 0,05. 
 
Resposta: Valor < alfa, portanto pelo menos uma média é diferente das outras. 
CORRELAÇÃO 
 
1. (P2 2010.2) Observe os gráficos a seguir: 
 
 
 
Tais gráficos refletem os seguintes tipos de correlação: 
(A) I e III – Lineares Positivas. 
(B) I e II – Lineares Positivas. 
(C) III e IV – Não Lineares. 
(D) I e II – Lineares Negativas. 
(E) II – Linear; e III – Não Linear. 
 
Resposta: 
 
 Gráfico 1 é linear positivo 
 Gráfico 2 é linear negativo 
 Gráfico 3 é linear positivo 
 Gráfico 4 é não linear 
Portanto a alternativa A é correta o gráfico I e II é linear positivo. 
 
 
2. (P2 2008.1) Analise os gráficos de dispersão abaixo e assinale os comentários corretos sobre 
a medida de associação–correlação. 
 
 
 
 
 
(A) O gráfico A apresenta fraca correlação, e o gráfico B apresenta forte correlação negativa. 
(B) O gráfico A apresenta forte correlação positiva, e o gráfico B apresenta forte correlação 
negativa. 
(C) O gráfico A apresenta fraca correlação, e o gráfico B apresenta forte correlação positiva. 
(D) O gráfico A apresenta forte correlação negativa, e o gráfico B apresenta fraca correlação. 
(E) Os gráficos A e B apresentam fraca correlação. 
 
Resposta: 
 Gráfico A: Dados muito espalhados, logo, apresenta uma correlação fraca. 
 Gráfico B: Dados seguem um padrão de queda, apresentando uma correlação negativa. 
Portanto a alternativa correta é A. 
 
 
3. (PS 2012.1) Observe os gráficos a seguir: 
 
 
Assim sendo, é CORRETO afirmar que: 
(A) em ambos os gráficos a correlação entre as variáveis X1 e X2 é aproximadamente 1. 
(B) no gráfico 1 a correlação entre as variáveis é aproximadamente 0 e no gráfico 2 
aproximadamente 1. 
(C) no gráfico 1 a correlação entre as variáveis é aproximadamente 0,5 e no gráfico 2 
aproximadamente 1. 
(D) no gráfico 2, se excluirmos o ponto correspondente a X1 = 10 e X2 = 5, a correlação entre X1 
e X2 será aproximadamente 1. 
(E) em ambos os gráficosa correlação entre as variáveis X1 e X2 é aproximadamente 0. 
 
Resposta: 
 Gráfico 1 não é linear, logo é zero. 
 Gráfico 2 apresenta um outlier, logo, é 1. 
Portanto a alternativa correta é a B. 
 
4. (P2 2010.2) As queimadas, até o mês de agosto deste ano, comparadas ao mesmo período 
do ano passado, aumentaram em 94%, tendo em vista apenas as regiões Norte, Nordeste e 
Centro-Oeste do Brasil. Além de outros danos, as queimadas elevam as temperaturas nas 
grandes cidades, em média, em mais de 3 °C e, ao mesmo tempo, reduzem em muito a 
fertilidade do solo dessas regiões. Esses efeitos das queimadas traduzem, respectivamente, 
os tipos de correlação denominados: 
 
(A) Positiva e Perfeita Positiva. 
(B) Negativa e Perfeita Negativa. 
(C) Positiva e Negativa. 
(D) Negativa e Positiva. 
(E) Perfeita Negativa e Perfeita Positiva. 
 
Resposta: As queimadas cresceram em 94%, logo, apresenta uma correlação positiva. As 
queimadas diminuem a fertilidade do solo, logo, apresenta uma correlação negativa. 
 
5. (PS 2014.2) Os dados a seguir mostram o número de horas estudadas e suas respectivas 
notas em uma prova de matemática. 
 
X (tempo) Y (notas) 
1 6,5 
2 7,0 
3 7,5 
4 8,0 
5 8,5 
 
O valor aproximado do coeficiente de correlação linear para esses valores é: 
(A) 1,00. 
(B) -0,90. 
(C) 0,80. 
(D) 0,85. 
(E) 1,20. 
 
Resposta: 
 
X Y X² Y² X * Y 
1 6,5 1 42,25 6,5 
2 7,0 4 49 14 
3 7,5 9 56,25 22,5 
4 8,0 16 64 32 
5 8,5 25 72,25 42,5 
Total 15 37,5 55 283,75 117,5 
 
 
 
 ∑ ∑ ∑ 
√ ∑ ∑ ] ∑ ∑ ]
 
 
 
√ 
 
 
 
√ 
 
 
√ 
 
 
 
 
 
 
6. (PS 2012.2) A tabela representa as medidas de duas variáveis aleatórias: 
X 0 1 2 3 4 5 
Y 10 20 30 40 50 60 
 
O grau de correlação só pode ser: 
(A) 20%. 
(B) 35%. 
(C) 50%. 
(D) 80%. 
(E) 100%. 
 
Resposta: 
X Y X² Y² X * Y 
0 10 0 10 0 
1 20 1 40 20 
2 30 4 90 60 
3 40 9 160 120 
4 50 16 250 200 
5 60 25 360 300 
Total 15 210 55 910 700 
 
 
 ∑ ∑ ∑ 
√ ∑ ∑ ] ∑ ∑ ]
 
 
 
√ 
 
 
 
√ 
 
 
√ 
 
 
 
 
 
 
7. (P2 2010.2) O quadro seguinte apresenta a relação existente entre a massa muscular de uma 
pessoa e a idade. Para estudar essa relação, uma médica selecionou sete mulheres e 
observou a idade (X) e a massa muscular (Y) de cada indivíduo. 
Idade Massa muscular 
85 98,4 
77 109,2 
60 120 
80 81,6 
67 104,4 
87 87,6 
82 93,6 
 
Nesse caso, o coeficiente de correlação linear de Pearson é: 
(A) –0,78 
(B) –0,90 
(C) 0,90 
(D) 0,58 
(E) 0,87 
 
Resposta: O coeficiente de correlação linear de Pearson é -0,78 (Cálculo feito excel) 
 
 
8. (PS 2008.1) Foram estudadas duas variáveis emparelhadas, x e y, com desvios-padrão de 
2,6 e 3,1, respectivamente. Além disso, a covariância entre as variáveis x e y resultou em –
7,3. Com base nessas informações, pode-se afirmar que: 
 
(A) a variável x apresenta menor dispersão relativa do que a variável y. 
(B) existe uma correlação linear perfeita entre x e y. 
(C) existe uma forte correlação negativa entre x e y. 
(D) nada se pode afirmar sobre a força da correlação entre x e y. 
(E) existe uma forte correlação positiva entre x e y. 
 
Resposta: A correlação é entre duas médias, como só existe os desvios-padrões não é possível 
concluir, portanto nada se pode afirmas sobre a força da correlação entre x e y. 
 
9. (FGV OS 2010,1) Uma amostra de 20 observações mensais foi levantada por um analista do 
mercado de capitais para construir um modelo matemático que lhe responda qual é o 
percentual de retorno (Y) de uma ação ordinária de uma empresa tomando por base o índice 
Standard and Poor’s 500 (X). As informações disponíveis estão abaixo 
∑ 
∑ 
∑ 
∑ 
Onde y1 = Y1 – Y e xi = Xi – X 
Considerando os dados acima, podemos afirmas que: 
(A) A covariância entre as variáveis é positiva 
(B) Há uma baixa correlação entre Y e X 
(C) A covariância entre as variáveis é alta 
(D) A cada ponto de acréscimo no Índice SP- 500 o retorno da ação aumenta em R$0,226 
(E) A variância do Índice SP- 500 foi de 145,7 no período 
Resposta: A correlação entre duas variáveis é dada entre -1 e 1, portanto é positiva 
 
∑ ∑ 
 
 
 
 
 
 
 
 
 
 
10. (PS 2012.2) Na análise de duas séries de dados pareadas, observou-se uma correlação de 
0,15. Diante disso, é correto afirmar que: 
(A) o valor baixo de correlação indica proximidade entre as séries e a possibilidade de uma reta 
definir com fidelidade o comportamento observado. 
(B) o valor baixo de correlação indica divergência entre as séries e a possibilidade de uma reta 
definir com fidelidade o comportamento observado. 
(C) o valor baixo de correlação indica proximidade entre as séries e a dificuldade de uma reta 
definir com fidelidade o comportamento observado. 
(D) o valor baixo de correlação indica divergência entre as séries e a dificuldade de uma reta 
definir com fidelidade o comportamento observado. 
(E) o valor positivo de correlação indica proximidade entre as séries e a possibilidade de uma 
reta definir com fidelidade o comportamento observado. 
 
Resposta: Uma correlação de 0,15 é classificada como baixa, indicando diferenças entre as 
séries e indicando uma dificuldade em traçar uma linha reta entre elas. 
 
11. (ENADE 2018) Em pesquisa realizada com um conjunto de 15 empresas do setor varejista, 
no ano de 2017, foram levantadas, para cada uma delas, as seguintes informações: o 
investimento em responsabilidade socioambiental (IRSC), medido pelo percentual do 
investimento total aplicado em atividades e projetos socioambientais; a satisfação dos 
clientes (SAT), medida obtida de uma amostra de clientes, em escala que varia de 0 a 10; a 
lucratividade anual (LUC), referente à relação entre o lucro líquido total e a receita total; e o 
crescimento de receita (CREC) em relação a 2016, descontada a inflação. Os dados 
levantados estão dispostos na tabela a seguir. 
 
Foram extraídas medidas de correlação de Pearson entre IRSC e CREC (correlação de 0,72), e 
entre SAT e LUC (correlação de 0,17). Os gráficos a seguir apresentam essas relações entre as 
variáveis. 
 
Com base nos dados expostos, avalie as asserções a seguir e a relação proposta entre elas. 
I. Os gráficos refletem visualmente que a relação linear entre IRSC e CREC é mais forte do que 
SAT e LUC, o que indica níveis de correlação distintos: um mais próximo da associação perfeita 
(0,72), outro mais próximo da total falta de associação (0,17). 
PORQUE 
II. As correlações calculadas sinalizam que o marketing (associado com a variável SAT) e a 
relação com a sociedade (associada com a variável IRSC) predizem resultados financeiros de 
maneiras variadas; porém, tomadas em conjunto, pela soma das correlações (0,72 + 0,17), que 
se aproxima de 0,9, as duas variáveis predizem fortemente o resultado financeiro conjunto de 
CREC e LUC. 
 
A respeito dessas asserções, assinale a opção correta. 
(A) As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. 
(B) As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I. 
(C) A asserção I é uma proposição verdadeira, e a II é uma proposição falsa. 
(D) A asserção I é uma proposição falsa, e a II é uma proposição verdadeira. 
(E) As asserções I e II são proposições falsas. 
 
Resposta: Proposição um está correta, pois eles seguem uma linha linear e positiva e 
correlação maior que a segunda. Proposição 2 está errada, pois não é possível somar as 
correlações para deixar uma correlação maior. Portanto a alternativa correta é a C. 
 
MODELO REGRESSÃO LINEAR 
 
1. (PS 2014.1) Qual das informações a seguir corresponde à equação deuma reta de regressão 
simples e qual (is) é(são) o(s) coeficiente(s) necessário(s) para gerar tal equação, 
respectivamente? 
(A) y = Log(2x – 1). São necessários os coeficientes de inclinação e de intercepto. 
(B) y = 3x – e2x. São necessários os coeficientes de intercepto e de inclinação. 
(C) y = 32,4 + 2,15x. São necessários os coeficientes de inclinação e de intercepto. 
(D) y = 5x – 1. É apenas necessário o coeficiente de intercepto, pois o coeficiente de inclinação é 
optativo. 
(E) y = 32,4. É apenas necessário o coeficiente de inclinação, pois o coeficiente de intercepto é 
optativo. 
 
Resposta: 
Inclinação: y = 32,4 + 2,15x e Intercepto: 32,4. Portanto os dois são apresentados. 
 
 
O ENUNCIADO A SEGUIR SERÁ UTILIZADO PELAS DUAS PRÓXIMAS QUESTÕES 
 
2. (PS 2016.2) A função de regressão linear simples permite se estimar o custo mensal (em 
reais) com transporte dos funcionários de uma indústria em função de distância ( em 
quilômetros) existe entre a residência e a fábrica é assim expressa Y= 28,71 + 1,51 X . O custo 
mensal estimado com transporte de um funcionário que reside a 20km da fábrica é de 
aproximadamente: 
 
(A) R$69,00 
(B) R$30,00 
(C) R$32,00 
(D) R$59,00 
(E) R$29,00 
 
Cálculo: 
 ( ) 
Resposta: portanto o custo mensal estimado com transporte de um funcionário que reside a 
20km da fábrica é de R$59,00. 
 
3. Para cada km a mais na distância entre a residência do funcionário e a fábrica, é correto 
afirmar que o custo mensal estimado com o transporte desse funcionário: 
(A) não ocasiona alteração no custo mensal. 
(B) aumenta R$28,71. 
(C) aumenta R$1,51. 
(D) diminui R$1,51. 
(E) diminui R$28,71. 
Resposta: 1.51 multiplica a variável x, logo, a cada km a mais irá aumentar 1,51 
 
4. O custo mensal estimado com o transporte de um funcionário que resida a 0 km da fábrica é 
de: 
(A) R$0,00. 
(B) R$27,20. 
(C) R$30,22. 
(D) R$28,71. 
(E) R$1,51. 
 
Cálculo: 
 ( ) 
Resposta: O custo mensal estimado com o transporte de um funcionário que resida a 0 km da 
fábrica é de R$28,71 
 
 
5. (P2 2010.2) A função que melhor representa o comportamento do lucro de uma empresa 
relativo ao quantitativo de colaboradores é: Y = 60 - 1,5x. A quantidade limite de colaboradores 
que a empresa deve possuir para não ter lucro é de: 
(A) 60 
(B) 61,5 
(C) 15 
(D) 40 
(E) 58,5 
 
 
Cálculo: 
 
 
 
 
 
 
 
Resposta: A quantidade limite de colaboradores que a empresa deve possuir para não ter lucro 
é de 40. 
 
 
6. (FGV PS 2014.1) Um professor de estatística deseja utilizar o número de horas que um aluno 
estuda para uma prova final de estatística (x1) para prever a nota da prova final numa escala de 
0 a 100 (Y).Foi ajustado um modelo de regressão com base nos dados coletados 
(aleatoriamente) de uma classe durante o semestre anterior. O modelo ajustado foi: Y= 35 + 
3X1. Qual é a interpretação, respectivamente, do intercepto (b0) e para a inclinação (b1) da 
equação estimada ¿ 
 
(A) Alunos que estudam para a prova obtêm, em média, uma nota 38 na prova final. É previsto 
que o resultado para a prova final cresça, em média, 3 pontos para cada hora de aumento no 
tempo de estudo. 
(B) Alunos que não estudam para a prova obtêm, em média, uma nota 35 na prova final. É 
previsto que o resultado para a prova final cresça, em média, 3 pontos para cada hora de 
aumento no tempo de estudo. 
(C) Alunos que estudam para a prova obtêm, em média, uma nota 35 na prova final. É previsto 
que o resultado para a prova final cresça 35 pontos, em média, para cada hora de aumento 
no tempo de estudo. 
(D) Alunos que não estudam para a prova obtêm, em média, uma nota 3 na prova final. É 
previsto que o resultado para a prova final cresça 35 pontos, em média, para cada hora de 
aumento no tempo de estudo. 
(E) Alunos que estudam para a prova obtêm, em média, uma nota 35 na prova final. É previsto 
que o resultado para a prova final cresça , em média, 38 pontos,para cada hora de aumento 
no tempo de estudo. 
 
Cálculo: 
 ( ) 
 
Resposta: Portanto 35 sendo a constante e 3 a variável do X (prova final) Alunos que não 
estudam para a prova obtêm, em média, uma nota 35 na prova final. É previsto que o resultado 
para a prova final cresça, em média, 3 pontos para cada hora de aumento no tempo de estudo. 
 
 
 
7. (FGV PS 2010.1) Foi realizado um estudo para estimar a relação linear entre as variáveis 
Preço (Y), em reais, e demanda por um produto (X), em unidades. O modelo de regressão linear 
ajustado aos dados Y = 31,31 + 1,65X. Esse modelo passou no teste ANOVA, suas premissas 
foram observadas e nenhum valor extremo ou influente foi observado. Nessas circunstâncias, é 
possível afirmas que: 
 
(A) O aumento de uma unidade demanda desse produto faz com que seu preço aumente 
R$31,31 
(B) O aumento de uma unidade demanda desse produto faz com que seu preço aumente R$1,65 
(C) O aumento de R$1,00 desse produto faz com que sua demanda cresça R$1,65 
(D) O aumento de R$1,00 desse produto faz com que sua demanda cresça R$31,31 
(E) O aumento de R$1,00 desse produto faz com que sua demanda cresça R$32,96 
 
Resposta: a inclinação é R$1,65, logo a cada aumento de X em unidade o preço subirá R$1,65. 
 
8. (FGV OS 2014.2) Um modelo de regressão linear simples teve como variável dependente as 
vendas em um ano de uma amostra de 1.000 vendedores, mensurada em R$, e como variável 
independente, a variável X1 , que assume valor 1 quando o vendedor é o sexo masculino e zero 
quando contrário. A equação estimada foi: Y=15.000 – 2.500 X1 
Com base na equação estimada, é correto concluir que um vendedor o sexo: 
(A) Masculino vendeu, em média, R$2.500,00 a menos que um vendedor do sexo feminino. 
(B) Masculino vendeu, em média, R$17.2500,00 a menos que um vendedor do sexo feminino. 
(C) Feminino vendeu, em média, R$12.250,00 a mais que um vendedor do sexo masculino. 
(D) Feminino vendeu, em média, R$15.000,00 a menos que um vendedor do sexo masculino. 
(E) Feminino vendeu, em média, R$17.250,00 a menos que um vendedor do sexo masculino. 
 
Cálculo: 
 
 ( ) 
Resposta: Masculino (1), em média, R$2.500,00 a menos que um vendedor do sexo feminino. 
 
 
9. (P2 2012.1) A tabela a seguir indica as quantidades produzidas de um certo insumo agrícola e 
seus respectivos custos de produção. 
Quantidade (kg) 10 25 50 80 90 
Custo total (US$) 150 290 540 840 900 
 
Se a reta de mínimos quadrados que se ajusta aos dados é representada pela equação Y= 
55,29 + 9,58x, então podemos dizer que o valor mais provável para o custo fixo é: 
(A) 9,58. 
(B) 64,87. 
(C) 45,71. 
(D) 32,44. 
(E) 55,29. 
 
Resposta: Custo fixo = intercepto= 55,29. 
 
10. (PS 2016.1) A fábrica Porto Print analisou os custos totais de produção de determinadas 
quantidades de seu principal produto, que é o cartucho de impressora jato de tinta na cor preta, 
considerando cinco observações independentes, conforme a tabela a seguir: 
Quantidades Custos totais (R$) 
10 100 
20 230 
30 270 
40 410 
50 490 
 
Com base nas informações acima, o valor do custo variável e do custo fixo, em reais, é 
respectivamente: 
(A) 9,60 e 12,00. 
(B) 9,50 e 13,00. 
(C) 9,00 e 15,00. 
(D) 10,00 e 14,00. 
(E) 8,00 e 11,00. 
 
Memória de Cálculo: 
 
Cálculo: 
 
∑ 
∑ 
 
∑ (
 
 )
∑ (
 
 )
 
 [
( )
 
]
 (
 
 
)
 
 
 
 
 
∑ 
 
 (
∑ 
 
) ( ) 
Resposta: O valor do custo variável é $ 9,6 e do custo fixo $12 
 
11. (PS 2014.1) As informações contidas na tabela a seguir foram cedidas pelo gerente de uma 
rede de lojas que atua no mercado automotivo com a comercialização de peças para reparos. O 
gerente desejadeterminar a relação entre o número de comerciais de rádio divulgados nos fins 
de semana e as vendas nas lojas durante a semana seguinte. Os dados foram coletados durante 
dez finais de semanas e os valores das vendas estão expressos em um (1) por dez mil R$ 
(10.000,00). 
Semana 
Número de comerciais 
(X) 
Volume de vendas 
(Y) 
1ª 2,0 5,00 
2ª 5,0 5,70 
3ª 1,0 4,10 
4ª 3,0 5,40 
5ª 4,0 5,40 
6ª 1,0 3,80 
7ª 5,0 6,30 
8ª 3,0 4,80 
9ª 4,0 5,90 
10ª 2,0 4,60 
Os valores a seguir foram obtidos a partir da tabela acima: n = 10; Σx = 30; Σy = 51; Σxy = 162,9; 
Σx2 = 110; Σy2 = 265,76; (Σx)2 = 900 e (Σy)2 = 2601. Nesse contexto e com base nas informações 
disponíveis, pode-se afirmar que a Reta de Regressão Linear Simples é dada pela equação: 
(A) 0,495x + 3,615 
(B) 0,490x + 3,615 
(C) 0,495x + 3,610 
(D) 0,495x + 3,625 
(E) 0,485x + 3,635 
Cálculo: 
 
∑ 
∑ 
 
∑ (
 
 )
∑ (
 
 )
 
 [
( )
 ]
 
 
 
 
 
 
 
 
 
 
 (
∑ 
 
) 
 
 
 ( 
 
 
) 
Resposta: pode-se afirmar que a Reta de Regressão Linear Simples é dada pela equação 
0,495.x + 3,615 
12. (P2 2010.2) Um aluno de uma Faculdade de Administração precisa fazer um controle do 
número de cachorros-quentes vendidos na lanchonete de sua faculdade em função do número 
de refrigerantes vendidos. Para isso, levantou informações sobre o número de vendas/semana 
de refrigerantes e a quantidade vendida de cachorros-quentes. Após coleta das informações, 
durante o período de cinco semanas, obteve os resultados apresentados na tabela abaixo: 
Número de refrigerantes vendido/semana Número de cachorros-quentes vendidos/semana 
30 20 
45 30 
50 40 
42 29 
60 40 
 
Considere que: Σx = 227; Σy = 159; Σxy = 7568 e Σx2 = 10789 A equação linear que 
representa esse conjunto de dados, tal que y = a + bx, é: 
(A) y = -1,03 + 0,72x 
(B) y = -1,03 - 0,72x 
(C) y = 1,80 - 1,82x 
(D) y = -1,80 - 1,82x 
(E) y = 1,93 - 0, 22x 
 
Cálculo: 
 
∑ 
∑ 
 
∑ (
 
 )
∑ (
 
 )
 
 [
( )
 
]
 
 
 
 
 
 
 
 
∑ 
 
 (
∑ 
 
) 
 
 
 ( 
 
 
) 
 
Resposta: A equação linear que representa esse conjunto de dados, tal que y = a + bx, é – 1,03 
+ 0,72x 
 
 
 
13. (P2 2012.1) Os dados a seguir correspondem à renda familiar e ao custo com alimentação 
de uma pesquisa realizada com seis famílias de uma cidade do interior do estado de São Paulo. 
Renda familiar (X) Custo com alimentação (Y) 
R$ 1.920,00 R$ 1.080,00 
R$ 2.670,00 R$ 1.830,00 
R$ 1.840,00 R$ 1.190,00 
R$ 2.580,00 R$ 1.536,00 
R$ 3.200,00 R$ 1.960,00 
R$ 2.500,00 R$ 1.696,00 
 
A equação da reta de regressão estimada do custo com alimentação (Y) em função da renda 
familiar (X) é mais próxima de: 
(A) Y = 0,6571.X – 62,3235. 
(B) Y = 0,6571.X + 62,3235. 
(C) Y = – 0,6571.X – 62,3235. 
(D) Y = 1,6571.X + 62,3235. 
(E) Y = 1,6571.X – 62,3235. 
 
Memória de Cálculo: 
 
Cálculo: 
 
∑ 
∑ 
 
∑ (
 
 )
∑ (
 
 )
 
 [
( )
 ]
 
 
 
 
 
 
 
 
∑ 
 
 (
∑ 
 
) 
 
 
 ( 
 
 
) 
Resposta: A equação linear que representa esse conjunto de dados, tal que y = bx +a, é 
0,6571X – 62,41 
 
O ENUNCIADO A SEGUIR SERÁ UTILIZADO PELAS DUAS PRÓXIMAS QUESTÕES 
14. (FGV OS 2014.1) A função de regressão linear simples permite estimarmos o custo com 
saúde (em R$) (Y) como função da renda per capita familiar (em R$)(X). A equação de 
regressão pode ser expressa da seguinte maneira: Y= 28,8 + 0,07X 
Com base na equação acima, cada R$10,00 adicionados à renda mensal per capita familiar fará 
com que a família tenha seu gasto com saúde: 
 
(A) Aumentado, em média, R$28,8 
(B) Diminuindo, em média, R$28,8 
(C) Aumentado, em média, R$0,07 
(D) Diminuindo, em média, R$0,70 
(E) Aumentando, em média, R$0,70 
 
Cálculo: 
 
 
Resposta: Com base na equação acima, cada R$10,00 adicionados à renda mensal per capita 
familiar fará com que a família tenha seu gasto com saúde aumentando, em média R$0,70 
 
15. O gasto com saúde de uma família com uma renda per capita de R$ 2.400,00 será: 
(A) R$ 320,25 
(B) R$ 196,80 
(C) R$ 258,00 
(D) R$ 297,50 
(E) R$ 160,00 
 
Cálculo: 
 
 
Resposta: O gasto com saúde de uma família com uma renda per capita de R$ 2.400,00 será 
R$196,8. 
 
 
16. (PS 2010.2) Um extrato do estudo sobre o gasto mensal com educação realizado em famílias 
da classe “A”, em função do número de filhos, é apresentado a seguir: 
Número de filhos Gasto mensal (em reais) 
2 3.500,00 
3 4.000,00 
1 1.500,00 
6 8.000,00 
8 10.000,00 
 
Considerando: Σ Y = 27000; Σ X = 20; Σ YX = 148500 e Σ X2 = 114 
então, se um casal está planejando ter outro filho, o valor estimado do acréscimo de gasto 
mensal com educação dos filhos é de: 
(A) R$ 2.000,00 
(B) R$ 1.190,00 
(C) R$ 635,00 
(D) R$ 2.500,00 
(E) R$ 800,00 
 
Memória de Cálculo: 
Σ Y = 27000; Σ X = 20; Σ YX = 148500 e Σ X2 = 114 n = 5 
 
Cálculo: 
 
∑ 
∑ 
 
∑ (
 
 )
∑ (
 
 )
 
 [
( )
 
]
 
 
 
 
 
 
 
Resposta: O valor estimado do acréscimo de gasto mensal com educação dos filhos é de 
R$1.190,00 
 
 
17. (P2 2010.1) Ao examinar as estatísticas de um modelo de regressão linear simples, entre as 
variáveis venda de um produto (Y) e a renda dos consumidores (X), a variação total é igual a 2,5 
e a variação devida a outros fatores é igual a 0,1. Assim, é possível concluir que: 
(A) O coeficiente de correlação linear entre as variáveis é igual a 0,04. 
(B) O coeficiente de correlação linear entre as variáveis é igual a 0,96. 
(C) 98% da variação total da renda dos consumidores podem ser explicados pela variável 
volume de vendas. 
(D) 96% da variação total do volume de vendas podem ser explicados pela variável renda dos 
consumidores. 
(E) Esse modelo tem baixa capacidade preditiva. 
 
Cálculo: 
 
 
 
 
 
 
 
Resposta: o complementar do r² é igual a 96%96% da variação total do volume de vendas 
podem ser explicados pela variável renda dos consumidores. 
 
18. (PS 2016.1) Um modelo de regressão linear simples foi estimado com o seguinte conjunto de 
dados, em que Y é a variável dependente e X a variável independente: 
Loja Espaço de prateleira (X) (m) Vendas semanais (Y) 
1 2 160 
2 2 220 
3 2 140 
4 5 190 
5 5 240 
6 5 260 
7 8 230 
8 8 270 
9 8 280 
10 10 260 
 
Com base nos dados apresentados, o r2 obtido é de: 
(A) r2 = 0,35. 
(B) r2 = 0,68. 
(C) r2 = 0,58. 
(D) r2 = 0,48. 
(E) r2 = 0,25. 
 
Cálculo: 
 
Reposta: resolvendo no excel a função = RQUAD encontra-se o valor de 0,58. 
19. (PS 2010.1) Um estudo sobre a relação entre as variáveis Renda e Gasto com alimentação, 
com 7 famílias, apresentou Soma de quadrados total, SQT = 60,8591, e Soma dos quadrados 
dos resíduos, SQR = 4,9283. A média amostral da variável Y foi 9,1429, com b0 = 1,1414 e b1 = 
0,2642. O coeficiente de determinação obtido e a respectiva interpretação são: 
(A) r2 = 0,87; 87% da variação total nos gastos com alimentação foi explicada pela renda. Assim, 
para previsões, é melhor utilizar o modelo linear obtido e não a média amostral. 
(B) r2 = 0,92; 92% da variação total nos gastos com alimentação foi explicada pela renda. Assim, 
para previsões, é melhor utilizar o modelo linear obtido e não a média amostral. 
(C) r2 = 0,81; 81% da variação total nos gastos com alimentação foi explicada pela renda. Assim, 
para previsões, é melhor utilizar o modelo linear obtido e não a média amostral. 
(D) r2 = 0,96; 4% da variação total nos gastos com alimentação não foi explicada pelo modelo. 
Assim, para previsões, é melhorutilizar o modelo linear obtido e não a média amostral. 
(E) r2 = 0,08; 8% da variação total nos gastos com alimentação foi explicada pela renda. Assim, 
para previsões, é melhor utilizar o modelo linear obtido e não a média amostral. 
 
Memória de Cálculo: 
 SQT= 60,8591 
 SQR = 4,9283 
 Y = 9,1429 
 B0= 1,1414 
 B1= 0,2642 
Cálculo: 
 
 
 
 
 
 
 
 
 
 
Resposta: O coeficiente de determinação obtido e a respectiva interpretação são r2 = 0,92; 92% 
da variação total nos gastos com alimentação foi explicada pela renda. Assim, para previsões, é 
melhor utilizar o modelo linear obtido e não a média amostral. 
 
 
 
20. (P2 2014.2) Um modelo de regressão linear simples foi estimado e os valores observados e 
previstos pela reta de regressão para variável dependente estão na tabela a seguir: 
 
Y observado Y previsto 
36 11 
27 16 
23 33 
11 40 
28 11 
45 10 
 
Dado que a soma de quadrados total foi de 3500, o valor aproximado para o R2 desse modelo é: 
(A) 2,5%. 
(B) 4,5%. 
(C) 6,5%. 
(D) 8,5%. 
(E) 10,5%. 
 
Cálculo: 
 
Resposta: usando o Excel o valor aproximado para o R2 desse modelo é 8,5%. 
21. (P2 2012.1) Foi realizado um levantamento de informações que buscava estabelecer uma 
relação linear entre o rendimento anual (R$) de profissionais com cursos de doutorado e o tempo 
decorrido de sua titulação. Os dados coletados são apresentados na tabela a seguir. 
 
Anos após doutoramento R$ anual 
2 60.000 
4 66.000 
5 66.000 
7 72.000 
8 74.400 
9 75.600 
10 84.000 
12 90.000 
 
Após estabelecida a equação de regressão linear que representa este conjunto de dados, 
obteve-se o valor de 0,95 para o coeficiente de determinação (r2). Baseando-se nessa 
informação, é correto dizer que: 
(A) 95% da variabilidade do rendimento anual é explicada pelo número de anos decorridos após 
titulação. 
(B) 0,95 é a probabilidade de um doutor ganhar R$66.000,00 a cada 5 anos de trabalho. 
(C) 95% da variabilidade da remuneração anual estão em função do título recebido. 
(D) em média, a cada ano que passa, o rendimento aumenta 9,5%. 
(E) não existe correlação entre as duas variáveis em questão. 
 
Resposta: A pesquisa é feita com a população de pessoas que recebem aumento após a 
titulação do doutorado e o aumento da renda anual, portanto o valor de 0,95 (95%) para r² é o 
valor da da variabilidade do rendimento anual do número de anos decorridos após titulação. 
 
22. (P2 2012.1) Os dados da tabela a seguir relacionam a quantidade em kg/m2 de Nitrogênio 
(fertilizante) aplicado ao solo e o rendimento obtido (kg/m2) de um cultivo de milho. A equação de 
regressão linear que representa esse conjunto de dados é: y = 2,4476x + 31,41 com r2 de 0,89. 
Nitrogênio (kg/m2) (x) Rendimento (kg/m2) (y) 
0,4 32 
0,5 32 
1,1 35 
1,8 37 
2,5 37 
2,5 37 
 
A partir do exposto, é correto afirmar que: 
(A) o rendimento esperado do feijão é de 31,41 em kg/m2 quando não é aplicado nitrogênio na 
lavoura. 
(B) a aplicação de nitrogênio na lavoura não altera o rendimento do feijão. 
(C) a variável Nitrogênio (kg/m2), nesse exemplo de dados, é a variável dependente. 
(D) a variação de nitrogênio aplicado explica somente 2,44% da variação da produtividade do 
feijão. 
(E) se forem aplicados 1,5 kg/m2 de nitrogênio na lavoura, será obtida uma produtividade de 30 
kg/m2. 
 
Cálculo: 
 ( ) 
Resposta: O valor de 31,41 em kg/m2 é constante, portanto não há a necessidade de colocar a 
variável nitrogênio (x). 
 
23. (P2 2016.1) Se a soma de quadrados devido à regressão for zero, em um modelo de 
regressão linear simples que relaciona Y (variável dependente) e X (variável independente), a 
reta estimada para esse modelo será: 
(A) uma reta negativamente inclinada. 
(B) uma parábola (ou função do segundo grau). 
(C) uma reta vertical. 
(D) uma reta horizontal. 
(E) uma reta positivamente inclinada. 
 
Resposta: Já que a soma de quadrados da regressão é zero com as duas variáveis Y 
(dependente) e X (independente), portanto multiplicando as variáveis de Y com 0 terá uma reta 
na horizontal. 
 
24. (P2 2016.1) Foi estimado um modelo de regressão linear simples em que a variável 
dependente é vendas (em R$) e a independente é experiência (em anos). O resultado indicou 
um intervalo de confiança de 95% para o beta estimado relacionado a variável experiência de 
[−30; 30]. Com base nesse resultado e considerando um nível de significância de 5%, pode-se 
concluir que: 
(A) rejeita-se a hipótese nula do teste F. 
(B) a variável experiência não foi significante a 5%. 
(C) estatisticamente um aumento na experiência reduz as vendas. 
(D) rejeita-se a hipótese nula do teste t. 
(E) o valor-p foi menor do que 5%. 
 
Cálculo: 
 
 
Resposta: valor crítico < alfa, portanto a variável experiência não foi significante a 5%. 
 
 
25. (P2 2012.2) Rafael realizou uma regressão para testar a influência do tempo de experiência 
de seus vendedores (em anos) sobre suas vendas anuais (em Reais). Para testar a premissa de 
homoscedasticidade desse teste, qual dos gráficos a seguir é mais indicado? 
 
 
 
 
Resposta: A resposta correta é a alternativa C, as demais são respectivamente: A = Princípio da 
normalidade; B = Tem um padrão; D = Tem um padrão; e E = Princípio da normalidade. 
 
26. (P2 2014.2) O diagrama de dispersão a seguir mostra a relação entre a variável dependente 
Y e independente X. 
 
Se um modelo de regressão linear simples for estimado com esses dados coletados 
aleatoriamente, qual premissa do modelo seria violada? 
(A) Independência da variável dependente. 
(B) Homocedasticidade dos resíduos. 
(C) Linearidade dos coeficientes estimados. 
(D) Alta correlação entre as variáveis dependente e independente do modelo. 
(E) Normalidade da variável independente. 
 
Resposta: o princípio da Homocedasticidade dos resíduos é serem igual e/ou parecidos. 
27. (P2 2012.1) Observe, atentamente, os três gráficos dos resíduos de um certo modelo 
ajustado. 
 
As suposições invalidadas do modelo de regressão em cada um dos gráficos acima são 
respectivamente: 
(A) normalidade, independência e homocedasticidade. 
(B) independência, normalidade e homocedasticidade. 
(C) independência, homocedasticidade e normalidade. 
(D) homocedasticidade, independência e normalidade. 
(E) homocedasticidade, normalidade e independência. 
 
Resposta: No primeiro gráfico as variáveis são dependentes, no segundo são diferentes 
(heterocedástico) e o terceiro a variável não é normal, portanto as suposições que contrariam 
essas afirmações são as da alternativa C independência, homocedasticidade e normalidade. 
28. (P2 2012.2) Um pesquisador estimou um modelo de ANOVA para cada uma das situações 
apresentadas nos gráficos 1 e 2. 
 
Com base nos gráficos, assinale quais as possíveis conclusões dos testes. 
(A) As conclusões dos modelos não seriam válidas, uma vez que no primeiro modelo a premissa 
de homoscedasticidade seria violada e no segundo a premissa de normalidade seria violada. 
(B) No primeiro teste, provavelmente a hipótese nula do teste seria rejeitada, uma vez que a 
média das notas dos alunos que frequentaram o cursinho A é inferior à média dos que 
frequentaram o cursinho C. Já no segundo teste, provavelmente a hipótese nula não seria 
rejeitada, pois as médias das notas são iguais. 
(C) As conclusões dos modelos não seriam válidas, uma vez que no primeiro modelo a premissa 
de normalidade seria violada e no segundo teste a premissa de homoscedasticidade seria 
violada. 
(D) As conclusões dos modelos seriam válidas, uma vez que em ambos as premissas foram 
respeitadas. 
(E) As conclusões dos modelos não seriam válidas, uma vez que no primeiro modelo a premissa 
de normalidade seria violada e no segundo as premissas de normalidadee homoscedasticidade 
seriam violadas. 
 
Resposta: No Gráfico 1 não segue o princípio da normalidade já no Gráfico 2 não segue um 
padrão. 
 
29. (PS 2010.2) O modelo de regressão linear para os rendimentos médios mensais de dois 
ativos financeiros nos últimos 10 meses produziram, respectivamente, as tabelas ANOVA 
abaixo: 
Tabela ANOVA para Ativo Financeiro “A” 
 
gl SQ MQ F F de significância 
Regressão 1 35,34701 35,3470088 15,07898 0,004653917 
Resíduo 8 18,75299 2,3441239 
 
Total 9 54,1 
 
 
Tabela ANOVA para Ativo Financeiro “B” 
 
gl SQ MQ F F de significância 
Regressão 1 36,81799 36,81799 1,505217 0,25479609 
Resíduo 8 195,682 24,46025 
 
Total 9 232,5 
 
 
Considerando o nível de significância de 5%, pode-se afirmar que: 
(A) o modelo linear para o ativo A adere aos dados tão bem quanto o modelo linear para o ativo 
B. 
(B) o modelo linear para o ativo B adere aos dados melhor do que o modelo linear para o ativo A. 
(C) a variação não explicada de ambos os modelos tem valores muito próximos. 
(D) a variação não explicada do modelo A é bem menor que a do modelo B, portanto o primeiro 
adere melhor aos dados que o segundo. 
(E) a variação não explicada para o modelo B é bem maior que a do modelo A, portanto o 
primeiro adere melhor aos dados que o segundo. 
 
Resposta: F de significância de A (0,004653917) < F de significância de B (0,25479609), 
considerando o nível de significância 5% portanto o primeiro adere melhor aos dados que o 
segundo. 
 
30. (P2 2012.2) Felipe quer investigar se o número de exercícios de estatística que os alunos 
fazem na véspera da prova afeta a nota dos alunos. Para isso, primeiro realizou um teste de 
ANOVA e, em seguida, realizou uma regressão linear simples, em que a nota do aluno na prova 
de estatística era sua variável dependente, e o número de exercícios realizados na véspera da 
prova era a sua variável independente. Após comparar os resultados dos testes, Felipe ficou 
intrigado: percebeu que o teste ANOVA deu significante e que o teste de regressão simples não 
deu significante para a variável “número de exercícios realizados na véspera da prova”. Com 
base nesses resultados, o que Felipe pode concluir? 
(A) O resultado da regressão simples está errado, já que o teste mais adequado nesse caso 
seria uma regressão múltipla. 
(B) O resultado do teste ANOVA está errado, já que a regressão simples apresenta um resultado 
com um grau de significância maior. 
(C) O resultado da regressão simples está errado, já que o teste ANOVA apresenta um resultado 
com um grau de significância maior. 
(D) É possível que o teste ANOVA e a regressão simples apresentem resultados diferentes 
nesse caso, tendo em vista que a regressão simples só identifica relações lineares entre 
variáveis, enquanto o teste ANOVA compara médias de grupos diferentes. 
(E) É possível que o teste ANOVA e a regressão simples apresentem resultados diferentes 
nesse caso, tendo em vista que o teste ANOVA só identifica relações lineares entre variáveis, 
enquanto a regressão simples compara médias de grupos. 
 
Resposta: A regressão pode mostrar uma relação linear entre as variáveis, já o teste ANOVA 
pode mostrar uma média diferente. 
 
 
31. (P2 2014.1) Analise as seguintes sentenças: 
I. Em um teste de comparação de variâncias, se o valor da estatística do teste t superar o valor t 
crítico, pode-se concluir que as variâncias são diferentes. 
II. Em teste de hipótese para comparação de médias para amostras independentes, assume-se 
que os resíduos são independentes. 
III. A estatística do teste t em um modelo de regressão linear simples é obtida por meio da razão 
entre o beta estimado e seu erro-padrão. 
Está (ão) INCORRETA(S) APENAS a(s) sentença(s): 
(A) I. 
(B) II. 
(C) I e II. 
(D) I e III. 
(E) II e III. 
 
Resposta: 
 Alternativa 1 (errada) = Teste F que compara as variâncias. 
 Alternativa 2 (errada) = A variável que deve ser independente. 
 
32. (P2 2012.2) Em um modelo de regressão linear simples que tem como variável dependente o 
gasto anual em atividades culturais (em Reais) e como variável independente a idade (em anos), 
o R2 encontrado foi igual a zero. Com base nessas informações e com nível de significância de 
0,05, pode-se afirmar que a variável: 
(A) independente “idade” apresentou um valor-p inferior a 5%, indicando que ela é significante 
para o modelo. 
(B) independente “idade” apresentou um valor-p superior a 5%, indicando que ela não é 
significante para o modelo. 
(C) dependente “gasto anual em atividades culturais” apresentou um valor-p superior a 5%, 
indicando que ela não é significante para o modelo. 
(D) dependente “gasto anual em atividades culturais” apresentou um valor-p superior a 5%, 
indicando que ela é significante para o modelo. 
(E) dependente “gasto anual em atividades culturais” apresentou um valor-p inferior a 5%, 
indicando que ela é significante para o modelo. 
 
Resposta: Pelo coeficiente de determinação (R²) ser 0 não existe nenhuma relação significativa 
entre as variáveis, como a variável “idade” é independente apresenta um valor-p > que 5%. 
 
 
33. (PS 2008.1) Com base na tabela abaixo, obtida a partir do ajuste de um modelo de regressão 
linear, é correto afirmar que: 
ANOVA 
 
Gl SQ MQ F F de significação 
Regressão 1 247114,29 247114,29 53,95 0,01804 
Resíduo 2 9160,71 4580,36 
 
Total 3 256275,00 
 
 
(A) o coeficiente de inclinação não é significativo. 
(B) o modelo se ajusta aos dados para α = 0,05. 
(C) a relação entre as variáveis é não-linear. 
(D) o modelo não se ajusta aos dados para α = 0,05. 
(E) o intercepto não é significativo. 
 
Memória de Cálculo: 
 
 
 
 
 
 
 
=0,05 
Resposta: o modelo se ajusta aos dados para alfa = 0,05 
 
 
34. (P2 2016.2) Em uma Análise de Regressão, ao se realizar um teste t para a inclinação, se for 
encontrado, para um dos regressores, um valor-p menor do que o risco, é correto afirmar que: 
(A) a hipótese nula de β > 0 é rejeitada. 
(B) a hipótese nula de β = 0 é rejeitada. 
(C) a hipótese nula de β ≥ 0 é rejeitada. 
(D) a hipótese nula de β ≤ 0 não é rejeitada. 
(E) a hipótese nula de β = 0 não é rejeitada. 
 
Resposta: valor p < que alfa, maior a evidência contra a hipótese nula, portanto a H1 B=0 é 
rejeitada e H1 B> 0 aceita 
 
35. (ENADE 2012) As tabelas a seguir apresentam estimativas de regressão entre os retornos 
da empresa Alfa, que atua na produção e comercialização de piscinas e implementos para 
piscinas nas cidades de São Paulo, Rio de Janeiro, Belo Horizonte e Vitória, e retornos do 
Ibovespa (Índice da Bolsa de Valores de São Paulo) 
 
Considerando que o modelo estimado é robusto à presença de auto correlação e 
heterocedasticidade nos resíduos, avalie as asserções a seguir e a relação proposta entre elas. 
I. O risco de mercado da empresa Alfa é menor do que o do Ibovespa (carteira de mercado), o 
que significa que os retornos esperados para a Alfa serão menores do que os retornos 
esperados para o índice Bovespa. PORQUE 
II. O modelo é estatisticamente não significante tendo em vista que não se pode rejeitar a 
hipótese de que os coeficientes da regressão sejam estatisticamente diferentes de zero. 
A respeito dessas asserções, assinale a opção correta. 
(A) As asserções I e II são proposições verdadeiras, e a II é uma justificativa da I. 
(B) As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa da I. 
(C) A asserção I é uma proposição verdadeira, e a II é uma proposição falsa. 
(D) A asserção I é uma proposição falsa, e a II é uma proposição verdadeira. 
(E) As asserções I e II são proposições falsas. 
 
Resposta: A alternativa I está correta pois quando menos o valor –p menor os valores 
esperados de retorno, ou seja Rico Alfa < do Ibovespa. A alternativa II está correta pois Ho 
diferente de 0,rejeita. 
36. (P2 2018.2) Vânia é analista de sistemas e recebeu a tarefa de determinar as relações 
existentes entre as variáveis Y e X. Através de uma reta de regressão linear Y = a + bX, obteve 
COV (Y, X) = 280 e VAR (X) = 5,30. Com base nesses dados, o valor de b na equação de 
regressão é, aproximadamente, de: 
(A) 87,40. 
(B) 52,83. 
(C) 13,42. 
(D) 0,02. 
(E) 9,97. 
 
Cálculo: 
 
 
 
 
 
 
 
Resposta: O valor de b na equação de regressão é, aproximadamente, de 52,83. 
 
37. (PS 2018.2) Utilizando o método dos mínimos quadrados, um estatístico está desenvolvendo 
um modelo de regressão para determinar a relação entre a quantidade de quilômetros 
percorridos pelos veículos de uma transportadora e o gasto de combustível. Dessa forma, os 
testes de hipóteses aplicados a esse modelo somente serão válidos se os resíduos forem: 
(A) única e exclusivamente normais. 
(B) obrigatoriamente nulos. 
(C) normais, dependentes entre si e homocedásticos. 
(D) todos, obrigatoriamente, positivos. 
(E) normais, independentes entre si e homocedásticos. 
 
Resposta: Pressupostos da regressão são os resíduos serem Independênctes de erros(requer 
que os erros sejam independentes entre si); Normalidade de erros(requer que os erros sejam 
normalmente distribuídos para cada um dos valores de X); e Igualdade de variâncias ou 
Homoscedasticidade (requer que a variância dos erros seja constante em relação a todos os 
valores de X). 
. 
 
 
38. (ENADE 2018) Um estudo desenvolvido para avaliar a relação entre a cobertura por serviços 
de saneamento e indicadores epidemiológicos nos países da América Latina, analisou a taxa de 
mortalidade infantil, processando-se a análise por meio de regressão linear múltipla, conforme 
mostrado na tabela a seguir. Encontrou-se um coeficiente R2 ajustado de 0,782, tendo 
permanecido, no modelo final, as variáveis Esperança de vida ao nascer e Cobertura por 
sistemas de esgotamento sanitário. 
 
A partir das informações apresentadas, avalie as afirmações a seguir. 
I. Os indicadores de Esperança de vida ao nascer e Cobertura por sistemas de esgotamento 
sanitário apresentaram coeficiente β negativo, mostrando uma relação inversamente 
proporcional à taxa de mortalidade infantil. 
II. Na análise dos dados estatísticos, fica evidenciado que o aumento da Cobertura por sistemas 
de esgotamento sanitário determina uma queda na taxa de mortalidade infantil. 
III. O aumento na variável Esperança de vida ao nascer aumentará a taxa de mortalidade infantil. 
É correto o que se afirma em 
(A) I, apenas. 
(B) III, apenas. 
(C) I e II, apenas. 
(D) II e III, apenas. 
(E) I, II e III. 
 
Resposta: A alternativa I está correta pois se a esperança de vida ao nascer é negativa portanto 
é inversamente proporcional a taxa de mortalidade (menos esperança de vida = maior taxa de 
mortalidade). Já a alternativa II evidencia uma queda da taxa de mortalidade em relação a 
cobertura por sistemas de esgotamento sanitário. 
 
39. (ENADE 2018) Uma empresa criou um produto para ser lançado no mercado e, para tanto, 
foi realizado um estudo de mercado que indicou a demanda estimada entre 100 e 600 unidades 
de produto por mês. De posse dessas informações, o pessoal do departamento de custos da 
empresa calculou a lucratividade esperada da venda do produto, conforme volume de vendas, 
traçou a linha de tendência a partir da equação de regressão e calculou o R-quadrado, obtendo 
os dados e o gráfico a seguir 
 
O departamento de marketing da empresa avaliou que a demanda pelo produto é sazonal, 
estando a expectativa de vendas, nos meses de baixa demanda, próxima de 150 unidades e, 
nos meses de alta demanda, em aproximadamente 550 unidades. O preço de venda operado 
pela empresa em qualquer dos cenários será de R$ 6,00. 
A respeito dessa situação hipotética, avalie as afirmações a seguir. 
I. Nos meses de alta demanda, segundo a previsão do departamento de marketing da empresa, 
espera-se uma lucratividade de 80%. 
II. Nos meses de baixa demanda, segundo a previsão do departamento de marketing da 
empresa, espera-se uma lucratividade de 40%. 
III. Nos meses de alta demanda, segundo a previsão do departamento de marketing da empresa, 
o lucro líquido da empresa será de R$ 3 300,00. 
IV. O R-quadrado indica que a correlação entre as variáveis é significativa. 
É correto apenas o que se afirma em 
(A) I e III. 
(B) I e IV. 
(C) II e III. 
(D) I, II e IV. 
(E) II, III e IV. 
 
Resposta: A alternativa B está correta porque as sentenças I e IV estão certas: 
I - no pico da demanda (600) a lucratividade é 0,8 que multiplicando por 100 é igual a 80%. 
IV - Utiliza-se o teste F geral para determinar se existe uma relação significativa entre a variável 
dependente e o conjunto de variáveis independentes, portanto o R² (SQReg/SQT) 
INTRODUÇÃO À REGRESSÃO MÚLTIPLA 
1. (FGV OS 2012.1) Um proprietário de uma empresa de telefonia fez um estudo estatístico 
para prever a produtividade de seus funcionários (em número médio de atendimentos 
telefônicos por dia), em função da quantidade de café ingerida (em número médio de copos 
de café por dia) e tempo de sono por noite (em horas médias dormidas por noite). Como 
resultado de seu estudo, chegou à seguinte equação: 
 
Com base no estudo descrito e na equação dele resultante, pode-se afirmar que se trata de uma 
regressão: 
a) Múltipla, na qual a produtividade dos funcionários é a variável independente, e quantidade de 
café ingerida e o tempo de sono por noite são as variáveis dependentes. 
b) Simples, na qual a produtividade dos funcionários é a variável independente, a quantidade de 
café ingerida é variável dependente, e o tempo de sono por noite é apenas uma variável de 
controle. 
c) Simples, na qual a produtividade dos funcionários é variável independente, o tempo de sono 
por noite é a a variável dependente, e a quantidade de café ingerida é apenas uma variável 
de controle. 
d) Simples, na qual a produtividade dos funcionários é a variável dependente, a quantidade de 
café ingerida é a variável independente, e o tempo de sono por noite é apenas uma variável 
de controle. 
e) Múltipla, na qual a produtividade dos funcionários é a variável dependente, e a quantidade de 
café ingerida e o tempo de sono por noite são as variáveis independentes. 
 
Resposta: Os modelos de regressão múltipla utilizam duas ou mais variáveis independentes 
para prever o valor de uma variável dependente, portanto a a produtividade dos funcionários é a 
variável dependente, e a quantidade de café ingerida e o tempo de sono por noite são as 
variáveis independentes. 
 
 
 
2. (P2 2012.2) Frederico quer estimar a equação de um modelo que relaciona o número de 
votos recebidos pelo candidato eleito de alguns municípios (em mil habitantes) com o número 
de eleitores desses municípios (em mil habitantes) e com os gastos totais dos candidatos em 
campanha (em mil reais). Para tal, fez uma regressão múltipla, e obteve os resultados a 
seguir: 
Modelo 
Soma dos 
Quadrados 
Graus de 
Liberdad
e 
Média dos 
Quadrado
s 
F 
Valor-
p 
Regressão 76633,617 2 38316,809 119,934 0,000 
Residual 9903,966 31 319,483 
 
Total 86537,584 33 
 
Modelo 
Coeficientes não 
padronizados 
Coeficientes 
padronizad
os T 
Valor-
p 
B Erro-padrão Beta 
(Constante) 10,907 6,401 
 
1,704 0,098 
Número de eleitores do 
município (mil habitantes) 
0,70 0,020 0,302 3,466 0,002 
Gastos de campanha do 
candidato (R$ 1000) 
0,010 0,001 0,700 8,027 0,000 
Variável dependente: Número de votos obtidos pelo candidato (mil habitantes) 
Com base nas tabelas apresentadas, e a partir do modelo de regressão linear múltipla 
 
onde X1 corresponde à variável número de elitores” do município” e X2 corresponde à variável 
“gastos de camapnha do candidato”, Frederico pode estimar a seguinte equação: 
a)Y = 10,907 + 0,302X1 + 0,700 X2 
b) Y = 119,934 + 0,302X1 + 0,700 X2 
c) Y = 10,907 + 0,70X1 + 0,010 X2 
d) Y = 0 + 0,7X1 + 0,010 X2 
e) Y = 0 + 0,302X1 + 0,700 X2 
Resposta: 
 
 ( )
 ( ) 
 
O ENUNCUINADO ABAIXO SERÁ UTILIZADO PELAS DUAS PRÓXIMAS QUESTÕES 
(PS 2016.2) Suponha que a função de regressão apresentada a seguir estabeleça a relação 
entre a variável VARA (dependente) e VARB, VARC e VARD (independente): 
 
3. É correto afirmas que, para VARB = 5, VARC = 3 e VARD = 6, o valor de VARA é igual a : 
a) 32,5 
b) 62,5 
c) 67,5 
d) 77,5 
e) 60 
Resposta: 
 ( ) ( ) ( ) 
 
4. Com relação à função de regressão apresentada, é correto afirmar que, para um acréscimo 
de uma unidade ao valor de VARB, o valor de VARA: 
(A) Não sofrerá alteração. 
(B) Diminuirá 18 unidades. 
(C) Diminuirá 3 unidades. 
(D) Aumentará 18 unidades. 
(E) Aumentará 3 unidades. 
 
Resposta: Aumenta três unidades já que a função é 3 x VARB. 
O ENUNCIADO A SEGUIR SERÁ UTILIZADO PELAS PRÓXIMAS TRÊS QUESTÕES 
(P2 2016.1) Um pesquisador estava interessado em verificar se existem diferenças entre os 
salários de homens e mulheres. Para isso, coletou uma amostra aleatória de 200 pessoas (100 
homens e 100 mulheres) e estimou a seguinte equação de regressão múltipla: 
 = 3000 + 800 𝑀 + 300 𝐸 + 500 𝐸 ê 
Em que: Y = salário mensal em R$; Homem = 1 se indivíduo do sexo masculino e 0 feminino; 
Escolaridade = anos completos de escolaridade; e Experiência = anos de experiência no 
mercado de trabalho. 
5. Todos os coeficientes estimados foram significantes a 5%, logo pode-se afirmar que os 
homens ganham: 
(A) R$4.600,00 a mais que as mulheres, em média, mantendo escolaridade e experiência 
constantes. 
(B) R$1.600,00 a mais que as mulheres, em média, mantendo escolaridade e experiência 
constantes. 
(C) R$800,00 a mais que as mulheres, em média, mantendo escolaridade e experiência 
constantes. 
(D) R$3.800,00 a mais que as mulheres, em média, mantendo escolaridade e experiência 
constantes. 
(E) R$1.100,00 a mais que as mulheres, em média, mantendo escolaridade e experiência 
constantes. 
 
Resposta: Homens ganham a mais que mulheres R$800,00 em média, mantendo escolaridade 
e experiência constante: 
 Homem 1 = 800 x 1 = 800 
 Mulher 0 = 800 x 0 = 0 
 
 
6. Assinale a alternativa que contém a correta interpretação do coeficiente associado à variável 
experiência. 
(A) Um ano adicional na experiência reduz, em média, R$1.600,00 no salário mensal, mantendo 
as outras constantes. 
(B) Um ano adicional na experiência reduz, em média, R$500,00 no salário mensal, mantendo as 
outras constantes. 
(C) Um ano adicional na experiência incrementa, em média, R$1.600,00 no salário mensal, 
mantendo as outras constantes. 
(D) Ter experiência incrementa, em média, R$500,00 no salário mensal, mantendo as outras 
constantes. 
(E) Um ano adicional na experiência incrementa, em média, R$500,00 no salário mensal, 
mantendo as outras constantes. 
 
Resposta: Experiência = 1 = 500 x 1 = 500 . Um ano de experiência retribui a um aumento de 
R$500,00 no salário. 
 
 
7. Assinale a alternativa que contém o valor previsto para o salário de uma mulher com 10 anos 
de escolaridade e experiência de mercado. 
(A) R$10.700,00. 
(B) R$11.000,00. 
(C) R$11.800,00. 
(D) R$8.000,00. 
(E) R$8.800,00. 
 
Resposta: 
 ( ) ( ) ( ) 
 
O valor previsto para o salário de uma mulher com 10 anos de escolaridade e experiência de 
mercado é de R$11.00 
 
 
8. (P2 2012.2) Um estagiário de uma grande livraria, a pedido de seu chefe, realizou uma 
regressão linear múltipla para analisar o efeito dos anos de estudo e do tempo de experiência 
(em anos) sobre as vendas médias mensais (em Reais) dos vendedores que trabalham nas 
filiais dessa grande livraria. Entretanto, ao rodar a regressão, o estagiário percebeu que havia 
apagado o nome das variáveis e, portanto, não conseguia mais identificar qual das variáveis 
independentes era significante no modelo. O resultado obtido a partir da regressão pode ser 
observado na tabela a seguir: 
Modelo 
Coeficientes não 
padronizados 
Coeficientes 
padronizados t 
Valor-
p 
B Erro-padrão Beta 
(Constante) 1359,1 824,08 
 
1,649 0,102 
X1 36,569 1,252 0,948 29,21 0 
X2 0,343 20,967 0,001 0,016 0,987 
Variável dependente: Y 
O estagiário lembrou, entretanto, que tinha salvado em seus arquivos alguns gráficos de 
dispersão em que as variáveis estavam sendo identificadas. Os gráficos salvos pelo estagiário 
podem ser observados a seguir: 
 
Com base nas informações apresentadas, pode-se afirmar que; 
(A) provavelmente, a variável “Anos de Estudo” corresponde à variável X1 do modelo, porque o 
gráfico 1 parece mostrar não haver relação entre “Anos de Estudo” e “Vendas”, e a variável 
X1 não é significante para o modelo. 
(B) provavelmente, a variável “Tempo de Experiência” corresponde à variável X1 do modelo, 
porque o gráfico 2 parece mostrar não haver relação entre “Tempo de Experiência” e 
“Vendas”, e a variável X1 é não significante para o modelo. 
(C) provavelmente, a variável “Anos de Estudo” corresponde à variável X2 do modelo, porque o 
gráfico 1 parece mostrar não haver relação entre “Anos de Estudo” e “Vendas”, e a variável 
X2 não é significante para o modelo. 
(D) provavelmente, a variável “Tempo de Experiência” corresponde à variável X2 do modelo, 
porque o gráfico 2 parece mostrar haver relação entre “Tempo de Experiência” e “Vendas”, e 
a variável X2 é significante para o modelo. 
(E) provavelmente, a variável “Anos de Estudo” corresponde à variável X1 do modelo, porque o 
gráfico 1 parece mostrar haver relação entre “Anos de Estudo” e “Vendas”, e a variável X1 é 
significante para o modelo. 
 
Resposta: O gráfico 1 não contém relação, logo, anos de estudo é a variável do 2. 
9. (P2 2012.2) A decomposição da variabilidade de uma variável em função de outra variável é 
um recurso importante utilizado pelos modelos estatísticos. Diante disso, em quais dos itens a 
seguir pode-se encontrar testes que utilizam essa prática? 
(A) Modelo de regressão linear simples e teste de comparação de médias de amostras 
independentes. 
(B) Modelo de regressão linear simples e teste de comparação de médias de amostras 
relacionadas. 
(C) Modelo de regressão linear múltipla e teste de comparação de médias de amostras 
relacionadas. 
(D) Modelo de regressão linear múltipla e análise da variância (ANOVA). 
(E) Analise da variância (ANOVA) e teste de comparação de médias de amostras 
independentes. 
 
Resposta: Usamos a análise ANOVA e a regressão múltipla para comparar mais de uma 
variável. 
 
 
10. (P2 2016.1) Analise as seguintes afirmações sobre regressão linear múltipla: 
I) Quanto maior o R2 menor a soma de quadrados devido à regressão. 
II) O R2 será igual a 50% se a soma de quadrados dos resíduos for igual à soma de quadrados 
totais. 
III) O R2 será maior que 50% se a soma de quadrados devido à regressão for maior que a soma 
de quadrados dos resíduos. 
Está (ão) correta(s) APENAS a(s) sentença(s): 
(A) I. 
(B) I e III. 
(C) III. 
(D) II. 
(E) I e II. 
 
Resposta: 
 A alternativa I está incorreta pois quanto maior R² maior a soma de quadrados devido a 
regressão 
 A alternativa II está incorreta visto que SQRes= SQT pode ser igual 
 A alternativa III está correta pois R² =SQR > R² SQS portanto R² será maior que 50% 
 
 
11. (P2 2008.1) Com base nos resultados do teste dos coeficientes de um modelo de regressão 
qualquer, apresentados na tabela a seguir gerada pelo software Excel, pode-se concluir que: 
 
Coeficientes 
Erro-
padrão 
Stat t 
Valor-
P 
95% 
inferiores95% 
superiores 
Interseção - 186,07 63,95 - 2,91 0,10 - 461,23 89,08 
Variável X1 0,42 0,06 7,35 0,02 0,17 0,66 
 
(A) o modelo não se ajusta aos dados para α = 0,05. 
(B) o coeficiente de inclinação não é significativo para α = 0,05. 
(C) 42% da variação da variável dependente são explicados pela variável independente. 
(D) o intercepto e o coeficiente angular são significativos para α = 0,05. 
(E) o intercepto não é significativo para α = 0,05. 
 
Resposta: 5% pelo fato de ser 95% superior e 95% inferior. 
12. (P2 2014.1) São premissas de um modelo de regressão linear múltipla: 
(A) Normalidade da variável dependente e heterocedasticidade das variáveis independentes. 
(B) Variáveis independentes altamente correlacionadas e normalidade dos resíduos. 
(C) Variável dependente qualitativa e homocedasticidade dos resíduos. 
(D) Normalidade e homocedasticidade dos resíduos. 
(E) Correlação e normalidade dos resíduos. 
 
Resposta: Normal e homocedásticidade dos resíduos 
 
 
13. (PS 2016.1) São premissas que precisam ser satisfeitas para que a regressão linear múltipla 
seja válida: 
(A) homocedasticidade dos resíduos, normalidade dos resíduos e independência dos resíduos. 
(B) homocedasticidade dos resíduos, normalidade da variável dependente e independência dos 
resíduos. 
(C) homocedasticidade das variáveis dependentes, normalidade dos resíduos e independência 
dos resíduos. 
(D) homocedasticidade das variáveis independentes, normalidade dos resíduos e dependência 
dos resíduos. 
(E) homocedasticidade dos resíduos, distribuição-t das variáveis dependentes e independência 
dos resíduos. 
 
Resposta: homocedasticidade dos resíduos, normalidade dos resíduos e independência dos 
resíduos. 
 
14. (P2 2012.2) São premissas que precisam ser satisfeitas para que a regressão linear múltipla 
seja válida: 
(A) homoscedasticidade dos resíduos, normalidade da variável dependente e independência do 
resíduo. 
(B) homoscedasticidade das variáveis independentes, normalidade da variável dependente e 
independência das variáveis independentes. 
(C) homoscedasticidade da variável dependente, normalidade dos resíduos e independência das 
variáveis independentes. 
(D) homoscedasticidade dos resíduos, normalidade dos resíduos e independência dos resíduos. 
(E) homoscedasticidade das variáveis independentes e normalidade da variável dependente. 
 
Resposta: homoscedasticidade dos resíduos, normalidade dos resíduos e independência dos 
resíduos. 
 
 
15. (P2 2016.2) Na construção de um modelo de regressão múltipla, as seguintes premissas 
deverão ser observadas: 
(A) independência, normalidade dos resíduos e homocedasticidade dos resíduos. 
(B) somente independência e normalidade dos resíduos. 
(C) somente normalidade dos resíduos e homocedasticidade dos resíduos. 
(D) dependência, normalidade dos resíduos e homocedasticidade dos resíduos. 
(E) independência, normalidade dos resíduos e heterocedasticidade dos resíduos. 
 
Resposta: independência, normalidade dos resíduos e homocedasticidade dos resíduos. 
16. (P2 2012.1) Podemos usar uma variável em um modelo de regressão quando desejamos 
incluir certo tipo de variável no modelo. Suponha que desejamos estudar os fatores que 
podem influenciar as notas dos alunos do ensino fundamental. Qual das variáveis a seguir 
pode ser representada por uma dummy? 
(A) Idade do aluno. 
(B) Anos de estudo dos pais. 
(C) Média de anos de experiência dos professores. 
(D) Se o aluno tem computador em casa. 
(E) Média das notas do aluno nas séries anteriores. 
 
Resposta: As demais alternativas estão erradas pois não apresentam uma relação que cause 
efeito na questão. 
 
17. (P2 2016.1) Analise as seguintes sentenças: 
I) Em um modelo de regressão linear múltipla, a rejeição da hipótese nula da ANOVA indica que 
pelo menos uma das médias populacionais é diferente das demais. 
II) Em um teste t para a inclinação de um modelo de regressão, quanto maior a estatística t 
maior o valor-p do teste. 
III) Os betas estimados são obtidos por meio da minimização dos valores previstos do modelo. 
IV) Se uma variável qualitativa tem três categorias, é necessário criar duas variáveis dummy 
para incluí-la em um modelo de regressão. 
Está (ão) INCORRETA(S) APENAS a(s) sentença(s): 
(A) I e II. 
(B) I, III e IV. 
(C) II e IV. 
(D) I, II e III. 
(E) I e III. 
 
Resposta: As alternativas incorretas são: 
 I – São as variâncias e não a média 
 II – Quanto maior o t, menor será o p 
 III – Está errado 
 IV – Está correto 
18. (P2 2016.1) Analise os gráficos de dispersão a seguir: 
 
Se um modelo de regressão múltipla for estimado tendo com variável dependente o salário 
mensal e variáveis independentes como experiência e escolaridade, provavelmente: 
(A) as variáveis escolaridade e experiência seriam significantes estatisticamente. 
(B) a variável escolaridade em anos seria significante estatisticamente. 
(C) as variáveis salário, escolaridade e experiência seriam significantes estatisticamente. 
(D) a variável experiência seria significante estatisticamente. 
(E) nenhuma das duas variáveis seria significante estatisticamente. 
 
Resposta: a variável escolaridade tem relação em anos seria significante estatisticamente. 
 
19. (PS 2012.1) Um estatístico está realizando um estudo para tentar prever a influência das 
variáveis X1 – idade (em anos completos) – e X2 − nível de escolaridade (em anos 
completos), no número médio de livros que um indivíduo lê por ano (Y). Entretanto, antes de 
estimar o modelo e obter uma equação de previsão, o estatístico gerou alguns gráficos para 
analisar os dados disponíveis. Os gráficos produzidos são apresentados a seguir: 
 
Com base nos gráficos apresentados, pode-se afirmar que: 
(A) A variável X1 provavelmente ajuda a explicar a variabilidade da variável dependente Y, pois 
está negativamente relacionada com ela. 
(B) A variável X2 não ajuda a explicar a variabilidade da variável dependente Y, pois não está 
relacionada com ela. 
(C) Ambas as variáveis X1 e X2, provavelmente, ajudam a prever a variável depende Y, pois 
estão positivamente relacionadas com ela. 
(D) Não é possível fazer nenhuma especulação a respeito dos resultados esperados com base 
nos gráficos apresentados, pois as variáveis utilizadas se constituem como variáveis Dummy. 
(E) Não é possível fazer nenhuma especulação a respeito dos resultados esperados com base 
apenas nos gráficos apresentados, sem que outras medidas de estatística descritiva sejam 
analisadas. 
 
Resposta: Ambas as variáveis X1 e X2, provavelmente, ajudam a prever a variável depende Y, 
pois estão positivamente relacionadas com ela. 
 
 
20. (FGV PS 2012.2) O proprietário de uma livraria de pequeno porte, diante de um recente 
aumento na ocorrência de roubos de livros em seu empreendimento, contratou um consultor 
para realizar uma pesquisa que aponte quais são as principais variáveis que tornam os furtos 
mais prováveis. A partir do resultado, pretende adotar uma nova maneira de dispor os livros 
na livraria, de forma a evitar futuros furtos. Para tal, o consutor teve acesso às sequintes 
informações: 
1 (X1)– Preço do livro ( em reis); 
2 (X2)– Número de páginas do livro; 
3-Área de conhecimento abordado pelo livro (1- Psicologia (X3); 2- Direito (X4); 3- Economia(X5); 
4- Literatura (X6); 5- Estatística(X7)). Com os dados disponíveis, o consultor realizou uma 
regressão e chegou à seguinte equação: 
 
Se quisermos representar a variável “área de conhecimento abordada pelo livro” tomando como 
variável dummy de referência literatura (X6), como ficaria a nova equação: 
a) Y= 3,3 +1,01 X1 + 0,003 X2 – 1,6 X3 – 0,38 X4 – 0,9 X5 + 0,7 X7 
b) Y= 4 +1,01 X1 + 0,003 X2 – 2 X3 – 0,38 X4 – 0,9 X5 + 0,7 X7 
c) Y= 3,3 +3,01 X1 + 0,010 X2 – 1,6 X3 – 0,38 X4 – 0,9 X5 + 0,7 X7 
d)Y= 4 +1,01 X1 + 0,003 X2 – 1,6 X3 – 0,5 X4 – 0,9 X5 + 1,0 X7 
e) Y= 3,3 +1,01 X1 + 0,003 X2 – 1,3 X3 – 0,38 X4 – 3,0 X5 + 0,7 X7 
Resposta: 
 *, ( )- , - , - , ( ) - , ( ) -
 , ( ) - , ( ) -+ 
 
 
21. (P2 2014.1) Dois modelos de regressão múltipla foram estimados e representados 
graficamente a seguir. Sabe-se que uma variável independente quantitativa e outra qualitativa 
foram consideradas na estimação dos modelos. Além disso, a variável dependente é a 
mesma nos dois modelos. 
 
As equações que melhor representam os modelos apresentados nos gráficos são 
respectivamente: 
(A) M1:Y = 0 + 1X1 + 2X2 + ; M2:Y = 0 + 1X1 + 2X2 +  
(B) M1:Y = 0 + 1X1 + 2X2 + 3X3 + ; M2:Y = 0 + 1X1 +  
(C) M1:Y = 1X1 + 2X2 + 3X3 + ; M2:Y = 1X1 + 2X2 +  
(D) M1:Y = 0 + 1X1 + 2X2 + 3X3 + ; M2:Y = 0 + 1X1 + 2X2 +  
(E) M1:Y = 0 + 1X1 + 2X2 + ; M2:Y = 0 + 1X1 + 2X2 + 3X3 +  
 
Resposta: 
 𝑀 
O ENUNCIADO ABAIXO SERÁ UTILIZADO PELAS QUATRO PRÓXIMAS QUESTÕES. 
(P2 2014.2) O gerente de uma rede de lojas de departamento estava interessado em 
compreender quais variáveis explicam a variabilidade das vendas de seus vendedores. Para 
isso, contratou um estatístico que coletou dados de uma amostra de 126 vendedores e estimou o 
seguinte modelo de regressão múltipla. 
 
Em que: 
 Idade = idade do vendedor em anos; Experiência = anos de experiência como vendedor; 
 Capital = assume valor 1 se o vendedor é de uma loja da capital e 0 de uma loja do interior; 
 Eletro = assume valor 1 se o vendedor atua na seção de eletroeletrônicos e 0 caso atue na 
seção de vestuário ou esportes; 
 Vestuário = assume valor 1 se o vendedor atua na seção de vestuário e 0 caso atue na seção 
de eletroeletrônicos ou esportes; 
 Esporte = assume valor 1 se o vendedor atua na seção de esportes e 0 caso atue na seção 
de eletroeletrônicos ou vestuário. 
 
22. As variáveis independentes incluídas no modelo explicam quantos % da variabilidade das 
vendas? 
(A) 5,4%. 
(B) 25,4%. 
(C) 57,4%. 
(D) 74,5%. 
(E) 82,4%. 
 
Resposta: 
 
 
 
 
23. Um dos diretores da empresa suspeitava que as vendas médias dos vendedores do interior 
eram maiores. Há evidências que comprovem essa suspeita? 
(A) Não, uma vez que o erro-padrão da variável Capital é muito elevado, o que torna a variável 
não significante estatisticamente. 
(B) Não, uma vez que o coeficiente da variável Capital é negativo. 
(C) Não, embora a variável apresente significância estatística, o R2 desse modelo é praticamente 
nulo. 
(D) Sim, uma vez que a variável Capital apresenta significância estatística e, em média, um 
vendedor da capital vende R$7.571,00 a menos que os vendedores do interior. 
(E) Sim, uma vez que, em média, um vendedor da capital vende R$1.275,00 a menos que os 
vendedores do interior. 
 
Resposta: O vendedor da capital vende 7571 a menos do que o vendedor do interior. O valor de 
p < 0,05 
 
24. Existe diferença nas vendas médias entre os departamentos de eletroeletrônicos, vestuário e 
esportes? 
(A) Sim, os vendedores do departamento de eletroeletrônicos vendem, em média, R$368,00 a 
menos que os vendedores do departamento de esportes (valor-p < 5%). 
(B) Sim, os vendedores do departamento de eletroeletrônicos vendem, em média, R$864,00 a 
mais que os vendedores do departamento de esportes (valor-p > 5%). 
(C) Sim, os vendedores do departamento de vestuário vendem, em média, R$864,00 a menos 
que os vendedores do departamento de esportes (valor-p < 5%). 
(D) Não, as variáveis Eletro e Vestuário não são significantes (valores-p > 5%), ou seja, não 
existem diferenças nas médias de vendas entre departamentos. 
(E) Não, a variável Eletro não é significante (valor-p > 5%), ou seja, não existem diferenças na 
média de vendas entre departamentos. 
 
Resposta: Não, pois os valores de p são > 0,05. 
 
25. Tendo em vista a interpretação dos coeficientes das variáveis Idade e Experiência dos 
vendedores, é correto afirmar que o aumento de um ano de idade implica: 
(A) um aumento médio de R$491mil nas vendas, mantendo as outras variáveis constantes. Um 
ano a mais de experiência incrementa, em média, R$961 mil nas vendas, mantendo as outras 
variáveis constantes. 
(B) um aumento médio de R$491 nas vendas, mantendo as outras variáveis constantes. Um ano 
a mais de experiência incrementa, em média, R$961 nas vendas, mantendo as outras 
variáveis constantes. 
(C) um aumento médio de 49,1% nas vendas, mantendo as outras variáveis constantes. Um ano 
a mais de experiência incrementa, em média, 96,1% nas vendas, mantendo as outras 
variáveis constantes. 
(D) um aumento médio de R$491 nas vendas, mantendo as outras variáveis constantes. Um ano 
a mais de experiência reduz, em média, R$961 nas vendas, mantendo as outras variáveis 
constantes. 
(E) uma redução média de R$491 nas vendas, mantendo as outras variáveis constantes. Um 
ano a mais de experiência reduz, em média, R$961 nas vendas, mantendo as outras 
variáveis constantes. 
 
Resposta: 1 ano de idade aumenta R$491,00 na venda e 1 de experiência aumenta R$961,00. 
 
O ENUNCIADO ABAIXO SERÁ UTILIZADO PELAS TRÊS PRÓXIMAS QUESTÕES. 
(P2 2014.1) O governo federal encomendou uma pesquisa que teve como objetivo avaliar os 
efeitos da assistência técnica rural (ATER) na receita total com a produção agropecuária (em mil 
R$) dos agricultores familiares. Nas regiões Sul e Sudeste do Brasil, a pesquisa entrevistou um 
grupo de agricultores que utilizou e outro que não utilizou ATER no ano de 2013. A consultoria 
contratada pelo governo apresentou o seguinte modelo de regressão em seu relatório: 
Modelo gl SQ MQ F 
F de 
significação 
Regressão 2 6777 3389 5,52 0,01 
Residual 47 28834 613 
 
Total 49 35611 
 
 
Coeficientes 
Erro 
padrã
o 
Stat t 
Valor-
P 
95% 
inferior
es 
95% 
superior
es 
Interseção 211 6,53 32,40 0,000 198,3 224,6 
ATER 22 7,08 3,09 0,003 7,7 36,1 
SUL - 6 7,06 - 0,83 0,408 - 20,1 8,3 
Variável dependente: Receita total com a produção agropecuária (em mil R$) no ano de 2013. F 
= 5,52, valor-p = 0,01. Obs: todas as premissas do modelo foram respeitadas. 
Em que: ATER assume valor 1 se o agricultor familiar utilizou o serviço de ATER na produção e 
0 caso contrário; SUL assume valor 1 para propriedades do Sul e 0 se localizada na região 
Sudeste. 
26. Com base no modelo estimado e considerando um nível de significância de 5%, pode-se 
concluir que: 
(A) O governo federal não deveria financiar um programa de ATER, uma vez que não é 
significante estatisticamente para explicar receita total do agricultor. 
(B) O governo federal não deveria financiar um programa de ATER. Apesar de ser significante, a 
variável explica apenas 1% da variância da receita total do agricultor. 
(C) O governo federal deveria financiar um programa de ATER. Além de ser significante 
estatisticamente, a ATER incrementa a receita total do agricultor em R$22 mil, em média. 
(D) A receita total do grupo de agricultores que utilizaram assistência técnica é de R$22 mil. 
(E) O governo federal não deveria financiar um programa de ATER. Apesar de ser significante, a 
variável SUL tem um efeito maior na explicação da receita total dos agricultores. 
 
Resposta: P < 0,05 e 22 x 1000 = R$22.000 
 
27. Qual o valor e a interpretação do R2 deste modelo? 
(A) R2 = 39%. A variável ATER explica 39% da variância da receita total com a produção 
agropecuária (em mil R$) no ano de 2013. 
(B) R2 = 30%. As variáveis ATER e SUL explicam 30% da média da receita total com a produção 
agropecuária (em mil R$) no ano de 2013. 
(C) R2 = 19%. As variáveis ATER e SUL explicam 19% da variância da receita total com a 
produção agropecuária (em mil R$) no ano de 2013. 
(D) R2 = 81%. As variáveisATER e SUL explicam 81% da mediana da receita total com a 
produção agropecuária (em mil R$) no ano de 2013. 
(E) R2 = 19%. As variáveis dependentes incluídas no modelo explicam 19% da variância da 
receita total com a produção agropecuária (em mil R$) no ano de 2013. 
 
Resposta: R2 = 19%. As variáveis ATER e SUL explicam 19% da variância da receita total com 
a produção agropecuária (em mil R$) no ano de 2013. 
 
 
 
 
 
 
 
28. Com base na equação estimada, qual é a receita total com a produção agropecuária de um 
agricultor sem ATER que reside na região Sudeste? 
(A) R$205 mil 
(B) R$211 mil 
(C) R$227 mil 
(D) R$252 mil 
(E) R$276 mil 
 
Resposta: 
 ( ) ( ) 
 
 
29. (P2 2014.2) O governo federal encomendou uma pesquisa que teve como objetivo avaliar os 
efeitos da assistência técnica rural (ATER) na receita total com a produção agropecuária (em 
mil R$) dos agricultores familiares. A pesquisa entrevistou um grupo de agricultores que 
utilizou e outro que não utilizou ATER no ano de 2013. A consultoria contratada pelo governo 
apresentou o seguinte modelo de regressão em seu relatório: 
 
Coeficientes 
Erro 
padrão 
Stat t 
Valor-
P 
95% 
inferiores 
95% 
superiores 
Interseção 211 6,53 32,40 0,000 198,3 224,6 
ATER 22 7,08 3,09 0,003 7,7 36,1 
 
Variável dependente: Receita Total com a produção agropecuária (em mil R$) no ano de 
2013.Em que: ATER assume valor 1 se o agricultor familiar utilizou o serviço de ATER na 
produção e 0 caso contrário. O governo federal irá incrementar os recursos para o financiamento 
de ATER se a receita total dos agricultores que utilizaram ATER for pelo menos 5% maior na 
receita total dos agricultores que não utilizaram ATER. Com base nas informações disponíveis, é 
correto afirmar que o governo: 
(A) não deve incrementar os recursos, uma vez que a variável ATER não é significante 
estatisticamente. 
(B) não deve incrementar os recursos, uma vez que o grupo que utilizou ATER teve uma receita 
total com a produção agropecuária 3,09% maior, em média. 
(C) deve incrementar os recursos, uma vez que o grupo que utilizou ATER teve uma receita total 
com a produção agropecuária 10,4% maior, em média. 
(D) deve incrementar os recursos, uma vez que o grupo que utilizou ATER teve uma receita total 
com a produção agropecuária 22%% maior, em média. 
(E) deve incrementar os recursos, uma vez que o grupo que utilizou ATER teve uma receita total 
com a produção agropecuária 36,1% maior, em média. 
 
Resposta: deve incrementar os recursos, uma vez que o grupo que utilizou ATER teve uma 
receita total com a produção agropecuária 10,4% maior, em média. 
 
 
30. (P2 2018.2) Um analista precisa incorporar, a um modelo de regressão, uma variável 
qualitativa para representar o estado civil da pessoa. A variável poderá assumir os seguintes 
valores: casado, solteiro, viúvo, separado e outros. Nesse caso, é correto afirmar que o 
número de variáveis “dummy” a serem utilizadas é igual a: 
(A) 5. 
(B) 4. 
(C) 8. 
(D) 3. 
(E) 10. 
 
Resposta: 5 – 1 = 4 
 
O ENUNCIADO ABAIXO SERÁ UTILIZADO PELAS QUATRO PRÓXIMAS QUESTÕES. 
(P2 2018.2) Com o auxílio do Excel, uma empresa de telefonia criou um modelo de regressão 
múltipla relacionando as variáveis FATURAMENTO (em milhões de R$) e seus 
INVESTIMENTOS em Propaganda (PROP) e em Tecnologia (TEC) (ambos em milhares de R$). 
O relatório gerado pelo aplicativo de planilhas eletrônicas foi o seguinte: 
 
31. Com vista nesses dados, a porcentagem de explicação da variabilidade do faturamento da 
empresa pelos investimentos em propaganda e tecnologia é, aproximadamente, de: 
(A) 7,5% 
(B) 3,7%. 
(C) 86%. 
(D) 48%. 
(E) 29%. 
 
Resposta: 
 
 
 
32. Caso decida fazer um investimento adicional de R$1 mil em propaganda, mantendo 
constante o investimento em tecnologia, a empresa verá seu faturamento: 
(A) aumentar em cerca de R$3,7 milhões. 
(B) diminuir em cerca de R$465 milhões. 
(C) cair em cerca de R$5,3 milhões. 
(D) diminuir em cerca de R$3,7 milhões. 
(E) aumentar em cerca de R$5,3 milhões. 
 
Resposta: aumentar em cerca de R$3,7 milhões. 
 
 
 
 
33. Caso a empresa decida não investir nada em propaganda e em tecnologia, o faturamento 
deverá ser, em média, de aproximadamente: 
(A) R$370 milhões. 
(B) R$465 milhões. 
(C) R$570 milhões. 
(D) R$163 milhões. 
(E) R$533 milhões. 
 
Resposta: 
 ( ) ( ) 
 
 
34. Caso a direção da empresa decida investir R$85 mil em propaganda e R$90 mil em 
tecnologia, o valor esperado para o faturamento da empresa será de, aproximadamente: 
(A) R$665 milhões. 
(B) R$927 milhões. 
(C) R$465 milhões. 
(D) R$147 milhões. 
(E) R$314 milhões. 
 
Resposta: O valor esperado para o faturamento da empresa será de, aproximadamente: 
 ( ) ( ) 
 
 
35. (PS 2018.2) Ao construir um modelo de regressão, um analista adicionou uma variável 
qualitativa que possuía 3 categorias. É correto dizer que, para representar essa variável 
qualitativa, o número de variáveis “dummy” necessárias é igual a: 
(A) 3. 
(B) 1. 
(C) 4. 
(D) 5. 
(E) 2. 
 
Resposta: 
 
 
 
 
 
 
O ENUNCIADO ABAIXO SERÁ UTILIZADO PELAS QUATRO PRÓXIMAS QUESTÕES. 
(PS 2018.2) A direção de uma corretora de valores pediu que seu analista desenvolvesse uma 
regressão que explicasse o valor total das aplicações financeiras de seus clientes (em milhares 
de R$) em função da sua renda mensal declarada (em milhares de R$) e de uma variável 
qualitativa que representasse seu estado civil (solteiro = 1; outros = 0). O modelo de regressão 
foi calculado por uma planilha Excel, e um extrato do relatório emitido pela planilha consta a 
seguir: 
 
36. Com base nesses dados, é correto afirmar que, em média, o valor das aplicações de um 
cliente solteiro é aproximadamente: 
(A) R$3.700,00 maior do que o de um cliente que não seja solteiro. 
(B) R$31.700,00 maior do que o de um cliente que não seja solteiro. 
(C) R$10.900,00 maior do que o de um cliente que não seja solteiro. 
(D) R$3.700,00 menor do que o de um cliente que não seja solteiro. 
(E) R$16.100,00 maior do que o de um cliente que não seja solteiro. 
 
Resposta: R$3.657 a mais que o não solteiro ⩭ 3.700, maior do que o de um cliente que não 
seja solteiro. 
 
 
37. Com base nesses dados, um acréscimo de R$1.000,00 na renda mensal declarada de um 
cliente, mantidas constantes as demais variáveis, ocasionará nas suas aplicações, em média: 
(A) um aumento de R$16.500,00. 
(B) uma diminuição de R$27.400,00. 
(C) um aumento de R$3.700,00. 
(D) uma diminuição de R$20.100,00. 
(E) uma diminuição de R$16.500,00. 
 
Resposta: 
 
 
 
38. É correto afirmar que a variabilidade do valor das aplicações realizadas por um cliente nessa 
corretora é explicado pela renda mensal declarada e pelo estado civil em, aproximadamente: 
(A) 11%. 
(B) 74%. 
(C) 10%. 
(D) 92%. 
(E) 96%. 
 
Resposta: 
 
 
 
 
 
 
39. Considere α = 0,05 para o teste de significância utilizado para se verificar a significância da 
relação entre o valor da aplicação e a renda mensal declarada. Em face dos dados 
apresentados no relatório emitido pela planilha Excel, é correto afirmar que: 
(A) a relação entre o valor da aplicação e a renda declarada não é significante, pois o coeficiente 
da variável RENDA, igual a 16,51376, é maior do que α = 0,05. 
(B) a relação entre o valor da aplicação e a renda declarada não é significante, pois o erro 
padrão da variável RENDA, igual a 2,16828, é maior do que α = 0,05. 
(C) a relação entre o valor da aplicação e a renda declarada é significante, pois o valor p da 
variável RENDA, igual a 0,000267, é menor do que α= 0,05. 
(D) a relação entre o valor da aplicação e a renda declarada não é significante, pois o valor p da 
variável RENDA, igual a 0,000267, é menor do que α = 0,05. 
(E) a relação entre o valor da aplicação e a renda declarada não é significante, pois o stat t da 
variável RENDA, igual a 7,616063, é maior do que α = 0,05. 
 
Resposta: Valor -p = 0,0002 < 0,05, a relação entre o valor da aplicação e a renda declarada é 
significante, pois o valor p da variável RENDA, igual a 0,000267, é menor do que α = 0,05. 
 
 
40. (ENADE 2018) Com o objetivo de entender o impacto das internações causadas pela falta de 
saneamento básico, um pesquisador estimou o modelo apresentado na tabela a seguir, 
usando a quantidade de dias de internação de uma amostra de 7 260 pacientes do Sistema 
Único de Saúde como variável explicada. As variáveis explicativas são: (i) gênero do 
paciente, binária em que é 1 é utilizado para identificar as mulheres e 0 para identificar os 
homens; (ii) idade do paciente em anos de vida; e (iii) motivo da internação, também binária, 
em que recebe o valor 1 para identificar internações que são causadas por problemas de 
saneamento básico e o valor 0 para as demais internações. 
 
Considerando as informações apresentadas, assinale a opção correta. 
(A) O coeficiente R-quadrado encontra-se abaixo de 30%, o que significa que o modelo deve ser 
descartado. 
(B) As internações causadas pela deficiência de saneamento básico tendem a gerar um aumento 
de 1,96% nos gastos de saúde. 
(C) A média de dias de internação para mulheres é estatisticamente maior que a de internação 
para homens. 
(D) A variável idade não é estatisticamente significativa para explicar o número de dias de 
internação. 
(E) O teste F mostra que as variáveis explicativas conjuntamente são estatisticamente 
significativas para explicar o número de dias de internação. 
 
Resposta: Valor -p < 0,05 
 
TESTE DE HIPÓTESE PARA A PROPORÇÃO DE UMA POPULAÇÃO 
1. (PS 2014.2) Em uma pesquisa que teve por objetivo investigar as intenções de voto no candidato A 
e B para o segundo turno da eleição da Presidência da República, a margem de erro foi de 5%. Se 
esse instituto desejar reduzir a margem de erro dessa pesquisa, deverá: 
(A) aumentar o tamanho da amostra. 
(B) aumentar o nível de confiança da pesquisa. 
(C) reduzir o nível de significância da pesquisa. 
(D) diminuir a proporção encontrada na amostra. 
(E) aumentar a proporção encontrada na amostra. 
Resposta: Maior o tamanho da amostra menor o erro. 
 
2. (PS 2016.1) Uma pesquisa de mercado de determinado comércio varejista na cidade de 
Rondonópolis-MT constatou que 25% dos 200 clientes recentemente entrevistados no centro da 
cidade residem a mais de 10km do local. Supondo que foi escolhida uma amostra aleatória, 
adotando um nível de confiança de 95%, podemos afirmar que o intervalo de confiança para a 
percentagem real de clientes que residem a mais que 10km é aproximadamente: 
(A) [0,15; 0,32]. 
(B) [0,12; 0,40]. 
(C) [0,19; 0,31]. 
(D)[0,18; 0,40]. 
(E) [0,15; 0,25]. 
Memória de Cálculo: 
 Média= 10 km 
 n = 200 
 P= 25% de N = 50/200 = 0,25 
 Significância=95% = Z = 1,96 
 
Cálculo: 
 
 √
 
 
 √
 
 
 
Resposta: O intervalo de confiança para a percentagem real de clientes que residem a mais que 10km 
é aproximadamente [0,19;0,31] 
3. (PS 2016.1) Uma empresa deseja estimar a percentagem dos motoristas que usam o WhatsApp 
enquanto dirigem. Uma amostra de 850 motoristas acusou que 544 usam o aplicativo enquanto 
dirigem. Com base nos dados disponíveis, a estimativa intervalar com 98% de confiança é: 
(A) 63,40 a 63,55%. 
(B) 55,16 a 72,84%. 
(C) 61,40 a 66,55%. 
(D) 62,70 a 64,64%. 
(E) 60,16 a 67,83%. 
Memória de Cálculo: 
 n = 850 
 P= 544/850=0,64 
 Significância=98% = Z = 2,33 
 
Cálculo: 
 
 √
 
 
 √
 
 
 
 
Resposta: A estimativa intervalar com 98% de confiança é 60,16 a 67,83% 
 
 
4. (P2 2010.2) Uma pesquisa realizada com 65 alunos de uma grande universidade revelou que 10 
alunos consideram insuficiente o número de livros disponíveis para consulta na biblioteca de sua 
universidade. O intervalo de confiança de 90% para a proporção de alunos habitantes dessa 
Universidade que consideram o número de livros como sendo suficiente é de: 
(A) 0,08 a 0,23. 
(B) 0,10 a 0,21. 
(C) 0,72 a 0,95. 
(D) 0,77 a 0,92. 
(E) 0,76 a 0,93. 
Memória de Cálculo: 
 n = 65 
 Complementar = 65- 10 
 P= 55/65 = 0,8462 
 Significância=90% = Z = 1,645 
 
Cálculo: 
 
 √
 
 
 √
 
 
 
 
Resposta: O número de livros como sendo suficiente é de 0,77 a 0,92 
 
 
 
5. (PS 2008.2) Numa amostra aleatória simples de 120 domicílios, realizada num certo bairro da 
cidade, observou-se que 70% possuíam instalações sanitárias inadequadas. Qual é o intervalo, de 
90% de confiança, para a proporção de domicílios com instalações sanitárias inadequadas? 
(A) 0,65 ≤ π ≤ 0,75. 
(B) 0,23 ≤ π ≤ 0,37. 
(C) 0,25 ≤ π ≤ 0,35. 
(D) 0,63 ≤ π ≤ 0,77. 
(E) 0,50 ≤ π ≤ 0,70 
Memória de Cálculo: 
 n = 120 
 P= 84/120=0,7 
 Significância=90% = Z = 1,645 
 
Cálculo: 
 
 √
 
 
 √
 
 
 
Resposta: O interval é de 0,63 a 0,77 
 
 
6. (P2 2016.1) Um clube de futebol está interessado em aumentar o número de sócio torcedores que 
adquirem ingressos antecipadamente para os jogos dos atuais 25% para 50% dos sócios. Para isso, 
encaminhou mensagens (SMS) para os torcedores um dia antes da partida. Para verificar os efeitos 
de tal ação, coletou uma amostra aleatória de 100 torcedores e verificou que 45 torcedores 
compraram os ingressos antecipadamente. Considere um nível de significância de 5%. Assinale a 
alternativa que contém o intervalo de confiança de 90% para a proporção de torcedores que 
compraram ingressos antecipadamente após o envio das mensagens. 
(A) 𝐼𝐶 ( ; 90%) = [35,2%; 54,7%]. 
(B) 𝐼𝐶 ( ; 90%) = [36,8%; 53,2%]. 
(C) 𝐼𝐶 ( ; 90%) = [32,1%; 57,8%]. 
(D) 𝐼𝐶 ( ; 90%) = [29,6%; 60,3%]. 
(E) 𝐼𝐶 ( ; 90%) = [38,6%; 51,4%]. 
Memória de Cálculo: 
 n = 100 
 P= 45/100=0,45 
 Significância=90% = Z = 1,645 
 
Cálculo: 
 
𝐼𝐶 √
 
 
 √
 
 
 
 
Resposta: O intervalo é de 36,8% a 53,2%. 
 
 
7. (P2 2010.1) Uma pesquisa por amostragem realizada por um governo estadual revelou que 25% 
dos seus servidores efetivos estão obesos. Sabendo que a amostra foi de 625 servidores e o nível 
de confiança utilizada foi de 98%, o intervalo de confiança para a verdadeira proporção de 
servidores obesos é: 
(A) (0,2053; 0,2947) 
(B) (0,2100; 0,2900) 
(C) (0,2493; 0,2507) 
(D) (-0,1536; 0,6536) 
(E) (0,1536; 0,6536) 
Memória de Cálculo: 
 n = 625 
 P= 156,25/625=0,25 
 Significância=98% = Z = 2,33 
 
Cálculo: 
 
𝐼𝐶 √
 
 
 √
 
 
 
Resposta: O intervalo é de 0,21;0,29 
 
 
8. (PS 2010.1) Até que ponto os veículos de transporte alternativos em certa cidade são seguros para 
os usuários? Segundo pesquisa realizada cinco anos atrás, foi constatado que 45% dos usuários os 
consideravam inseguros. Uma recente pesquisa realizada pela Companhia de Trânsito com 600 
usuários informou que 354 não se sentiam seguros com a utilização desse tipo de transporte. 
Considerando um nível de confiança de 98%, a estimativa do intervalo de confiança da proporção 
populacional que considera esse tipo de transporte inseguro é: 
(A) (0,50; 0,70) 
(B) (0,54; 0,77) 
(C) (0,45; 0,67) 
(D) (0,52; 0,80) 
(E) (0,54; 0,64) 
Memória de Cálculo: 
 n = 600 
 P= 354/600=0,59 
 Significância=98% = Z = 2,33 
 
Cálculo: 
 
𝐼𝐶 √√
 
 
 
Resposta: O intervalo é de 0,54;0,64 
 
 
9. (PS 2008.2) Uma pesquisa realizada pelo Conselho Federal de Administração em 2008, envolvendo 
uma amostra de 3300 administradores registrados nos Conselhos Regionais de Administração 
(CRAs), revelou que 1155 administradores possuem especialização em alguma área de 
Administração. Determinando-se o intervalo de confiança de 99% para a proporção populacional, 
chega-se aos resultados: 
(A) ICπ = (20,06%; 24,94%). 
(B) ICπ = (20,06%; 37,94%). 
(C) ICπ = (25,00%; 40,00%). 
(D) ICπ = (32,86%; 37,14%). 
(E) ICπ = (40,06%; 50,94%). 
Memória de Cálculo: 
 n = 3300 
 P= 1155/3300=0,35 
 Significância=99% = Z = 2,57 
 
Cálculo: 
 
𝐼𝐶 √
 
 
 √
 
 
 
 
Resposta: O intervalo é de 32,86%;37,14% 
 
 
10. (P2 2014.1) Para avaliar a proporção de alunos brancos nas universidades públicas de determinado 
estado, selecionou-se uma amostra de 1000 alunos. O resultado da amostra indicou que a 
proporção de brancos era de 75%. O intervalo de confiança de 99% para a proporção de brancos, 
neste estado, é aproximadamente: 
(A) IC (99%) = [0,7147; 0,7853] 
(B) IC (99%) = [0,6147; 0,8853] 
(C) IC (99%) = [0,5147; 0,9853] 
(D) IC (99%) = [0,6647; 0,8553] 
(E) IC (99%) = [0,7647; 0,8653] 
Memória de Cálculo: 
 n = 1.000 
 P= 750/1.000=0,75 
 Significância=99% = Z = 2,57 
 
Cálculo: 
 
𝐼𝐶 √
 
 
 √
 
 
 
 
Resposta: O intervalo é de 0,7147;0,7853 
 
 
11. (PS 2014.1) Mulheres são maioria entre os novos empreendedores. Segundo o Sebrae, 52% dos 
empresários com menos de três anos e meio de atividade são do sexo feminino. (Alessandra Pires). 
Brasília – As mulheres estão comandando a abertura de novos negócios no Brasil. Dados revelados 
pelo Sebrae a partir da pesquisa Global Entrepreneurship Monitor (GEM) mostram que 52% dos novos 
empreendedores – aqueles com menos de três anos e meio de atividade – são as mulheres. A força 
empreendedora feminina é maioria em quatro das cinco regiões brasileiras. Apenas no Nordeste elas 
ainda não ultrapassaram os homens, mas estão quase lá, com aproximadamente 49% de participação 
entre os novos empresários. No Brasil, a GEM é patrocinada pelo Sebrae e realizada pelo Instituto 
Brasileiro de Qualidade e Produtividade (IBQP), em parceria com a Fundação Getulio Vargas (FGV). 
Foram entrevistadas 10 mil pessoas de 18 a 64 anos, de todas as regiões. Entre os ouvidos pela GEM 
estão desde pessoas que estão se preparando para iniciar um empreendimento até os que já estão 
estabelecidos no mercado. Disponível em: 
http://www.agenciasebrae.com.br/noticia/21096309/ultimasnoticias/mulheres-sao-maioria-entre-os-
novos-empreendedores/. Acesso em: mar. 2014. 
Considerando um nível de significância de 5%, o que pode ser afirmado sobre o intervalo de confiança 
(aproximado) da porcentagem de mulheres que comandam novos negócios? 
(A) Com 5% de confiança, a verdadeira porcentagem de mulheres empreendedoras com menos de três 
anos e meio de atividade está entre 51,03% e 52,97%. 
(B) Com 95% de confiança, a verdadeira porcentagem de mulheres empreendedoras com menos de 
três anos e meio de atividade está entre 52,2% e 53,8%. 
(C) A margem de erro para este intervalo de confiança é de 0,97%. 
(D) A margem de erro para este intervalo de confiança é de 0,80%. 
(E) Devido à proporção 0,52 e o tamanho da amostra não atenderem às exigências para caracterização 
como distribuição normal, não será possível prever o intervalo de confiança. 
Memória de Cálculo: 
 n = 10.000 
 Significância=98% = Z = 1,96 
 
Cálculo: 
 
 [ √
 
 
] [ √
 
 
] 
Resposta: A margem de erro para este intervalo de confiança é de 0,97%. 
 
http://www.agenciasebrae.com.br/noticia/21096309/ultimasnoticias/mulheres-sao-maioria-entre-os-novos-empreendedores/
http://www.agenciasebrae.com.br/noticia/21096309/ultimasnoticias/mulheres-sao-maioria-entre-os-novos-empreendedores/
12. (P2 2010.1) Em uma pesquisa de satisfação, a pré-amostra indicou que 80% dos clientes de uma 
grande rede de lojas comerciais mostraram-se insatisfeitos com o serviço de entrega de suas 
mercadorias. O tamanho mínimo da amostra, para estimar a proporção real de clientes insatisfeitos, 
com um erro máximo de 4% e um nível de confiança de 95%, é: 
(A) 4 
(B) 8 
(C) 16 
(D) 196 
(E) 385 
Memória de Cálculo: 
 P= 80% 
 Significância= 95% = Z = 1,96 
 
Cálculo: 
 
 
 
 
 
 
 
 
Resposta: O tamanho da amostra é 385 
 
 
13. (PS 2014.2) Segundo os dados de uma pesquisa anterior, 30% dos alunos de uma universidade 
apresentam dependência em pelo menos uma disciplina. Admitindo um erro tolerável de 3% e um 
nível de confiança de 95%, o tamanho da amostra para a próxima pesquisa é aproximadamente: 
(A) 93. 
(B) 114. 
(C) 533. 
(D) 896. 
(E) 934. 
Memória de Cálculo: 
 P= 30% 
 Significância= 5% = Z = 1,96 
 
Cálculo: 
 
 
 
 
 
 
 
 
Resposta: O tamanho da amostra é 896 
 
 
14. (PS 2016.1) Deseja-se estimar a proporção de funcionários de uma empresa que acham precárias 
as condições de trabalho numa determinada empresa, com margem de erro de 5% e nível de 
confiança de 90%. De acordo com estudos prévios, a proporção de funcionários que não 
classificavam como precárias as condições de trabalho nessa empresa era de 80%. Assim, o 
tamanho mínimo de amostra para se estimar essa proporção é de: 
(A) 121. 
(B) 173. 
(C) 200. 
(D) 189. 
(E) 215. 
Memória de Cálculo: 
 P= 80% 
 Significância= 90% = Z = 1,645 
 
Cálculo: 
 
 
 
 
 
 
 
 
Resposta: O tamanho da amostra é 173 
 
 
15. (P2 2010.2) Um deputado estadual encomendou uma pesquisa de popularidade a seu respeito 
visando sua campanha eleitoral para o próximo pleito. Como resultado, recebeu as seguintes 
informações: 
· com 95% de certeza o deputado pode esperar uma proporção de votos entre 17,542% e 23,618%. 
· o desvio padrão da proporção amostral é 1,55%. 
Com base nessas informações, podemos dizer que a amostra levantada tinha: 
(A) 435 eleitores. 
(B) 537 eleitores. 
(C) 642 eleitores. 
(D) 584 eleitores. 
(E) 681 eleitores. 
Memória de Cálculo: 
 Significância= 95% = Z = 1,96 
 
Cálculo: 
 
 
 
 
 
 
 
 
Resposta: A amostra levantada tinha 681 eleitores 
 
 
 
16. (PS 2010.1) Um processo industrial de encher latas de leite fornece, em média, 5% de latas com 
volume abaixo das especificações. Extraída uma amostra de 150 latas da produção de um dia, a 
probabilidade de a proporção de latas com volume abaixo das especificações estar entre 4% e 10% 
é aproximadamente de: 
(A) 31% 
(B) 41% 
(C) 51% 
(D) 61% 
(E) 71% 
Memória de Cálculo: 
 Média = 5% 
 n = 150 
 4% a 10% 
 
Cálculo: 
 
 
 
√ 
 
 
 
 
 
 
√ 
 
 
 
 
 
 
 
 
0,2123 + 0,4974 = 0,7097 x 100 =70,97% = 71% 
Resposta: A probabilidade é de aproximadamente 71% 
 
 
 
 
O ENUNCIADO A SEGUIR SERÁ UTILIZADO PELAS DUAS PRÓXIMAS QUESTÕES 
(PS 2016.2) O gerente financeiro de uma rede de lojas de vestuário infantil deseja verificar se as 
proporções de clientes que pagam suas compras com cartão de crédito nas lojas A e B são iguais. 
Para tal, mandou realizar uma pesquisa, cujo resultado foi o seguinte: 
 
 
Loja A Loja B 
Pagam com CC 255 246 
Tamanho da amostra 300 300 
 
17. Em face dos resultados apresentados, é correto afirmar que a estimativa agrupada para as 
proporções amostrais é igual a: 
(A) 0,90. 
(B) 0,80. 
(C) 0,835. 
(D) 0,82. 
(E) 0,85 
Cálculo: 
 
 
 
 
 
 
 
 
Resposta: A estimativa para a proporção comum é de, aproximadamente0,835 
 
 
18. A estatística de teste para o referido teste de duas proporções é igual, aproximadamente, a: 
(A) 1,00. 
(B) 1,96. 
(C) 1,645. 
(D) 2,00. 
(E) 2,575. 
Memória de Cálculo: 
 n = 600 
 P= 0,835 
 
Cálculo: 
 
 
 
√ 
 
 
 
√ 
 
 
Resposta: A estatística de teste será de, aproximadamente 1,0 
 
 
19. (P2 2017.2) Um fabricante de refrigerante, desejando saber se o refrigerante com sabor cola por ele 
fabricado possuía o mesmo índice de aceitação pelos consumidores de duas cidades diferentes, A e 
B, realizou um teste, cujos resultados são apresentados na tabela a seguir: 
 
 
Cidade A Cidade B 
Gostaram 320 395 
Não gostaram 80 105 
Total 400 500 
 
É correto afirmar que a estatística de teste para a comparação dessas duas proporções é 
aproximadamente igual a: 
(A) Z = 0,37. 
(B) Z = 1,37. 
(C) Z = 1,98. 
(D) Z = 0,98. 
(E) Z = 2,37. 
Memória de Cálculo: 
 n = 900 
 P= 0,8 
 
Cálculo: 
 
 
 
√ 
 
 
 
√ 
 
 
Resposta: A estatística de teste será de, aproximadamente 0,37 
 
 
20. (P2 2010.2) Uma empresa do ramo metalúrgico fabrica peças para aplicação em tratores agrícolas. 
O padrão de qualidade da empresa impõe que no máximo 20% das peças possam estar fora do 
padrão do projeto. Colheu-se uma amostra de 340 peças e entre elas foram detectadas 54 fora do 
padrão do projeto. Com um nível de significância de 5%, é CORRETO: 
(A) rejeitar H0 e, assim, rejeitar o lote de peças por não atender às especificações. 
(B) não rejeitar H0 e, assim, rejeitar o lote de peças por não atender às especificações. 
(C) rejeitar H0 e, assim, aceitar o lote de peças por atender às especificações. 
(D) não rejeitar H0 e, assim, aceitar o lote de peças por atender às especificações. 
(E) chegar à conclusão alguma, pois não há dados suficientes para tal. 
Memória de Cálculo: 
 n = 340 
 P= 54/340=0,16 
 Significância=95% = Z = 1,96 
 
Cálculo: 
 
𝐼𝐶 √
 
 
 √
 
 
 
Resposta: É correto não rejeitar H0 este que tem padrão de qualidade da empresa (máximo 20%), 
tendo atendido com no máximo 18% 
 
21. (PS 2008.2) Um candidato a deputado estadual afirma que terá 60% dos votos dos eleitores de uma 
cidade (teste bilateral). Um Instituto de Pesquisa coleta uma amostra de 300 eleitores dessa cidade, 
encontrando 160 que votarão no candidato. Esse resultado mostra que: 
(A) a afirmação do candidato é verdadeira, ao nível de 7,5%. 
(B) a afirmação do candidato é falsa, ao nível de 1%. 
(C) a afirmação do candidato é verdadeira, ao nível de 10%. 
(D) a afirmação do candidato é falsa, ao nível de 5%. 
(E) a afirmação do candidato é verdadeira, ao nível de 5%. 
Memória de Cálculo: 
 n = 300 
 P= 160/300=0,533 
 60% de 300 = 180 
 
Cálculo: 
 
 √
 
 
 √
 
 
 
 
Resposta: Ou seja a um nível de significância de 5% o candidato fez uma afirmação falsa, pois o 
máximo será votos de 56,2% e não 60% 
 
 
22. (FGV P2 2010.1) O professor de Estatística afirma que o índice de reprovação da disciplina é de 
33%. Foi coletada uma amostra aleatória de 40 alunos e observou-se que 17 foram reprovados. Ao 
nível de significância de 5%, é correto dizer que a afirmação do professor: 
(A) Está correta, pois ocorreu ⁄ 
(B) Não está correta, pois ocorreu ⁄ 
 
 ⁄ 
(C) Está correta, pois ocorreu ⁄ 
 
 ⁄ 
(D) Está correta, pois ocorreu ⁄ 
 
 ⁄ 
(E) Não está correta, pois ocorreu 
Memória de Cálculo: 
 n = 40 
 P= 17/40= 0,425 
 Significância= 5% = Z = 1,96 
 Reprovação = 23 /40 = 0,575 
 
Cálculo: 
 
 √
 
 
 √
 
 
 
 
Resposta: Ou seja a um nível de significância de 5% é correto afirmar que o professor está correto 
pois o nível de reprovação é aproximadamente 34% 
 
 
23. (PS 2014.1) Em uma clínica de recuperação para indivíduos dependentes de álcool, foi realizado o 
acompanhamento do número de pacientes que, após saída do tratamento, tiveram reincidência no 
uso de bebida alcoólica. A OMS (Organização Mundial da Saúde), em seus relatórios, relata que 
esse valor é de 20%. A clínica suspeitava que este valor divulgado pela OMS era menor do que os 
funcionários realmente observavam em tal clínica. Para testar essa hipótese, observou-se, com 
base numa amostra selecionada aleatoriamente, que 30 de 120 pacientes da clínica voltaram a ser 
dependentes. Utilizando um nível de significância de 5%, o que se pode concluir com base nos 
valores obtidos na clínica avaliada? 
(A) Rejeita-se a H0 ao nível de significância de 5%, uma vez que a estatística do teste Z foi de 1,6693 e 
o Z tabelado foi de 1,64. Nesse sentido, o resultado é consistente com o resultado divulgado pela 
OMS. 
(B) Não se rejeita a H0 ao nível de significância de 5%, uma vez que a estatística do teste Z foi de 
1,3693 e o Z tabelado foi de 1,64. Nesse sentido, o resultado é consistente com o resultado 
divulgado pela OMS. 
(C) Rejeita-se H0 ao nível de significância de 5%, uma vez que a estatística do teste Z foi 3,5693 e o Z 
tabelado foi de 1,64. Nesse sentido, o resultado não é consistente com o resultado divulgado pela 
OMS. 
(D) Rejeita-se H0 ao nível de significância de 5%, uma vez que a estatística do teste Z foi de 1,3693 e o 
Z tabelado foi de 1,64. Nesse sentido, o resultado não é consistente com o resultado divulgado pela 
OMS. 
(E) Não se rejeita H0 ao nível de significância de 5%, uma vez que a estatística do teste Z foi de 1,3693 
e o Z tabelado foi de 2,58. Nesse sentido, o resultado não é consistente com o resultado divulgado 
pela OMS. 
Memória de Cálculo: 
 n = 120 
 P= 30/120= 0,25 
 Significância= 5% = Z = 1,96 
 
Cálculo: 
 
 
 
√ 
 
 
 
√ 
 
 
 
Resposta: Não se rejeita a H0 ao nível de significância de 5%, uma vez que a estatística do teste Z foi 
de 1,3693 e o Z tabelado foi de 1,64. Nesse sentido, o resultado é consistente com o resultado 
divulgado pela OMS. 
 
24. (P2 2008.1) Um medicamento-padrão é conhecido por ser eficiente em, aproximadamente, 80% dos 
casos em que é utilizado para tratar de uma infecção. Uma nova droga se mostrou eficiente em 85 
dos primeiros 100 casos testados. A superioridade da nova droga está clara a um nível de 
significância de 5%? 
(A) Sim, porque o Valor-P é maior do que o nível de significância do teste. 
(B) Não, porque o Valor-P é menor do que o nível de confiança do teste. 
(C) Não, porque, sendo o teste unilateral, o Valor-P é maior do que o nível de significância do teste. 
(D) Sim, porque, sendo um teste bilateral, a metade do Valor-P é maior do que a significância do teste. 
(E) Não, porque, sendo um teste bilateral, o Valor-P é menor do que o dobro do nível de significância 
do teste. 
 
Memória de Cálculo: 
 n = 100 
 P= 85/100= 0,25 
 Significância= 5% = Z = 1,96 
 
Cálculo: 
 
 
 
√ 
 
 
 
√ 
 
 
 
Resposta: A superioridade da nova droga não está clara a um nível de significância de 5% pois o valor 
– p (13,75) é maior que o nível de significância, ou seja 
 
 
O ENUNCIADO A SEGUIR SERÁ UTILIZADO PELAS QUATRO PRÓXIMAS QUESTÕES 
(P2 2018.2) Uma cervejaria realizou uma pesquisa sobre o gosto dos consumidores por cervejas 
encorpadas. Foram entrevistadas 1.500 pessoas escolhidas aleatoriamente, e, dessas, 525 
declararam gostar desse tipo de cerveja. 
25. Em face dos resultados obtidos na pesquisa, é correto afirmar que o estimador da proporção 
populacional de consumidores que gostam de cervejas encorpadas é igual a: 
(A) 0,15. 
(B) 0,85. 
(C) 0,35. 
(D) 0,65. 
(E) 0,75. 
Cálculo: 
 P= 525/1500= 0,35 
 
Resposta: O estimador da proporção populacional de consumidores que gostam de cervejas 
encorpadas é iguala 0,35 
 
 
26. Com base nesses dados, é correto afirmar que a distribuição amostral da população de 
consumidores que gostam de cervejas encorpadas, a ser usada como aproximação da distribuição 
binomial, é a distribuição: 
(A) F. 
(B) poisson. 
(C) exponencial. 
(D) log – normal. 
(E) normal. 
Resposta: Se o número de eventos de interesse (X) e o número de eventos que não são de interesse 
(n – X) forem, cada um deles, pelo menos iguais a cinco, a distribuição de amostragens de uma 
proporção, segue, aproximadamente, uma distribuição normal. 
 
 
27. Semanas depois, a cervejaria precisou fazer uma pesquisa idêntica sobre consumidores de cervejas 
maltadas. Considerando que foi usado um grau de confiança de 95% (Z = 1,96), um erro de 
amostragem de 1% e uma estratégia conservadora para a proporção populacional, o tamanho da 
amostra usada nessa nova pesquisa foi de: 
(A) 9.604. 
(B) 6.724. 
(C) 97. 
(D) 16.641. 
(E) 10.604. 
Memória de Cálculo: 
 n = 1500 
 P= 525/1500= 0,35 
 Significância= 5% = Z = 1,96 
 
Cálculo: 
 
 
 
 
 
 
 
 
Resposta: O tamanho da amostra usada nessa nova pesquisa foi de 9.604 
 
 
 
28. Caso a diretoria precise testar se a proporção de consumidores que gostam de cervejas encorpadas 
é de pelo menos 40%, a estatística de teste será de, aproximadamente: 
(A) 5,15. 
(B) 2,50. 
(C) -5,28. 
(D) -3,95. 
(E) 0,80. 
Memória de Cálculo: 
 n = 1500 
 P= 525/1500= 0,35 
 
Cálculo: 
 
 
 
√ 
 
 
 
√ 
 
 
Resposta: A estatística de teste será de, aproximadamente -3,95 
 
 
O ENUNCIADO A SEGUIR SERÁ UTILIZADO PELAS TRÊS PRÓXIMAS QUESTÕES 
(PS 2018.2) Um fabricante de refrigerantes realizou, nas cidades A e B, uma pesquisa de mercado 
para descobrir a aceitação de seu refrigerante sabor cola. O resultado obtido foi o seguinte: 
 
 
Cidade A Cidade B 
Gosta 656 850 
Não gosta 144 150 
TOTAL 800 1000 
 
29. Em um teste de hipóteses para comparação (igualdade) das proporções de consumidores que 
gostam do refrigerante nas cidades A e B, a estimativa para a proporção comum é de, 
aproximadamente: 
(A) 0,63. 
(B) 0,19. 
(C) 0,51. 
(D) 0,84. 
(E) 0,37. 
Cálculo: 
 
 
 
 
 
 
 
 
Resposta: A estimativa para a proporção comum é de, aproximadamente 0,84 
 
 
 
30. No caso do teste para comparação de proporções (teste de igualdade de proporções), a estatística 
de teste (Z) é de, aproximadamente: 
(A) 2,00. 
(B) 2,93. 
(C) 1,73. 
(D) 0,15. 
(E) 3,12. 
Memória de Cálculo: 
 n = 1800 
 P= 0,84 
 
Cálculo: 
 
 
 
√ 
 
 
 
 
 
Resposta: A estatística de teste será de, aproximadamente 1,73 
 
 
31. Se for utilizado um intervalo de confiança de 95% (Z = 1,96), então a diferença de proporções de 
consumidores que gostam do refrigerante sabor cola, entre as cidades B e A, será de, 
aproximadamente: 
(A) 0,82 a 0,85. 
(B) 0,03 a 0,6. 
(C) 0,03 a 0,09. 
(D) 0 a 0,06. 
(E) 0,3 a 0,10. 
 
Cálculo: 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 √
 
 
 √
 
 
 
 √
 
 
 √
 
 
 
 √
 
 
 √
 
 
 
 
𝐼𝐶 
𝐼𝐶 
Resposta: Respectivamente o B é 0 e o A é 0,06 
 
TESTES DO QUI-QUADRADO: ADERÊNCIA, INDEPENDÊNCIA E HOMOGENEIDADE 
 
1. (P2 2016.2) Supondo que em um teste de aderência estão sendo consideradas seis 
diferentes categorias, é correto afirmar que o grau de liberdade a ser considerado para a 
determinação da estatística crítica é: 
a. 3. 
b. 4. 
c. 6. 
d. 2. 
e. 5. 
Resposta: grau de liberdade é n – 1, portanto 6-1 = 5. 
2. (P2 2012.1) Na biblioteca de uma universidade, a quantidade de livros emprestados durante 
os cinco dias úteis de uma determinada semana está indicada na tabela a seguir: 
Dia da semana Número de livros emprestados 
Segunda-feira 173 
Terça-feira 180 
Quarta-Feira 136 
Quinta-Feira 177 
Sexta-Feira 189 
 
Esperando-se que a quantidade de livros seja igualmente distribuída entre esses cinco dias da 
semana, o valor calculado do Teste da Aderência do Qui-Quadrado é: 
a. 8,8360. 
b. 9,2778. 
c. 9,4350. 
d. 9,6532. 
e. 9,7661. 
Cálculo: 
 
Resposta: O valor calculado do Teste da Aderência do Qui-Quadrado é 9,7661 
 
3. (P2 2010.1) Em uma pesquisa realizada em 2007, sobre a modalidade de transporte utilizada 
para o trajeto de casa para o trabalho e vice-versa, 79,6% dos entrevistados disseram que 
dirigiam sozinhos; 11,1% utilizavam carona; 5,1% utilizavam transporte público; e 4,2% 
dependiam de outras modalidades de transporte. Foi perguntado recentemente a 1000 
trabalhadores, selecionados aleatoriamente, a mesma coisa. A tabela a seguir apresenta o 
resultado da pesquisa: 
Modalidade de transporte Dirige sozinho Carona Transporte público Outra 
Frequência 812 102 57 29 
 
Ao nível de significância de 2,5%, pode-se afirmar que o padrão atual de utilização de transporte 
é diferente do padrão apresentado em 2007? 
a. não, pois o valor calculado 9,348 é menor que o valor crítico 11,143. 
b. não, pois o valor calculado 5,782 é menor que o valor crítico 11,143. 
c. não, pois o valor calculado 5,782 é menor que o valor crítico 9,348. 
d. sim, pois o valor calculado 9,348 é menor que o valor crítico 11,143. 
e. sim, pois o valor calculado 5,782 é menor que o valor crítico 9,348. 
Cálculo: 
 
 
 
Resposta: Não pois o valor calculado 5,782 é menor que o valor crítico 9,348. 
 
 
4. (PS 2016.1) Uma cooperativa agroindustrial possui, atualmente, quatro produtos (A, B, C e D) 
lançados no mercado. Cada produto tem a sua parcela de mercado. Essa cooperativa 
implementou modificações nos produtos acima mencionados e, agora, o Diretor Presidente 
precisa saber se a anterior distribuição das fatias de mercado pelos quatro produtos 
permanece válida. Para tal, mandou realizar um teste qui-quadrado de aderência, o qual 
gerou a seguinte tabela: 
 
Produto 
Frequência 
Observada 
Frequência 
Esperada 
A 25 20 
B 20 15 
C 25 40 
D 30 25 
 
Considerando a tabela apresentada, a estatística qui-quadrado relativa ao teste é, 
aproximadamente, igual a: 
a. 9,54. 
b. 11,24. 
c. 5,34. 
d. 5,50. 
e. 3,45. 
Cálculo: 
 
 
Resposta: A estatística qui-quadrado relativa ao teste é, aproximadamente, igual a 9,54 
 
 
5. (PS 2008.2) A tabela a seguir resume a opinião de homens e mulheres quanto à instalação 
de uma penitenciária de segurança máxima em uma região. 
 
Gênero 
Opinião 
Concorda Não concorda 
Homem 10 40 
Mulher 40 70 
 
Aplicando o teste qui-quadrado da independência, ao nível de significância de 5%, qual é o 
resultado correto? 
a. O qui-quadrado tabelado é igual a 4,24. Neste caso rejeita-se H0. 
b. O qui-quadrado calculado é igual a 3,84. Neste caso aceita-se H0. 
c. Como o qui-quadrado calculado é maior do que o tabelado, aceita-se H0 e conclui-se que há 
independência entre as variáveis. 
d. Como o qui-quadrado calculado é maior do que o tabelado, rejeita-se H0 e conclui-se que não 
há independência entre as variáveis. 
e. Como o qui-quadrado calculado é menor do que o tabelado, aceita-se H0 e conclui-se que as 
variáveis são independentes. 
Cálculo: Qui-quadrado calculado é > que o tabelado (8>3,841), portanto rejeito Ho 
 
Resposta: Como o qui-quadrado calculado é maior do que o tabelado, rejeita-se H0 e conclui-se 
que não há independência entre as variáveis. 
 
 
 
6. (PS 2010.2) O gerente de recursos humanos de uma grande empresa do ramo metalúrgico 
afirma que a satisfação de seus funcionários com o trabalho não tem qualquer ligação com o 
grau de escolaridade dos mesmos. Uma amostra de 131 funcionários apresentou os 
seguintes resultados: 
 
Frequência observada 
Satisfação trabalho 
Alta Média Baixa 
Anos deestudo 
Superior 25 12 6 
2º Grau 16 22 8 
1º Grau 5 7 30 
 
Tendo em vista tais resultados, e considerando de X²t = 46,42 e que X²cr = 9,4877, é 
CORRETO: 
a) Rejeita H0 ao nível de significância de 5% e concluir que o gerente está errado 
b) Não rejeita H0 ao nível de significância de 5% e, então, concluir que o gerente está certo. 
c) Não rejeita H0 ao nível de significância de 5% e, então, concluir que o gerente está errado. 
d) Não rejeita H0 ao nível de significância de 5% e, então, mas não podemos concluir que o 
gerente está certo. 
e) Rejeita H0 ao nível de significância de 5% mas não podemos concluir que o gerente está 
errado 
Resposta: Como o qui-quadrado calculado é maior do que o tabelado, rejeita-se H0 ao nível de 
significância de 5% e concluir que o gerente está errado 
 
 
 
7. (PS 2010.1) Uma cadeia de supermercados deseja determinar se existe diferença entre 
anunciar em jornal ou TV. Para isso avaliou a capacidade de o consumidor vir a se recordar 
de um comercial de suas lojas após anúncio veiculado pelas duas mídias. O resultado do 
estudo com 100 consumidores foi o seguinte: 
 Meio de comunicação 
Capacidade de recordar Jornal TV Total 
Recordam 20 10 30 
Não recordam 10 60 70 
Total 30 70 100 
 
Ao nível de significância de 0,05, existem evidências de um efeito significativo de um meio de 
comunicação sobre o outro? 
a. sim, porque 2 = 27,4, enquanto o valor crítico 2 é 3,84. 
b. sim, porque 2 = 27,4, enquanto o valor crítico 2 é 9,49. 
c. não, porque 2 = 27,4, enquanto o valor crítico 2 é 9,49. 
d. não, porque 2 = 27,4, enquanto o valor crítico 2 é 3,84. 
e. sim, porque 2 = 27,4, enquanto o valor crítico 2 é 5,02. 
Cálculo: 
 
Resposta: Sabe-se que o X² é = a 27,4 pois todas as alternativas estão com este valor, portanto 
o valor crítico sendo 3,84, existem evidências de um efeito significativo de um meio de 
comunicação sobre o outro pois 27,4>3,84. 
 
 
8. (PS 2014.2) Um professor de matemática da Faculdade Ômega insiste junto a seus 
superiores (Diretores Pedagógicos) que os alunos das áreas de ciências sociais não 
dominam tão bem os conteúdos de ciências exatas quanto os das áreas biológicas. 
Buscando informações para embasar o pedido de aumento de carga horária em exatas para 
os alunos matriculados em administração, ele propõe a aplicação de um teste de 
conhecimento em matemática para os cursos de administração e odontologia, com o objetivo 
de detectar o menor rendimento dos administradores. Selecionou aleatoriamente 100 alunos 
dos dois cursos (50 de cada) que já tinham sido aprovados na matéria Matemática Básica. 
Alunos que alcançaram a nota 8, foram considerados aprovados, os demais, reprovados. 
Após correção da avaliação, foi obtida a seguinte distribuição de frequência: 
 Aprovação 
Curso Sim Não 
Administração 30 20 
Odontologia 25 25 
 
Utilizando nível de significância de 0,01, analise os dados e assinale a alternativa correta. 
a. Rejeita-se H0, existe associação entre as duas variáveis em questão. 
b. Aceita-se H1, não existe associação entre as duas variáveis em questão. 
c. Rejeita-se H0, não existe associação entre as duas variáveis em questão. 
d. Rejeita-se H0, não existe associação entre as duas variáveis em questão, existe associação 
entre conhecimento em matemática básica e curso. 
e. Aceita-se H0, não existe associação entre as duas variáveis em questão. 
Cálculo: 
 
 
Resposta: Como o qui- quadrado tabelado é maior que o qui-quadrado calculado aceita H0, não 
existe associação entre as duas variáveis em questão. 
 
9. (PS 2018.2) Em um teste de aderência, foi obtido um qui-quadrado observado = 15,25. 
Considerando que, para o risco adotado, o quiquadrado crítico é igual a 5,99, pode-se afirmar 
que, nesse teste de aderência, a hipótese nula: 
a. será rejeitada, pois o qui-quadrado crítico é maior do que o risco. 
b. não será rejeitada, pois o qui-quadrado observado é maior do que o qui-quadrado crítico. 
c. não será rejeitada, pois o qui-quadrado observado não é negativo. 
d. não será rejeitada, pois o qui-quadrado observado é maior do que 0,05. 
e. será rejeitada, pois o qui-quadrado observado é maior do que o qui-quadrado crítico. 
Resposta: Como o qui-quadrado observado é maior do que o tabelado, rejeita-se H0. 
 
10. (P2 20182.) Um analista está trabalhando na simulação de um sistema de fila e precisa 
verificar se determinada massa de dados obedece a uma distribuição exponencial. Para tal, 
aplicou à massa de dados um teste qui-quadrado, a um risco de α = 0,05, tendo obtido um 
qui-quadrado de teste igual a 11,45 e um qui-quadrado crítico igual a 23,68. Dessa forma, é 
correto afirmar que: 
a. rejeita-se H0, isto é, os dados se ajustam a uma distribuição exponencial, uma vez que o qui-
quadrado de teste é maior que o α = 0,05. 
b. não se pode rejeitar H0, isto é, os dados não se ajustam a uma distribuição exponencial, uma 
vez que o qui-quadrado de teste é maior que o risco α = 0,05. 
c. não se pode rejeitar H0, isto é, os dados se ajustam a uma distribuição exponencial, uma vez 
que o qui-quadrado de teste é menor que o qui-quadrado crítico. 
d. rejeita-se H0, isto é, os dados se ajustam a uma distribuição exponencial, uma vez que o qui-
quadrado crítico é maior que o qui-quadrado para α = 0,12. 
e. rejeita-se H0, isto é, os dados se ajustam a uma distribuição exponencial, uma vez que o qui-
quadrado de teste é menor que o qui-quadrado crítico. 
Resposta: Como o qui-quadrado crítico é maior do que o teste, não rejeita-se H0, isto é, os 
dados se ajustam a uma distribuição exponencial, uma vez que o qui-quadrado de teste é menor 
que o qui-quadrado crítico.

Mais conteúdos dessa disciplina