Prévia do material em texto
Estatística II
Lista 1 – Amostragem e distribuições de amostragens
1. (PS 2010.1) O número total de amostras de tamanho 2, extraídas de uma população de tamanho 6,
utilizando amostragem com reposição, é:
(A) 15
(B) 16
(C) 30
(D) 36
(E) 64
Memória de Cálculo:
amostra (n) = 2
população (N)= 6
Cálculo:
Resposta: Utilizando amostragem com reposição é 36
2. (P2 2010.2) A fim de orientar os condutores de veículos sobre a necessidade do uso de cadeirinha
no banco traseiro para o transporte de crianças com até quatro anos de idade, a Polícia Rodoviária
Federal na Br320 parava um a cada 50 veículos para verificação do uso das mesmas e/ou fazer os
devidos esclarecimentos sobre a sua necessidade de uso. Tal procedimento caracteriza uma amostra:
(A) estratificada.
(B) conglomerada.
(C) sistemática.
(D) casual simples.
(E) não probabilística.
Memória de Cálculo:
A Polícia Rodoviária Federal na Br320 parava um a cada 50 veículos e a polícia tinha uma ordem
certa para parar os carros, ou seja, um padrão. A única amostragem com ordenação do sistema de
referência (essa sendo o número oito) é a sistemática
Resposta: Amostragem sistemática
3. (PS 2012.1) O peso dos brasileiros segue uma distribuição normal com média de 70 kg e desvio-
padrão de 10 kg. Toma-se um grande número de amostras de 100 pessoas aleatoriamente escolhidas
e calcula-se o peso médio das pessoas em cada amostra. A média e o desvio-padrão das médias das
amostras serão próximos, respectivamente, de:
(A) 70 kg e 10 kg.
(B) 70 kg e 0,10 kg.
(C) 70 kg e 1 kg.
(D) 0,70 kg e 10 kg.
(E) 0,70 kg e 0,10 kg.
Memória de Cálculo:
Média = 70 kg
Desvio- padrão= 10 kg
Amostra (n) = 100
Cálculo:
√
√
Resposta: A média é 70 kg e o Desvio-padrão (erro padrão) é 1kg
4. (PS 2012.2) O colégio XTX tem um total de 5.000 alunos matriculados. Sabemos que a altura média
dos alunos é de 175 cm e a variância é de 25 cm2. Retiramos uma amostra aleatória, de tamanho n =
100.Nesse caso, o valor aproximado do desvio-padrão da média amostral é:
(A) 0,25.
(B) 0,05.
(C) 0,005.
(D) 0,5.
(E) 0,025.
Memória de Cálculo:
Média = 175 cm
Variância = 25 cm ²
Amostra (n) = 100
População = 5.000
Cálculo:
√ √
√
√
Resposta: O valor aproximado do desvio-padrão da média amostral é 0,5
5. (PS 2018.2) Um levantamento sobre o faturamento diário de um restaurante da cidade utilizou uma
amostra de 30 dias, escolhidos aleatoriamente. O resultado foi o seguinte: Média = R$4.320,00. Desvio
padrão = R$980,00. É correto dizer que o desvio padrão das médias amostrais (erro padrão) é,
aproximadamente, de:
(A) R$566,00.
(B) R$716,00.
(C) R$49,00.
(D) R$289,00.
(E) R$179,00.
Memória de Cálculo:
Média = R$4.320,00
Desvio-padrão = R$980,00
Amostra (n) = 30
Cálculo:
√
√
Resposta: O desvio padrão das médias amostrais (erro padrão) é, aproximadamente, de R$178,00.
6. (FGV PS 2010,2) Numa pesquisa, se o analista desejar diminuir o erro padrão da estimativa, ela
necessariamente pode esperar que:
(A) O intervalo de confiança aumente
(B) A hipótese inicial do teste de hipótese seja rejeitada
(C) A média da amostra aumente
(D) O tamanho da amostra aumente
(E) O valor de Z (a/2) diminua
Memória de Cálculo:
A medida que cresce o tamanho da amostra o erro-padrão decresce em um fator igual a raiz do
tamanho da amostra.
Resposta: Se o analista desejar diminuir o erro padrão da estimativa o tamanho da amostra terá que
aumentar.
7. (PS 2014.2) A altura dos indivíduos em uma população tem média 1,70m e desvio-padrão 0,10. Qual
é, aproximadamente, a probabilidade de que uma amostra de 100 pessoas tenha média entre 1,68 e
1,72?
(A) 0,954.
(B) 0,854.
(C) 0,754.
(D) 0,654.
(E) 0,554.
Memória de Cálculo:
Média = 1,70
Desvio-padrão = 0,10
Amostra (n) = 100
Cálculo:
√
√
Z = 2 = 4772
0
0,0228
2,28%
0,0228 x 0,0228 = 0,0456
1 - 0,0456 = 0,9544
Resposta: A probabilidade é de
0,9544
0,9544
95,44%
0,0228
2,28%
0,5-0,4772=0,0228
8. (P2 2012.2) Uma empresa atuante no ramo de papel celulose planta árvores para reparar o dano
ambiental inerente a sua atividade econômica. A empresa sabe que o tempo necessário para uma
muda de árvore se tornar uma árvore adulta segue uma distribuição contínua com média de 10 anos e
desvio padrão de 3 anos. Se a empresa plantar 200 mudas de árvore, a probabilidade de que o tempo
médio para que as árvores se tornem adultas exceda 10,5 anos é:
(A) menor que 1%.
(B) entre 1% e 5%.
(C) entre 5% e 10%.
(D) entre 10% e 20%.
(E) maior que 20%.
Memória de Cálculo:
Média = 10
Desvio-padrão = 3
Amostra (n) = 200
Cálculo:
√
√
Z = 2,38 = 4913
0
0,0087
0,87%
0,0087 x 100 = 0,87%
Resposta: A probabilidade de que o
tempo médio para que as árvores se
tornem adultas exceda 10,5 anos é
menor que 1 %
0,5-0,4913=0,0087
9. (PS 2008.2) O número de minutos para a realização de uma prova de Estatística II, na Faculdade
Mundial, tem variância de 144 minutos. Uma amostra de 36 provas acusou um tempo médio de 100
minutos. Aproximadamente, com que confiança se pode afirmar que o tempo médio de realização da
prova está acima de 104 minutos?
(A) 48%.
(B) 35%.
(C) 24%.
(D) 8%.
(E) 2%.
Memória de Cálculo:
Média = 100
Variância = 144
Amostra (n) = 36
Cálculo:
√
√
√
Z = 2 = 4772
0
0,0228
2,28%
0,0228 x 100 = 2,28
Resposta: Aproximadamente 2,28%
de confiança se pode afirmar que o
tempo médio de realização da prova
está acima de 104 minutos.
0,5-0,4772=0,0228
10. (PS 2010.1) Sabe-se que os preços de um determinado produto têm distribuição normal no
mercado, com desvio padrão igual a R$ 60,00. Uma amostra aleatória de 100 mercados revelou um
valor médio de R$ 290,00 para esse produto. Qual é a probabilidade deste valor não ultrapassar o
verdadeiro, mas desconhecido, valor médio do mercado em mais do que R$ 12,00, em valor absoluto?
(A) 19,146%
(B) 38,292%
(C) 47,725%
(D) 90,000%
(E) 95,450%
Memória de Cálculo:
Média = R$290,00
Desvio padrão = R$60,00
Amostra (n) = 100
Cálculo:
√
√
Z = 2 = 4772
0
0,0228
2,28%
0,0228 x 2 = 0,0456
1 – 0,0456 = 0,9544 x 100 = 95,44%
Resposta: A probabilidade deste valor
não ultrapassar o verdadeiro é
aproximadamente 95,450%
0,5-0,4772=0,0228
0,0228
2,28% 0,9544
95,44%
0,5-0,4772=0,0228
11. (P2 2012.2) O Teorema do Limite Central diz que a média de variáveis aleatórias segue uma
distribuição aproximadamente normal. Para que esse teorema seja válido, é necessário que as
variáveis:
(A) sejam normalmente distribuídas.
(B) não sejam discretas.
(C) sejam independentes.
(D) tenham os mesmos valores esperados e desvios-padrão.
(E) tenham a mesma distribuição.
Memória de Cálculo:
A alternativa correta é a C, pois uma variável aleatória representa uma variável que está sendo
manipulada em um experimento, diferente da variável dependente a independente não depene de
outro fator. Para que tenha uma distribuição normal tem que ser independente, caso fosse
dependente seria uma exponencial.
Resposta: É necessário que as variáveis sejam independentes.
12. (FGV PS 2014.2) O Teorema do Limite Central, quando tem suas premissas satisfeitas, diz que o
estimador da média populacional possui variância:
(A)
(B)
√
(C)√
(D)
√
√
(E)
Memóriade Cálculo:
O Teorema do Limite central que o estimador da média amostral segue uma distribuição normal
com esperança igual à média populacional e variância igual à variância populacional dividida pelo
tamanho da amostra.
Resposta: Variância=
13. (PS 2016.2) Os modelos matemáticos se dividem em:
(A) determinísticos e aleatórios.
(B) algébricos ou agrupados em partes.
(C) alfabéticos ou nominais.
(D) exponenciais ou alfanuméricos.
(E) complexos ou conjugados.
Memória de Cálculo:
Um modelo matemático pode ser uma representação ou interpretação simplificada da realidade
com uma estrutura de conceitos mentais ou experimentais.
Existem os determinísticos que também são conhecidos como probabilísticos, que tem por teoria
que existe um conjunto de entrada conhecido e que resulta em uma única saída. E o outro é o
aleatória, que contém um conjunto de entrada conhecido e que podem dar saídas diferentes.
Resposta: Determinístico e aleatórios.
14. (ENADE 2012) Uma operadora turística, que atua no mercado de viagens, no Estado do Mato
Grosso, encomendou uma pesquisa ao Instituto de Pesquisas Turísticas com o objetivo de identificar
os destinos brasileiros preferidos pelos consumidores da classe C, residentes no próprio Estado, no
último ano. Para que os dados coletados sejam merecedores de crédito, é necessário que o Instituto
estabeleça um plano de ação para a pesquisa que inicie com a definição:
(A) do universo de indivíduos da classe C do Estado do Mato Grosso e, em seguida, com a
determinação da amostragem, a fim de identificar os principais destinos brasileiros preferidos.
(B) da variável de estudo “destinos brasileiros” e, em seguida, com sua aplicação no universo de
indivíduos da classe do Estado do Mato Grosso.
(C) das técnicas para estratificação da camada de indivíduos da classe C do Estado do Mato Grosso e,
em seguida, com o sorteio dos destinos brasileiros que serão contemplados na pesquisa.
(D) do problema que norteará a investigação sobre indivíduos da classe C do Estado do Mato Grosso
e, em seguida, com a seleção da amostragem probabilística, constituída pelos destinos brasileiros
preferidos pelo público estudado.
(E) da amostragem por área, constituída pelos indivíduos da classe C localizados geograficamente no
Estado do Mato Grosso e, em seguida, com a seleção das 20 cidades mais populosas do Estado.
Memória de Cálculo:
Para que a pesquisa seja confiável é preciso que seja feito uma ordem, como eles querem saber
quais os destinos brasileiros preferidos pelos consumidores da Classe “C” que residem no Mato
Grosso, precisam identificar os consumidores da Classe “C” que residem no estado em questão,
ou seja, a população e após isso verificar os destinos preferidos- amostras.
Resposta: Para que os dados coletados sejam merecedores de crédito, é necessário que o Instituto
estabeleça um plano de ação para a pesquisa que inicie com a definição: do universo de indivíduos da
classe C do Estado do Mato Grosso e, em seguida, com a determinação da amostragem, a fim de
identificar os principais destinos brasileiros preferidos.
15. (P2 2010.1) Para a fabricação de aparelhos de ar-condicionado, uma fábrica recebe de um
fornecedor um dos componentes em lotes de 10.000 peças. Para a aceitação de cada lote, retira-se
aleatoriamente do lote uma amostra de 100 peças e verifica-se o seu comprimento médio. O lote é
aceito se esse comprimento estiver entre 7 e 9 cm. Sabendo-se que o comprimento das peças é uma
variável aleatória cuja média é igual a 8 cm e variância é igual a 25 cm2, qual é aproximadamente a
probabilidade de aceitação de cada lote?
(A) 30%
(B) 68%
(C) 69%
(D) 80%
(E) 95%
Memória de Cálculo:
Média = 8 cm
Variância = 25 cm²
Amostra (n) = 100
Cálculo:
√
√
√
Z = 2 = 4772
0
0,0228
2,28%
0,0228 x 0,0228 = 0,0456
1 - 0,0456 = 0,9544 x 100 =95,44%
Resposta: A probabilidade é de 95%
0,9544
95,44%
0,0228
2,28%
0,5-0,4772=0,0228
16. (P2 2016.1) A média amostral é um estimador não viesado (ou não tendencioso) da média
populacional, porque:
(A) a variância do estimador da média amostral é igual à média populacional.
(B) o valor esperado do estimador da média amostral é igual à média populacional.
(C) a média amostral é igual à média populacional.
(D) a média sempre é aproximadamente igual à média populacional.
(E) a variância do estimador da média amostral é igual à variância da média populacional.
Memória de Cálculo:
Um estimador é não viesado (ou não tendencioso) se seu valor esperado for o próprio parâmetro que
se pretende estimar, isto é, .
Resposta: O valor esperado do estimador da média amostral é igual à média populacional.
17. (PS 2012.1) O comprimento de um parafuso segue uma distribuição uniforme entre 1 e 3
centímetros. A média dos comprimentos de uma amostra de 900 parafusos escolhida aleatoriamente
segue uma distribuição:
(A) uniforme com média de 2 centímetros.
(B) uniforme com desvio-padrão de 2 centímetros.
(C) normal com média de 2 centímetros.
(D) normal com desvio-padrão igual a 2 centímetros.
(E) Poisson com desvio-padrão igual a 2 centímetros.
Memória de Cálculo:
Média = 8 cm
Amostra (n) =900
Cálculo:
Resposta: Normal, pois a amostra é maior que 30 e a média igual a 2 centímetros.
Q1=1 Q3=3
18. (PS 2016.2) Lançam-se 100 moedas não viesadas e independentes. As faces das moedas são
numeradas com 0 e 1. O número X é a média dos números das faces voltadas para cima. A respeito do
resultado dos 100 lançamentos, é correto afirmar que:
(A) a média dos resultados dos lançamentos segue uma distribuição aproximadamente normal, com o
valor esperado de 0,5 a variância 1/40
(B)os resultados dos lançamentos têm moda 0,5
(C) os resultados dos lançamentos seguem uma distribuição aproximadamente normal
(D) a probabilidade de nenhuma moeda cair com 1 voltando para cima de 1/200
(E) a média dos resultados dos lançamentos segue uma distribuição aproximadamente normal, com
valor esperado de 0,5 e variância de 1/400
Memória de Cálculo:
N = 100 moedas
n = 2
0 a 1
Cálculo:
A alternativa que corresponde a 0,0025 na variância é a alternativa E, que dividindo 1/400 obtemos o
mesmo resultado.
Resposta: A respeito do resultado dos 100 lançamentos, é correto afirmar que a média dos resultados
dos lançamentos segue uma distribuição aproximadamente normal, com valor esperado de 0,5 e
variância de 1/400.
19. (PS 2010.1) Um processo industrial de encher latas de leite fornece, em média, 5% de latas com
volume abaixo das especificações. Extraída uma amostra de 150 latas da produção de um dia, a
probabilidade de a proporção de latas com volume abaixo das especificações estar entre 4% e 10% é
aproximadamente de:
(A) 31%
(B) 41%
(C) 51%
(D) 61%
(E) 71%
Memória de Cálculo:
Média = 5%
n = 150
4% a 10%
Cálculo:
√
√
0,2123 + 0,4974 = 0,7097 x 100 =70,97% = 71%
Resposta: A probabilidade é de aproximadamente 71%
20. (P2 2018.2) O peso de uma pessoa segue uma distribuição normal com média de 70kg e desvio-
padrão 6kg. Em um elevador com capacidade para 9 pessoas, a probabilidade de o peso total das
pessoas ultrapassar 675kg é aproximadamente:
(A) 0,006%.
(B) 26%.
(C) 0,6%.
(D) 16%.
(E) 6%.
Memória de Cálculo:
Média =70 kg
n = 9
Desvio padrão = 6 kg
675/9=75
Cálculo:
√
√
Z = 2,5 = 4938
0
0,0062
0,62%
0,0062 x 100 = 0,62%
Resposta:A probabilidade de o peso
total das pessoas ultrapassar 675kg é
aproximadamente de 0,6%
0,5-0,4938=0,0062
Estatística II
Lista 2 – Estimativa do intervalo de confiança
1. (P2 2008.1) O número de atendimentos em certo serviço municipal é verificado durante 36 dias,
apresentando média igual e 20,6 e desvio-padrão igual a 9. O erro máximo de estimativa que podemos
aceitar, considerando um nível de confiança de 95%, é dado por: (Utilize 1,96 e assuma distribuição
normal dos dados.)
(A) 1,96.
(B) 2,94.
(C) 1,64.
(D) 3,50.
(E) 4,00.
Memória de Cálculo:
n= 36 dias
Média =20,6
Desvio- padrão=9
Nível de Confiança = 95% =1,96
Cálculo:
ε = Z
σ
√n
= 1,96
9
√36
= 2,94
Resposta: O erro máximo de estimativa que podemos aceitar, considerando um nível de confiança de
95%, é 2,94.
2. (PS 2014.1) Uma determinada empresa necessita realizar um estudo estatístico para descobrir qual
o intervalo de confiança de seu faturamento. O funcionário responsável pela análise selecionou uma
amostra aleatória de 196 clientes e o resultado obtido foi de uma média amostral de R$ 1.280,00, com
um desvio padrão igual a R$ 325,00. Considerando-se que a confiança utilizada para o intervalo de
confiança foi de 99%, a margem de erro (erro amostral, erro de amostragem dessa estimação da média
aritmética do faturamento) é de aproximadamente:
(A) 33,7
(B) 59,8
(C) 110,25
(D) 25,67
(E) 35,67
Memória de Cálculo:
n= 196 clientes
Média =1.280,00
Desvio- padrão= 325,00
Nível de Confiança = 99% =2,57
Cálculo:
ε = Z
σ
√n
= 2,57
325
√196
≅ 59,67 = 59,8
Resposta: A margem de erro é 59,8
3. (P2 2014.2) Analise o seguinte intervalo de confiança para o gasto mensal, em R$, com alimentação
fora do domicílio: IC (μ; 95%) = [876,16; 1123,84]
Sabe-se que o tamanho da amostra utilizada para estimar esse intervalo foi de 25 pessoas. Diante
dessas informações, a margem de erro desse IC é:
(A) 54,23.
(B) 68,75.
(C) 85,84.
(D) 105,43.
(E) 123,84.
Memória de Cálculo:
IC (μ; 95%) = [876,16; 1123,84]
Cálculo:
1.123,84 − 876,16 = 247,
68
2
= 123,84
Resposta: A margem de erro é 123,84
4. (PS 2014.1) O gerente de controle da qualidade de uma fábrica de lâmpadas precisa estimar a
média aritmética da vida útil de uma grande remessa de lâmpadas. O desvio-padrão do processo
corresponde a 100 horas. Uma amostra aleatória contendo 64 lâmpadas indicou uma média aritmética
de 350 horas para a vida útil da amostra. Qual o intervalo de confiança para a média aritmética da
população relativa à vida útil das lâmpadas nessa remessa com o IC de 95%?
(A) [350; 355]
(B) [325,5; 374,5]
(C) [330; 340]
(D) [355; 359,9]
(E) [350; 380]
Memória de Cálculo:
n= 64 lâmpadas
Média =350 h
Desvio- padrão= 100 h
Nível de Confiança = 95% =1,96
Cálculo:
ε = x + Z
σ
√n
= 350 + 1,96
100
√64
= 374,5
ε = x − Z
σ
√n
= 350 − 1,96
100
√64
= 325,5
Resposta: O intervalo de confiança para a média aritmética é 325,5 ;374,5
5. (PS 2012.2) Suponha que X represente a duração da vida de uma peça de equipamento. Admita que
100 peças sejam ensaiadas, fornecendo uma duração de vida média de 501,2 horas. Suponha que σ
seja conhecido e igual a 4 horas. Assinale a alternativa que contenha o intervalo de confiança de 95%
para essa média.
(A) (498,41; 502,98).
(B) (502,41; 503,98).
(C) (500,41; 501,98).
(D) (488,41; 492,98).
(E) (468,41; 498,98).
Memória de Cálculo:
n= 100 peças
Média =501,2 h
Desvio- padrão= 4 h
Nível de Confiança = 95% =1,96
Cálculo:
ε = x + Z
σ
√n
= 501,2 + 1,96
4
√100
= 501,98
ε = x − Z
σ
√n
= 501,2 − 1,96
4
√100
= 500,41
Resposta: O intervalo de confiança é 500,41 ; 501,98
6. (PS 2010.1) Uma grande empresa deseja estimar o tempo médio de acesso a sites de
relacionamento por parte de seus funcionários, durante o período de expediente da empresa. Uma
pesquisa foi realizada com 36 funcionários que se dispuseram a dar a informação solicitada, obtendo-
se um tempo médio semanal de 50 minutos e uma variância de 64. Considerando-se uma distribuição
aproximadamente normal para este tempo e um nível de confiança de
95%, a estimativa do intervalo de confiança é:
(A) (57,5; 52,5)
(B) (47,5; 62,5)
(C) (67,5; 82,5)
(D) (47,5; 52,5)
(E) (57,5; 72,5)
Memória de Cálculo:
n= 36 funcionários
Média = 50m
Variância = 64 = 8
Nível de Confiança = 95% =1,96
Cálculo:
ε = x + Z
σ
√n
= 50 + 1,96
8
√36
≅ 52,62
ε = x − Z
σ
√n
= 50 − 1,96
8
√36
≅ 47,40
Resposta: O intervalo de confiança é 52,5 ; 47,5
7. (PS 2014.1) Considere as seguintes informações:
· a média correspondente a uma amostra é 75;
· o desvio-padrão da população é igual a 24;
· o número de elementos da amostra é 36.
Suponha que a população seja distribuída nos moldes de distribuição normal.
Nesse caso, a estimativa aproximada do intervalo de confiança de 95% da média aritmética da
população, μ, é:
(A) [60,20; 86,24]
(B) [67,16; 82,84]
(C) [68,09; 79,08]
(D) [70,20; 75,94]
(E) [66,00; 85,00]
Memória de Cálculo:
n= 36
Média = 75
Desvio-padrão = 24
Nível de Confiança = 95% =1,96
Cálculo:
ε = x + Z
σ
√n
= 75 + 1,96
24
√36
= 82,84
ε = x − Z
σ
√n
= 75 − 1,96
24
√36
= 67,16
Resposta: O intervalo de confiança é 67,16 ; 82,84.
8. (PS 2014.2) Se a média de uma amostra é 75, o desvio-padrão da amostra igual a 24 e o número de
elementos é 36, qual a estimativa aproximada do intervalo de confiança de 95% da média aritmética da
população, μ? Suponha que a média segue uma distribuição normal.
(A) [60,20; 86,24]
(B) [67,16; 82,84]
(C) [68,09; 79,08]
(D) [70,20; 75,94]
(E) [66,12; 85,13]
Memória de Cálculo:
n= 36
Média = 75
Desvio-padrão = 24
Nível de Confiança = 95% =1,96
Cálculo:
ε = x + Z
σ
√n
= 75 + 1,96
24
√36
= 82,84
ε = x − Z
σ
√n
= 75 − 1,96
24
√36
= 67,16
Resposta: O intervalo de confiança é 67,16 ; 82,84.
9. (PS 2014.2) Se a média X = 125, σ = 24 e n = 36, construa uma estimativa para o intervalo de
confiança de 95% para a média aritmética da população μ.
(A) 117,16 = μ = 132,84.
(B) 140,00 = μ = 153,00.
(C) 110,25 = μ = 120,45.
(D) 132,96 = μ = 145,67.
(E) 112,86 = μ = 146,76.
Memória de Cálculo:
n= 36
Média = 125
Desvio-padrão = 24
Nível de Confiança = 95% =1,96
Cálculo:
ε = x + Z
σ
√n
= 125 + 1,96
24
√36
= 132,84
ε = x − Z
σ
√n
= 125 − 1,96
24
√36
= 117,16
Resposta: O intervalo de confiança é 117,16 ; 132,84
10. (PS 2010.2) Um levantamento sobre o valor diário das vendas realizadas pelos vendedores de uma
determinada cadeia de lojas de eletrodomésticos considerou as vendas efetuadas por seis vendedores
da loja de Ipanema e por oito vendedores da loja da Tijuca. O resultado obtido foi o seguinte:
Loja da Ipanema Loja da Tijuca
Venda média diária R$ 12.830,00 R$ 14.120,00
Desvio padrão R$ 2.350,00
R$ 2.870,00
Considere que o valor das vendas diárias seja normalmente distribuído e que as variâncias
populacionais do valor das vendas diárias das duas lojas sejam aproximadamente iguais. Assim sendo,
com 95% de confiança, e considerando que o erro de estimação do intervalo de confiança assim
determinado para o valor médio das vendas diárias da loja de Ipanema seja de R$ 2.466,57, o limite
superior desse intervalo de confiança é de:
(A) R$ 18.871,85
(B) R$ 29.918,93
(C) R$ 14.710,39
(D) R$ 15.177,61
(E) R$ 15.296,57
Memória de Cálculo:
Média = 12.830
Desvio-padrão = 2.466,57
Cálculo:
R$ 12.830,00 + R$ 2.466,57= R$15.296,57
Resposta: O limite superior desse intervalo de confiança é de R$15.296,57
11. (PS 2008.1) A renda mensal de um bacharel em Administração é normalmente distribuída com
desvio padrão de R$ 475,00. Uma amostra aleatória de 121 bacharéis forneceu uma média da rendamensal de R$ 2.800,00.
Construa um intervalo de 95% de confiança para estimar o salário médio da população.
(A) ICμ : [2.700,00; 2.900,00]
(B) ICμ : [2.750,00; 2.850,00]
(C) ICμ : [2.743,11; 2.856,89]
(D) ICμ : [2.715,36; 2.884,64]
(E) ICμ : [2.678,73; 2.921,27]
Memória de Cálculo:
n= 121
Média = 2.800
Desvio-padrão = 475
Nível de Confiança = 95% =1,96
Cálculo:
ε = x + Z
σ
√n
= 2.800 + 1,96
475
√121
= 2.884,64
ε = x − Z
σ
√n
= 2.800 − 1,96
475
√121
= 2.715,36
Resposta: O intervalo de confiança é 2.715,36 ; 2.884,64
12. (PS 2008.2) Em um estudo sobre o tempo que os alunos de Administração dedicam ao estudo da
disciplina Estatística II, segundo uma amostra aleatória de 36 discentes, obteve-se média de 2,4
horas/dia, e desvio-padrão de 1,3 hora/dia. Supondo uma distribuição aproximadamente normal, o
intervalo de 98% de confiança para o tempo médio de dedicação aos estudos, de todos os alunos de
Administração, será:
(A) [1,9; 2,9] horas/dia.
(B) [2,9; 3,4] horas/dia.
(C) [1,9; 3,4] horas/dia.
(D) [2,9; 3,6] horas/dia.
(E) [3,6; 4,8] horas dia.
Memória de Cálculo:
n= 36
Média = 2,4 h/d
Desvio-padrão = 1,3 h/d
Nível de Confiança = 98% =2,32
Cálculo:
ε = x + Z
σ
√n
= 2,4 + 2,32
1,3
√36
= 2,9
ε = x − Z
σ
√n
= 2,4 − 2,32
1,3
√36
= 1,9
Resposta: O intervalo de confiança é 1,9; 2,9
13. (PS 2014.1) A vida útil média de uma amostra de 225 peças mecânicas é de 1060 horas.
Sabendo que o desvio padrão é igual a 8 horas, determine o intervalo de confiança (aproximado) para
a verdadeira duração média dessa população de peças, considerando um nível de confiança de 99%.
(A) IC: (1057,47; 1063,23)
(B) IC: (1058,62; 1061,38)
(C) IC: (1056,17; 1063,83)
(D) IC: (1055,37; 1065,63)
(E) IC: (1059,77; 1063,23)
Memória de Cálculo:
n= 225
Média = 1060
Desvio-padrão = 8
Nível de Confiança = 99% =2,57
Cálculo:
ε = x + Z
σ
√n
= 1060 + 2,57
8
√225
= 1.061,38
ε = x − Z
σ
√n
= 1060 − 2,57
8
√225
= 1.058,62
Resposta: O intervalo de confiança é 1.058,62 ; 1.061,38
14. (P2 2012.2) A respeito dos intervalos de confiança, é correto afirmar que:
(A) quanto menor o grau de confiança, maior é o comprimento do intervalo.
(B) quanto menor for o tamanho da amostra, menor será o comprimento do intervalo.
(C) quanto menor a variância da população, menor o comprimento do intervalo.
(D) quanto maior o tamanho da amostra, menor a media amostral, já que a média amostral se obtém
dividindo o total pelo tamanho da amostra.
(E) ao dobrar o tamanho da amostra, o comprimento do intervalo de confiança cai a metade.
Resposta: A variância é o desvio-padrão ao quadrado, portanto quando menor a variância, menor o
desvio-padrão e menor o comprimento do intervalo.
15. (PS 2010.1) Mantendo constantes os valores do desvio padrão populacional, o grau de confiança e
a média da amostra, foram construídos intervalos de confiança para a média populacional utilizando
tamanhos de amostras (n) diferentes. Usando n = 10 e n = 100, os intervalos de 95% de confiança da
média populacional μ foram, respectivamente, (93,80; 106,20) e (98,04; 101,96). Diante do exposto, a
influência do tamanho da amostra na amplitude (diferença entre o limite superior e o inferior) do
intervalo de confiança é:
(A) Quanto maior o tamanho da amostra, menor é a amplitude do intervalo de confiança da média, pois
o erro amostral diminui.
(B) Quanto menor o tamanho da amostra, menor é a amplitude do intervalo de confiança da média,
pois o erro amostral diminui.
(C) Quanto maior o tamanho da amostra, menor é a amplitude do intervalo de confiança da média, pois
o erro amostral aumenta.
(D) Quanto menor o tamanho da amostra, menor é a amplitude do intervalo de confiança da média,
pois o erro amostral aumenta.
(E) Quanto menor o tamanho da amostra mais precisa será a amplitude do intervalo de confiança para
a média, pois o erro amostral aumenta.
Resposta:
Amostra 10 = 106,20 – 93,80 = 12,4
Menor a amostra maior a amplitude, maior o erro amostral.
Amostra 100 = 101,96 – 98,04 = 3,92
Maior a amostra menor a amplitude, menor o erro amostral.
16. (P2 2008.1) O grau de acidez do azeite produzido em certa região admite uma distribuição normal.
Em uma amostra de tamanho 25, foi registrada uma acidez média de 1 grau e desvio-padrão de 0,33
grau. Com esses valores, alguém sugeriu um intervalo para a verdadeira acidez como 0,815 ≤ μ ≤
1,185. Sendo assim, pode-se dizer que o intervalo de confiança associado a esse intervalo é de:
(A) 97%.
(B) 93%.
(C) 95%.
(D) 99%.
(E) 91%.
Memória de Cálculo:
n= 25
Média = 1
Desvio-padrão = 0,33
0,815 ≤ μ ≤ 1,185.
Cálculo:
Fazendo a prova real:
ε = x + Z
σ
√n
= 1 + 2,57
0,33
√25
= 1,185
ε = x − Z
σ
√n
= 1 − 2,57
0,33
√25
= 0,815
Resposta: O intervalo de confiança é 0,815 ; 1,185.
18. (FGV PS 2008.2) Um provedor de acesso à internet está monitorando a duração do tempo das
conexões de seus cliente, com o objetivo de dimensionar seus equipamentos. São desconhecidas a
média e a distribuição de probabilidade desse tempo, mas o desvio-padrão, por analogia a outros
serviços, é considerado igual a √50 minutos. Uma amostra de 500 conexões resultou num valor médio
observado de 25 minutos. Pode-se afirmar que:
(A) a média de tempo de conexão está entre (24,45; 25,55) com grau de confiança de 95%
(B) a média de tempo de conexão está entre (24,45; 25,55) com grau de confiança de 92%
(C) a média de tempo de conexão está entre (24,45; 25,55) com grau de confiança de 99%
(D) a média de tempo de conexão está entre (24,45; 25,55) com grau de confiança de 94%
(E) a média de tempo de conexão está entre (24,45; 25,55) com grau de confiança de 96%
Memória de Cálculo:
n= 500
Média = 25
Desvio-padrão = raiz 50
Cálculo:
Fazendo a prova real:
ε = x + Z
σ
√n
= 25 + 1,75
√50
√500
= 25,55
ε = x − Z
σ
√n
= 25 − 1,75
√50
√500
= 24.45
Resposta: O intervalo de confiança é 24,45 ; 25,55.
17. (PS 2012.1) Uma pesquisa com clientes de uma loja de roupas indicou um gasto médio na amostra
de R$200,00. Sabe-se que o desvio padrão populacional do gasto é de R$72,00. O limite inferior do
intervalo de confiança foi igual a R$176,48. Com base nessas afirmações, é CORRETO concluir que:
(A) a amostra apresentava 36 clientes.
(B) o gasto médio na população é de R$200,00.
(C) o grau de confiança utilizado foi de 95% e o tamanho da amostra foi 49.
(D) é impossível que a média da população seja superior a R$223,52.
(E) se o grau de confiança utilizado foi de 95%, então o tamanho da amostra foi 36.
Memória de Cálculo:
Média = 200
Desvio-padrão = 72
Limite inferior 176,48
Cálculo:
Fazendo a prova real:
ε = x − Z
σ
√n
= 200 − 1,96
72
√36
= 176,48
Resposta: É correto concluir que se o grau de confiança for 95% o tamanho da amostra é 36.
18. (PS 2012.1) Em uma pesquisa realizada com o objetivo de estimar se a renda média de
agricultores aumentou a partir da implantação de uma determinada política pública, coletaram-se dados
de uma amostra de 5000 agricultores. Com um grau de confiança de 95%, chegou-se ao seguinte
intervalo de confiança para a diferença de renda média dos agricultores que foram beneficiados pela
política e os que não foram: [50,4; 76,6]. Dessa forma, entende-se que:
(A) com 95% de confiança, a renda média da população de agricultores após a implementação da
política pública está entre R$50,4 e R$76,6.
(B) 95% da população de agricultores alcançaram, após a implementação da política pública, uma
renda média entre R$50,4 e R$76,6.
(C) com 95% de confiança, a renda média da amostra de agricultores após a implementação da política
pública está entre R$50,4e R$76,6.
(D) 95% da amostra de agricultores alcançaram, após a implementação da política pública, uma rendamédia entre R$50,4 e R$76,6.
(E) com 95% de confiança, a diferença de renda média da população de agricultores que foram
beneficiados pela política pública e aqueles que não foram está entre R$50,4 e R$76,6.
Memória de Cálculo:
n= 5.000
Desvio-padrão = 72
Grau de confiança =95% =1,96
Resposta: O enunciado diz que com um grau de confiança de 95% o intervalo de confiança para a
diferença de renda média dos agricultores que foram beneficiados pela política e os que não foram é de
[50,4; 76,6].
19. (P2 2014.2) Assinale a alternativa que contém a correta interpretação de um intervalo de confiança
para a média de uma população, considerando um grau de confiança de 95%.
(A) Com um determinado grau de confiança, o valor da média amostral estará entre -3 e 3 desvios-
padrões.
(B) Se um número grande de intervalos for construído, com base em amostragem aleatória de 100
observações, então 95% deles irão conter o valor da média populacional.
(C) Com uma determinada variância, o valor da média amostral estará entre os limites inferior e
superior do intervalo de confiança.
(D) Com um determinado coeficiente de determinação, o valor da média amostral estará entre -3 e 3
desvios padrões.
(E) Com uma determinada margem de erro, o valor da média amostral estará entre o primeiro quartil e
terceiro quartil da distribuição.
Resposta: A porcentagem é um número decimal multiplicado por 100, portanto se uma amostra 100
com o grau de confiança de 95% então 95% terão o valor da média populacional.
20. (PS 2016.1) Uma determinada empresa realizou uma pesquisa de mercado em um hipermercado a
fim de apresentar uma conclusão sobre o gasto médio familiar da população da cidade A com produtos
alimentícios no mês. Os dados foram obtidos a partir de uma amostra de 121 clientes, apresentando
média de R$1.081,00 e desvio-padrão de R$112,00. Supondo um nível de significância de 5%, conclui-
se que o intervalo de confiança é de:
(A) 𝐼𝐶 (μ; 95%) = 1193,00 ± 1,9600 (10,22).
(B)𝐼𝐶 (μ; 95%) = 1081,00 ± 1,658 (10,18).
(C) 𝐼𝐶 (μ; 95%) = 1081,00 ± 1,980 (10,22).
(D) 𝐼𝐶 (μ; 95%) = 1081,00 ± 1,658 (10,22).
(E) 𝐼𝐶 (μ; 95%) = 1081,00 ± 1,980 (10,18).
Memória de Cálculo:
n= 121
Média = 1.081
Desvio-padrão = 112
Significância 5%= valor de confiança 95%
Cálculo:
ε = x ± Z
σ
√n
= 1.081 ± 1,96
112
√121
= 1.081 ± 1,96(10,18)
Resposta: O intervalo de confiança é 𝐼𝐶 (μ; 95%) = 1081,00 ± 1,980 (10,18).
21. (PS 2014.1) No Brasil, o custo elevado da assistência médica é uma questão de grande
importância para um grande número de famílias. Uma amostra de 25 famílias, selecionadas
aleatoriamente a partir de uma área, mostrou que essas famílias gastam em média R$ 143,00 por mês
com assistência médica. Além disso, o desvio padrão amostral foi de R$ 28,00.O intervalo de confiança
de 95% para a média aritmética dos gastos mensais com assistência médica incorridos por todas as
famílias nessa área é:
(A) R$ 131,44 até R$ 154,55
(B) R$ 125,05 até R$ 179,05
(C) R$ 145,04 até R$ 173,47
(D) R$ 65,04 até R$ 89,75
(E) R$ 36,73 até R$ 198,75
Memória de Cálculo:
n= 25
Média = 143
Desvio-padrão = 28
Valor de confiança 95%=1,96
Cálculo:
ε = x + Z
σ
√n
= 143 + 1,96
28
√25
≅ 154
ε = x − Z
σ
√n
= 143 − 1,96
28
√25
≅ 132
Resposta: O intervalo de confiança é R$131,44 ; R$154,55
22. (PS 2008.2) Foi selecionada, ao acaso, dentre a quantidade de mercadorias entregues dentro do
prazo, uma amostra de 25 mercadorias. Essa amostra forneceu média x = 350 com variância s2 = 900.
O intervalo de confiança de 95% para a média da população de todas as mercadorias entregues dentro
do prazo é, aproximadamente:
(A) ICμ = (337,62; 362,38).
(B) ICμ = (327,62; 371,38).
(C) ICμ = (347,62; 381,38).
(D) ICμ = (357,62; 391,38).
(E) ICμ = (332,62; 356,38).
Memória de Cálculo:
n= 25
Média = 350
Desvio-padrão = 30
Valor de confiança 95%=1,96
Cálculo:
ε = x + Z
σ
√n
= 350 + 1,96
30
√25
≅ 361,76
ε = x − Z
σ
√n
= 350 − 1,96
30
√25
≅ 338,24
Resposta: O intervalo de confiança é 337,62 ; 362,38
23. (PS 2016.1) Seja uma amostra {9, 8, 12, 7, 9, 6, 11, 10, 9} extraída de uma população normal. Qual
o intervalo de confiança para a média ao nível de 95%?
(A) [3,17; 9,11].
(B) [7,30; 10,20].
(C) [7,57; 10,43].
(D) [7,23; 10,05]
(E) [6,27; 8,13].
Memória de Cálculo:
n= 9
Média = 9
Desvio-padrão = 1,87
Valor de confiança 95%=1,96
Cálculo:
ε = x + Z
σ
√n
= 9 + 1,96
1,87
√9
≅ 10,22
ε = x − Z
σ
√n
= 9 + 1,96
1,87
√9
≅ 7,77
Resposta: O intervalo de confiança 7,57; 10,22
24. (PS 2010.1) Uma concessionária de veículos deseja estimar o valor médio pago por proprietários
de veículos novos, quando da primeira revisão de seus veículos. Uma amostra aleatória de 10 veículos
novos acusou um valor médio de R$ 850 e um desvio padrão de R$ 250, para a primeira revisão.
Considerando que esses valores têm distribuição normal, a estimativa do intervalo de confiança com
99% para a média populacional será aproximadamente igual a:
(A) (550,50; 1200,30)
(B) (593,05; 1106,95)
(C) (450,50; 1300,30)
(D) (520,50; 900,30)
(E) (500,50; 1000,30)
Memória de Cálculo:
n= 10
Média = 850
Desvio-padrão = 250
Valor de confiança 99%=
Cálculo:
ε = x + Z
σ
√n
= 850 + 3,250
250
√10
≅ 1.106,93
ε = x − Z
σ
√n
= 850 − 3,250
250
√10
≅ 593,06
Resposta: O intervalo de confiança é 593,06;1.106,93
26. (PS 2010.1) A fim de verificar se os postos de gasolina de uma cidade estavam cobrando valores
aproximados sobre o litro da gasolina, um fiscal tomou uma amostra de 10 postos, obtendo um valor
médio de R$ 2,55 e desvio padrão de R$ 0,146 por litro. Utilizando um nível de confiança de 99%, o
intervalo de confiança para o valor médio do litro de gasolina para a cidade, em reais, é:
(A) (2,28; 2,82)
(B) (2,31; 2,79)
(C) (2,40; 2,70)
(D) (2,43; 2,67)
(E) (2,52; 2,58)
Memória de Cálculo:
n= 10
Média = 2,55
Desvio-padrão = 0,146
Valor de confiança 99%=2,32
Cálculo:
ε = x + Z
σ
√n
= 2,55 + 2,32
0,146
√10
≅ 2,66
ε = x − Z
σ
√n
= 2,55 − 2,32
0,146
√10
≅ 2,4
Resposta: O intervalo de confiança é 2,4 ; 2,7
27. (PS 2010.2) Numa pesquisa sobre aproveitamento médio nas disciplinas de um curso de
graduação em Administração de Empresas, foram calculados os estimadores da população, a variância
e a média por meio do processo de Esperança Matemática (média probabilística ou média ponderada
pela probabilidade) a partir de uma amostra de 25 alunos. De posse dessas duas estatísticas e
considerando que o aproveitamento nas disciplinas seja uma variável aleatória normalmente
distribuída, um analista que desejar construir um intervalo de confiança para a média populacional do
aproveitamento médio deverá, necessariamente, utilizar:
(A) a tabela T-Student, pois o tamanho da amostra é menor que 30.
(B) a tabela T-Student, pois não se conhece o desvio padrão.
(C) a tabela Z (Normal), pois a variância populacional é conhecida e a população é normalmente
distribuída.
(D) a tabela T-Student, pois a média populacional só pode ser estimada por meio dela.
(E) a tabela Z (Normal), pois a média populacional só pode ser estimada por meio dela.
Resposta: Antes de usar a Tabela T, tem que verificar se n<30, se o desvio-padrão é desconhecido e
se a população é aproximadamente normal. E a variância torna uma estimativa melhor. Portanto a
alternativa que corresponde é a C.
28. (PS 2010.2) Considere que um analista queira estimar um parâmetro populacional ou testá-lo a
partir de uma amostra de tamanho “n” retirada dessa população. Nesse caso, ele deverá utilizar:
(A) a tabela Z (Normal) toda vez que “n” for menor que 30 elementos e a variância populacional for
desconhecida.
(B) a tabela T-Student toda vez que “n”for maior que 30 elementos e a variância populacional for
conhecida.
(C) a tabela T-Student toda vez que “n” for menor que 30 elementos e a variância populacional for
conhecida.
(D) a tabela Z (Normal) toda vez que “n” for menor que 30 elementos, a variância populacional for
conhecida e a população normalmente distribuída.
(E) a tabela T-Student ou a tabela Z (Normal), indiferentemente, se “n” for maior que 30 elementos.
Resposta: Tem que verificar se n<30, se o desvio-padrão é desconhecido e/ ou a variância conhecida
e se a população é aproximadamente normal.
29. (PS 2014.1) Com relação à distribuição normal e à distribuição t de Student, pode-se afirmar que:
(A) a distribuição t é construída a partir de uma amostra menor que a distribuição normal.
(B) as distribuições t e normal não podem ser utilizadas para variáveis independentes.
(C) a distribuição t não está distribuída simetricamente em torno da média, enquanto a distribuição
normal tem tal característica.
(D) a distribuição t é construída a partir da variância amostral.
(E) as distribuições t e normal não são diferentes.
Resposta: À medida que crescem o tamanho da amostra e os graus de liberdade, S (amostral) passa
a ser uma melhor estimativa para σ, e a distribuição t gradualmente se aproxima da distribuição normal
padronizada, até que as duas passem a ser praticamente idênticas.
30. (PS 2010.2) Suponha que um fabricante de calçados queira realizar uma pesquisa sobre o gasto
mensal com sapatos realizado por famílias da classe média de determinada cidade. A confiança
desejada é de 95% e o erro máximo suportado na estimação do gasto mensal com sapatos é de R$
10,00. Considerando que esse fabricante sabe, por pesquisas anteriores, que o desvio padrão do gasto
mensal com sapatos é de R$ 40,00, o tamanho da amostra para a realização da pesquisa deverá ser
de:
(A) 60
(B) 62
(C) 50
(D) 70
(E) 40
Memória de Cálculo:
Desvio-padrão = 40
Variância=1.600
Erro = 10
Valor de confiança 95%=1,96
Cálculo:
𝑛 = (
𝑍. 𝜎
ε
)
2
= (
1,96 𝑥 40
10
)
2
≅ 62
Resposta: O tamanho da amostra é 62.
31. (PS 2008.1) Uma professora de Estatística resolveu escrever um artigo e para isso deve calcular o
tempo médio de horas dormidas por seus alunos e os demais alunos da universidade onde trabalha.
Como o total de alunos é 5.590, ela tomará uma amostra aleatória de n alunos. Devido à experiência
que possui, a professora está supondo um erro máximo de estimativa de = 0,7 hora e um desvio-
padrão de 2,3 horas. Considerando que a variável de estudo é normalmente distribuída, quantos alunos
(n) ela deverá pesquisar, dado que o nível de significância desejado é de 0,05?
(A) n = 40 alunos.
(B) n = 42 alunos.
(C) n = 38 alunos.
(D) n = 44 alunos.
(E) n = 46 alunos.
Memória de Cálculo:
Média = 2,55
Erro = 0,7
Desvio-padrão = 2,3
Significância= 0,05 = 0,95 = 1,96
Cálculo:
𝑛 = (
𝑍. 𝜎
ε
)
2
= (
1,96 𝑥 2,3
0,7
)
2
≅ 42
Resposta: O tamanho da amostra é 42.
32. (PS 2012.2) Uma pesquisa é planejada para determinar o valor de venda de um novo
empreendimento. Para isso, é preciso conhecer qual a renda média do público-alvo. A gerência da
empresa deseja ter 95% de confiança de que a média da amostra está no máximo com uma margem
de erro +/- $ 100 da média real da renda da população. Um estudo-piloto indica que o desvio padrão é
$ 3.061,23. Qual o tamanho da amostra necessário?
(A) 36.
(B) 3.600.
(C) 6.000.
(D) 2.520.
(E) 60.
Memória de Cálculo:
Erro = 100
Desvio-padrão = 3.061,23
Confiança= 95%=1,96
Cálculo:
𝑛 = (
𝑍. 𝜎
ε
)
2
= (
1,96 𝑥 3.061,23
100
)
2
≅ 3.600
Resposta: O tamanho da amostra é 3.600.
33. (P2 2010.2) Numa pesquisa sobre retornos de capital, uma amostra de ativos financeiros revelou
desvio padrão de 1,54 pontos percentuais, e com esse valor foi estimado um intervalo de confiança
com 95% de certeza e um erro padrão de estimativa de 0,3 pontos percentuais. Se o analista desejar
que o erro padrão dessa estimativa decresça para 0,2 pontos percentuais, supondo que a população
de ativos seja infinita, ele deverá aumentar o tamanho da amostra de ativos financeiros para:
(A) 228 ativos.
(B) 248 ativos.
(C) 540 ativos.
(D) 76 ativos.
(E) 46 ativos.
Memória de Cálculo:
Erro = 0,2
Desvio-padrão = 1,54
Confiança= 95$ = 1,96
Cálculo:
𝑛 = (
𝑍. 𝜎
ε
)
2
= (
1,96 𝑥 1,54
0,2
)
2
≅ 228
Resposta: O tamanho da amostra deverá ser de 228.
34. (P2 2010.2) Considerando as solicitações domiciliares de pizzas, é necessário reduzirmos pela
metade a amplitude da estimativa intervalar, que atualmente é de 24min a 26min, a uma confiança de
98% e um desvio padrão de 10% da média atual. Nesse caso, a quantidade de solicitações domiciliares
de pizzas a serem investigadas é:
(A) 34
(B) 36
(C) 126
(D) 136
(E) 116
Memória de Cálculo:
Média = 20 === 24min a 26min
Erro = 2
Desvio-padrão = 10
Confiança=98%=2,32
Cálculo:
𝑛 = (
𝑍. 𝜎
ε
)
2
= (
2,32 𝑥 10
2
)
2
≅ 135
Resposta: A quantidade de solicitações domiciliares de pizzas a serem investigadas é 136.
35. (PS 2018.2) Uma amostra de 35 elementos foi coletada com o intuito de construir um intervalo de
confiança para a média de uma variável em uma população. O desvio-padrão dessa variável na
população é 0,2kg. Sabendo que a média amostral encontrada foi de 2,1kg, o intervalo de confiança
com 95% de confiança é:
(A) 2,04 < x < 2,16.
(B) 2,03 < x < 2,17.
(C) 1,98 < x < 2,02.
(D) 1,95 < x < 2,05.
(E) 2 < x < 3.
Memória de Cálculo:
n= 35
Média = 2,1
Desvio-padrão = 0,2
Grau de confiança = 95% =1,96
Cálculo:
ε = x + Z
σ
√n
= 2,1 + 1,96
0,2
√35
≅ 2,17
ε = x − Z
σ
√n
= 2,1 − 2,32
0,2
√35
≅ 2,03
Resposta: O intervalo de confiança é 2,03 ; 2,17.
36. (PS 2014.2) Em uma pesquisa que teve por objetivo investigar as intenções de voto no candidato A
e B para o segundo turno da eleição da Presidência da República, a margem de erro foi de 5%. Se
esse instituto desejar reduzir a margem de erro dessa pesquisa, deverá:
(A) aumentar o tamanho da amostra.
(B) aumentar o nível de confiança da pesquisa.
(C) reduzir o nível de significância da pesquisa.
(D) diminuir a proporção encontrada na amostra.
(E) aumentar a proporção encontrada na amostra.
Resposta: Quanto maior a amostra menor o erro, e quanto menor a amostra maior o erro.
37. (ENADE 2008) Uma empresa realizou uma avaliação de desempenho de um sistema web. Nessa
avaliação, foram determinados o desvio padrão e a média do tempo de resposta do referido sistema,
tendo como base 10 consultas realizadas. Constatou-se que o tempo de resposta do sistema web
possui distribuição normal. Para um nível de confiança de 95%, identificou-se o intervalo de confiança
para a média do tempo de resposta das consultas. Com relação a essa avaliação de desempenho,
julgue os itens abaixo.
I- Com a medição do tempo de resposta do sistema para 10 consultas adicionais, é possível que a
média e o desvio padrão do tempo de resposta para o conjunto das 20 consultas aumente ou
diminua.
II- Com a medição do tempo de resposta do sistema para 15 consultas adicionais, com nível de
confiança de 95%, o intervalo de confiança para o conjunto das 25 consultas é maior que o intervalo
de confiança para o conjunto das 10 consultas iniciais.
III- Na medição do tempo de resposta das 10 consultas iniciais, o intervalo de confiança com nível de
confiança de 99% é maior que o intervalo de confiança com nível de confiança de 95%.
Assinale a opção correta:
(A) Apenas um item está certo.
(B) Apenas os itens I e II estão certos.
(C) Apenas os itens I e III estão certos.
(D) Apenas os itens II e III estão certos.
(E) Todos os itens estão certos.
Resposta:
A alternativa I está correta, pois aumentou a amostra, e consequentementeo intervalo de confiança irá
aumentar e diminuir proporcionalmente.
A alternativa II está incorreta pois a amostra é maior, portanto o intervalo de confiança será menor.
A alternativa III está correta, pois o nível de confiança é maior.
38. (ENADE 2012) Pesquisa realizada pelo Instituto X em todo o território nacional objetivou identificar
quantos consumidores brasileiros utilizam e realizam compras pela Internet. A pesquisa ouviu 2 mil
consumidores em todo o país, com margem de erro de 2,2 pontos percentuais para mais ou para
menos. O universo dessa pesquisa foi representado por amostras estratificadas de forma proporcional
à população de cada unidade da federação. As pessoas entrevistadas foram selecionadas com base
em cotas proporcionais, segundo as seguintes variáveis: população economicamente ativa, faixa etária
e localização. Com base nessas informações, avalie as afirmações a seguir.
I. O universo da pesquisa foi de 2 mil consumidores.
II. O objetivo das cotas foi garantir a representatividade do universo estudado.
III. A margem de erro diminuiria se a pesquisa tivesse entrevistado 5 mil consumidores.
IV. As entrevistas foram realizadas com a mesma quantidade de consumidores em cada estado.
É correto apenas o que se afirma em:
(A) I e II.
(B) I e IV.
(C) II e III.
(D) I, III e IV.
(E) II, III e IV.
Resposta:
A alternativa I está incorreta, pois 2 mil é a amostra a populacional seria o todos os consumidores do
país.
A alternativa II está incorreta, pois fizeram é uma amostra estratificada.
A alternativa III está correta, pois maior a amostra menor a margem de erro.
A alternativa IV está incorreta, pois não há informações suficientes para essa afirmação, e é difícil
terem a quantidades iguais dos consumidores em diferentes estados.
FUNDAMENTOS DOS TESTES DE HIPÓTESES
1. (PS 2008.2) Se quisermos realizar um estudo para decidir se o valor esperado da espessura de uma
peça produzida por uma determinada máquina mudou, sendo necessário fazer uma parada de
manutenção, e outro estudo para verificar se a proporção de itens defeituosos diminuiu, devemos
realizar testes de hipóteses, respectivamente:
(A) unilateral inferior e bilateral.
(B) bilateral e unilateral inferior.
(C) unilateral inferior e unilateral superior.
(D) unilateral superior e unilateral inferior.
(E) bilateral e unilateral superior.
Resposta: Os testes bilaterais ou bicaudal tem como primazia:
{
Portanto como a espessura de uma peça produzida mudou, ela ficou diferente a média anterior. Já o
segundo estudo temos testes unilateral inferior, tendo como característica:
{
Como ele quer saber se a proporção de itens defeituosos diminuiu portanto torna inferior (menor).
2. (P2 2012.2) Uma companhia de seguros iniciará uma campanha extensa de propaganda para
vender apólices de seguro de vida, caso verifique que a quantia média segurada por família é inferior a
R$ 10.000,00. Com base no enunciado, quais seriam as hipóteses nula (H0) e alternativa (Ha) deste
teste de hipótese?
(A) H0 : μ ≥ R$ 10.000; Ha : μ < R$ 10.000
(B) H0 : μ ≤ R$ 10.000; Ha : μ < R$ 10.000
(C) H0 : μ ≥ R$ 10.000; Ha : μ > R$ 10.000
(D) H0 : μ ≥ R$ 10.000; Ha : μ ≠ R$ 10.000
(E) H0 : μ = R$ 10.000; Ha : μ ≠ R$ 10.000
Memória de Cálculo:
{
{
Resposta: As hipóteses nula (H0) e alternativa (Ha) deste teste de hipótese H0 : μ ≥ R$ 10.000; Ha : μ
< R$ 10.000.
3. (PS 2014.2) Num tribunal, partimos do pressuposto de que um réu é considerado inocente até que
se prove o contrário. Baseando-se nessa ideia, o veredito pode:
I. Inocentar um réu, se o mesmo é culpado, ou seja, cometer um erro do tipo I.
II. Declarar culpado um réu, se o mesmo é inocente, ou seja, cometer um erro do tipo I.
III. Inocentar um réu, se o mesmo é culpado, ou seja, cometer um erro do tipo II.
IV. Declarar culpado um réu, se o mesmo é inocente, ou seja, cometer um erro do tipo II.
Dessa forma, serão VERDADEIROS somente os itens:
(A) I e II.
(B) I e III.
(C) II e III.
(D) II e IV.
(E) III e IV.
Memória de Cálculo:
I. Esta errada pois o Erro tipo 1 ocorre se você rejeita a hipótese nula ( ele é culpado), quando ela é
verdadeira e não deve ser rejeitada. Portanto ele é culpado e não pode ser inocentado seria um erro do
tipo 2.
II. Esta correta, pois o Erro do tipo 1 ocorre se você rejeita a hipótese nula (ele é inocente), quando ela
é verdadeira e não deve ser rejeitada. Portanto ele é inocente e não pode ser culpado
III. Está correta, pois o Erro tipo 2 ocorre se você não rejeita a hipótese nula (ele ser inocente), quando
ela é falsa e deve ser rejeitada. Portanto ele é culpado e não pode ser inocentado
IV. Esta correta, pois será Erro do tipo 2.
Resposta: serão VERDADEIROS somente os itens II e IV.
4. (P2 2010.1) Qual das alternativas corresponde à definição do Erro Tipo II?
(A) Erro cometido quando se rejeita H0 e ela é verdadeira.
(B) Erro cometido quando se aceita H0 e ela é verdadeira.
(C) Erro cometido quando se rejeita H1 e ela é falsa.
(D) Erro cometido quando se aceita H0 e ela é falsa.
(E) Erro cometido quando se aceita H1 e ela é verdadeira.
Resposta: ocorre se você não rejeita a hipótese nula (H0), quando ela é falsa e deve ser rejeitada.
5. (PS 2012.2) É INCORRETO afirmar que o ERRO TIPO II, presente nos testes de hipóteses:
(A) tem probabilidade representada pela letra grega beta.
(B) torna-se mais provável quanto menos provável for o ERRO TIPO I.
(C) ocorre quando não rejeitamos a hipótese nula sendo ela de fato falsa.
(D) ocorre quando rejeitamos a hipótese nula sendo ela de fato verdadeira.
(E) este tipo de erro diminui com o aumento do tamanho da amostra.
Resposta: O erro do tipo 1 é o que está destacado que ocorre quando rejeitamos a hipótese nula
sendo ela de fato verdadeira.
6. (FGV OS 2008.01) Uma empresa brasileira afirma que o faturamento médio de uma de suas filiais
sediadas na região Sul é de 230 mil reais e a distribuição normal. O desvio–padrão do faturamento e
todas as empresas da região é igual a 30 mil reais. Uma análise dos dados de uma amostra de 16
empresas encontrou um faturamento médio igual a R$195.000,00. Deve-se testar se a média desse
faturamento é inferior a 230 mil reais. As hipóteses a serem testadas são:
{
O valor calculado da estatística de teste é:
(A) 4,67
(B) 0,46
(C) -4,67
(D) -1,17
(E) 0,04
Memória de Cálculo:
Média = 195.000,000
Desvio-padrão = 30.000
Amostra (n) = 16
Cálculo:
√
√
Resposta: O valor calculado da estatística de teste é -4,67.
7. (PS 2012.2) Uma empresa de liga de materiais está estudando a possibilidade de uso de uma
nova liga de níquel-cromo-ferro. O objetivo é obter um metal forte o suficiente para satisfazer as
especificações do consumidor de uma nova máquina que faz estampas. As especificações
requerem que o número médio de ciclos antes de uma falha, μ, obtido nos testes de vibração,
exceda 500.000. A partir de testes prévios com outros materiais, sabe-se que o desvio-padrão na
resistência está em torno de 50.000 ciclos antes de uma falha. Foi realizado teste de resistência
em 100 peças feitas com este material. A média da amostra calculada a partir de dados
experimentais foi igual a 519.500 ciclos antes de uma falha.
Nesse caso, qual o valor observado do teste?
(A) Valor z observado do teste é 3,90.
(B) Valor z observado do teste é 2,40.
(C) Valor z observado do teste é 2,33.
(D) Valor z observado do teste é 1,96.
(E) Valor z observado do teste é 1,64.
Memória de Cálculo:
Média = 519.500,00
Desvio-padrão = 50.000
Amostra (n) = 100
Cálculo:
√
√
Resposta: O valor calculado da estatística de testeé 3,9 (positivo) pois fala exceder que é na
parte superior da curva Z.
8. (PS 2014.2) Uma amostra aleatória contendo 64 lâmpadas indicou uma média de 350 horas
para a vida útil da amostra e desvio padrão de 100 horas. Considerando um nível de
significância de 5%, existem evidências de que a média populacional da vida útil seja diferente
de 375 horas?
(A) Não, uma vez que o Z observado = 2,00 > Z crítico = -1,96, logo não se rejeita a hipótese
nula.
(B) Não, uma vez que o Z observado = - 2,00 < Z crítico = 1,96; logo não se rejeita a hipótese
nula.
(C) Sim, uma vez que o Z observado = - 2,00 < Z crítico = -1,96; logo se rejeita a hipótese nula.
(D) Sim, uma vez que o Z observado = -2,50 < Z crítico = -1,68, logo se rejeita a hipótese nula.
(E) Não, uma vez que o Z observado = -2,50 > Z crítico -1,96, logo não se rejeita a hipótese nula.
Memória de Cálculo:
Média = 350h
Desvio-padrão = 10h
Amostra (n) = 64
Nível de significância = 5% =95% confiança= 1,96
Média populacional= 375h
Cálculo:
√
√
Resposta: Sim, uma vez que o Z observado = - 2,00 < Z crítico = -1,96; logo se rejeita a
hipótese nula.
9. (PS 2008.1) Em um teste vocacional, a distribuição das notas dos candidatos é normalmente
distribuída com média 160 pontos e desvio-padrão de 30 pontos. Uma nova turma de 49
candidatos apresentou uma média igual a 140 pontos. Ao nível de 5% de significância, teste se a
nova turma tem desempenho inferior e assinale a alternativa correta.
(A) Rejeita-se H0 e considera-se que a nova turma tem desempenho inferior.
(B) Aceita-se H0 e considera-se que a nova turma tem desempenho inferior.
(C) Rejeita-se H0 e considera-se que a nova turma tem desempenho superior.
(D) Aceita-se H0 e considera-se que a nova turma tem desempenho superior.
(E) Rejeita-se H0 e H1 e considera-se que a nova turma tem desempenho inferior.
Memória de Cálculo:
Média = 160
Desvio-padrão = 30
Amostra (n) = 49
Nível de significância = 5% =95% confiança= 1,96
Média populacional= 140
Cálculo:
√
√
Resposta: Rejeitar H0 se ZESTAT > + 1,96 === ZESTAT 4,67 > + 1,96, portanto rejeita H0
0
1,96
4,67
10. (PS 2016.1) A indústria TML avaliou a vida média de 100 televisores em 1.570 dias, com
desvio-padrão de 120 dias. Sabe-se que a duração dos televisores dessa indústria tem
distribuição normal com média de 1.600 dias. Ao testar se houve alteração, com um nível de
significância de 5% na duração média dos televisores, é correto recomendar:
(A) não se rejeita H0 ao nível de significância de 5%.
(B) a amostra é insuficiente para uma conclusão estatisticamente significativa.
(C) rejeita-se H0 ao nível de significância de 5%.
(D) rejeita-se H1 ao nível de significância de 5%.
(E) não é possível aplicar esse teste por falta de dados.
Memória de Cálculo:
Média = 1.570
Desvio-padrão = 120
Amostra (n) = 100
Nível de significância = 5% =95% confiança= 1,96
Média populacional= 1.600
Cálculo:
√
√
Resposta: Rejeitar H0 se ZESTAT > + 1,96 === ZESTAT 2,5 > + 1,96, portanto rejeita H0 ao nível
de significância de 5%.
0
1,96
2,5
11 (PS 2012.2) Na indústria cerâmica, avalia-se sistematicamente a resistência de amostras de
massas cerâmicas, após o processo de queima. Dessas avaliações, sabe-se que certo tipo de
massa tem resistência mecânica aproximadamente normal, com média 53 MPa e variância 16
MPa2. Após a troca de alguns fornecedores de matérias-primas, deseja-se verificar se houve
alteração na qualidade. Uma amostra de 15 corpos de prova de massa cerâmica acusou média
igual a 50 MPa. Qual é a conclusão ao nível de significância de 5%?
(A) Como consequência do resultado de teste estatístico, há evidência de redução na resistência
média da massa cerâmica.
(B) Como consequência do resultado de teste estatístico, não há evidencia de redução na
resistência média da massa cerâmica.
(C) Usando a tabela normal padrão, encontramos área na cauda superior igual a 0,019. Logo, há
evidencia de redução na resistência média da massa cerâmica.
(D) Não podemos realizar um teste de hipótese com esses dados.
(E) Como consequência do resultado de teste estatístico, provamos heterocedasticidade nas
amostras testadas.
Memória de Cálculo:
Média = 53
Desvio-padrão = 4
Amostra (n) = 15
Nível de significância = 5% =95% confiança= 1,96
Média populacional= 50
Cálculo:
√
√
Resposta: Rejeitar H0 se ZESTAT > + 1,96 === ZESTAT 2,9 > + 1,96, portanto rejeita H0 ao nível
de significância de 5%. Portanto houve uma redução de 53 para 50, rejeita H0.
0
1,96
2,9
12. (PS 2010.1) Um laboratório que fabrica comprimidos analgésicos anuncia que seu remédio
para dor de cabeça leva em média 10 minutos para aliviar a dor, com desvio padrão de 3
minutos. Um médico sustenta que o tempo é maior e seleciona aleatoriamente 25 pacientes.
Pede a eles que tomem tais comprimidos quando tiverem dor de cabeça, anotando o tempo (em
minutos) até o alívio da dor. Após a coleta de todas as respostas, ele verifica um tempo médio de
alívio da dor de 13 minutos. Admitindo a distribuição normal dos tempos, para um nível de
significância de 5%, assinale a alternativa correta.
(A) rejeita-se H0 e o laboratório tem razão.
(B) aceita-se H0 e o laboratório tem razão.
(C) rejeita-se H0 e o laboratório não tem razão.
(D) aceita-se H0 e o laboratório não tem razão.
(E) rejeita-se H0 e o laboratório realiza outra amostra para aumentar a confiança na inferência.
Memória de Cálculo:
Média = 10
Desvio-padrão = 3
Amostra (n) = 25
Nível de significância = 5% =95% confiança= 1,96
Média = 13
Cálculo:
√
√
Resposta: Rejeitar H0 se ZESTAT > + 1,96 === ZESTAT 5,00 > + 1,96, portanto rejeita H0 ao nível
de significância de 5%. Rejeitando a hipótese nula temos que o laboratório não tem razão no seu
tempo de efeito do remédio.
0
1,96
5,00
13. (P2 2008.1) Uma grande construtora nacional afirma que seus funcionários recebem um
salário médio igual a, no mínimo, R$ 1.450,00, com desvio-padrão igual a R$ 700,00. Uma
amostra com 500 funcionários apresentou uma média de R$ 1.390,00. Considerando que os
dados são normalmente distribuídos, o que se pode afirmar?
(A) Há evidência suficiente na amostra para rejeitarmos H0 a um nível de significância de 1%.
(B) Há evidência suficiente na amostra para rejeitarmos H0 a um nível de significância de 5%.
(C) Não há evidência suficiente na amostra para rejeitarmos H0 a um nível de significância de
5%.
(D) Há evidência suficiente na amostra para rejeitarmos H0 a um nível de significância de 2,5%.
(E) Há evidência suficiente na amostra para rejeitarmos H0 a um nível de significância de 2%.
Memória de Cálculo:
Média = 1.450
Desvio-padrão = 700
Amostra (n) = 500
Nível de significância = 5% =95% confiança= 1,96
Média = 1.390
Cálculo:
√
√
0,5 - 0,4750 = 0,025 x 100 = 2,5 %
0,5 - 0,4719 = 0,0281 x 100 = 2,81%
Resposta: Rejeitar H0 se ZESTAT > + 1,96 === 2, 81% > 2,5 %, portanto rejeita H0 ao nível de
significância de 5%.
0
1,96
5,00
14. (PS 2012.2) Um fornecedor afirma que seu tempo médio de entrega é menor do que 30
horas. Um estudo com 36 entregas registrou tempo médio de 28,5 horas. Sabe-se que o tempo
de entrega segue uma distribuição normal com desvio-padrão de 3,5 horas. O valor-p e a
conclusão para um nível de significância α = 1% são respectivamente:
(A) 2,57; há evidência de que o tempo médio de entrega seja menor que 30 horas.
(B) 0,0102; há evidência de que o tempo médio de entrega seja menor que 30 horas.(C) 0,0051; há evidência de que o tempo médio de entrega seja menor que 30 horas.
(D) 0,0102; não há evidência de que o tempo médio de entrega seja menor que 30 horas.
(E) 0,0051; não há evidência de que o tempo médio de entrega seja menor que 30 horas.
Memória de Cálculo:
Média = 30
Desvio-padrão = 3,5
Amostra (n) = 36
Nível de significância = 1% =99% confiança= 2,57
Média = 28,5
2,4377
Cálculo:
√
√
0,4949==== Unilateral = 0,50 – 0,4949 = 0,0051 (Valor p)
Z = 2,33
Resposta: Se o valor-p for maior ou igual a α, não rejeitar a hipótese nula; 5,57>2,33.
15. (P2 2012.1) Com relação a testes de hipótese, é correto afirmar que o nível de significância
de um teste é:
(A) a probabilidade de se cometer o erro tipo I.
(B) a probabilidade de se cometer o erro tipo II.
(C) a probabilidade de não se cometer o erro tipo I.
(D) o mesmo que valor p.
(E) a probabilidade de não se cometer um erro do tipo II.
Resposta: Probabilidade de vir a cometer um Erro do Tipo 1, representado por alfa, é
identificado como o nível de significância do teste estatístico .
16. (P2 2016.1) O menor nível de significância a qual se pode rejeitar uma hipótese nula de um
teste é o:
(A) erro do tipo I.
(B) nível de significância.
(C) beta estimado.
(D) valor-p.
(E) grau de confiança.
Resposta: Se o valor-p for menor do que α, rejeitar a hipótese nula.
17. (PS 2012.1) Um professor constata que um de seus alunos faltou nas últimas cinco aulas e
conclui que o aluno deve ter abandonado o curso. Na aula seguinte, porém, o aluno reaparece e
diz que não havia abandonado o curso, mas que tinha viajado para resolver assuntos familiares.
Considere que o professor tenha tratado essa situação como um teste estatístico de hipóteses,
utilizando o número de faltas como base para a estatística de teste. Nesse contexto, é
INCORRETO afirmar que:
(A) a hipótese nula do professor era que o aluno estava cursando o curso.
(B) o professor cometeu um erro tipo II.
(C) se o valor-p do teste for maior do que o nível de significância, então o professor deve concluir
que o
aluno continua matriculado no curso.
(D) no teste realizado pelo professor, a hipótese nula é rejeitada sempre que o número de faltas
consecutivas
de um aluno exceder um certo limite.
(E) a hipótese alternativa do professor era que o aluno havia abandonado o curso.
Resposta: O Erro tipo 2 ocorre se você não rejeita a hipótese nula (o aluno está cursando o
curso), quando ela é falsa e deve ser rejeitada. Contudo o erro cometido pelo professor foi o
erro tipo 1 que ocorre se você rejeita a hipótese nula (o aluno está cursando o curso), quando ela
é verdadeira e não deve ser rejeitada. Ele não rejeitou.
18. (PS 2012.1) É INCORRETO afirmar que:
(A) o valor p é o menor nível de significância ao qual se pode rejeitar H0 .
(B) se a hipótese nula foi rejeitada, não é possível cometer um erro do tipo II.
(C) a probabilidade de cometer um erro tipo II é igual ao nível de significância.
(D) só é possível cometer um erro do tipo II se H0 não for rejeitada.
(E) se o valor p é menor que o nível de significância, rejeita-se H0 .
Resposta: A probabilidade e cometer um erro do tipo I é igual ao nível de significância
19. (P2 2012.2) O coordenador de um curso de administração de uma grande universidade do
Rio de Janeiro quer saber se o Coeficiente de Rendimento Acumulado (CRA) de seus alunos é,
em média, superior ao CRA dos alunos do curso de administração de uma de suas principais
concorrentes. Para tal, ele calculou o CRA médio de uma amostra de 100 alunos de seu curso,
obtendo um valor de 7,8. Ele pretende comparar este valor com o CRA médio de todos os alunos
do curso de administração de sua principal concorrente, que, segundo informações divulgadas
em seu site, é de 8,1. Nesse caso, que tipo de teste é mais adequado para se utilizado pelo
coordenador?
(A) ANOVA.
(B) Comparação de médias para amostras dependentes.
(C) Comparação de médias para amostras independentes.
(D) Teste de Hipóteses para a média de uma população.
(E) Regressão Linear Simples.
Resposta: O teste de hipóteses é uma técnica que nos permite aceitar ou rejeitar a hipótese
estatística, a partir dos dados da amostra dessa população, com a média de 8,1 com uma
amostra de 100 alunos do curso comparando 7,8 de CRA.
20. (PS 2018.2) A montadora automotiva Y avaliou se o peso das portas dos carros estava de
acordo com a especificação. A norma dizia que cada porta deveria pesar 2Kg. Para fazer a
avaliação, o gerente selecionou 35 portas aleatórias e as pesou, encontrando uma média de
peso de 2,1Kg. Sabe-se que o desvio padrão do peso das portas é 0,2Kg e o nível de
significância usado no teste foi 5%. A opção que retrata corretamente o teste de hipótese
realizado para descobrir se a média da amostra é maior que a suposta média descrita na norma
é:
(A) Z = 1,64 Ho: rejeita. Z crítico = 2,96 Ha: não rejeita.
(B) Z = 2,96 Ho: rejeita. Z crítico = 1,64 Ha: não rejeita.
(C) Z = 1,64 Ho: não rejeita. Z crítico = 2,96 Ha: rejeita.
(D) Z = 2,96 Ho: não rejeita. Z crítico = 1,64 Ha: rejeita.
(E) Z = 1,60 Ho: não rejeita. Z crítico = 1,64 Ha: rejeita.
Memória de Cálculo:
Média = 2 Kg
Desvio-padrão = 0,2 Kg
Amostra (n) = 35
Nível de significância = 5% =95% confiança= 1,96
Média = 2,1 Kg
2,4377
Cálculo:
√
√
0,5 - 0,05 = 0,45 = 1,64
Resposta: Rejeitar H0 se ZESTAT > + 1,96 === 2,96 > 1,96, portanto rejeita H0 ao nível de
significância de 5%.
Não Rejeitar Ha se ZESTAT < 1,96 === 1,64 < 1,96, portanto não rejeita H0 ao nível de
significância de 5%.
TESTE DE HIPÓTESE PARA VARIÁVEL RESPOSTA QUANTITATIVA
1. (PS 2016.1) O desvio-padrão é a medida mais comum da dispersão estatística representado
pelo símbolo sigma, σ. Ele mostra o quanto de variação ou “dispersão” existe em relação à
média. Se no teste de hipóteses for apresentado o desvio-padrão da amostra, o teste mais
adequado é o:
(A) Teste t.
(B) Teste Z.
(C) Teste de qui-quadrado.
(D) Teste t ou F.
(E) Teste F.
Resposta: O teste t para corrigir problemas conectados com amostras de pequeno tamanho.
Antes de utilizar a distribuição t para construir um intervalo de confiança, deve-se verificar se n <
30, se σ é desconhecido e se a população é aproximadamente normal.
2. (PS 2016.1) A distribuição t de Student é uma distribuição de probabilidade estatística,
publicada por um autor que se chamou de Student, pseudônimo de William Sealy Gosset, que
não podia usar seu nome verdadeiro para publicar trabalhos enquanto trabalhasse para a
cervejaria Guinness. Sobre essa aplicação, pode-se afirmar que:
(A) se a população não for distribuída nos moldes da distribuição normal, você ainda pode utilizar
o teste t para amostras somente com n=10.
(B) se a população não for distribuída nos moldes da distribuição normal, você ainda pode utilizar
o teste t caso para qualquer tamanho da amostra.
(C) se a população não for distribuída nos moldes da distribuição normal, você ainda pode
utilizar o teste t para amostras somente com n=20.
(D) se a população não for distribuída nos moldes da distribuição normal, você ainda pode
utilizar o teste t caso o tamanho da amostra seja grande o suficiente para que o teorema do
Limite Central possa ser aplicado.
(E) se a população não for distribuída nos moldes da distribuição normal, você ainda pode utilizar
o teste t para amostras somente com n=15.
Resposta: À medida que o tamanho da amostra (ou seja, o número de valores em cada uma
das amostras) vai se tornando grande o suficiente, a distribuição de amostragens da média
aritmética passa a ser distribuída aproximadamente nos moldes da distribuição normal. Isso é
verdadeiro independentementedo formato da distribuição dos valores individuais dentro da
população. Portanto o teste T ainda pode ser feito.
3. (PS 2008.2) Um exame de padrão de inteligência tem sido usado por vários anos com média
de 80 pontos, sendo os dados normalmente distribuídos. Um grupo de 25 estudantes é
ensinado, dando-se ênfase à resolução e testes. Se esse grupo obtém média de 83 pontos e
desvio-padrão de 7 pontos no exame, pode-se concluir que:
(A) há razões para se acreditar que a ênfase dada mudou o resultado do teste ao nível de
significância de 1%.
(B) não há razões para se acreditar que a ênfase dada mudou o resultado do teste ao nível de
significância de 10%.
(C) há razões para se acreditar que a ênfase dada mudou o resultado do teste ao nível de
significância de 5%.
(D) não há razões para se acreditar que a ênfase dada mudou o resultado do teste ao nível de
significância de 5%.
(E) não há razões para se acreditar que a ênfase dada mudou o resultado do teste ao nível de
significância de 2,5%.
Memória de Cálculo:
Média = 80
n= 25
Média populacional = 83
Desvio Padrão = 7
Prova Real: Z = 5 % de nível de significância = 95% = 1,96
Cálculo:
√
√
Resposta: Portanto com o nível de significância de 5% podemos afirmas a alternativa C.
4. (PS 2014.1) Os órgãos ambientais estão levando a sério a fiscalização quanto ao uso de
agrotóxicos na produção agrícola e estão desconfiados de que a quantidade de inseticidas
aplicados na lavoura pelos agricultores da região supera a quantidade preconizada de 5
litros/ha/safra. Para verificar se a suspeita do fiscalizador procede, um grupo de engenheiros
agrônomos fez um levantamento utilizando a informação de aplicação de inseticidas por 25
agricultores, selecionados aleatoriamente. Da amostra, forma observados média de 5,5
litros/ha/safra e desvio padrão de 0,5 litro/ha/safra. Utilizando um nível de significância de 5%, o
que se pode afirmar a partir do teste de hipótese proposta?
(A) Rejeita-se H0 ao nível de significância de 5% (tcrítico = 1,7111; tcalculado = 5), ou seja, o
órgão fiscalizador tem razão em sua desconfiança.
(B) Não se rejeita H0 ao nível de significância de 5% (tcrítico = 2,064; tcalculado = 3,5), ou seja, o
órgão fiscalizador tem razão em sua desconfiança.
(C) Rejeita-se H0 ao nível de significância de 5% (tcrítico = 2,492; tcalculado = 4,5), ou seja, o
órgão fiscalizador não tem razão em sua desconfiança.
(D) Rejeita-se H0 ao nível de significância de 5% (tcrítico = 2,797; tcalculado = 5), ou seja, os
agrônomos têm razão em sua desconfiança.
(E) Não se rejeita H0 ao nível de significância de 5% (tcrítico = 1,711; tcalculado = 2), ou seja, os
agrônomos não têm razão em sua desconfiança.
Memória de Cálculo:
Média = 5
n= 25
Média populacional = 5,5
Desvio Padrão = 0,5
Nível de significância 5% = 95% = 1,96
Cálculo:
√
Resposta: A única alternativa que corresponde ao Tcrítico e Tcalculado é a alternativa A,
portanto Rejeita-se H0 ao nível de significância de 5% (tcrítico = 1,7111; tcalculado = 5), ou seja,
o órgão fiscalizador tem razão em sua desconfiança.
5. (PS 2010.2) Um estudo sobre o tempo gasto, por dia, por um trabalhador para se deslocar no
percurso residência-trabalho-residência foi realizado em duas cidades diferentes: A e B. O
resultado, em minutos, foi o seguinte:
Cidade A Cidade B
Tamanho da amostra 15 12
Tempo médio gasto 32 28
Desvio padrão 8 5
Considere que o tempo de deslocamento é uma variável normalmente distribuída. Em relação
ao tempo gasto para deslocamento no percurso citado na cidade A, aceitando-se 5% de risco,
podemos rejeitar a hipótese de que o tempo médio gasto no citado percurso seja, no máximo,
igual a 30 minutos?
(A) Não, porque a estatística de teste = 1,51 é menor que a estatística crítica = 1,96.
(B) Não, porque a estatística de teste = 1,96 é maior que a estatística crítica = 1,51.
(C) Sim, porque a estatística de teste = 1,51 é menor que a estatística crítica = 2,06.
(D) Não, porque a estatística de teste = 0,97 é menor que a estatística crítica = 1,761.
(E) Não, porque a estatística de teste = 2,17 é maior que a estatística crítica = 1,96.
Memória de Cálculo:
n= 15
Desvio Padrão = 8
Nível de significância 5% = 95% = 1,96
Cálculo:
Resposta: A única que tem o Tcrítico correspondendo à 1,7613 é a alternativa D, portanto é a
alternativa correta.
6. (PS 2016.1) Após ser observado um aumento do índice de acidentes em uma determinada
cidade do estado de São Paulo, o departamento de trânsito iniciou uma pesquisa para verificar a
velocidade média dos veículos em diferentes locais. Como parte desse trabalho, uma viatura
policial local procurou estimar a velocidade média (km/h) ao longo de uma avenida principal.
Com um radar oculto, mediu-se a velocidade de uma amostra aleatória de 30 veículos resultando
em uma média amostral de 62km/h e desvio-padrão de 4km/h. A placa de sinalização da avenida
principal alerta aos motoristas que a velocidade máxima permitida é de 60km/h. Considerando
um grau de significância (confiança) de 99%, essa amostra oferece evidência suficiente para
concluir que a média da população é superior a 60km/h:
(A) rejeita-se H0 ao nível de significância de 1% e o intervalo de confiança é de 62 ± 2,739
(0,730).
(B) rejeita-se H0, uma vez que no nível de significância de 1% a amostra fornece evidências para
concluir que a média verdadeira seja superior a 60km/h.
(C) rejeita-se H0 ao nível de significância de 1% e o intervalo de confiança é de 62 ± 2,750
(0,730).
(D) aceita-se H0, uma vez que ao nível de significância de 1% a amostra não fornece evidências
para concluir que a média verdadeira seja superior a 60km/h.
(E) rejeita-se H0 ao nível de significância de 1%, não é possível calcular a estatística do teste.
Memória de Cálculo:
Média = 62
n= 30
Média populacional = 60
Desvio Padrão = 4
Nível de significância 1% = 99% = 2,57
Cálculo:
√
Resposta: Rejeitar H0 se ZESTAT 2,73 > 2,57, a única alternativa que corresponde a rejeição é
alternativa B, pois a A e C são a mesma e a última diz que não pode ser calculado o teste e isso
é falso.
7. (PS 2010.2) Uma empresa do ramo farmacêutico deve testar um lote de certo medicamento
que ultimamente originou queixas de náuseas por parte dos pacientes que o utilizam de forma
continuada. A especificação padrão sugerida pela OMS (Organização Mundial da Saúde) para
esse medicamento é que a média do componente “X” por comprimido seja de 4,3 mg. Uma
amostra de 25 comprimidos foi colhida de certo lote e revelou média de 4,39 mg e desvio padrão
de 0,23 mg. Supondo que o teste seja conduzido com um nível de significância de 5%, e
considerando que a estatística de teste tt = 1,96 e a estatística crítica tcr = 1,711, a empresa
deverá:
(A) aceitar as queixas dos pacientes e destruir o lote do medicamento.
(B) rejeitar a queixa dos pacientes e destruir o lote do medicamento.
(C) aceitar a queixa dos pacientes e não destruir o lote do medicamento.
(D) rejeitar a queixa dos pacientes e não destruir o lote do medicamento.
(E) não destruir o lote em nenhuma hipótese.
Memória de Cálculo:
Média =4,3
n= 25
Média populacional = 4,39
Desvio Padrão = 0,23
Nível de significância 5% = 95% = 1,96
Resposta: Tt >Tcr = 1,96 > 1,711, portanto não rejeita Ho, isso se da a aceitação das queixas os
pacientes e destruir o lote do medicamento.
8. (PS 2016.1) Paula seleciona ao acaso 18 funcionários de determinada empresa e mede a taxa
de batimento cardíaco durante o repouso de cada um deles. A taxa amostral média é de 64
batimentos cardíacos por minuto, com desvio-padrão amostral de 2,5 batimentospor minuto.
Supondo que a taxa de batimento cardíaco tenha uma distribuição normal, Paula deveria então
usar, com 10% de significância, qual cálculo da estatística de teste para a taxa média de
batimento cardíaco?
(A) Uma vez que a população é normalmente distribuída e o desvio-padrão populacional é
desconhecido, deve-se utilizar a estatística de teste z.
(B) Uma vez que a população é normalmente distribuída e o desvio-padrão populacional é
desconhecido, deve-se utilizar a estatística de teste F.
(C) Uma vez que a população é normalmente distribuída e o desvio-padrão populacional é
conhecido, deve-se utilizar a estatística de teste t.
(D) Uma vez que a população é normalmente distribuída e o desvio-padrão populacional é
conhecido, deve-se utilizar a estatística de teste z.
(E) Uma vez que a população é normalmente distribuída e o desvio-padrão populacional é
desconhecido, deve-se utilizar a estatística de teste t.
Resposta: Antes de utilizar a distribuição t para construir um intervalo de confiança, deve-se
verificar se n < 30, se σ é desconhecido e se a população é aproximadamente normal, no
exercício o n=18 (menor que 30) o desvio padrão populacional desconhecido e a distribuição é
normal.
9. (PS 2010.1) Um gerente de banco afirma que, em sua agência, o tempo médio de espera é de
10 minutos, com desvio padrão de 3 minutos. Uma amostra forneceu média do tempo de espera
de 12 minutos sendo a estatística p (p-value) igual a 0,0014. Nessas condições, pode-se afirmar
que, para a condução deste teste ao nível de significância de 5%, utilizou-se a tabela:
(A) t de Student, e o tamanho da amostra foi de 28 clientes.
(B) Z (Normal), e o tamanho da amostra foi de 20 clientes.
(C) t de Student, e o tamanho da amostra foi de 34 clientes.
(D) Z (Normal), e o tamanho da amostra foi de 42 clientes.
(E) t de Student, e o tamanho da amostra foi de 42 clientes.
Memória de Cálculo:
Média = 12
n= 30
Média populacional = 10
Desvio Padrão = 3
Nível de significância 5% = 95% = 1,96
Erro padrão
Cálculo:
Prova real:
√
Resposta: Fazendo a prova real usando a tabela Z (normal) temos que o tamanho da amostra é
20 a um valor p de 0,0014.
10. (P2 2018.2) Ana é uma estatística e está realizando um teste de hipóteses envolvendo a
média de uma determinada variável aleatória. Com isso em vista, é correto afirmar que, em
termos práticos, a distribuição “t” poderá ser aproximada por uma distribuição normal quando o
tamanho de amostra (n) for:
(A) ≥10.
(B) ≥30.
(C) <30.
(D) <20
(E) ≥1.
Resposta: Para valores grandes do tamanho da amostra, n maior ou igual a 30, a distribuição
das médias amostrais se comporta como uma distribuição normal.
TESTE DE HIPÓTESE PARA COMPARAÇÃO DE MÉDIAS DE DUAS POPULAÇÕES COM
AMOSTRAS INDEPENDENTES E DADOS EMPARELHADOS
1. (P2 2012.1) Se desejamos testar a igualdade de médias de duas populações diferentes com
um tamanho de amostra pequena e variância populacional desconhecida, deveremos:
(A) utilizar a distribuição t-student.
(B) realizar antes um teste para checar a igualdade da variância de duas populações para só
então decidirmos se poderemos usar a t-student ou não.
(C) usar a estatística F, mas não a t-student.
(D) usar a distribuição qui-quadrado.
(E) usar a distribuição normal padronizada.
Resposta: Utiliza-se o teste t de variância agrupada para determinar a existência de diferença
significativa entre as médias aritméticas de duas populações.
2. (P2 2016.1) Um pesquisador está interessado em investigar se existe diferença entre a idade
média dos egressos do mestrado profissional e mestrado acadêmico no Brasil. O teste
estatístico que o pesquisador deve utilizar para esse propósito é o:
(A) Teste de independência.
(B) Teste de qui-quadrado.
(C) Teste F.
(D) Teste Z.
(E) Teste de hipótese para comparação de médias de duas populações com amostras
independentes.
Resposta: Por se tratar de duas populações diferentes esse o mestrado profissional e mestrado
acadêmico no Brasil, são independentes contudo seu H0 = mestrado profissional = mestrado
acadêmico no Brasil.
3. (PS 2016.1) Os gastos médios com cinema da população do Rio de Janeiro são maiores que
os da população de São Paulo. Supondo que seja realizado um teste de comparação para
amostras independentes, as hipóteses nula e alternativa são respectivamente:
(A) 𝐻𝑜: μ𝑆𝑃 − μ𝑅𝐽 = 0; 𝐻𝑎: μ𝑆𝑃 − μ𝑅𝐽 >0.
(B) 𝐻𝑜: μ𝑆𝑃 = μ𝑅𝐽; 𝐻𝑎: μ𝑆𝑃 ≠ μ𝑅𝐽.
(C) 𝐻𝑜: μ𝑆𝑃 ≥ μ𝑅𝐽; 𝐻𝑎: μ𝑆𝑃 < μ𝑅𝐽.
(D) 𝐻𝑜: μ𝑆𝑃 < μ𝑅𝐽; 𝐻𝑎: μ𝑆𝑃 ≥ μ𝑅𝐽.
(E) 𝐻𝑜: μ𝑆𝑃 > μ𝑅𝐽; 𝐻𝑎: μ𝑆𝑃 < μ𝑅𝐽
Resposta: Os gastos médios do Rio de Janeiro são maiores do que os gastos médios de São
Paulo, por se tratar de amostras independentes dizemos que é maior ou igual, já a hipótese
alternativa é que os gastos médio do Rio de Janeiro são menores do que o de São Paulo, caso
as hipóteses não fossem iguais, diríamos que RJ diferente de SP.
4. (PS 2014.1) Suponha uma amostra de tamanho n1 = 8, com média aritmética da amostra
correspondente a 42 e desvio padrão igual a 4, e uma outra amostra independente, de
tamanho n2 = 15, extraída de uma outra população, com uma média aritmética de amostra
correspondente a 34 e um desvio padrão igual a 5. Qual o valor aproximado da estatística do
teste t (estat.) de variância agrupada, para testar a hipótese nula de que µ1 = µ2?
(A) t = 2,5485
(B) t = 1,9673
(C) t = 2,5246
(D) t = 4,002
(E) t = 3,8959
Memória de Cálculo:
N1= 8
Média 1 = 42
Desvio padrão 1 = 4
N2= 15
Média 2 = 34
Desvio-padrão = 5
Cálculo:
( ) ( )
( ) ( )
( ) ( )
√
( )
√
√
Resposta: o valor aproximado da estatística do teste t (estat.) de variância agrupada, para testar
a hipótese nula de que µ1 = µ2 é t = 3,8962.
5. (P2 2012.2) Considere o seguinte teste de hipótese:
H0 : µ1 = µ2
Ha : µ1 ≠ µ2
Em que:
µ1 = escolaridade média de todos os residentes no estado de São Paulo.
µ2 = escolaridade média de todos os residentes no estado do Rio de Janeiro.
Para testar essas hipóteses, coletou-se uma amostra aleatória e independente de indivíduos de
ambos os estados. A tabela a seguir resume os resultados dessa pesquisa:
Estatística descritiva SP RJ
Média 7,0 6,2
Desvio-padrão 1 1
N 61 61
Diante das informações fornecidas, considerando a existência de homogeneidade de variâncias
entre as amostras coletadas e um nível de significância de 5%, aponte o resultado do teste de
hipótese.
(A) Não se rejeita a hipótese nula, uma vez que a estatística de teste t foi de aproximadamente
4,42 e o t crítico foi de 1,98.
(B) Rejeita-se a hipótese nula, uma vez que a estatística do teste t foi de aproximadamente 4,42
e o t crítico foi de 1,98.
(C) Não se rejeita a hipótese nula, uma vez que a estatística do teste t foi de aproximadamente
1,35 e o t crítico foi de 1,98.
(D) Rejeita-se a hipótese nula, uma vez que a estatística do teste t foi de aproximadamente 1,35
e o t crítico foi de 2,00.
(E) Rejeita-se a hipótese nula, uma vez que a estatística do teste t foi de aproximadamente 3,35
e o t crítico foi de 1,98.
Memória de Cálculo:
N1= 61
Média 1 = 7
Desvio padrão 1 = 1
N2= 61
Média 2 = 6,2
Desvio-padrão = 1
Cálculo:
( ) ( )
( ) ( )
( ) ( )
√
( )
√
√
Resposta: Rejeita-se a hipótese nula, uma vez que a estatística do teste t foide
aproximadamente 4,42 e o t crítico foi de 1,98.
6. (PS 2014.1) A Secretaria de Ação Social de um município no estado de Minas Gerais
pretende lançar um programa de qualificação de jovens para o mercado de trabalho. Então,
resolveu pesquisar se a idade de jovens do sexo masculino que ingressam no mercado de
trabalho é maior que a idade de jovens do sexo feminino. Para isso, foram coletadas duas
amostras aleatórias, a primeira composta por 99 jovens do sexo masculino, com idade média
de 17,6 anos e desvio padrão de 1,92 ano. E a segunda amostra com 120 jovens do sexo
feminino com idade média de 16,5 anos e desvio padrão de 1,80 ano. Com 95% de
confiança, é possível afirmar que a idade média dos jovens do sexo masculino em relação
aos jovens do sexo feminino é estatisticamente:
(A) maior, uma vez que a estatística t observável é 3,3426 e o t crítico é 1,645.
(B) menor, uma vez que a estatística t observável é – 3,1986 e o t crítico é – 1,645.
(C) igual, uma vez que a estatística t observável é 1,3395 e o t crítico é 1,960.
(D) maior, uma vez que a estatística t observável é 4,3671 e o t crítico é 1,645.
(E) menor, uma vez que a estatística t observável é – 3,1986 e o t crítico é – 1,960.
Memória de Cálculo:
N1= 99
Média 1 = 17,6
Desvio padrão 1 = 1,92
N2= 120
Média 2 = 16,5
Desvio-padrão = 1,8
Cálculo:
( ) ( )
( ) ( )
( ) ( )
√
( )
√
√
√
Resposta: é possível afirmar que a idade média dos jovens do sexo masculino em relação aos
jovens do sexo feminino é estatisticamente maior, uma vez que o t estudado é 4,36.
7. (PS 2016.1) Uma fabricante de lâmpadas afirma que a vida útil de suas lâmpadas (em horas)
é maior que a do concorrente (o líder de mercado). Você realiza um estudo com 14 dessas
lâmpadas e 16 do líder de mercado selecionados aleatoriamente. Os resultados do fabricante
são: 𝑥1 = 1.275; 𝑠1 = 45; 𝑛1 = 14; e do concorrente são 𝑥2 = 1.250; 𝑠2 = 30; 𝑛2 = 16. Ao um
nível de significância de 5%, há evidência suficiente para confirmar a alegação do fabricante?
Assuma que as variâncias são desconhecidas, mas supostamente iguais.
(A) Rejeita-se a hipótese nula e há evidência para aceitar alegação do fabricante.
(B) Aceita-se a hipótese nula e não há evidência para aceitar alegação do fabricante.
(C) Rejeita-se a hipótese alternativa e não há evidência para aceitar alegação do fabricante.
(D) Rejeita-se a hipótese alternativa e há evidência para aceitar alegação do fabricante.
(E) Rejeita-se a hipótese nula e não há evidência para aceitar alegação do fabricante.
Memória de Cálculo:
N1= 14
Média 1 = 1.275
Desvio padrão 1 = 45
N2= 16
Média 2 = 1.250
Desvio-padrão = 30
Cálculo:
( ) ( )
( ) ( )
( ) ( )
√
( )
√
√
Resposta: T estudado > t crítico, portanto rejeita a hipótese nula, ou seja e há evidência para
aceitar alegação do fabricante.
8. (P2 2012.1) Um estudo direcionado a medir o valor da hora-aula dos professores
universitários utilizou duas regiões metropolitanas. Na região A, aferiu um valor médio de R$
85,00 com desvio-padrão de R$ 20,00. Na região B, o valor da hora-aula foi de R$ 65,00 com
desvio-padrão de R$ 10,00. Foram entrevistados 40 professores na região A e 50 na região
B. Utilizando um nível de significância α = 0,01, é correto afirmar que:
(A) há indícios de que as médias populacionais das regiões A e B são diferentes.
(B) não há indícios de que as médias populacionais das regiões A e B são diferentes.
(C) não é possível afirmar se as médias populacionais são iguais.
(D) as médias amostrais são iguais.
(E) a estatística de teste a ser utilizada é nula.
Memória de Cálculo:
N1= 40
Média 1 = 85
Desvio padrão 1 = 20
N2=50
Média 2 = 65
Desvio-padrão = 10
Cálculo:
( ) ( )
( ) ( )
( ) ( )
√
( )
√
√
Resposta: t estudado < t crítico, portanto aceita a hipótese nula, afirmando que são diferentes.
9. (PS 2014.1) Um laboratório de análises químicas quer verificar se compostos químicos de
marcas comerciais possuem tempos médios de reação (minutos) diferentes, quando
submetidos a duas temperaturas (50 e 60 0C). Dos testes estatísticos apresentados a seguir,
o indicado para tal situação é:
(A) Comparação de médias para amostras pareadas.
(B) ANOVA.
(C) Teste de hipótese para igualdade de variância.
(D) Comparação de médias para amostras independentes.
(E) Regressão linear simples.
Resposta: O laboratório deseja realizar uma análise onde compara as marcas em reação em
duas temperaturas diferentes, ou seja, os dados da primeira temperatura de todas as marcas
estarão pareados.
10. (PS 2012.2) Qual a condição para que o valor crítico de um Teste t para 95% de confiança
seja menor (em módulo) que o valor crítico de um Teste Z, nas mesmas condições de
confiança, média e desvio-padrão?
(A) Que as amostras sejam pareadas.
(B) Que a distribuição de Student contenha poucas amostras.
(C) Que o desvio-padrão seja menor que a media.
(D) Que as variâncias sejam equivalentes.
(E) Não existe possibilidade de o valor crítico para o Teste t ser menor (em módulo) que o do
Teste Z.
Resposta: Para qualquer valor do gl para o teste T não existe a possibilidade de ser menor em
módulo que o do teste Z, pois o Z é só 1,96.
11. (P2 2014.2) Uma pesquisa teve por objetivo verificar se a renda dos trabalhadores aumentou
após sua participação em uma política pública de qualificação profissional. O estatístico que
testou tal hipótese apresentou os seguintes resultados:
· Foi coletada a renda de 25 trabalhadores antes e após a participação na política pública.
· O desvio-padrão da diferença entre as médias foi de R$65,30.
· A estatística do teste t foi de 10,9.
· O grau de confiança do teste foi de 95%.
Com base nas informações disponíveis, é correto afirmar que, na amostra, após a participação
na política pública, a renda dos trabalhadores:
(A) incrementou, em média, R$142,35.
(B) incrementou, em média, R$342,89.
(C) incrementou, em média, R$711,77.
(D) diminuiu, em média, R$150,77.
(E) diminuiu, em média, R$334,77.
Cálculo:
√
√
Resposta: é correto afirmar que, na amostra, após a participação na política pública, a renda
dos trabalhadores incrementou, em média, R$142,35.
12. (PS 2016.1) Uma empresa de engenharia de alimentos quer verificar se compostos químicos
de marcas comerciais possuem tempo médio de reação (minutos) diferentes, quando
submetidos a duas temperaturas (50 e 60ºC). Dos testes estatísticos apresentados a seguir,
o teste indicado para a análise é:
(A) Comparação de médias para amostras independentes.
(B) Regressão linear simples.
(C) Comparação de médias para amostras pareadas.
(D) ANOVA.
(E) Teste de hipótese para igualdade de variância.
Resposta: A empresa deseja realizar uma verificação onde compara compostos químicos em
reação em duas temperaturas diferentes, ou seja, os dados da primeira temperatura de todas os
compostos químicos estarão pareados.
13. (PS 2016.1) Como controle de qualidade na usina sucroalcooleira são realizados diversos
testes físico-químicos e microbiológicos da matéria-prima, do produto em processo edo
produto final. De acordo com a Portaria n. 152 de 6 de dezembro de 2013 do MAPA
(Ministério da Agricultura, Pecuária e Abastecimento), o controle da pol (porcentagem
aparente de sacarose ºZ) do açúcar tipo branco cristal deve ser de no mínimo 99,5ºZ. Para
observar a variabilidade da pol do açúcar, um estudante de graduação coletou dados do
laboratório industrial de duas usinas (A e B) da região noroeste do Estado de São Paulo,
conforme consta na Tabela 1. Sabe-se que para a determinação da média e desvio-padrão,
foram coletados os resultados de 30 análises de cada unidade industrial realizada ao longo
de um dia da safra.
Tabela 1 – Resultados obtidos dos laboratórios industriais das usinas A e B
Usina A Usina B
N 31 31
Média da Pol do açúcar branco cristal (ºZ) 99,7 99,6
Desvio-padrão 0,3 0,4
Com 5% de significância, pode-se concluir que:
(A) aceita-se H1 ao nível de significância de 5%, as variâncias são significativamente iguais.
(B) rejeita-se H0 ao nível de significância de 5%, conclui-se que as variâncias são diferentes na
população.
(C) rejeita-se H0 ao nível de significância de 2,5%, conclui-se que as variâncias são diferentes na
população.
(D) não se rejeita H0 ao nível de significância de 2,5%, conclui-se que as variâncias são iguais na
população.
(E) não se rejeita H0 ao nível de significância de 5%, conclui-se que as variâncias são iguais na
população.
Memória de Cálculo:
N1= 31
Média 1 = 99,7
Desvio padrão 1 = 0,3
N2=31
Média 2 = 99,6
Desvio-padrão = 0,4
Cálculo:
( ) ( )
( ) ( )
( ) ( )
√
( )
√
√
Resposta: T estudado < T crítico, portanto não rejeita H0 a um nível de significância de 5%
O ENUNCIADO ABAIXO SERÁ UTILIZADO PELAS SEIS PRÓXIMAS QUESTÕES.
(P2 2018.2) A diretoria de marketing de uma cadeia de lojas de produtos para o público feminino
deseja descobrir se os valores médios das compras realizadas nas suas lojas A, B e C podem
ser considerados iguais. Para realizar o estudo, foi tirada, de cada loja, uma amostra aleatória de
50 compras. O resultado foi o seguinte:
Loja Valor médio Desvio padrão
A R$ 140,00 R$ 38,00
B R$ 185,00 R$ 54,00
C R$ 192,00 R$ 58,00
15. De acordo com os dados, o erro padrão do valor das compras realizadas na loja B é de,
aproximadamente:
(A) R$1,08.
(B) R$10,98.
(C) R$0,36.
(D) R$7,64.
(E) R$4,41.
Cálculo:
√
√
Resposta: o erro padrão do valor das compras realizadas na loja B é de, aproximadamente
7,64.
16. Considerando que as variâncias populacionais dos valores das compras realizadas nas lojas
A e B sejam conhecidas, num teste de igualdade entre as médias dessas lojas a estatística
de teste será, aproximadamente, de:
(A) 8,67.
(B) 0,74.
(C) 1,82.
(D) 10,41.
(E) 4,82.
Cálculo:
( ) ( )
( ) ( )
( ) ( )
√
( )
√
Resposta: num teste de igualdade entre as médias dessas lojas a estatística de teste será,
aproximadamente de 4,82.
17. No caso de um teste de hipóteses de igualdade de variâncias, a estatística de teste a ser
usada segue a distribuição:
(A) poisson.
(B) binomial.
(C) normal.
(D) F.
(E) student
Resposta: Utilizamos o teste F, para teste de hipóteses que são homocedasticidade, ou seja,
igualdade de variância.
18. Num teste de hipóteses de igualdade das variâncias dos valores das compras realizadas nas
lojas A e C, o valor da estatística de teste é, aproximadamente, de:
(A) 1,01.
(B) 2,33.
(C) 0,96.
(D) 5,28.
(E) 3,54.
Cálculo:
Resposta: o valor da estatística de teste é, aproximadamente, de 2,33.
19. Caso não seja conhecido, o estimador do desvio padrão populacional do valor das compras
realizadas na loja B será igual a:
(A) R$54,00.
(B) R$2.916,00.
(C) R$0,30.
(D) R$7,40.
(E) R$3,40.
Resposta: R$ 54, pois o exercício já disponibiliza essa informação.
20. A diretoria encomendou um teste de hipóteses para verificar se o valor médio das compras
realizadas na loja A pode ser considerado igual a R$150,00. Nesse caso, a estatística de
teste é, aproximadamente, de:
(A) -1,86.
(B) 0,40.
(C) 3,15.
(D) -3,15.
(E) 2,15.
Cálculo:
√
Resposta: a estatística de teste é, aproximadamente, de -1,86.
O ENUNCIADO ABAIXO SERÁ UTILIZADO PELAS CINCO PRÓXIMAS QUESTÕES.
(PS 2018.2) Uma chocolateria possui uma loja em dois shoppings da cidade, as lojas A e B. Um
levantamento sobre o faturamento diário dessas lojas utilizou amostras de 25 dias, escolhidos
aleatoriamente, e o resultado foi o seguinte:
Loja A Loja B
Faturamento médio R$ 4.380,00 R$ 3.950,00
Desvio padrão R$ 840,00 R$ 761,00
Tamanho da amostra 25 25
21. Caso a chocolateria queira fazer um teste de hipóteses para comparação de variâncias
populacionais do faturamento diário das lojas A e B, encontrará estatística de teste de,
aproximadamente:
(A) 0,32.
(B) 1,22.
(C) 1,98.
(D) 1,10.
(E) 2,12.
Cálculo:
Resposta: encontrará estatística de teste de, aproximadamente 1,22.
22. Tendo-se em conta que as variâncias amostrais dos faturamentos diários das lojas A e B
possam ser consideradas iguais, a estimativa agrupada da variância populacional será de,
aproximadamente:
(A) 802.400.
(B) 342.630.
(C) 807.000.
(D) 669.000.
(E) 642.361.
Cálculo:
Resposta: a estimativa agrupada da variância populacional será de, aproximadamente 642,361.
23. É correto dizer que, no caso de a variância populacional não ser conhecida, o estimador da
variância populacional do faturamento diário da loja B é igual a:
(A) 308.774.
(B) 28.
(C) 761.
(D) 147.
(E) 579.121
Cálculo:
Resposta: o estimador da variância populacional do faturamento diário da loja B é igual a
579.121.
24. O gerente da loja B precisa saber se o faturamento diário da sua loja pode ser considerado,
pelo menos, igual a R$4.200,00. Nesse caso, a estatística de teste a ser obtida no teste de
hipóteses a ser feito é de, aproximadamente:
(A) 2,58.
(B) -3,12.
(C) -0,15.
(D) -1,64.
(E) 1,96.
Cálculo:
√
Resposta: a estatística de teste a ser obtida no teste de hipóteses a ser feito é de,
aproximadamente -1,64.
25. (PS 2018.2) Um levantamento sobre o faturamento diário de um restaurante da cidade
utilizou uma amostra de 30 dias, escolhidos aleatoriamente. O resultado foi o seguinte:
Média = R$4.320,00.
Desvio padrão = R$980,00.
É correto dizer que o desvio padrão das médias amostrais (erro padrão) é, aproximadamente,
de:
(A) R$566,00.
(B) R$716,00.
(C) R$49,00.
(D) R$289,00.
(E) R$179,00.
Cálculo:
√
√
Resposta: É correto dizer que o desvio padrão das médias amostrais (erro padrão) é,
aproximadamente de 178,92.
ANÁLISE DE VARIÂNCIA (ANOVA)
1. (P2 2016.1) Se o objetivo for comparar as vendas médias dos vendedores (selecionados
aleatoriamente) de cinco lojas de uma determinada rede de supermercados, o teste mais
adequado é:
(A) Teste de qui-quadrado.
(B) Regressão linear simples.
(C) Análise de correlação.
(D) Análise de variância (ANOVA).
(E) Comparação de médias para amostras emparelhadas.
Resposta: Utilizado para examinar diferenças entre mais de dois grupos. Os grupos envolvidos
são classificados de acordo com níveis de um fator de interesse.
2. (PS 2016.1) A distribuição F de Snedecor,também conhecida como distribuição de Fisher, é
frequentemente utilizada na inferência estatística para estudar:
(A) a análise de variância.
(B) a análise da hipótese nula.
(C) a análise da média.
(D) a análise do desvio-padrão.
(E) a análise da hipótese alternativa.
Resposta: Teste F para a proporcionalidade entre duas variâncias (Fisher-Snedecor). Usado para
testar se duas populações independentes apresentam a mesma variabilidade., aotestar
variâncias, consegue-se detectar diferenças na variabilidade em duas populações
independentes.
3. (PS 2014.2) Suponha que se esteja interessado em avaliar o desempenho de 4 treinadores –
mensurado numa escala de 1 a 5, em que 1 é péssimo e 5 excelente – que passaram por um
determinado clube de futebol por meio da opinião de 24 jornalistas esportivos, todos com
critérios homogêneos de análise. Como resultado, obteve-se a tabela de ANOVA a seguir:
Os valores de A, B, C, D, E e F são nessa ordem:
(A) 4; 24; 201,45; 266,75; 3,26; 20,56.
(B) 4; 24; 268,6; 333,90; 85,3; 0,7872.
(C) 3; 23; 201,45; 266,75; 3,26; 20,56.
(D) 3; 23; 201,45; 266,75; 32,65; 2,05.
(E) 4; 24; 201,45; 266,75; 32,65; 2,05.
Memória de Cálculo:
Fonte
Graus
de liberdade
Soma
dos quadrados
Média dos quadrados
(Variância)
F
Entre grupos c – 1 SQE MQE = SQE/c – 1 FESTAT = MQE/MQD
Dentro dos grupos n – c SQD MQD = SQD/n – c
Total n – 1 STQ
Cálculo:
𝑛
𝑛
(𝑛 )
( )
Resposta:
Fonte
Graus
de liberdade
Soma
dos quadrados
Média dos quadrados
(Variância)
F
Entre grupos 3 201,45 67,15 20,56
Dentro dos grupos 20 65,3 3,26
Total 23 266,75
4. (PS 2012.1) Considere as seguintes situações:
I. Foi coletada a renda de uma amostra probabilística de 500 habitantes de uma cidade em dois
anos consecutivos, mas não se tratam dos mesmos habitantes nos dois anos.
II. Foi coletada a produtividade de uma amostra probabilística de 50 trabalhadores e, após 12
meses da implementação de uma nova técnica de produção, novamente se coletou a
produtividade destes 50 trabalhadores.
III. Foi coletada a variável ativo total de uma amostra probabilística de empresas de cinco
setores de atividades diferentes em um determinado ano.
Diante dessas amostras aleatórias que foram selecionadas acima, assinale qual tipo de teste de
hipótese para comparação de médias é o mais adequado para cada caso, respectivamente:
(A) Comparação de médias para amostras independentes; Comparação de médias para
amostras independentes; e ANOVA.
(B) Comparação de médias para amostras dependentes; Comparação de médias para amostras
dependentes; e ANOVA.
(C) ANOVA; Comparação de médias para amostras dependentes; e ANOVA.
(D) Comparação de médias para amostras independentes; Comparação de médias para
amostras dependentes; e ANOVA.
(E) Comparação de médias para amostras independentes; Comparação de médias para
amostras dependentes; e Comparação de médias para amostras independentes.
Resposta:
I. Utilizando subscritos para diferenciar entre a média aritmética da primeira população, µ1 e a
média aritmética da segunda população, µ2,, portanto comparação de médias para
amostras independentes. Por ter a mesma quantidade de amostra contudo serem de
populações diferentes.
II. Outra situação que envolve dados correlacionados entre populações é quando temos
amostras combinadas. Nesse caso, os itens ou indivíduos são colocados em pares,
conjuntamente, de acordo com alguma característica de interesse. As amostras
dependentes são também chamadas de amostras emparelhadas, amostras pareadas ou
amostras associadas. Por se tratar da mesma população e mesma amostra são
dependetes.
III. Os grupos envolvidos são classificados de acordo com níveis de um fator de interesse, por
se tratar de cinco setores diferentes é ANOVA.
5. (PS 2014.1) A anemia é uma doença que afeta muitas pessoas e que pode ter diversas
origens. Pretendendo-se avaliar possíveis diferenças entre alguns tratamentos de estados
anêmicos, planejou-se um experimento com 120 indivíduos anêmicos, divididos aleatoriamente
em três grupos de 40, aos quais se atribuiu cada um dos tratamentos. O primeiro tratamento era
constituído apenas por uma dieta rica em ferro; o segundo tratamento combinava um dieta rica
em ferro e vitamina C; e o último consistiu numa dieta baseada em um complexo vitamínico.
Visando observar possíveis diferenças entre os tratamentos, foi realizada uma Análise de
Variância (ANOVA), com base nos valores de hemoglobina (em gramas por decilitro) das 120
pessoas submetidas aos tratamentos, após um período de três meses.
Com base na tabela apresentada, qual é o valor aproximado, respectivamente, da estatística do
teste F e da fração da variabilidade explicada deste experimento?
(A) 0,7334 e 0,0124.
(B) 0,7334 e 0,9876.
(C) 0,4848 e 0,9876.
(D) 0,4848 e 0,0124.
(E) 0,9876 e 0,7334.
Memória de Cálculo/ Resposta:
Fonte
Graus
de liberdade
Soma
dos quadrados
Média dos quadrados
(Variância)
F
Entre grupos c – 1 =2
SQE=122,925-
121,403=1,522
MQE = 1,522/2=0,761
FESTAT =
0,761/1,038=0,733
Dentro dos
grupos
n – c =117 SQD=121,403
MQD =
121,403/117=1,038
Fração=SQE/SQD=0,0124
Total n – 1 =119 STQ=122,925
O ENUNCIADO A SEGUIR SERÁ UTILIZADO PELAS PRÓXIMAS DUAS QUESTÕES
(PS 2016.2) Um Teste de n médias, realizado com o auxílio da função ANOVA, disponível na
Planilha Eletrônica EXCEL, apresentou o seguinte relatório:
6. Considerando os valores apresentados no relatório apresentado, é correto afirmar que os
valores das Médias dos Quadrados (MQ) para as Fontes de Variação “Entre Grupos” (assinalado
como XXX) e “Dentro dos Grupos” (assinalado como YYY) são respectivamente:
(A) 212,667 e 4,789.
(B) 312,759 e 4,789.
(C) 436.287 e 6,908.
(D) 212,667 e 5,874.
(E) 360,887 e 6,223.
Memória de Cálculo/Resposta:
Fonte
Graus
de liberdade
Soma
dos quadrados
Média dos quadrados
(Variância)
F
Entre grupos c – 1 =3 SQE=638 MQE = 638/3=212,67
FESTAT =
212,67/4,789=44,41
Dentro dos
grupos
n – c =76 SQD=364 MQD = 364/76= 4,789 Fração=SQE/SQD=1,75
Total n – 1 =79 STQ=1.002
7. Em face do relatório apresentado, é correto afirmar que o teste considerou:
(A) 3 amostras de tamanho 18.
(B) 4 amostras de tamanho 19.
(C) 2 amostras de tamanho 40.
(D) 4 amostras de tamanho 20.
(E) 3 amostras de tamanho 20.
Cálculo:
𝑛
8. (P2 2016.1) O Presidente da República estava interessado em testar as seguintes hipóteses:
𝐻0 : 𝜇 𝑃 = 𝜇𝑅𝐽 = 𝜇 𝐺
𝐻𝑎: 𝑝𝑒𝑙o 𝑚𝑒𝑛𝑜𝑠 𝑢𝑚𝑎 𝑑𝑎𝑠 𝑚é𝑑𝑖𝑎𝑠 é 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑑𝑎𝑠 𝑑𝑒𝑚𝑎𝑖𝑠
Em que 𝜇 𝑃, 𝜇𝑅𝐽 𝑒 𝜇 𝐺 são, respectivamente, a rentabilidade média (em milhões de R$) das
empresas do setor elétrico de SP, RJ e MG. O A amostra aleatória de 63 empresas (21 de cada
estado) produziu o seguinte resultado:
Em um teste unicaudal e considerando um nível de significância de 5%, pode-se concluir que as
empresas do setor elétrico têm:
(A) diferenças de rentabilidade média (Fobservado= 3,15 e Fcrítico = 3).
(B) em média a mesma rentabilidade média (Fobservado= 3 e Fcrítico = 3,15).
(C) diferenças de rentabilidade média (Fobservado= 3,92 e Fcrítico = 3).
(D) em média a mesma rentabilidade média (Fobservado= 2 e Fcrítico = 2,75).
(E) em média a mesma rentabilidade média (Fobservado= 2 e Fcrítico = 3,34).
Memória de Cálculo/Resposta:
Fonte
Graus
de
liberdade
Soma
dos quadrados
Média dos
quadrados
(Variância)
F
Entre grupos c – 1 =2 SQE=1.000 MQE = 1.000/2=500
FESTAT =
500/166,67= 3
Dentro dos
grupos
n – c =60 SQD=10.000
MQD =
10.000/60=166,67
Total n – 1 =62 STQ=11.000
9. (P2 2014.2) As hipóteses nula e alternativa de um determinadoteste de hipótese são:
H0: μ1 = μ2 = μ3
Ha: pelo menos uma das médias é diferente das demais
Aproximadamente, quantas vezes a variância entre grupos deve ser maior que a variância dentro
do grupo para que tal hipótese nula seja rejeitada sabendo-se que o tamanho da amostra é 63
observações?
(A) 2,56.
(B) 2,71.
(C) 2,86.
(D) 3,01.
(E) 3,16.
Cálculo / Resposta:
Fonte
Graus
de
liberdade
Soma
dos quadrados
SEntre grupos c – 1 =2 SQE>SQD
Dentro dos
grupos
n – c =60 SQD<SQE
Total 63 – 1 =62
[(c-1) /n] x 100
(2/63) x 100=
3,16
10. (PS 2012.1) Observando o comportamento dos funcionários da linha de produção de
sapatos, um gerente queria testar se os funcionários que tomam café durante o dia apresentam
melhor desempenho em termos de unidades produzidas do que aqueles que não tomam café.
Diante disso, resolveu fazer uma pesquisa para testar essa hipótese. O gerente anotou a
quantidade de copos de café que uma amostra de 40 funcionários selecionada aleatoriamente
tomou durante o dia e a respectiva quantidade de pares de sapatos produzidos. Essa amostra foi
separada em 4 grupos: 1 = não bebeu café; 2 = tomou um copo de café; 3 = tomou 3 copos de
café; 4 = tomou 4 copos de café. Admita que as premissas de normalidade, homocedasticidade
e independência estão sendo respeitadas.
Ao completar a tabela apresentada, pode-se concluir a respeito do teste de hipótese realizado
por meio da ANOVA, considerando um nível de significância de 5%, que:
(A) rejeita-se a hipótese nula desse teste, uma vez que o F observado (ou calculado) é 6,70 e
maior que o F crítico.
(B) rejeita-se a hipótese nula desse teste, uma vez que o F observado (ou calculado) é 2,87 e
menor que o F crítico que é 6,70.
(C) nada se pode concluir a respeito desse teste de hipótese, pois os graus de liberdade não
foram apresentados no problema.
(D) a fração da variabilidade explicada pelos grupos nesse teste foi de 64,1%.
(E) rejeita-se a hipótese nula desse teste, uma vez que o F observado (ou calculado) é 10,5 e
menor que o F crítico que é 3,5.
Memória de Cálculo/Resposta:
Fonte
Graus
de
liberdade
Soma
dos
quadrados
Média dos quadrados
(Variância)
F
Entre
grupos
c – 1 =3 SQE=1.495,5 MQE = 1.495,5/3=498,5 FESTAT = 498,5/74,35=6,7
Dentro dos
grupos
n – c =36 SQD=2.676,5 MQD = 2.676,5/36=74,35 Festat>Fcrítico=6,7>3,804
Total n – 1 =39 STQ=4.172,0
11. (P2 2012.2) Um estudo teve por objetivo avaliar a capacidade dos consumidores de lembrar
as marcas líderes de cerveja. Para isso, foi realizado um experimento com três grupos distintos:
para o primeiro grupo foram expostas cinco marcas menos conhecidas, para o segundo grupo,
10 marcas menos conhecidas, e para o terceiro grupo não foi mostrado nenhuma marca. Após
esses estímulos, foi solicitado que os participantes escrevessem num papel quais marcas eles
lembravam, além daquelas a que foram expostos. Para cada participante, foi computado o
número de marcas líderes que se lembraram dentre as sete marcas líderes consideradas no
estudo. Em cada grupo, 30 indivíduos participaram do experimento.
A partir dos resultados estatísticos e considerando um nível de significância de 5%, pode-se
concluir que:
(A) Expor os participantes a marcas menos conhecidas não afetou a capacidade de lembrar as
marcas líderes, uma vez que se rejeita a hipótese nula do teste.
(B) Expor os participantes a marcas menos conhecidas afetou a capacidade de lembrar as
marcas líderes, uma vez que se rejeita a hipótese nula do teste e a fração de variabilidade
explicada no estudo é de 20,7%.
(C) Expor os participantes a marcas menos conhecidas afetou a capacidade de lembrar as
marcas líderes, uma vez que se rejeita a hipótese nula do teste e a fração de variabilidade
explicada no estudo é de 80,7%.
(D) Expor os participantes a marcas menos conhecidas não afetou a capacidade de lembrar as
marcas líderes, uma vez que não se rejeita a hipótese nula do teste.
(E) Expor os participantes a marcas menos conhecidas afetou a capacidade de lembrar as
marcas líderes, uma vez que se rejeita a hipótese nula do teste e a fração de variabilidade
explicada no estudo é de 19,2%.
Resposta: MQE > MQD, portanto Expor os participantes a marcas menos conhecidas afetou a
capacidade de lembrar as marcas líderes, a fração da variabilidade explicada no estudo é de
80,7%. (236/293)
12. (PS 2012.2) Sobre os testes de hipóteses e as distribuições de probabilidade, é
INCORRETO afirmar que:
(A) diferentes hipóteses são testadas com o uso de diferentes estatísticas de teste que, por sua
vez, apresentam distintas distribuições de probabilidade.
(B) quando testamos hipóteses sobre a média de uma população, vimos que podemos usar as
estatísticas z ou t, que seguem as distribuições normal e t de Student, respectivamente.
(C) quando testamos hipóteses sobre variâncias, usamos a estatística F, que segue a
distribuição F de Fisher- Snedecor.
(D) qualquer teste é aplicável, desde que a amostra seja maior que 30.
(E) a distribuição F é assimétrica (ao contrário das distribuições t e Normal).
Resposta: O único teste de hipótese e as distribuições de probabilidade é o teste T, se as
populações não forem normalmente distribuídas, o teste t de variância agrupada pode, ainda
assim, ser utilizado se os tamanhos de amostras forem grandes o suficiente (geralmente ≥ 30
para cada uma das amostras).
13. (P2 2016.1) Um pesquisador obteve, a partir da análise de variância (ANOVA) que comparou
o desempenho das empresas de três estados do Brasil, um valor da estatística do teste F de 5,5.
Pode-se dizer a respeito desse valor que:
(A) não se pode rejeitar a hipótese nula, uma vez que o valor da estatística do teste F é superior
ao F crítico obtido pela tabela.
(B) nada se pode concluir desse valor, uma vez que o tamanho da amostra e os graus de
liberdade não foram fornecidos.
(C) a variância do erro do modelo é inferior à variância do desempenho médio das empresas
entre os estados analisados.
(D) a variância dos erros do modelo é superior à variância do desempenho médio das empresas
entre os estados analisados.
(E) a fração da variabilidade explicada é superior a 50%.
Resposta: A primeira amostra, extraída da primeira população, é definida como a amostra que
apresenta a maior variância de amostra. A segunda amostra, extraída da segunda população, é
definida como a amostra com a menor variância de amostra. Se o teste F der maior que 5
significa que a Segunda amostra é maior que a primeira.
ENUNCIADO A SEGUIR SERÁ UTILIZADO PELAS PRÓXIMAS DUAS QUESTÕES
(P2 2016.1) Uma empresa tem três tipos de embalagem para um mesmo produto. Diante disso,
um experimento foi conduzido para compreender se a embalagem do produto influencia a
propensão de compra desse produto. Para isso, foi solicitado que 20 pessoas consumissem o
produto com a embalagem A, 20 pessoas com a embalagem B e 20 pessoas com a embalagem
C. As pessoas foram aleatoriamente selecionadas para cada uma das condições. Após o
consumo, as pessoas responderam a seguinte pergunta: “Você compraria esse produto
novamente?”. A resposta foi dada em uma escala de 0 (não compraria de maneira nenhuma) a
10 (certamente compraria). Os resultados do experimento encontram-se a seguir:
14. Supondo que todas as premissas do teste estatístico foram respeitadas e um nível de
significância de 5%, pode-se afirmar que a hipótese de que as médias:
(A) amostrais são iguais não foi rejeitada, ou seja, a embalagem influencia na propensão de
compra dos produtos.
(B) populacionais são iguais não foi rejeitada, ou seja, a embalagem não influencia na propensão
de compra dos produtos.
(C) populacionais são iguais foi rejeitada, ou seja, a embalagem influencia na propensão de
compra dos produtos.
(D) amostrais são iguais não foi rejeitada, ou seja, a embalagem não influencia na propensão de
compra dos produtos.
(E) amostrais sãoiguais foi rejeitada, ou seja, a embalagem influencia na propensão de compra
dos produtos.
Resposta: F observado > F crítico, portanto a hipótese nula é rejeitada, e quanto menor entre
os grupos maior a influência dos valores estudados, ou seja, a embalagem influencia na
propensão de compra dos produtos.
15. Qual é a fração da variância da propensão a consumir o produto explicada pela embalagem?
(A) 0,0%.
(B) 12,0%.
(C) 10,7%.
(D) 3,2%.
(E) 89,2%.
Cálculo:
𝑟𝑎 𝑜 𝑑𝑎 𝑣𝑎𝑟𝑖𝑎 𝑖𝑙𝑖𝑑𝑎𝑑𝑒 𝑑𝑎 𝑝𝑟𝑜𝑝𝑒𝑛𝑠 𝑜
16. (PS 2012.1) O prefeito de um município com quatro bairros estava interessado em
implementar um programa de distribuição de leite. Entretanto, não tinha verba suficiente para
atender a todos os bairros. Diante dos recursos disponíveis, decidiu beneficiar os dois bairros
com menor renda per capita média (R$). Coletaram-se amostras independentes e aleatórias de
famílias em cada bairro. Os resultados do teste de hipótese (realizado por meio de uma ANOVA)
são apresentados a seguir:
Com base nas tabelas apresentadas, é CORRETO afirmar que:
(A) ao rejeitar a hipótese nula desse teste, pode-se concluir que os bairros 1 e 4 possuem renda
per capita média na população menor que os demais bairros.
(B) esse teste de hipótese não é válido, uma vez que há fortes indícios de que não respeita a
premissa de homocedasticidade.
(C) esse teste de hipótese não é válido, uma vez que não respeita a premissa de normalidade.
(D) a fração da variabilidade explicada total pelo bairro é de 35,1%.
(E) não se rejeita a hipótese nula desse teste, ou seja, estatisticamente não se pode rejeitar que
a renda per capita média desses bairros são iguais na população. O prefeito terá que utilizar
outro critério para escolher os bairros beneficiados.
Resposta: Em estatística, o termo técnico mais comum para representar igualdade de variâncias
é homocedasticidade, e não há igualdade nas variâncias.
17. (PS 2012.1) Em um modelo de ANOVA para comparação de médias de três grupos, a fração
da variabilidade explicada observada foi de 0%. A partir disso, é possível concluir que:
(A) as médias dos três grupos na população são iguais entre si.
(B) as médias dos três grupos na amostra observada são iguais entre si.
(C) as variâncias dos três grupos na população são iguais entre si.
(D) as variâncias dos três grupos na amostra são iguais entre si.
(E) a soma de quadrados entre grupos é igual à soma de quadrados total.
Resposta: A fração da variabilidade explicada for mais próxima de 100% maior a diferença entre
elas, quando menor a fração menor a diferença.
O ENUNCIADO ABAIXO SERÁ UTILIZADO PELAS DUAS PRÓXIMAS QUESTÕES.
(P2 2018.2) Saulo é analista de sistemas e recebeu a tarefa de realizar um teste de hipóteses de
igualdade de n médias (mais de duas). Para isso, pretende utilizar um modelo ANOVA.
18. Para que um modelo ANOVA seja considerado válido, é necessário que as seguintes
premissas básicas sejam observadas:
(A) única e exclusivamente normalidade.
(B) única e exclusivamente independência.
(C) apenas normalidade e independência.
(D) independência, normalidade e heterocedasticidade.
(E) independência, normalidade e homocedasticidade.
Resposta: As observações são independentes, ou seja, cada elemento amostral (aluno) deve
ser independente; Os grupos comparados apresentam a mesma variância; Os erros são
independentes e provenientes de uma distribuição normal com média igual a zero e variância
constante.
19. Nesse caso, como hipótese alternativa do teste, o ANOVA mostrará a Saulo que:
(A) pelo menos uma das médias é diferente das demais.
(B) obrigatoriamente, (n-1) médias são diferentes entre si.
(C) não existem médias diferentes entre si.
(D) pelo menos n médias são diferentes das demais.
(E) pelo menos duas das médias são diferentes das demais.
Resposta: No entanto, ao analisar a variação entre os grupos e dentro dos grupos, chega-se a
conclusões sobre possíveis diferenças entre médias aritméticas dos grupos, pois esse será a hipótese
nula.
O ENUNCIADO ABAIXO SERÁ UTILIZADO PELAS TRÊS PRÓXIMAS QUESTÕES.
(PS 2018.2) Maria é analista e está testando a performance de 4 diferentes gasolinas, A, B, C e
D, utilizando para isso amostras de 6 carros diferentes entre si. Seguindo um modelo ANOVA,
ela testará se, em média, o número de quilômetros rodados por litro de gasolina é igual em cada
marca.
20. Neste teste, a variabilidade total apresentada pelo modelo ANOVA será igual:
(A) à variabilidade entre as amostras mais a variabilidade dentro das amostras.
(B) a 2 vezes a diferença das variabilidades entre e dentro das amostras.
(C) a 4 vezes a variabilidade entre as amostras.
(D) à variabilidade entre as amostras menos a variabilidade dentro das amostras.
(E) a 6 vezes a variabilidade dentro da amostra.
Resposta: Variabilidade total = Variabilidade entre + Variabilidade dentro
21. Utilizando o modelo ANOVA, Maria descobriu que a variabilidade entre as 4 amostras de 6
carros cada (SQE) era igual a 526,3, e a variabilidade dentro das amostras (SQD) era igual a
301,7. Assim, é correto afirmar que a parcela da variabilidade total explicada pela gasolina é de,
aproximadamente:
(A) 36%.
(B) 32%.
(C) 18%.
(D) 96%.
(E) 64%
Cálculo:
22. Ao desenvolver o modelo ANOVA a um risco α = 0,05, Maria obteve os seguintes valores:
valor-p = 0,00037; F = 38,49. Assim, é correto se afirmar que:
(A) pelo menos uma média é diferente das outras, uma vez que o valor de F = 38,49 é maior do
que α = 0,05.
(B) as 4 médias são iguais, pois o valor p = 0,00037 é menor do que o α = 0,05.
(C) as 4 médias são iguais, uma vez que o valor de F = 38,49 é maior do que o valor-p =
0,00037.
(D) pelo menos 3 médias são diferentes, pois o valor-p encontrado é > 0.
(E) pelo menos uma média é diferente das outras, uma vez que o valor-p = 0,00037 é menor do
que α = 0,05.
Resposta: Valor < alfa, portanto pelo menos uma média é diferente das outras.
CORRELAÇÃO
1. (P2 2010.2) Observe os gráficos a seguir:
Tais gráficos refletem os seguintes tipos de correlação:
(A) I e III – Lineares Positivas.
(B) I e II – Lineares Positivas.
(C) III e IV – Não Lineares.
(D) I e II – Lineares Negativas.
(E) II – Linear; e III – Não Linear.
Resposta:
Gráfico 1 é linear positivo
Gráfico 2 é linear negativo
Gráfico 3 é linear positivo
Gráfico 4 é não linear
Portanto a alternativa A é correta o gráfico I e II é linear positivo.
2. (P2 2008.1) Analise os gráficos de dispersão abaixo e assinale os comentários corretos sobre
a medida de associação–correlação.
(A) O gráfico A apresenta fraca correlação, e o gráfico B apresenta forte correlação negativa.
(B) O gráfico A apresenta forte correlação positiva, e o gráfico B apresenta forte correlação
negativa.
(C) O gráfico A apresenta fraca correlação, e o gráfico B apresenta forte correlação positiva.
(D) O gráfico A apresenta forte correlação negativa, e o gráfico B apresenta fraca correlação.
(E) Os gráficos A e B apresentam fraca correlação.
Resposta:
Gráfico A: Dados muito espalhados, logo, apresenta uma correlação fraca.
Gráfico B: Dados seguem um padrão de queda, apresentando uma correlação negativa.
Portanto a alternativa correta é A.
3. (PS 2012.1) Observe os gráficos a seguir:
Assim sendo, é CORRETO afirmar que:
(A) em ambos os gráficos a correlação entre as variáveis X1 e X2 é aproximadamente 1.
(B) no gráfico 1 a correlação entre as variáveis é aproximadamente 0 e no gráfico 2
aproximadamente 1.
(C) no gráfico 1 a correlação entre as variáveis é aproximadamente 0,5 e no gráfico 2
aproximadamente 1.
(D) no gráfico 2, se excluirmos o ponto correspondente a X1 = 10 e X2 = 5, a correlação entre X1
e X2 será aproximadamente 1.
(E) em ambos os gráficosa correlação entre as variáveis X1 e X2 é aproximadamente 0.
Resposta:
Gráfico 1 não é linear, logo é zero.
Gráfico 2 apresenta um outlier, logo, é 1.
Portanto a alternativa correta é a B.
4. (P2 2010.2) As queimadas, até o mês de agosto deste ano, comparadas ao mesmo período
do ano passado, aumentaram em 94%, tendo em vista apenas as regiões Norte, Nordeste e
Centro-Oeste do Brasil. Além de outros danos, as queimadas elevam as temperaturas nas
grandes cidades, em média, em mais de 3 °C e, ao mesmo tempo, reduzem em muito a
fertilidade do solo dessas regiões. Esses efeitos das queimadas traduzem, respectivamente,
os tipos de correlação denominados:
(A) Positiva e Perfeita Positiva.
(B) Negativa e Perfeita Negativa.
(C) Positiva e Negativa.
(D) Negativa e Positiva.
(E) Perfeita Negativa e Perfeita Positiva.
Resposta: As queimadas cresceram em 94%, logo, apresenta uma correlação positiva. As
queimadas diminuem a fertilidade do solo, logo, apresenta uma correlação negativa.
5. (PS 2014.2) Os dados a seguir mostram o número de horas estudadas e suas respectivas
notas em uma prova de matemática.
X (tempo) Y (notas)
1 6,5
2 7,0
3 7,5
4 8,0
5 8,5
O valor aproximado do coeficiente de correlação linear para esses valores é:
(A) 1,00.
(B) -0,90.
(C) 0,80.
(D) 0,85.
(E) 1,20.
Resposta:
X Y X² Y² X * Y
1 6,5 1 42,25 6,5
2 7,0 4 49 14
3 7,5 9 56,25 22,5
4 8,0 16 64 32
5 8,5 25 72,25 42,5
Total 15 37,5 55 283,75 117,5
∑ ∑ ∑
√ ∑ ∑ ] ∑ ∑ ]
√
√
√
6. (PS 2012.2) A tabela representa as medidas de duas variáveis aleatórias:
X 0 1 2 3 4 5
Y 10 20 30 40 50 60
O grau de correlação só pode ser:
(A) 20%.
(B) 35%.
(C) 50%.
(D) 80%.
(E) 100%.
Resposta:
X Y X² Y² X * Y
0 10 0 10 0
1 20 1 40 20
2 30 4 90 60
3 40 9 160 120
4 50 16 250 200
5 60 25 360 300
Total 15 210 55 910 700
∑ ∑ ∑
√ ∑ ∑ ] ∑ ∑ ]
√
√
√
7. (P2 2010.2) O quadro seguinte apresenta a relação existente entre a massa muscular de uma
pessoa e a idade. Para estudar essa relação, uma médica selecionou sete mulheres e
observou a idade (X) e a massa muscular (Y) de cada indivíduo.
Idade Massa muscular
85 98,4
77 109,2
60 120
80 81,6
67 104,4
87 87,6
82 93,6
Nesse caso, o coeficiente de correlação linear de Pearson é:
(A) –0,78
(B) –0,90
(C) 0,90
(D) 0,58
(E) 0,87
Resposta: O coeficiente de correlação linear de Pearson é -0,78 (Cálculo feito excel)
8. (PS 2008.1) Foram estudadas duas variáveis emparelhadas, x e y, com desvios-padrão de
2,6 e 3,1, respectivamente. Além disso, a covariância entre as variáveis x e y resultou em –
7,3. Com base nessas informações, pode-se afirmar que:
(A) a variável x apresenta menor dispersão relativa do que a variável y.
(B) existe uma correlação linear perfeita entre x e y.
(C) existe uma forte correlação negativa entre x e y.
(D) nada se pode afirmar sobre a força da correlação entre x e y.
(E) existe uma forte correlação positiva entre x e y.
Resposta: A correlação é entre duas médias, como só existe os desvios-padrões não é possível
concluir, portanto nada se pode afirmas sobre a força da correlação entre x e y.
9. (FGV OS 2010,1) Uma amostra de 20 observações mensais foi levantada por um analista do
mercado de capitais para construir um modelo matemático que lhe responda qual é o
percentual de retorno (Y) de uma ação ordinária de uma empresa tomando por base o índice
Standard and Poor’s 500 (X). As informações disponíveis estão abaixo
∑
∑
∑
∑
Onde y1 = Y1 – Y e xi = Xi – X
Considerando os dados acima, podemos afirmas que:
(A) A covariância entre as variáveis é positiva
(B) Há uma baixa correlação entre Y e X
(C) A covariância entre as variáveis é alta
(D) A cada ponto de acréscimo no Índice SP- 500 o retorno da ação aumenta em R$0,226
(E) A variância do Índice SP- 500 foi de 145,7 no período
Resposta: A correlação entre duas variáveis é dada entre -1 e 1, portanto é positiva
∑ ∑
10. (PS 2012.2) Na análise de duas séries de dados pareadas, observou-se uma correlação de
0,15. Diante disso, é correto afirmar que:
(A) o valor baixo de correlação indica proximidade entre as séries e a possibilidade de uma reta
definir com fidelidade o comportamento observado.
(B) o valor baixo de correlação indica divergência entre as séries e a possibilidade de uma reta
definir com fidelidade o comportamento observado.
(C) o valor baixo de correlação indica proximidade entre as séries e a dificuldade de uma reta
definir com fidelidade o comportamento observado.
(D) o valor baixo de correlação indica divergência entre as séries e a dificuldade de uma reta
definir com fidelidade o comportamento observado.
(E) o valor positivo de correlação indica proximidade entre as séries e a possibilidade de uma
reta definir com fidelidade o comportamento observado.
Resposta: Uma correlação de 0,15 é classificada como baixa, indicando diferenças entre as
séries e indicando uma dificuldade em traçar uma linha reta entre elas.
11. (ENADE 2018) Em pesquisa realizada com um conjunto de 15 empresas do setor varejista,
no ano de 2017, foram levantadas, para cada uma delas, as seguintes informações: o
investimento em responsabilidade socioambiental (IRSC), medido pelo percentual do
investimento total aplicado em atividades e projetos socioambientais; a satisfação dos
clientes (SAT), medida obtida de uma amostra de clientes, em escala que varia de 0 a 10; a
lucratividade anual (LUC), referente à relação entre o lucro líquido total e a receita total; e o
crescimento de receita (CREC) em relação a 2016, descontada a inflação. Os dados
levantados estão dispostos na tabela a seguir.
Foram extraídas medidas de correlação de Pearson entre IRSC e CREC (correlação de 0,72), e
entre SAT e LUC (correlação de 0,17). Os gráficos a seguir apresentam essas relações entre as
variáveis.
Com base nos dados expostos, avalie as asserções a seguir e a relação proposta entre elas.
I. Os gráficos refletem visualmente que a relação linear entre IRSC e CREC é mais forte do que
SAT e LUC, o que indica níveis de correlação distintos: um mais próximo da associação perfeita
(0,72), outro mais próximo da total falta de associação (0,17).
PORQUE
II. As correlações calculadas sinalizam que o marketing (associado com a variável SAT) e a
relação com a sociedade (associada com a variável IRSC) predizem resultados financeiros de
maneiras variadas; porém, tomadas em conjunto, pela soma das correlações (0,72 + 0,17), que
se aproxima de 0,9, as duas variáveis predizem fortemente o resultado financeiro conjunto de
CREC e LUC.
A respeito dessas asserções, assinale a opção correta.
(A) As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
(B) As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.
(C) A asserção I é uma proposição verdadeira, e a II é uma proposição falsa.
(D) A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
(E) As asserções I e II são proposições falsas.
Resposta: Proposição um está correta, pois eles seguem uma linha linear e positiva e
correlação maior que a segunda. Proposição 2 está errada, pois não é possível somar as
correlações para deixar uma correlação maior. Portanto a alternativa correta é a C.
MODELO REGRESSÃO LINEAR
1. (PS 2014.1) Qual das informações a seguir corresponde à equação deuma reta de regressão
simples e qual (is) é(são) o(s) coeficiente(s) necessário(s) para gerar tal equação,
respectivamente?
(A) y = Log(2x – 1). São necessários os coeficientes de inclinação e de intercepto.
(B) y = 3x – e2x. São necessários os coeficientes de intercepto e de inclinação.
(C) y = 32,4 + 2,15x. São necessários os coeficientes de inclinação e de intercepto.
(D) y = 5x – 1. É apenas necessário o coeficiente de intercepto, pois o coeficiente de inclinação é
optativo.
(E) y = 32,4. É apenas necessário o coeficiente de inclinação, pois o coeficiente de intercepto é
optativo.
Resposta:
Inclinação: y = 32,4 + 2,15x e Intercepto: 32,4. Portanto os dois são apresentados.
O ENUNCIADO A SEGUIR SERÁ UTILIZADO PELAS DUAS PRÓXIMAS QUESTÕES
2. (PS 2016.2) A função de regressão linear simples permite se estimar o custo mensal (em
reais) com transporte dos funcionários de uma indústria em função de distância ( em
quilômetros) existe entre a residência e a fábrica é assim expressa Y= 28,71 + 1,51 X . O custo
mensal estimado com transporte de um funcionário que reside a 20km da fábrica é de
aproximadamente:
(A) R$69,00
(B) R$30,00
(C) R$32,00
(D) R$59,00
(E) R$29,00
Cálculo:
( )
Resposta: portanto o custo mensal estimado com transporte de um funcionário que reside a
20km da fábrica é de R$59,00.
3. Para cada km a mais na distância entre a residência do funcionário e a fábrica, é correto
afirmar que o custo mensal estimado com o transporte desse funcionário:
(A) não ocasiona alteração no custo mensal.
(B) aumenta R$28,71.
(C) aumenta R$1,51.
(D) diminui R$1,51.
(E) diminui R$28,71.
Resposta: 1.51 multiplica a variável x, logo, a cada km a mais irá aumentar 1,51
4. O custo mensal estimado com o transporte de um funcionário que resida a 0 km da fábrica é
de:
(A) R$0,00.
(B) R$27,20.
(C) R$30,22.
(D) R$28,71.
(E) R$1,51.
Cálculo:
( )
Resposta: O custo mensal estimado com o transporte de um funcionário que resida a 0 km da
fábrica é de R$28,71
5. (P2 2010.2) A função que melhor representa o comportamento do lucro de uma empresa
relativo ao quantitativo de colaboradores é: Y = 60 - 1,5x. A quantidade limite de colaboradores
que a empresa deve possuir para não ter lucro é de:
(A) 60
(B) 61,5
(C) 15
(D) 40
(E) 58,5
Cálculo:
Resposta: A quantidade limite de colaboradores que a empresa deve possuir para não ter lucro
é de 40.
6. (FGV PS 2014.1) Um professor de estatística deseja utilizar o número de horas que um aluno
estuda para uma prova final de estatística (x1) para prever a nota da prova final numa escala de
0 a 100 (Y).Foi ajustado um modelo de regressão com base nos dados coletados
(aleatoriamente) de uma classe durante o semestre anterior. O modelo ajustado foi: Y= 35 +
3X1. Qual é a interpretação, respectivamente, do intercepto (b0) e para a inclinação (b1) da
equação estimada ¿
(A) Alunos que estudam para a prova obtêm, em média, uma nota 38 na prova final. É previsto
que o resultado para a prova final cresça, em média, 3 pontos para cada hora de aumento no
tempo de estudo.
(B) Alunos que não estudam para a prova obtêm, em média, uma nota 35 na prova final. É
previsto que o resultado para a prova final cresça, em média, 3 pontos para cada hora de
aumento no tempo de estudo.
(C) Alunos que estudam para a prova obtêm, em média, uma nota 35 na prova final. É previsto
que o resultado para a prova final cresça 35 pontos, em média, para cada hora de aumento
no tempo de estudo.
(D) Alunos que não estudam para a prova obtêm, em média, uma nota 3 na prova final. É
previsto que o resultado para a prova final cresça 35 pontos, em média, para cada hora de
aumento no tempo de estudo.
(E) Alunos que estudam para a prova obtêm, em média, uma nota 35 na prova final. É previsto
que o resultado para a prova final cresça , em média, 38 pontos,para cada hora de aumento
no tempo de estudo.
Cálculo:
( )
Resposta: Portanto 35 sendo a constante e 3 a variável do X (prova final) Alunos que não
estudam para a prova obtêm, em média, uma nota 35 na prova final. É previsto que o resultado
para a prova final cresça, em média, 3 pontos para cada hora de aumento no tempo de estudo.
7. (FGV PS 2010.1) Foi realizado um estudo para estimar a relação linear entre as variáveis
Preço (Y), em reais, e demanda por um produto (X), em unidades. O modelo de regressão linear
ajustado aos dados Y = 31,31 + 1,65X. Esse modelo passou no teste ANOVA, suas premissas
foram observadas e nenhum valor extremo ou influente foi observado. Nessas circunstâncias, é
possível afirmas que:
(A) O aumento de uma unidade demanda desse produto faz com que seu preço aumente
R$31,31
(B) O aumento de uma unidade demanda desse produto faz com que seu preço aumente R$1,65
(C) O aumento de R$1,00 desse produto faz com que sua demanda cresça R$1,65
(D) O aumento de R$1,00 desse produto faz com que sua demanda cresça R$31,31
(E) O aumento de R$1,00 desse produto faz com que sua demanda cresça R$32,96
Resposta: a inclinação é R$1,65, logo a cada aumento de X em unidade o preço subirá R$1,65.
8. (FGV OS 2014.2) Um modelo de regressão linear simples teve como variável dependente as
vendas em um ano de uma amostra de 1.000 vendedores, mensurada em R$, e como variável
independente, a variável X1 , que assume valor 1 quando o vendedor é o sexo masculino e zero
quando contrário. A equação estimada foi: Y=15.000 – 2.500 X1
Com base na equação estimada, é correto concluir que um vendedor o sexo:
(A) Masculino vendeu, em média, R$2.500,00 a menos que um vendedor do sexo feminino.
(B) Masculino vendeu, em média, R$17.2500,00 a menos que um vendedor do sexo feminino.
(C) Feminino vendeu, em média, R$12.250,00 a mais que um vendedor do sexo masculino.
(D) Feminino vendeu, em média, R$15.000,00 a menos que um vendedor do sexo masculino.
(E) Feminino vendeu, em média, R$17.250,00 a menos que um vendedor do sexo masculino.
Cálculo:
( )
Resposta: Masculino (1), em média, R$2.500,00 a menos que um vendedor do sexo feminino.
9. (P2 2012.1) A tabela a seguir indica as quantidades produzidas de um certo insumo agrícola e
seus respectivos custos de produção.
Quantidade (kg) 10 25 50 80 90
Custo total (US$) 150 290 540 840 900
Se a reta de mínimos quadrados que se ajusta aos dados é representada pela equação Y=
55,29 + 9,58x, então podemos dizer que o valor mais provável para o custo fixo é:
(A) 9,58.
(B) 64,87.
(C) 45,71.
(D) 32,44.
(E) 55,29.
Resposta: Custo fixo = intercepto= 55,29.
10. (PS 2016.1) A fábrica Porto Print analisou os custos totais de produção de determinadas
quantidades de seu principal produto, que é o cartucho de impressora jato de tinta na cor preta,
considerando cinco observações independentes, conforme a tabela a seguir:
Quantidades Custos totais (R$)
10 100
20 230
30 270
40 410
50 490
Com base nas informações acima, o valor do custo variável e do custo fixo, em reais, é
respectivamente:
(A) 9,60 e 12,00.
(B) 9,50 e 13,00.
(C) 9,00 e 15,00.
(D) 10,00 e 14,00.
(E) 8,00 e 11,00.
Memória de Cálculo:
Cálculo:
∑
∑
∑ (
)
∑ (
)
[
( )
]
(
)
∑
(
∑
) ( )
Resposta: O valor do custo variável é $ 9,6 e do custo fixo $12
11. (PS 2014.1) As informações contidas na tabela a seguir foram cedidas pelo gerente de uma
rede de lojas que atua no mercado automotivo com a comercialização de peças para reparos. O
gerente desejadeterminar a relação entre o número de comerciais de rádio divulgados nos fins
de semana e as vendas nas lojas durante a semana seguinte. Os dados foram coletados durante
dez finais de semanas e os valores das vendas estão expressos em um (1) por dez mil R$
(10.000,00).
Semana
Número de comerciais
(X)
Volume de vendas
(Y)
1ª 2,0 5,00
2ª 5,0 5,70
3ª 1,0 4,10
4ª 3,0 5,40
5ª 4,0 5,40
6ª 1,0 3,80
7ª 5,0 6,30
8ª 3,0 4,80
9ª 4,0 5,90
10ª 2,0 4,60
Os valores a seguir foram obtidos a partir da tabela acima: n = 10; Σx = 30; Σy = 51; Σxy = 162,9;
Σx2 = 110; Σy2 = 265,76; (Σx)2 = 900 e (Σy)2 = 2601. Nesse contexto e com base nas informações
disponíveis, pode-se afirmar que a Reta de Regressão Linear Simples é dada pela equação:
(A) 0,495x + 3,615
(B) 0,490x + 3,615
(C) 0,495x + 3,610
(D) 0,495x + 3,625
(E) 0,485x + 3,635
Cálculo:
∑
∑
∑ (
)
∑ (
)
[
( )
]
(
∑
)
(
)
Resposta: pode-se afirmar que a Reta de Regressão Linear Simples é dada pela equação
0,495.x + 3,615
12. (P2 2010.2) Um aluno de uma Faculdade de Administração precisa fazer um controle do
número de cachorros-quentes vendidos na lanchonete de sua faculdade em função do número
de refrigerantes vendidos. Para isso, levantou informações sobre o número de vendas/semana
de refrigerantes e a quantidade vendida de cachorros-quentes. Após coleta das informações,
durante o período de cinco semanas, obteve os resultados apresentados na tabela abaixo:
Número de refrigerantes vendido/semana Número de cachorros-quentes vendidos/semana
30 20
45 30
50 40
42 29
60 40
Considere que: Σx = 227; Σy = 159; Σxy = 7568 e Σx2 = 10789 A equação linear que
representa esse conjunto de dados, tal que y = a + bx, é:
(A) y = -1,03 + 0,72x
(B) y = -1,03 - 0,72x
(C) y = 1,80 - 1,82x
(D) y = -1,80 - 1,82x
(E) y = 1,93 - 0, 22x
Cálculo:
∑
∑
∑ (
)
∑ (
)
[
( )
]
∑
(
∑
)
(
)
Resposta: A equação linear que representa esse conjunto de dados, tal que y = a + bx, é – 1,03
+ 0,72x
13. (P2 2012.1) Os dados a seguir correspondem à renda familiar e ao custo com alimentação
de uma pesquisa realizada com seis famílias de uma cidade do interior do estado de São Paulo.
Renda familiar (X) Custo com alimentação (Y)
R$ 1.920,00 R$ 1.080,00
R$ 2.670,00 R$ 1.830,00
R$ 1.840,00 R$ 1.190,00
R$ 2.580,00 R$ 1.536,00
R$ 3.200,00 R$ 1.960,00
R$ 2.500,00 R$ 1.696,00
A equação da reta de regressão estimada do custo com alimentação (Y) em função da renda
familiar (X) é mais próxima de:
(A) Y = 0,6571.X – 62,3235.
(B) Y = 0,6571.X + 62,3235.
(C) Y = – 0,6571.X – 62,3235.
(D) Y = 1,6571.X + 62,3235.
(E) Y = 1,6571.X – 62,3235.
Memória de Cálculo:
Cálculo:
∑
∑
∑ (
)
∑ (
)
[
( )
]
∑
(
∑
)
(
)
Resposta: A equação linear que representa esse conjunto de dados, tal que y = bx +a, é
0,6571X – 62,41
O ENUNCIADO A SEGUIR SERÁ UTILIZADO PELAS DUAS PRÓXIMAS QUESTÕES
14. (FGV OS 2014.1) A função de regressão linear simples permite estimarmos o custo com
saúde (em R$) (Y) como função da renda per capita familiar (em R$)(X). A equação de
regressão pode ser expressa da seguinte maneira: Y= 28,8 + 0,07X
Com base na equação acima, cada R$10,00 adicionados à renda mensal per capita familiar fará
com que a família tenha seu gasto com saúde:
(A) Aumentado, em média, R$28,8
(B) Diminuindo, em média, R$28,8
(C) Aumentado, em média, R$0,07
(D) Diminuindo, em média, R$0,70
(E) Aumentando, em média, R$0,70
Cálculo:
Resposta: Com base na equação acima, cada R$10,00 adicionados à renda mensal per capita
familiar fará com que a família tenha seu gasto com saúde aumentando, em média R$0,70
15. O gasto com saúde de uma família com uma renda per capita de R$ 2.400,00 será:
(A) R$ 320,25
(B) R$ 196,80
(C) R$ 258,00
(D) R$ 297,50
(E) R$ 160,00
Cálculo:
Resposta: O gasto com saúde de uma família com uma renda per capita de R$ 2.400,00 será
R$196,8.
16. (PS 2010.2) Um extrato do estudo sobre o gasto mensal com educação realizado em famílias
da classe “A”, em função do número de filhos, é apresentado a seguir:
Número de filhos Gasto mensal (em reais)
2 3.500,00
3 4.000,00
1 1.500,00
6 8.000,00
8 10.000,00
Considerando: Σ Y = 27000; Σ X = 20; Σ YX = 148500 e Σ X2 = 114
então, se um casal está planejando ter outro filho, o valor estimado do acréscimo de gasto
mensal com educação dos filhos é de:
(A) R$ 2.000,00
(B) R$ 1.190,00
(C) R$ 635,00
(D) R$ 2.500,00
(E) R$ 800,00
Memória de Cálculo:
Σ Y = 27000; Σ X = 20; Σ YX = 148500 e Σ X2 = 114 n = 5
Cálculo:
∑
∑
∑ (
)
∑ (
)
[
( )
]
Resposta: O valor estimado do acréscimo de gasto mensal com educação dos filhos é de
R$1.190,00
17. (P2 2010.1) Ao examinar as estatísticas de um modelo de regressão linear simples, entre as
variáveis venda de um produto (Y) e a renda dos consumidores (X), a variação total é igual a 2,5
e a variação devida a outros fatores é igual a 0,1. Assim, é possível concluir que:
(A) O coeficiente de correlação linear entre as variáveis é igual a 0,04.
(B) O coeficiente de correlação linear entre as variáveis é igual a 0,96.
(C) 98% da variação total da renda dos consumidores podem ser explicados pela variável
volume de vendas.
(D) 96% da variação total do volume de vendas podem ser explicados pela variável renda dos
consumidores.
(E) Esse modelo tem baixa capacidade preditiva.
Cálculo:
Resposta: o complementar do r² é igual a 96%96% da variação total do volume de vendas
podem ser explicados pela variável renda dos consumidores.
18. (PS 2016.1) Um modelo de regressão linear simples foi estimado com o seguinte conjunto de
dados, em que Y é a variável dependente e X a variável independente:
Loja Espaço de prateleira (X) (m) Vendas semanais (Y)
1 2 160
2 2 220
3 2 140
4 5 190
5 5 240
6 5 260
7 8 230
8 8 270
9 8 280
10 10 260
Com base nos dados apresentados, o r2 obtido é de:
(A) r2 = 0,35.
(B) r2 = 0,68.
(C) r2 = 0,58.
(D) r2 = 0,48.
(E) r2 = 0,25.
Cálculo:
Reposta: resolvendo no excel a função = RQUAD encontra-se o valor de 0,58.
19. (PS 2010.1) Um estudo sobre a relação entre as variáveis Renda e Gasto com alimentação,
com 7 famílias, apresentou Soma de quadrados total, SQT = 60,8591, e Soma dos quadrados
dos resíduos, SQR = 4,9283. A média amostral da variável Y foi 9,1429, com b0 = 1,1414 e b1 =
0,2642. O coeficiente de determinação obtido e a respectiva interpretação são:
(A) r2 = 0,87; 87% da variação total nos gastos com alimentação foi explicada pela renda. Assim,
para previsões, é melhor utilizar o modelo linear obtido e não a média amostral.
(B) r2 = 0,92; 92% da variação total nos gastos com alimentação foi explicada pela renda. Assim,
para previsões, é melhor utilizar o modelo linear obtido e não a média amostral.
(C) r2 = 0,81; 81% da variação total nos gastos com alimentação foi explicada pela renda. Assim,
para previsões, é melhor utilizar o modelo linear obtido e não a média amostral.
(D) r2 = 0,96; 4% da variação total nos gastos com alimentação não foi explicada pelo modelo.
Assim, para previsões, é melhorutilizar o modelo linear obtido e não a média amostral.
(E) r2 = 0,08; 8% da variação total nos gastos com alimentação foi explicada pela renda. Assim,
para previsões, é melhor utilizar o modelo linear obtido e não a média amostral.
Memória de Cálculo:
SQT= 60,8591
SQR = 4,9283
Y = 9,1429
B0= 1,1414
B1= 0,2642
Cálculo:
Resposta: O coeficiente de determinação obtido e a respectiva interpretação são r2 = 0,92; 92%
da variação total nos gastos com alimentação foi explicada pela renda. Assim, para previsões, é
melhor utilizar o modelo linear obtido e não a média amostral.
20. (P2 2014.2) Um modelo de regressão linear simples foi estimado e os valores observados e
previstos pela reta de regressão para variável dependente estão na tabela a seguir:
Y observado Y previsto
36 11
27 16
23 33
11 40
28 11
45 10
Dado que a soma de quadrados total foi de 3500, o valor aproximado para o R2 desse modelo é:
(A) 2,5%.
(B) 4,5%.
(C) 6,5%.
(D) 8,5%.
(E) 10,5%.
Cálculo:
Resposta: usando o Excel o valor aproximado para o R2 desse modelo é 8,5%.
21. (P2 2012.1) Foi realizado um levantamento de informações que buscava estabelecer uma
relação linear entre o rendimento anual (R$) de profissionais com cursos de doutorado e o tempo
decorrido de sua titulação. Os dados coletados são apresentados na tabela a seguir.
Anos após doutoramento R$ anual
2 60.000
4 66.000
5 66.000
7 72.000
8 74.400
9 75.600
10 84.000
12 90.000
Após estabelecida a equação de regressão linear que representa este conjunto de dados,
obteve-se o valor de 0,95 para o coeficiente de determinação (r2). Baseando-se nessa
informação, é correto dizer que:
(A) 95% da variabilidade do rendimento anual é explicada pelo número de anos decorridos após
titulação.
(B) 0,95 é a probabilidade de um doutor ganhar R$66.000,00 a cada 5 anos de trabalho.
(C) 95% da variabilidade da remuneração anual estão em função do título recebido.
(D) em média, a cada ano que passa, o rendimento aumenta 9,5%.
(E) não existe correlação entre as duas variáveis em questão.
Resposta: A pesquisa é feita com a população de pessoas que recebem aumento após a
titulação do doutorado e o aumento da renda anual, portanto o valor de 0,95 (95%) para r² é o
valor da da variabilidade do rendimento anual do número de anos decorridos após titulação.
22. (P2 2012.1) Os dados da tabela a seguir relacionam a quantidade em kg/m2 de Nitrogênio
(fertilizante) aplicado ao solo e o rendimento obtido (kg/m2) de um cultivo de milho. A equação de
regressão linear que representa esse conjunto de dados é: y = 2,4476x + 31,41 com r2 de 0,89.
Nitrogênio (kg/m2) (x) Rendimento (kg/m2) (y)
0,4 32
0,5 32
1,1 35
1,8 37
2,5 37
2,5 37
A partir do exposto, é correto afirmar que:
(A) o rendimento esperado do feijão é de 31,41 em kg/m2 quando não é aplicado nitrogênio na
lavoura.
(B) a aplicação de nitrogênio na lavoura não altera o rendimento do feijão.
(C) a variável Nitrogênio (kg/m2), nesse exemplo de dados, é a variável dependente.
(D) a variação de nitrogênio aplicado explica somente 2,44% da variação da produtividade do
feijão.
(E) se forem aplicados 1,5 kg/m2 de nitrogênio na lavoura, será obtida uma produtividade de 30
kg/m2.
Cálculo:
( )
Resposta: O valor de 31,41 em kg/m2 é constante, portanto não há a necessidade de colocar a
variável nitrogênio (x).
23. (P2 2016.1) Se a soma de quadrados devido à regressão for zero, em um modelo de
regressão linear simples que relaciona Y (variável dependente) e X (variável independente), a
reta estimada para esse modelo será:
(A) uma reta negativamente inclinada.
(B) uma parábola (ou função do segundo grau).
(C) uma reta vertical.
(D) uma reta horizontal.
(E) uma reta positivamente inclinada.
Resposta: Já que a soma de quadrados da regressão é zero com as duas variáveis Y
(dependente) e X (independente), portanto multiplicando as variáveis de Y com 0 terá uma reta
na horizontal.
24. (P2 2016.1) Foi estimado um modelo de regressão linear simples em que a variável
dependente é vendas (em R$) e a independente é experiência (em anos). O resultado indicou
um intervalo de confiança de 95% para o beta estimado relacionado a variável experiência de
[−30; 30]. Com base nesse resultado e considerando um nível de significância de 5%, pode-se
concluir que:
(A) rejeita-se a hipótese nula do teste F.
(B) a variável experiência não foi significante a 5%.
(C) estatisticamente um aumento na experiência reduz as vendas.
(D) rejeita-se a hipótese nula do teste t.
(E) o valor-p foi menor do que 5%.
Cálculo:
Resposta: valor crítico < alfa, portanto a variável experiência não foi significante a 5%.
25. (P2 2012.2) Rafael realizou uma regressão para testar a influência do tempo de experiência
de seus vendedores (em anos) sobre suas vendas anuais (em Reais). Para testar a premissa de
homoscedasticidade desse teste, qual dos gráficos a seguir é mais indicado?
Resposta: A resposta correta é a alternativa C, as demais são respectivamente: A = Princípio da
normalidade; B = Tem um padrão; D = Tem um padrão; e E = Princípio da normalidade.
26. (P2 2014.2) O diagrama de dispersão a seguir mostra a relação entre a variável dependente
Y e independente X.
Se um modelo de regressão linear simples for estimado com esses dados coletados
aleatoriamente, qual premissa do modelo seria violada?
(A) Independência da variável dependente.
(B) Homocedasticidade dos resíduos.
(C) Linearidade dos coeficientes estimados.
(D) Alta correlação entre as variáveis dependente e independente do modelo.
(E) Normalidade da variável independente.
Resposta: o princípio da Homocedasticidade dos resíduos é serem igual e/ou parecidos.
27. (P2 2012.1) Observe, atentamente, os três gráficos dos resíduos de um certo modelo
ajustado.
As suposições invalidadas do modelo de regressão em cada um dos gráficos acima são
respectivamente:
(A) normalidade, independência e homocedasticidade.
(B) independência, normalidade e homocedasticidade.
(C) independência, homocedasticidade e normalidade.
(D) homocedasticidade, independência e normalidade.
(E) homocedasticidade, normalidade e independência.
Resposta: No primeiro gráfico as variáveis são dependentes, no segundo são diferentes
(heterocedástico) e o terceiro a variável não é normal, portanto as suposições que contrariam
essas afirmações são as da alternativa C independência, homocedasticidade e normalidade.
28. (P2 2012.2) Um pesquisador estimou um modelo de ANOVA para cada uma das situações
apresentadas nos gráficos 1 e 2.
Com base nos gráficos, assinale quais as possíveis conclusões dos testes.
(A) As conclusões dos modelos não seriam válidas, uma vez que no primeiro modelo a premissa
de homoscedasticidade seria violada e no segundo a premissa de normalidade seria violada.
(B) No primeiro teste, provavelmente a hipótese nula do teste seria rejeitada, uma vez que a
média das notas dos alunos que frequentaram o cursinho A é inferior à média dos que
frequentaram o cursinho C. Já no segundo teste, provavelmente a hipótese nula não seria
rejeitada, pois as médias das notas são iguais.
(C) As conclusões dos modelos não seriam válidas, uma vez que no primeiro modelo a premissa
de normalidade seria violada e no segundo teste a premissa de homoscedasticidade seria
violada.
(D) As conclusões dos modelos seriam válidas, uma vez que em ambos as premissas foram
respeitadas.
(E) As conclusões dos modelos não seriam válidas, uma vez que no primeiro modelo a premissa
de normalidade seria violada e no segundo as premissas de normalidadee homoscedasticidade
seriam violadas.
Resposta: No Gráfico 1 não segue o princípio da normalidade já no Gráfico 2 não segue um
padrão.
29. (PS 2010.2) O modelo de regressão linear para os rendimentos médios mensais de dois
ativos financeiros nos últimos 10 meses produziram, respectivamente, as tabelas ANOVA
abaixo:
Tabela ANOVA para Ativo Financeiro “A”
gl SQ MQ F F de significância
Regressão 1 35,34701 35,3470088 15,07898 0,004653917
Resíduo 8 18,75299 2,3441239
Total 9 54,1
Tabela ANOVA para Ativo Financeiro “B”
gl SQ MQ F F de significância
Regressão 1 36,81799 36,81799 1,505217 0,25479609
Resíduo 8 195,682 24,46025
Total 9 232,5
Considerando o nível de significância de 5%, pode-se afirmar que:
(A) o modelo linear para o ativo A adere aos dados tão bem quanto o modelo linear para o ativo
B.
(B) o modelo linear para o ativo B adere aos dados melhor do que o modelo linear para o ativo A.
(C) a variação não explicada de ambos os modelos tem valores muito próximos.
(D) a variação não explicada do modelo A é bem menor que a do modelo B, portanto o primeiro
adere melhor aos dados que o segundo.
(E) a variação não explicada para o modelo B é bem maior que a do modelo A, portanto o
primeiro adere melhor aos dados que o segundo.
Resposta: F de significância de A (0,004653917) < F de significância de B (0,25479609),
considerando o nível de significância 5% portanto o primeiro adere melhor aos dados que o
segundo.
30. (P2 2012.2) Felipe quer investigar se o número de exercícios de estatística que os alunos
fazem na véspera da prova afeta a nota dos alunos. Para isso, primeiro realizou um teste de
ANOVA e, em seguida, realizou uma regressão linear simples, em que a nota do aluno na prova
de estatística era sua variável dependente, e o número de exercícios realizados na véspera da
prova era a sua variável independente. Após comparar os resultados dos testes, Felipe ficou
intrigado: percebeu que o teste ANOVA deu significante e que o teste de regressão simples não
deu significante para a variável “número de exercícios realizados na véspera da prova”. Com
base nesses resultados, o que Felipe pode concluir?
(A) O resultado da regressão simples está errado, já que o teste mais adequado nesse caso
seria uma regressão múltipla.
(B) O resultado do teste ANOVA está errado, já que a regressão simples apresenta um resultado
com um grau de significância maior.
(C) O resultado da regressão simples está errado, já que o teste ANOVA apresenta um resultado
com um grau de significância maior.
(D) É possível que o teste ANOVA e a regressão simples apresentem resultados diferentes
nesse caso, tendo em vista que a regressão simples só identifica relações lineares entre
variáveis, enquanto o teste ANOVA compara médias de grupos diferentes.
(E) É possível que o teste ANOVA e a regressão simples apresentem resultados diferentes
nesse caso, tendo em vista que o teste ANOVA só identifica relações lineares entre variáveis,
enquanto a regressão simples compara médias de grupos.
Resposta: A regressão pode mostrar uma relação linear entre as variáveis, já o teste ANOVA
pode mostrar uma média diferente.
31. (P2 2014.1) Analise as seguintes sentenças:
I. Em um teste de comparação de variâncias, se o valor da estatística do teste t superar o valor t
crítico, pode-se concluir que as variâncias são diferentes.
II. Em teste de hipótese para comparação de médias para amostras independentes, assume-se
que os resíduos são independentes.
III. A estatística do teste t em um modelo de regressão linear simples é obtida por meio da razão
entre o beta estimado e seu erro-padrão.
Está (ão) INCORRETA(S) APENAS a(s) sentença(s):
(A) I.
(B) II.
(C) I e II.
(D) I e III.
(E) II e III.
Resposta:
Alternativa 1 (errada) = Teste F que compara as variâncias.
Alternativa 2 (errada) = A variável que deve ser independente.
32. (P2 2012.2) Em um modelo de regressão linear simples que tem como variável dependente o
gasto anual em atividades culturais (em Reais) e como variável independente a idade (em anos),
o R2 encontrado foi igual a zero. Com base nessas informações e com nível de significância de
0,05, pode-se afirmar que a variável:
(A) independente “idade” apresentou um valor-p inferior a 5%, indicando que ela é significante
para o modelo.
(B) independente “idade” apresentou um valor-p superior a 5%, indicando que ela não é
significante para o modelo.
(C) dependente “gasto anual em atividades culturais” apresentou um valor-p superior a 5%,
indicando que ela não é significante para o modelo.
(D) dependente “gasto anual em atividades culturais” apresentou um valor-p superior a 5%,
indicando que ela é significante para o modelo.
(E) dependente “gasto anual em atividades culturais” apresentou um valor-p inferior a 5%,
indicando que ela é significante para o modelo.
Resposta: Pelo coeficiente de determinação (R²) ser 0 não existe nenhuma relação significativa
entre as variáveis, como a variável “idade” é independente apresenta um valor-p > que 5%.
33. (PS 2008.1) Com base na tabela abaixo, obtida a partir do ajuste de um modelo de regressão
linear, é correto afirmar que:
ANOVA
Gl SQ MQ F F de significação
Regressão 1 247114,29 247114,29 53,95 0,01804
Resíduo 2 9160,71 4580,36
Total 3 256275,00
(A) o coeficiente de inclinação não é significativo.
(B) o modelo se ajusta aos dados para α = 0,05.
(C) a relação entre as variáveis é não-linear.
(D) o modelo não se ajusta aos dados para α = 0,05.
(E) o intercepto não é significativo.
Memória de Cálculo:
=0,05
Resposta: o modelo se ajusta aos dados para alfa = 0,05
34. (P2 2016.2) Em uma Análise de Regressão, ao se realizar um teste t para a inclinação, se for
encontrado, para um dos regressores, um valor-p menor do que o risco, é correto afirmar que:
(A) a hipótese nula de β > 0 é rejeitada.
(B) a hipótese nula de β = 0 é rejeitada.
(C) a hipótese nula de β ≥ 0 é rejeitada.
(D) a hipótese nula de β ≤ 0 não é rejeitada.
(E) a hipótese nula de β = 0 não é rejeitada.
Resposta: valor p < que alfa, maior a evidência contra a hipótese nula, portanto a H1 B=0 é
rejeitada e H1 B> 0 aceita
35. (ENADE 2012) As tabelas a seguir apresentam estimativas de regressão entre os retornos
da empresa Alfa, que atua na produção e comercialização de piscinas e implementos para
piscinas nas cidades de São Paulo, Rio de Janeiro, Belo Horizonte e Vitória, e retornos do
Ibovespa (Índice da Bolsa de Valores de São Paulo)
Considerando que o modelo estimado é robusto à presença de auto correlação e
heterocedasticidade nos resíduos, avalie as asserções a seguir e a relação proposta entre elas.
I. O risco de mercado da empresa Alfa é menor do que o do Ibovespa (carteira de mercado), o
que significa que os retornos esperados para a Alfa serão menores do que os retornos
esperados para o índice Bovespa. PORQUE
II. O modelo é estatisticamente não significante tendo em vista que não se pode rejeitar a
hipótese de que os coeficientes da regressão sejam estatisticamente diferentes de zero.
A respeito dessas asserções, assinale a opção correta.
(A) As asserções I e II são proposições verdadeiras, e a II é uma justificativa da I.
(B) As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa da I.
(C) A asserção I é uma proposição verdadeira, e a II é uma proposição falsa.
(D) A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
(E) As asserções I e II são proposições falsas.
Resposta: A alternativa I está correta pois quando menos o valor –p menor os valores
esperados de retorno, ou seja Rico Alfa < do Ibovespa. A alternativa II está correta pois Ho
diferente de 0,rejeita.
36. (P2 2018.2) Vânia é analista de sistemas e recebeu a tarefa de determinar as relações
existentes entre as variáveis Y e X. Através de uma reta de regressão linear Y = a + bX, obteve
COV (Y, X) = 280 e VAR (X) = 5,30. Com base nesses dados, o valor de b na equação de
regressão é, aproximadamente, de:
(A) 87,40.
(B) 52,83.
(C) 13,42.
(D) 0,02.
(E) 9,97.
Cálculo:
Resposta: O valor de b na equação de regressão é, aproximadamente, de 52,83.
37. (PS 2018.2) Utilizando o método dos mínimos quadrados, um estatístico está desenvolvendo
um modelo de regressão para determinar a relação entre a quantidade de quilômetros
percorridos pelos veículos de uma transportadora e o gasto de combustível. Dessa forma, os
testes de hipóteses aplicados a esse modelo somente serão válidos se os resíduos forem:
(A) única e exclusivamente normais.
(B) obrigatoriamente nulos.
(C) normais, dependentes entre si e homocedásticos.
(D) todos, obrigatoriamente, positivos.
(E) normais, independentes entre si e homocedásticos.
Resposta: Pressupostos da regressão são os resíduos serem Independênctes de erros(requer
que os erros sejam independentes entre si); Normalidade de erros(requer que os erros sejam
normalmente distribuídos para cada um dos valores de X); e Igualdade de variâncias ou
Homoscedasticidade (requer que a variância dos erros seja constante em relação a todos os
valores de X).
.
38. (ENADE 2018) Um estudo desenvolvido para avaliar a relação entre a cobertura por serviços
de saneamento e indicadores epidemiológicos nos países da América Latina, analisou a taxa de
mortalidade infantil, processando-se a análise por meio de regressão linear múltipla, conforme
mostrado na tabela a seguir. Encontrou-se um coeficiente R2 ajustado de 0,782, tendo
permanecido, no modelo final, as variáveis Esperança de vida ao nascer e Cobertura por
sistemas de esgotamento sanitário.
A partir das informações apresentadas, avalie as afirmações a seguir.
I. Os indicadores de Esperança de vida ao nascer e Cobertura por sistemas de esgotamento
sanitário apresentaram coeficiente β negativo, mostrando uma relação inversamente
proporcional à taxa de mortalidade infantil.
II. Na análise dos dados estatísticos, fica evidenciado que o aumento da Cobertura por sistemas
de esgotamento sanitário determina uma queda na taxa de mortalidade infantil.
III. O aumento na variável Esperança de vida ao nascer aumentará a taxa de mortalidade infantil.
É correto o que se afirma em
(A) I, apenas.
(B) III, apenas.
(C) I e II, apenas.
(D) II e III, apenas.
(E) I, II e III.
Resposta: A alternativa I está correta pois se a esperança de vida ao nascer é negativa portanto
é inversamente proporcional a taxa de mortalidade (menos esperança de vida = maior taxa de
mortalidade). Já a alternativa II evidencia uma queda da taxa de mortalidade em relação a
cobertura por sistemas de esgotamento sanitário.
39. (ENADE 2018) Uma empresa criou um produto para ser lançado no mercado e, para tanto,
foi realizado um estudo de mercado que indicou a demanda estimada entre 100 e 600 unidades
de produto por mês. De posse dessas informações, o pessoal do departamento de custos da
empresa calculou a lucratividade esperada da venda do produto, conforme volume de vendas,
traçou a linha de tendência a partir da equação de regressão e calculou o R-quadrado, obtendo
os dados e o gráfico a seguir
O departamento de marketing da empresa avaliou que a demanda pelo produto é sazonal,
estando a expectativa de vendas, nos meses de baixa demanda, próxima de 150 unidades e,
nos meses de alta demanda, em aproximadamente 550 unidades. O preço de venda operado
pela empresa em qualquer dos cenários será de R$ 6,00.
A respeito dessa situação hipotética, avalie as afirmações a seguir.
I. Nos meses de alta demanda, segundo a previsão do departamento de marketing da empresa,
espera-se uma lucratividade de 80%.
II. Nos meses de baixa demanda, segundo a previsão do departamento de marketing da
empresa, espera-se uma lucratividade de 40%.
III. Nos meses de alta demanda, segundo a previsão do departamento de marketing da empresa,
o lucro líquido da empresa será de R$ 3 300,00.
IV. O R-quadrado indica que a correlação entre as variáveis é significativa.
É correto apenas o que se afirma em
(A) I e III.
(B) I e IV.
(C) II e III.
(D) I, II e IV.
(E) II, III e IV.
Resposta: A alternativa B está correta porque as sentenças I e IV estão certas:
I - no pico da demanda (600) a lucratividade é 0,8 que multiplicando por 100 é igual a 80%.
IV - Utiliza-se o teste F geral para determinar se existe uma relação significativa entre a variável
dependente e o conjunto de variáveis independentes, portanto o R² (SQReg/SQT)
INTRODUÇÃO À REGRESSÃO MÚLTIPLA
1. (FGV OS 2012.1) Um proprietário de uma empresa de telefonia fez um estudo estatístico
para prever a produtividade de seus funcionários (em número médio de atendimentos
telefônicos por dia), em função da quantidade de café ingerida (em número médio de copos
de café por dia) e tempo de sono por noite (em horas médias dormidas por noite). Como
resultado de seu estudo, chegou à seguinte equação:
Com base no estudo descrito e na equação dele resultante, pode-se afirmar que se trata de uma
regressão:
a) Múltipla, na qual a produtividade dos funcionários é a variável independente, e quantidade de
café ingerida e o tempo de sono por noite são as variáveis dependentes.
b) Simples, na qual a produtividade dos funcionários é a variável independente, a quantidade de
café ingerida é variável dependente, e o tempo de sono por noite é apenas uma variável de
controle.
c) Simples, na qual a produtividade dos funcionários é variável independente, o tempo de sono
por noite é a a variável dependente, e a quantidade de café ingerida é apenas uma variável
de controle.
d) Simples, na qual a produtividade dos funcionários é a variável dependente, a quantidade de
café ingerida é a variável independente, e o tempo de sono por noite é apenas uma variável
de controle.
e) Múltipla, na qual a produtividade dos funcionários é a variável dependente, e a quantidade de
café ingerida e o tempo de sono por noite são as variáveis independentes.
Resposta: Os modelos de regressão múltipla utilizam duas ou mais variáveis independentes
para prever o valor de uma variável dependente, portanto a a produtividade dos funcionários é a
variável dependente, e a quantidade de café ingerida e o tempo de sono por noite são as
variáveis independentes.
2. (P2 2012.2) Frederico quer estimar a equação de um modelo que relaciona o número de
votos recebidos pelo candidato eleito de alguns municípios (em mil habitantes) com o número
de eleitores desses municípios (em mil habitantes) e com os gastos totais dos candidatos em
campanha (em mil reais). Para tal, fez uma regressão múltipla, e obteve os resultados a
seguir:
Modelo
Soma dos
Quadrados
Graus de
Liberdad
e
Média dos
Quadrado
s
F
Valor-
p
Regressão 76633,617 2 38316,809 119,934 0,000
Residual 9903,966 31 319,483
Total 86537,584 33
Modelo
Coeficientes não
padronizados
Coeficientes
padronizad
os T
Valor-
p
B Erro-padrão Beta
(Constante) 10,907 6,401
1,704 0,098
Número de eleitores do
município (mil habitantes)
0,70 0,020 0,302 3,466 0,002
Gastos de campanha do
candidato (R$ 1000)
0,010 0,001 0,700 8,027 0,000
Variável dependente: Número de votos obtidos pelo candidato (mil habitantes)
Com base nas tabelas apresentadas, e a partir do modelo de regressão linear múltipla
onde X1 corresponde à variável número de elitores” do município” e X2 corresponde à variável
“gastos de camapnha do candidato”, Frederico pode estimar a seguinte equação:
a)Y = 10,907 + 0,302X1 + 0,700 X2
b) Y = 119,934 + 0,302X1 + 0,700 X2
c) Y = 10,907 + 0,70X1 + 0,010 X2
d) Y = 0 + 0,7X1 + 0,010 X2
e) Y = 0 + 0,302X1 + 0,700 X2
Resposta:
( )
( )
O ENUNCUINADO ABAIXO SERÁ UTILIZADO PELAS DUAS PRÓXIMAS QUESTÕES
(PS 2016.2) Suponha que a função de regressão apresentada a seguir estabeleça a relação
entre a variável VARA (dependente) e VARB, VARC e VARD (independente):
3. É correto afirmas que, para VARB = 5, VARC = 3 e VARD = 6, o valor de VARA é igual a :
a) 32,5
b) 62,5
c) 67,5
d) 77,5
e) 60
Resposta:
( ) ( ) ( )
4. Com relação à função de regressão apresentada, é correto afirmar que, para um acréscimo
de uma unidade ao valor de VARB, o valor de VARA:
(A) Não sofrerá alteração.
(B) Diminuirá 18 unidades.
(C) Diminuirá 3 unidades.
(D) Aumentará 18 unidades.
(E) Aumentará 3 unidades.
Resposta: Aumenta três unidades já que a função é 3 x VARB.
O ENUNCIADO A SEGUIR SERÁ UTILIZADO PELAS PRÓXIMAS TRÊS QUESTÕES
(P2 2016.1) Um pesquisador estava interessado em verificar se existem diferenças entre os
salários de homens e mulheres. Para isso, coletou uma amostra aleatória de 200 pessoas (100
homens e 100 mulheres) e estimou a seguinte equação de regressão múltipla:
= 3000 + 800 𝑀 + 300 𝐸 + 500 𝐸 ê
Em que: Y = salário mensal em R$; Homem = 1 se indivíduo do sexo masculino e 0 feminino;
Escolaridade = anos completos de escolaridade; e Experiência = anos de experiência no
mercado de trabalho.
5. Todos os coeficientes estimados foram significantes a 5%, logo pode-se afirmar que os
homens ganham:
(A) R$4.600,00 a mais que as mulheres, em média, mantendo escolaridade e experiência
constantes.
(B) R$1.600,00 a mais que as mulheres, em média, mantendo escolaridade e experiência
constantes.
(C) R$800,00 a mais que as mulheres, em média, mantendo escolaridade e experiência
constantes.
(D) R$3.800,00 a mais que as mulheres, em média, mantendo escolaridade e experiência
constantes.
(E) R$1.100,00 a mais que as mulheres, em média, mantendo escolaridade e experiência
constantes.
Resposta: Homens ganham a mais que mulheres R$800,00 em média, mantendo escolaridade
e experiência constante:
Homem 1 = 800 x 1 = 800
Mulher 0 = 800 x 0 = 0
6. Assinale a alternativa que contém a correta interpretação do coeficiente associado à variável
experiência.
(A) Um ano adicional na experiência reduz, em média, R$1.600,00 no salário mensal, mantendo
as outras constantes.
(B) Um ano adicional na experiência reduz, em média, R$500,00 no salário mensal, mantendo as
outras constantes.
(C) Um ano adicional na experiência incrementa, em média, R$1.600,00 no salário mensal,
mantendo as outras constantes.
(D) Ter experiência incrementa, em média, R$500,00 no salário mensal, mantendo as outras
constantes.
(E) Um ano adicional na experiência incrementa, em média, R$500,00 no salário mensal,
mantendo as outras constantes.
Resposta: Experiência = 1 = 500 x 1 = 500 . Um ano de experiência retribui a um aumento de
R$500,00 no salário.
7. Assinale a alternativa que contém o valor previsto para o salário de uma mulher com 10 anos
de escolaridade e experiência de mercado.
(A) R$10.700,00.
(B) R$11.000,00.
(C) R$11.800,00.
(D) R$8.000,00.
(E) R$8.800,00.
Resposta:
( ) ( ) ( )
O valor previsto para o salário de uma mulher com 10 anos de escolaridade e experiência de
mercado é de R$11.00
8. (P2 2012.2) Um estagiário de uma grande livraria, a pedido de seu chefe, realizou uma
regressão linear múltipla para analisar o efeito dos anos de estudo e do tempo de experiência
(em anos) sobre as vendas médias mensais (em Reais) dos vendedores que trabalham nas
filiais dessa grande livraria. Entretanto, ao rodar a regressão, o estagiário percebeu que havia
apagado o nome das variáveis e, portanto, não conseguia mais identificar qual das variáveis
independentes era significante no modelo. O resultado obtido a partir da regressão pode ser
observado na tabela a seguir:
Modelo
Coeficientes não
padronizados
Coeficientes
padronizados t
Valor-
p
B Erro-padrão Beta
(Constante) 1359,1 824,08
1,649 0,102
X1 36,569 1,252 0,948 29,21 0
X2 0,343 20,967 0,001 0,016 0,987
Variável dependente: Y
O estagiário lembrou, entretanto, que tinha salvado em seus arquivos alguns gráficos de
dispersão em que as variáveis estavam sendo identificadas. Os gráficos salvos pelo estagiário
podem ser observados a seguir:
Com base nas informações apresentadas, pode-se afirmar que;
(A) provavelmente, a variável “Anos de Estudo” corresponde à variável X1 do modelo, porque o
gráfico 1 parece mostrar não haver relação entre “Anos de Estudo” e “Vendas”, e a variável
X1 não é significante para o modelo.
(B) provavelmente, a variável “Tempo de Experiência” corresponde à variável X1 do modelo,
porque o gráfico 2 parece mostrar não haver relação entre “Tempo de Experiência” e
“Vendas”, e a variável X1 é não significante para o modelo.
(C) provavelmente, a variável “Anos de Estudo” corresponde à variável X2 do modelo, porque o
gráfico 1 parece mostrar não haver relação entre “Anos de Estudo” e “Vendas”, e a variável
X2 não é significante para o modelo.
(D) provavelmente, a variável “Tempo de Experiência” corresponde à variável X2 do modelo,
porque o gráfico 2 parece mostrar haver relação entre “Tempo de Experiência” e “Vendas”, e
a variável X2 é significante para o modelo.
(E) provavelmente, a variável “Anos de Estudo” corresponde à variável X1 do modelo, porque o
gráfico 1 parece mostrar haver relação entre “Anos de Estudo” e “Vendas”, e a variável X1 é
significante para o modelo.
Resposta: O gráfico 1 não contém relação, logo, anos de estudo é a variável do 2.
9. (P2 2012.2) A decomposição da variabilidade de uma variável em função de outra variável é
um recurso importante utilizado pelos modelos estatísticos. Diante disso, em quais dos itens a
seguir pode-se encontrar testes que utilizam essa prática?
(A) Modelo de regressão linear simples e teste de comparação de médias de amostras
independentes.
(B) Modelo de regressão linear simples e teste de comparação de médias de amostras
relacionadas.
(C) Modelo de regressão linear múltipla e teste de comparação de médias de amostras
relacionadas.
(D) Modelo de regressão linear múltipla e análise da variância (ANOVA).
(E) Analise da variância (ANOVA) e teste de comparação de médias de amostras
independentes.
Resposta: Usamos a análise ANOVA e a regressão múltipla para comparar mais de uma
variável.
10. (P2 2016.1) Analise as seguintes afirmações sobre regressão linear múltipla:
I) Quanto maior o R2 menor a soma de quadrados devido à regressão.
II) O R2 será igual a 50% se a soma de quadrados dos resíduos for igual à soma de quadrados
totais.
III) O R2 será maior que 50% se a soma de quadrados devido à regressão for maior que a soma
de quadrados dos resíduos.
Está (ão) correta(s) APENAS a(s) sentença(s):
(A) I.
(B) I e III.
(C) III.
(D) II.
(E) I e II.
Resposta:
A alternativa I está incorreta pois quanto maior R² maior a soma de quadrados devido a
regressão
A alternativa II está incorreta visto que SQRes= SQT pode ser igual
A alternativa III está correta pois R² =SQR > R² SQS portanto R² será maior que 50%
11. (P2 2008.1) Com base nos resultados do teste dos coeficientes de um modelo de regressão
qualquer, apresentados na tabela a seguir gerada pelo software Excel, pode-se concluir que:
Coeficientes
Erro-
padrão
Stat t
Valor-
P
95%
inferiores95%
superiores
Interseção - 186,07 63,95 - 2,91 0,10 - 461,23 89,08
Variável X1 0,42 0,06 7,35 0,02 0,17 0,66
(A) o modelo não se ajusta aos dados para α = 0,05.
(B) o coeficiente de inclinação não é significativo para α = 0,05.
(C) 42% da variação da variável dependente são explicados pela variável independente.
(D) o intercepto e o coeficiente angular são significativos para α = 0,05.
(E) o intercepto não é significativo para α = 0,05.
Resposta: 5% pelo fato de ser 95% superior e 95% inferior.
12. (P2 2014.1) São premissas de um modelo de regressão linear múltipla:
(A) Normalidade da variável dependente e heterocedasticidade das variáveis independentes.
(B) Variáveis independentes altamente correlacionadas e normalidade dos resíduos.
(C) Variável dependente qualitativa e homocedasticidade dos resíduos.
(D) Normalidade e homocedasticidade dos resíduos.
(E) Correlação e normalidade dos resíduos.
Resposta: Normal e homocedásticidade dos resíduos
13. (PS 2016.1) São premissas que precisam ser satisfeitas para que a regressão linear múltipla
seja válida:
(A) homocedasticidade dos resíduos, normalidade dos resíduos e independência dos resíduos.
(B) homocedasticidade dos resíduos, normalidade da variável dependente e independência dos
resíduos.
(C) homocedasticidade das variáveis dependentes, normalidade dos resíduos e independência
dos resíduos.
(D) homocedasticidade das variáveis independentes, normalidade dos resíduos e dependência
dos resíduos.
(E) homocedasticidade dos resíduos, distribuição-t das variáveis dependentes e independência
dos resíduos.
Resposta: homocedasticidade dos resíduos, normalidade dos resíduos e independência dos
resíduos.
14. (P2 2012.2) São premissas que precisam ser satisfeitas para que a regressão linear múltipla
seja válida:
(A) homoscedasticidade dos resíduos, normalidade da variável dependente e independência do
resíduo.
(B) homoscedasticidade das variáveis independentes, normalidade da variável dependente e
independência das variáveis independentes.
(C) homoscedasticidade da variável dependente, normalidade dos resíduos e independência das
variáveis independentes.
(D) homoscedasticidade dos resíduos, normalidade dos resíduos e independência dos resíduos.
(E) homoscedasticidade das variáveis independentes e normalidade da variável dependente.
Resposta: homoscedasticidade dos resíduos, normalidade dos resíduos e independência dos
resíduos.
15. (P2 2016.2) Na construção de um modelo de regressão múltipla, as seguintes premissas
deverão ser observadas:
(A) independência, normalidade dos resíduos e homocedasticidade dos resíduos.
(B) somente independência e normalidade dos resíduos.
(C) somente normalidade dos resíduos e homocedasticidade dos resíduos.
(D) dependência, normalidade dos resíduos e homocedasticidade dos resíduos.
(E) independência, normalidade dos resíduos e heterocedasticidade dos resíduos.
Resposta: independência, normalidade dos resíduos e homocedasticidade dos resíduos.
16. (P2 2012.1) Podemos usar uma variável em um modelo de regressão quando desejamos
incluir certo tipo de variável no modelo. Suponha que desejamos estudar os fatores que
podem influenciar as notas dos alunos do ensino fundamental. Qual das variáveis a seguir
pode ser representada por uma dummy?
(A) Idade do aluno.
(B) Anos de estudo dos pais.
(C) Média de anos de experiência dos professores.
(D) Se o aluno tem computador em casa.
(E) Média das notas do aluno nas séries anteriores.
Resposta: As demais alternativas estão erradas pois não apresentam uma relação que cause
efeito na questão.
17. (P2 2016.1) Analise as seguintes sentenças:
I) Em um modelo de regressão linear múltipla, a rejeição da hipótese nula da ANOVA indica que
pelo menos uma das médias populacionais é diferente das demais.
II) Em um teste t para a inclinação de um modelo de regressão, quanto maior a estatística t
maior o valor-p do teste.
III) Os betas estimados são obtidos por meio da minimização dos valores previstos do modelo.
IV) Se uma variável qualitativa tem três categorias, é necessário criar duas variáveis dummy
para incluí-la em um modelo de regressão.
Está (ão) INCORRETA(S) APENAS a(s) sentença(s):
(A) I e II.
(B) I, III e IV.
(C) II e IV.
(D) I, II e III.
(E) I e III.
Resposta: As alternativas incorretas são:
I – São as variâncias e não a média
II – Quanto maior o t, menor será o p
III – Está errado
IV – Está correto
18. (P2 2016.1) Analise os gráficos de dispersão a seguir:
Se um modelo de regressão múltipla for estimado tendo com variável dependente o salário
mensal e variáveis independentes como experiência e escolaridade, provavelmente:
(A) as variáveis escolaridade e experiência seriam significantes estatisticamente.
(B) a variável escolaridade em anos seria significante estatisticamente.
(C) as variáveis salário, escolaridade e experiência seriam significantes estatisticamente.
(D) a variável experiência seria significante estatisticamente.
(E) nenhuma das duas variáveis seria significante estatisticamente.
Resposta: a variável escolaridade tem relação em anos seria significante estatisticamente.
19. (PS 2012.1) Um estatístico está realizando um estudo para tentar prever a influência das
variáveis X1 – idade (em anos completos) – e X2 − nível de escolaridade (em anos
completos), no número médio de livros que um indivíduo lê por ano (Y). Entretanto, antes de
estimar o modelo e obter uma equação de previsão, o estatístico gerou alguns gráficos para
analisar os dados disponíveis. Os gráficos produzidos são apresentados a seguir:
Com base nos gráficos apresentados, pode-se afirmar que:
(A) A variável X1 provavelmente ajuda a explicar a variabilidade da variável dependente Y, pois
está negativamente relacionada com ela.
(B) A variável X2 não ajuda a explicar a variabilidade da variável dependente Y, pois não está
relacionada com ela.
(C) Ambas as variáveis X1 e X2, provavelmente, ajudam a prever a variável depende Y, pois
estão positivamente relacionadas com ela.
(D) Não é possível fazer nenhuma especulação a respeito dos resultados esperados com base
nos gráficos apresentados, pois as variáveis utilizadas se constituem como variáveis Dummy.
(E) Não é possível fazer nenhuma especulação a respeito dos resultados esperados com base
apenas nos gráficos apresentados, sem que outras medidas de estatística descritiva sejam
analisadas.
Resposta: Ambas as variáveis X1 e X2, provavelmente, ajudam a prever a variável depende Y,
pois estão positivamente relacionadas com ela.
20. (FGV PS 2012.2) O proprietário de uma livraria de pequeno porte, diante de um recente
aumento na ocorrência de roubos de livros em seu empreendimento, contratou um consultor
para realizar uma pesquisa que aponte quais são as principais variáveis que tornam os furtos
mais prováveis. A partir do resultado, pretende adotar uma nova maneira de dispor os livros
na livraria, de forma a evitar futuros furtos. Para tal, o consutor teve acesso às sequintes
informações:
1 (X1)– Preço do livro ( em reis);
2 (X2)– Número de páginas do livro;
3-Área de conhecimento abordado pelo livro (1- Psicologia (X3); 2- Direito (X4); 3- Economia(X5);
4- Literatura (X6); 5- Estatística(X7)). Com os dados disponíveis, o consultor realizou uma
regressão e chegou à seguinte equação:
Se quisermos representar a variável “área de conhecimento abordada pelo livro” tomando como
variável dummy de referência literatura (X6), como ficaria a nova equação:
a) Y= 3,3 +1,01 X1 + 0,003 X2 – 1,6 X3 – 0,38 X4 – 0,9 X5 + 0,7 X7
b) Y= 4 +1,01 X1 + 0,003 X2 – 2 X3 – 0,38 X4 – 0,9 X5 + 0,7 X7
c) Y= 3,3 +3,01 X1 + 0,010 X2 – 1,6 X3 – 0,38 X4 – 0,9 X5 + 0,7 X7
d)Y= 4 +1,01 X1 + 0,003 X2 – 1,6 X3 – 0,5 X4 – 0,9 X5 + 1,0 X7
e) Y= 3,3 +1,01 X1 + 0,003 X2 – 1,3 X3 – 0,38 X4 – 3,0 X5 + 0,7 X7
Resposta:
*, ( )- , - , - , ( ) - , ( ) -
, ( ) - , ( ) -+
21. (P2 2014.1) Dois modelos de regressão múltipla foram estimados e representados
graficamente a seguir. Sabe-se que uma variável independente quantitativa e outra qualitativa
foram consideradas na estimação dos modelos. Além disso, a variável dependente é a
mesma nos dois modelos.
As equações que melhor representam os modelos apresentados nos gráficos são
respectivamente:
(A) M1:Y = 0 + 1X1 + 2X2 + ; M2:Y = 0 + 1X1 + 2X2 +
(B) M1:Y = 0 + 1X1 + 2X2 + 3X3 + ; M2:Y = 0 + 1X1 +
(C) M1:Y = 1X1 + 2X2 + 3X3 + ; M2:Y = 1X1 + 2X2 +
(D) M1:Y = 0 + 1X1 + 2X2 + 3X3 + ; M2:Y = 0 + 1X1 + 2X2 +
(E) M1:Y = 0 + 1X1 + 2X2 + ; M2:Y = 0 + 1X1 + 2X2 + 3X3 +
Resposta:
𝑀
O ENUNCIADO ABAIXO SERÁ UTILIZADO PELAS QUATRO PRÓXIMAS QUESTÕES.
(P2 2014.2) O gerente de uma rede de lojas de departamento estava interessado em
compreender quais variáveis explicam a variabilidade das vendas de seus vendedores. Para
isso, contratou um estatístico que coletou dados de uma amostra de 126 vendedores e estimou o
seguinte modelo de regressão múltipla.
Em que:
Idade = idade do vendedor em anos; Experiência = anos de experiência como vendedor;
Capital = assume valor 1 se o vendedor é de uma loja da capital e 0 de uma loja do interior;
Eletro = assume valor 1 se o vendedor atua na seção de eletroeletrônicos e 0 caso atue na
seção de vestuário ou esportes;
Vestuário = assume valor 1 se o vendedor atua na seção de vestuário e 0 caso atue na seção
de eletroeletrônicos ou esportes;
Esporte = assume valor 1 se o vendedor atua na seção de esportes e 0 caso atue na seção
de eletroeletrônicos ou vestuário.
22. As variáveis independentes incluídas no modelo explicam quantos % da variabilidade das
vendas?
(A) 5,4%.
(B) 25,4%.
(C) 57,4%.
(D) 74,5%.
(E) 82,4%.
Resposta:
23. Um dos diretores da empresa suspeitava que as vendas médias dos vendedores do interior
eram maiores. Há evidências que comprovem essa suspeita?
(A) Não, uma vez que o erro-padrão da variável Capital é muito elevado, o que torna a variável
não significante estatisticamente.
(B) Não, uma vez que o coeficiente da variável Capital é negativo.
(C) Não, embora a variável apresente significância estatística, o R2 desse modelo é praticamente
nulo.
(D) Sim, uma vez que a variável Capital apresenta significância estatística e, em média, um
vendedor da capital vende R$7.571,00 a menos que os vendedores do interior.
(E) Sim, uma vez que, em média, um vendedor da capital vende R$1.275,00 a menos que os
vendedores do interior.
Resposta: O vendedor da capital vende 7571 a menos do que o vendedor do interior. O valor de
p < 0,05
24. Existe diferença nas vendas médias entre os departamentos de eletroeletrônicos, vestuário e
esportes?
(A) Sim, os vendedores do departamento de eletroeletrônicos vendem, em média, R$368,00 a
menos que os vendedores do departamento de esportes (valor-p < 5%).
(B) Sim, os vendedores do departamento de eletroeletrônicos vendem, em média, R$864,00 a
mais que os vendedores do departamento de esportes (valor-p > 5%).
(C) Sim, os vendedores do departamento de vestuário vendem, em média, R$864,00 a menos
que os vendedores do departamento de esportes (valor-p < 5%).
(D) Não, as variáveis Eletro e Vestuário não são significantes (valores-p > 5%), ou seja, não
existem diferenças nas médias de vendas entre departamentos.
(E) Não, a variável Eletro não é significante (valor-p > 5%), ou seja, não existem diferenças na
média de vendas entre departamentos.
Resposta: Não, pois os valores de p são > 0,05.
25. Tendo em vista a interpretação dos coeficientes das variáveis Idade e Experiência dos
vendedores, é correto afirmar que o aumento de um ano de idade implica:
(A) um aumento médio de R$491mil nas vendas, mantendo as outras variáveis constantes. Um
ano a mais de experiência incrementa, em média, R$961 mil nas vendas, mantendo as outras
variáveis constantes.
(B) um aumento médio de R$491 nas vendas, mantendo as outras variáveis constantes. Um ano
a mais de experiência incrementa, em média, R$961 nas vendas, mantendo as outras
variáveis constantes.
(C) um aumento médio de 49,1% nas vendas, mantendo as outras variáveis constantes. Um ano
a mais de experiência incrementa, em média, 96,1% nas vendas, mantendo as outras
variáveis constantes.
(D) um aumento médio de R$491 nas vendas, mantendo as outras variáveis constantes. Um ano
a mais de experiência reduz, em média, R$961 nas vendas, mantendo as outras variáveis
constantes.
(E) uma redução média de R$491 nas vendas, mantendo as outras variáveis constantes. Um
ano a mais de experiência reduz, em média, R$961 nas vendas, mantendo as outras
variáveis constantes.
Resposta: 1 ano de idade aumenta R$491,00 na venda e 1 de experiência aumenta R$961,00.
O ENUNCIADO ABAIXO SERÁ UTILIZADO PELAS TRÊS PRÓXIMAS QUESTÕES.
(P2 2014.1) O governo federal encomendou uma pesquisa que teve como objetivo avaliar os
efeitos da assistência técnica rural (ATER) na receita total com a produção agropecuária (em mil
R$) dos agricultores familiares. Nas regiões Sul e Sudeste do Brasil, a pesquisa entrevistou um
grupo de agricultores que utilizou e outro que não utilizou ATER no ano de 2013. A consultoria
contratada pelo governo apresentou o seguinte modelo de regressão em seu relatório:
Modelo gl SQ MQ F
F de
significação
Regressão 2 6777 3389 5,52 0,01
Residual 47 28834 613
Total 49 35611
Coeficientes
Erro
padrã
o
Stat t
Valor-
P
95%
inferior
es
95%
superior
es
Interseção 211 6,53 32,40 0,000 198,3 224,6
ATER 22 7,08 3,09 0,003 7,7 36,1
SUL - 6 7,06 - 0,83 0,408 - 20,1 8,3
Variável dependente: Receita total com a produção agropecuária (em mil R$) no ano de 2013. F
= 5,52, valor-p = 0,01. Obs: todas as premissas do modelo foram respeitadas.
Em que: ATER assume valor 1 se o agricultor familiar utilizou o serviço de ATER na produção e
0 caso contrário; SUL assume valor 1 para propriedades do Sul e 0 se localizada na região
Sudeste.
26. Com base no modelo estimado e considerando um nível de significância de 5%, pode-se
concluir que:
(A) O governo federal não deveria financiar um programa de ATER, uma vez que não é
significante estatisticamente para explicar receita total do agricultor.
(B) O governo federal não deveria financiar um programa de ATER. Apesar de ser significante, a
variável explica apenas 1% da variância da receita total do agricultor.
(C) O governo federal deveria financiar um programa de ATER. Além de ser significante
estatisticamente, a ATER incrementa a receita total do agricultor em R$22 mil, em média.
(D) A receita total do grupo de agricultores que utilizaram assistência técnica é de R$22 mil.
(E) O governo federal não deveria financiar um programa de ATER. Apesar de ser significante, a
variável SUL tem um efeito maior na explicação da receita total dos agricultores.
Resposta: P < 0,05 e 22 x 1000 = R$22.000
27. Qual o valor e a interpretação do R2 deste modelo?
(A) R2 = 39%. A variável ATER explica 39% da variância da receita total com a produção
agropecuária (em mil R$) no ano de 2013.
(B) R2 = 30%. As variáveis ATER e SUL explicam 30% da média da receita total com a produção
agropecuária (em mil R$) no ano de 2013.
(C) R2 = 19%. As variáveis ATER e SUL explicam 19% da variância da receita total com a
produção agropecuária (em mil R$) no ano de 2013.
(D) R2 = 81%. As variáveisATER e SUL explicam 81% da mediana da receita total com a
produção agropecuária (em mil R$) no ano de 2013.
(E) R2 = 19%. As variáveis dependentes incluídas no modelo explicam 19% da variância da
receita total com a produção agropecuária (em mil R$) no ano de 2013.
Resposta: R2 = 19%. As variáveis ATER e SUL explicam 19% da variância da receita total com
a produção agropecuária (em mil R$) no ano de 2013.
28. Com base na equação estimada, qual é a receita total com a produção agropecuária de um
agricultor sem ATER que reside na região Sudeste?
(A) R$205 mil
(B) R$211 mil
(C) R$227 mil
(D) R$252 mil
(E) R$276 mil
Resposta:
( ) ( )
29. (P2 2014.2) O governo federal encomendou uma pesquisa que teve como objetivo avaliar os
efeitos da assistência técnica rural (ATER) na receita total com a produção agropecuária (em
mil R$) dos agricultores familiares. A pesquisa entrevistou um grupo de agricultores que
utilizou e outro que não utilizou ATER no ano de 2013. A consultoria contratada pelo governo
apresentou o seguinte modelo de regressão em seu relatório:
Coeficientes
Erro
padrão
Stat t
Valor-
P
95%
inferiores
95%
superiores
Interseção 211 6,53 32,40 0,000 198,3 224,6
ATER 22 7,08 3,09 0,003 7,7 36,1
Variável dependente: Receita Total com a produção agropecuária (em mil R$) no ano de
2013.Em que: ATER assume valor 1 se o agricultor familiar utilizou o serviço de ATER na
produção e 0 caso contrário. O governo federal irá incrementar os recursos para o financiamento
de ATER se a receita total dos agricultores que utilizaram ATER for pelo menos 5% maior na
receita total dos agricultores que não utilizaram ATER. Com base nas informações disponíveis, é
correto afirmar que o governo:
(A) não deve incrementar os recursos, uma vez que a variável ATER não é significante
estatisticamente.
(B) não deve incrementar os recursos, uma vez que o grupo que utilizou ATER teve uma receita
total com a produção agropecuária 3,09% maior, em média.
(C) deve incrementar os recursos, uma vez que o grupo que utilizou ATER teve uma receita total
com a produção agropecuária 10,4% maior, em média.
(D) deve incrementar os recursos, uma vez que o grupo que utilizou ATER teve uma receita total
com a produção agropecuária 22%% maior, em média.
(E) deve incrementar os recursos, uma vez que o grupo que utilizou ATER teve uma receita total
com a produção agropecuária 36,1% maior, em média.
Resposta: deve incrementar os recursos, uma vez que o grupo que utilizou ATER teve uma
receita total com a produção agropecuária 10,4% maior, em média.
30. (P2 2018.2) Um analista precisa incorporar, a um modelo de regressão, uma variável
qualitativa para representar o estado civil da pessoa. A variável poderá assumir os seguintes
valores: casado, solteiro, viúvo, separado e outros. Nesse caso, é correto afirmar que o
número de variáveis “dummy” a serem utilizadas é igual a:
(A) 5.
(B) 4.
(C) 8.
(D) 3.
(E) 10.
Resposta: 5 – 1 = 4
O ENUNCIADO ABAIXO SERÁ UTILIZADO PELAS QUATRO PRÓXIMAS QUESTÕES.
(P2 2018.2) Com o auxílio do Excel, uma empresa de telefonia criou um modelo de regressão
múltipla relacionando as variáveis FATURAMENTO (em milhões de R$) e seus
INVESTIMENTOS em Propaganda (PROP) e em Tecnologia (TEC) (ambos em milhares de R$).
O relatório gerado pelo aplicativo de planilhas eletrônicas foi o seguinte:
31. Com vista nesses dados, a porcentagem de explicação da variabilidade do faturamento da
empresa pelos investimentos em propaganda e tecnologia é, aproximadamente, de:
(A) 7,5%
(B) 3,7%.
(C) 86%.
(D) 48%.
(E) 29%.
Resposta:
32. Caso decida fazer um investimento adicional de R$1 mil em propaganda, mantendo
constante o investimento em tecnologia, a empresa verá seu faturamento:
(A) aumentar em cerca de R$3,7 milhões.
(B) diminuir em cerca de R$465 milhões.
(C) cair em cerca de R$5,3 milhões.
(D) diminuir em cerca de R$3,7 milhões.
(E) aumentar em cerca de R$5,3 milhões.
Resposta: aumentar em cerca de R$3,7 milhões.
33. Caso a empresa decida não investir nada em propaganda e em tecnologia, o faturamento
deverá ser, em média, de aproximadamente:
(A) R$370 milhões.
(B) R$465 milhões.
(C) R$570 milhões.
(D) R$163 milhões.
(E) R$533 milhões.
Resposta:
( ) ( )
34. Caso a direção da empresa decida investir R$85 mil em propaganda e R$90 mil em
tecnologia, o valor esperado para o faturamento da empresa será de, aproximadamente:
(A) R$665 milhões.
(B) R$927 milhões.
(C) R$465 milhões.
(D) R$147 milhões.
(E) R$314 milhões.
Resposta: O valor esperado para o faturamento da empresa será de, aproximadamente:
( ) ( )
35. (PS 2018.2) Ao construir um modelo de regressão, um analista adicionou uma variável
qualitativa que possuía 3 categorias. É correto dizer que, para representar essa variável
qualitativa, o número de variáveis “dummy” necessárias é igual a:
(A) 3.
(B) 1.
(C) 4.
(D) 5.
(E) 2.
Resposta:
O ENUNCIADO ABAIXO SERÁ UTILIZADO PELAS QUATRO PRÓXIMAS QUESTÕES.
(PS 2018.2) A direção de uma corretora de valores pediu que seu analista desenvolvesse uma
regressão que explicasse o valor total das aplicações financeiras de seus clientes (em milhares
de R$) em função da sua renda mensal declarada (em milhares de R$) e de uma variável
qualitativa que representasse seu estado civil (solteiro = 1; outros = 0). O modelo de regressão
foi calculado por uma planilha Excel, e um extrato do relatório emitido pela planilha consta a
seguir:
36. Com base nesses dados, é correto afirmar que, em média, o valor das aplicações de um
cliente solteiro é aproximadamente:
(A) R$3.700,00 maior do que o de um cliente que não seja solteiro.
(B) R$31.700,00 maior do que o de um cliente que não seja solteiro.
(C) R$10.900,00 maior do que o de um cliente que não seja solteiro.
(D) R$3.700,00 menor do que o de um cliente que não seja solteiro.
(E) R$16.100,00 maior do que o de um cliente que não seja solteiro.
Resposta: R$3.657 a mais que o não solteiro ⩭ 3.700, maior do que o de um cliente que não
seja solteiro.
37. Com base nesses dados, um acréscimo de R$1.000,00 na renda mensal declarada de um
cliente, mantidas constantes as demais variáveis, ocasionará nas suas aplicações, em média:
(A) um aumento de R$16.500,00.
(B) uma diminuição de R$27.400,00.
(C) um aumento de R$3.700,00.
(D) uma diminuição de R$20.100,00.
(E) uma diminuição de R$16.500,00.
Resposta:
38. É correto afirmar que a variabilidade do valor das aplicações realizadas por um cliente nessa
corretora é explicado pela renda mensal declarada e pelo estado civil em, aproximadamente:
(A) 11%.
(B) 74%.
(C) 10%.
(D) 92%.
(E) 96%.
Resposta:
39. Considere α = 0,05 para o teste de significância utilizado para se verificar a significância da
relação entre o valor da aplicação e a renda mensal declarada. Em face dos dados
apresentados no relatório emitido pela planilha Excel, é correto afirmar que:
(A) a relação entre o valor da aplicação e a renda declarada não é significante, pois o coeficiente
da variável RENDA, igual a 16,51376, é maior do que α = 0,05.
(B) a relação entre o valor da aplicação e a renda declarada não é significante, pois o erro
padrão da variável RENDA, igual a 2,16828, é maior do que α = 0,05.
(C) a relação entre o valor da aplicação e a renda declarada é significante, pois o valor p da
variável RENDA, igual a 0,000267, é menor do que α= 0,05.
(D) a relação entre o valor da aplicação e a renda declarada não é significante, pois o valor p da
variável RENDA, igual a 0,000267, é menor do que α = 0,05.
(E) a relação entre o valor da aplicação e a renda declarada não é significante, pois o stat t da
variável RENDA, igual a 7,616063, é maior do que α = 0,05.
Resposta: Valor -p = 0,0002 < 0,05, a relação entre o valor da aplicação e a renda declarada é
significante, pois o valor p da variável RENDA, igual a 0,000267, é menor do que α = 0,05.
40. (ENADE 2018) Com o objetivo de entender o impacto das internações causadas pela falta de
saneamento básico, um pesquisador estimou o modelo apresentado na tabela a seguir,
usando a quantidade de dias de internação de uma amostra de 7 260 pacientes do Sistema
Único de Saúde como variável explicada. As variáveis explicativas são: (i) gênero do
paciente, binária em que é 1 é utilizado para identificar as mulheres e 0 para identificar os
homens; (ii) idade do paciente em anos de vida; e (iii) motivo da internação, também binária,
em que recebe o valor 1 para identificar internações que são causadas por problemas de
saneamento básico e o valor 0 para as demais internações.
Considerando as informações apresentadas, assinale a opção correta.
(A) O coeficiente R-quadrado encontra-se abaixo de 30%, o que significa que o modelo deve ser
descartado.
(B) As internações causadas pela deficiência de saneamento básico tendem a gerar um aumento
de 1,96% nos gastos de saúde.
(C) A média de dias de internação para mulheres é estatisticamente maior que a de internação
para homens.
(D) A variável idade não é estatisticamente significativa para explicar o número de dias de
internação.
(E) O teste F mostra que as variáveis explicativas conjuntamente são estatisticamente
significativas para explicar o número de dias de internação.
Resposta: Valor -p < 0,05
TESTE DE HIPÓTESE PARA A PROPORÇÃO DE UMA POPULAÇÃO
1. (PS 2014.2) Em uma pesquisa que teve por objetivo investigar as intenções de voto no candidato A
e B para o segundo turno da eleição da Presidência da República, a margem de erro foi de 5%. Se
esse instituto desejar reduzir a margem de erro dessa pesquisa, deverá:
(A) aumentar o tamanho da amostra.
(B) aumentar o nível de confiança da pesquisa.
(C) reduzir o nível de significância da pesquisa.
(D) diminuir a proporção encontrada na amostra.
(E) aumentar a proporção encontrada na amostra.
Resposta: Maior o tamanho da amostra menor o erro.
2. (PS 2016.1) Uma pesquisa de mercado de determinado comércio varejista na cidade de
Rondonópolis-MT constatou que 25% dos 200 clientes recentemente entrevistados no centro da
cidade residem a mais de 10km do local. Supondo que foi escolhida uma amostra aleatória,
adotando um nível de confiança de 95%, podemos afirmar que o intervalo de confiança para a
percentagem real de clientes que residem a mais que 10km é aproximadamente:
(A) [0,15; 0,32].
(B) [0,12; 0,40].
(C) [0,19; 0,31].
(D)[0,18; 0,40].
(E) [0,15; 0,25].
Memória de Cálculo:
Média= 10 km
n = 200
P= 25% de N = 50/200 = 0,25
Significância=95% = Z = 1,96
Cálculo:
√
√
Resposta: O intervalo de confiança para a percentagem real de clientes que residem a mais que 10km
é aproximadamente [0,19;0,31]
3. (PS 2016.1) Uma empresa deseja estimar a percentagem dos motoristas que usam o WhatsApp
enquanto dirigem. Uma amostra de 850 motoristas acusou que 544 usam o aplicativo enquanto
dirigem. Com base nos dados disponíveis, a estimativa intervalar com 98% de confiança é:
(A) 63,40 a 63,55%.
(B) 55,16 a 72,84%.
(C) 61,40 a 66,55%.
(D) 62,70 a 64,64%.
(E) 60,16 a 67,83%.
Memória de Cálculo:
n = 850
P= 544/850=0,64
Significância=98% = Z = 2,33
Cálculo:
√
√
Resposta: A estimativa intervalar com 98% de confiança é 60,16 a 67,83%
4. (P2 2010.2) Uma pesquisa realizada com 65 alunos de uma grande universidade revelou que 10
alunos consideram insuficiente o número de livros disponíveis para consulta na biblioteca de sua
universidade. O intervalo de confiança de 90% para a proporção de alunos habitantes dessa
Universidade que consideram o número de livros como sendo suficiente é de:
(A) 0,08 a 0,23.
(B) 0,10 a 0,21.
(C) 0,72 a 0,95.
(D) 0,77 a 0,92.
(E) 0,76 a 0,93.
Memória de Cálculo:
n = 65
Complementar = 65- 10
P= 55/65 = 0,8462
Significância=90% = Z = 1,645
Cálculo:
√
√
Resposta: O número de livros como sendo suficiente é de 0,77 a 0,92
5. (PS 2008.2) Numa amostra aleatória simples de 120 domicílios, realizada num certo bairro da
cidade, observou-se que 70% possuíam instalações sanitárias inadequadas. Qual é o intervalo, de
90% de confiança, para a proporção de domicílios com instalações sanitárias inadequadas?
(A) 0,65 ≤ π ≤ 0,75.
(B) 0,23 ≤ π ≤ 0,37.
(C) 0,25 ≤ π ≤ 0,35.
(D) 0,63 ≤ π ≤ 0,77.
(E) 0,50 ≤ π ≤ 0,70
Memória de Cálculo:
n = 120
P= 84/120=0,7
Significância=90% = Z = 1,645
Cálculo:
√
√
Resposta: O interval é de 0,63 a 0,77
6. (P2 2016.1) Um clube de futebol está interessado em aumentar o número de sócio torcedores que
adquirem ingressos antecipadamente para os jogos dos atuais 25% para 50% dos sócios. Para isso,
encaminhou mensagens (SMS) para os torcedores um dia antes da partida. Para verificar os efeitos
de tal ação, coletou uma amostra aleatória de 100 torcedores e verificou que 45 torcedores
compraram os ingressos antecipadamente. Considere um nível de significância de 5%. Assinale a
alternativa que contém o intervalo de confiança de 90% para a proporção de torcedores que
compraram ingressos antecipadamente após o envio das mensagens.
(A) 𝐼𝐶 ( ; 90%) = [35,2%; 54,7%].
(B) 𝐼𝐶 ( ; 90%) = [36,8%; 53,2%].
(C) 𝐼𝐶 ( ; 90%) = [32,1%; 57,8%].
(D) 𝐼𝐶 ( ; 90%) = [29,6%; 60,3%].
(E) 𝐼𝐶 ( ; 90%) = [38,6%; 51,4%].
Memória de Cálculo:
n = 100
P= 45/100=0,45
Significância=90% = Z = 1,645
Cálculo:
𝐼𝐶 √
√
Resposta: O intervalo é de 36,8% a 53,2%.
7. (P2 2010.1) Uma pesquisa por amostragem realizada por um governo estadual revelou que 25%
dos seus servidores efetivos estão obesos. Sabendo que a amostra foi de 625 servidores e o nível
de confiança utilizada foi de 98%, o intervalo de confiança para a verdadeira proporção de
servidores obesos é:
(A) (0,2053; 0,2947)
(B) (0,2100; 0,2900)
(C) (0,2493; 0,2507)
(D) (-0,1536; 0,6536)
(E) (0,1536; 0,6536)
Memória de Cálculo:
n = 625
P= 156,25/625=0,25
Significância=98% = Z = 2,33
Cálculo:
𝐼𝐶 √
√
Resposta: O intervalo é de 0,21;0,29
8. (PS 2010.1) Até que ponto os veículos de transporte alternativos em certa cidade são seguros para
os usuários? Segundo pesquisa realizada cinco anos atrás, foi constatado que 45% dos usuários os
consideravam inseguros. Uma recente pesquisa realizada pela Companhia de Trânsito com 600
usuários informou que 354 não se sentiam seguros com a utilização desse tipo de transporte.
Considerando um nível de confiança de 98%, a estimativa do intervalo de confiança da proporção
populacional que considera esse tipo de transporte inseguro é:
(A) (0,50; 0,70)
(B) (0,54; 0,77)
(C) (0,45; 0,67)
(D) (0,52; 0,80)
(E) (0,54; 0,64)
Memória de Cálculo:
n = 600
P= 354/600=0,59
Significância=98% = Z = 2,33
Cálculo:
𝐼𝐶 √√
Resposta: O intervalo é de 0,54;0,64
9. (PS 2008.2) Uma pesquisa realizada pelo Conselho Federal de Administração em 2008, envolvendo
uma amostra de 3300 administradores registrados nos Conselhos Regionais de Administração
(CRAs), revelou que 1155 administradores possuem especialização em alguma área de
Administração. Determinando-se o intervalo de confiança de 99% para a proporção populacional,
chega-se aos resultados:
(A) ICπ = (20,06%; 24,94%).
(B) ICπ = (20,06%; 37,94%).
(C) ICπ = (25,00%; 40,00%).
(D) ICπ = (32,86%; 37,14%).
(E) ICπ = (40,06%; 50,94%).
Memória de Cálculo:
n = 3300
P= 1155/3300=0,35
Significância=99% = Z = 2,57
Cálculo:
𝐼𝐶 √
√
Resposta: O intervalo é de 32,86%;37,14%
10. (P2 2014.1) Para avaliar a proporção de alunos brancos nas universidades públicas de determinado
estado, selecionou-se uma amostra de 1000 alunos. O resultado da amostra indicou que a
proporção de brancos era de 75%. O intervalo de confiança de 99% para a proporção de brancos,
neste estado, é aproximadamente:
(A) IC (99%) = [0,7147; 0,7853]
(B) IC (99%) = [0,6147; 0,8853]
(C) IC (99%) = [0,5147; 0,9853]
(D) IC (99%) = [0,6647; 0,8553]
(E) IC (99%) = [0,7647; 0,8653]
Memória de Cálculo:
n = 1.000
P= 750/1.000=0,75
Significância=99% = Z = 2,57
Cálculo:
𝐼𝐶 √
√
Resposta: O intervalo é de 0,7147;0,7853
11. (PS 2014.1) Mulheres são maioria entre os novos empreendedores. Segundo o Sebrae, 52% dos
empresários com menos de três anos e meio de atividade são do sexo feminino. (Alessandra Pires).
Brasília – As mulheres estão comandando a abertura de novos negócios no Brasil. Dados revelados
pelo Sebrae a partir da pesquisa Global Entrepreneurship Monitor (GEM) mostram que 52% dos novos
empreendedores – aqueles com menos de três anos e meio de atividade – são as mulheres. A força
empreendedora feminina é maioria em quatro das cinco regiões brasileiras. Apenas no Nordeste elas
ainda não ultrapassaram os homens, mas estão quase lá, com aproximadamente 49% de participação
entre os novos empresários. No Brasil, a GEM é patrocinada pelo Sebrae e realizada pelo Instituto
Brasileiro de Qualidade e Produtividade (IBQP), em parceria com a Fundação Getulio Vargas (FGV).
Foram entrevistadas 10 mil pessoas de 18 a 64 anos, de todas as regiões. Entre os ouvidos pela GEM
estão desde pessoas que estão se preparando para iniciar um empreendimento até os que já estão
estabelecidos no mercado. Disponível em:
http://www.agenciasebrae.com.br/noticia/21096309/ultimasnoticias/mulheres-sao-maioria-entre-os-
novos-empreendedores/. Acesso em: mar. 2014.
Considerando um nível de significância de 5%, o que pode ser afirmado sobre o intervalo de confiança
(aproximado) da porcentagem de mulheres que comandam novos negócios?
(A) Com 5% de confiança, a verdadeira porcentagem de mulheres empreendedoras com menos de três
anos e meio de atividade está entre 51,03% e 52,97%.
(B) Com 95% de confiança, a verdadeira porcentagem de mulheres empreendedoras com menos de
três anos e meio de atividade está entre 52,2% e 53,8%.
(C) A margem de erro para este intervalo de confiança é de 0,97%.
(D) A margem de erro para este intervalo de confiança é de 0,80%.
(E) Devido à proporção 0,52 e o tamanho da amostra não atenderem às exigências para caracterização
como distribuição normal, não será possível prever o intervalo de confiança.
Memória de Cálculo:
n = 10.000
Significância=98% = Z = 1,96
Cálculo:
[ √
] [ √
]
Resposta: A margem de erro para este intervalo de confiança é de 0,97%.
http://www.agenciasebrae.com.br/noticia/21096309/ultimasnoticias/mulheres-sao-maioria-entre-os-novos-empreendedores/
http://www.agenciasebrae.com.br/noticia/21096309/ultimasnoticias/mulheres-sao-maioria-entre-os-novos-empreendedores/
12. (P2 2010.1) Em uma pesquisa de satisfação, a pré-amostra indicou que 80% dos clientes de uma
grande rede de lojas comerciais mostraram-se insatisfeitos com o serviço de entrega de suas
mercadorias. O tamanho mínimo da amostra, para estimar a proporção real de clientes insatisfeitos,
com um erro máximo de 4% e um nível de confiança de 95%, é:
(A) 4
(B) 8
(C) 16
(D) 196
(E) 385
Memória de Cálculo:
P= 80%
Significância= 95% = Z = 1,96
Cálculo:
Resposta: O tamanho da amostra é 385
13. (PS 2014.2) Segundo os dados de uma pesquisa anterior, 30% dos alunos de uma universidade
apresentam dependência em pelo menos uma disciplina. Admitindo um erro tolerável de 3% e um
nível de confiança de 95%, o tamanho da amostra para a próxima pesquisa é aproximadamente:
(A) 93.
(B) 114.
(C) 533.
(D) 896.
(E) 934.
Memória de Cálculo:
P= 30%
Significância= 5% = Z = 1,96
Cálculo:
Resposta: O tamanho da amostra é 896
14. (PS 2016.1) Deseja-se estimar a proporção de funcionários de uma empresa que acham precárias
as condições de trabalho numa determinada empresa, com margem de erro de 5% e nível de
confiança de 90%. De acordo com estudos prévios, a proporção de funcionários que não
classificavam como precárias as condições de trabalho nessa empresa era de 80%. Assim, o
tamanho mínimo de amostra para se estimar essa proporção é de:
(A) 121.
(B) 173.
(C) 200.
(D) 189.
(E) 215.
Memória de Cálculo:
P= 80%
Significância= 90% = Z = 1,645
Cálculo:
Resposta: O tamanho da amostra é 173
15. (P2 2010.2) Um deputado estadual encomendou uma pesquisa de popularidade a seu respeito
visando sua campanha eleitoral para o próximo pleito. Como resultado, recebeu as seguintes
informações:
· com 95% de certeza o deputado pode esperar uma proporção de votos entre 17,542% e 23,618%.
· o desvio padrão da proporção amostral é 1,55%.
Com base nessas informações, podemos dizer que a amostra levantada tinha:
(A) 435 eleitores.
(B) 537 eleitores.
(C) 642 eleitores.
(D) 584 eleitores.
(E) 681 eleitores.
Memória de Cálculo:
Significância= 95% = Z = 1,96
Cálculo:
Resposta: A amostra levantada tinha 681 eleitores
16. (PS 2010.1) Um processo industrial de encher latas de leite fornece, em média, 5% de latas com
volume abaixo das especificações. Extraída uma amostra de 150 latas da produção de um dia, a
probabilidade de a proporção de latas com volume abaixo das especificações estar entre 4% e 10%
é aproximadamente de:
(A) 31%
(B) 41%
(C) 51%
(D) 61%
(E) 71%
Memória de Cálculo:
Média = 5%
n = 150
4% a 10%
Cálculo:
√
√
0,2123 + 0,4974 = 0,7097 x 100 =70,97% = 71%
Resposta: A probabilidade é de aproximadamente 71%
O ENUNCIADO A SEGUIR SERÁ UTILIZADO PELAS DUAS PRÓXIMAS QUESTÕES
(PS 2016.2) O gerente financeiro de uma rede de lojas de vestuário infantil deseja verificar se as
proporções de clientes que pagam suas compras com cartão de crédito nas lojas A e B são iguais.
Para tal, mandou realizar uma pesquisa, cujo resultado foi o seguinte:
Loja A Loja B
Pagam com CC 255 246
Tamanho da amostra 300 300
17. Em face dos resultados apresentados, é correto afirmar que a estimativa agrupada para as
proporções amostrais é igual a:
(A) 0,90.
(B) 0,80.
(C) 0,835.
(D) 0,82.
(E) 0,85
Cálculo:
Resposta: A estimativa para a proporção comum é de, aproximadamente0,835
18. A estatística de teste para o referido teste de duas proporções é igual, aproximadamente, a:
(A) 1,00.
(B) 1,96.
(C) 1,645.
(D) 2,00.
(E) 2,575.
Memória de Cálculo:
n = 600
P= 0,835
Cálculo:
√
√
Resposta: A estatística de teste será de, aproximadamente 1,0
19. (P2 2017.2) Um fabricante de refrigerante, desejando saber se o refrigerante com sabor cola por ele
fabricado possuía o mesmo índice de aceitação pelos consumidores de duas cidades diferentes, A e
B, realizou um teste, cujos resultados são apresentados na tabela a seguir:
Cidade A Cidade B
Gostaram 320 395
Não gostaram 80 105
Total 400 500
É correto afirmar que a estatística de teste para a comparação dessas duas proporções é
aproximadamente igual a:
(A) Z = 0,37.
(B) Z = 1,37.
(C) Z = 1,98.
(D) Z = 0,98.
(E) Z = 2,37.
Memória de Cálculo:
n = 900
P= 0,8
Cálculo:
√
√
Resposta: A estatística de teste será de, aproximadamente 0,37
20. (P2 2010.2) Uma empresa do ramo metalúrgico fabrica peças para aplicação em tratores agrícolas.
O padrão de qualidade da empresa impõe que no máximo 20% das peças possam estar fora do
padrão do projeto. Colheu-se uma amostra de 340 peças e entre elas foram detectadas 54 fora do
padrão do projeto. Com um nível de significância de 5%, é CORRETO:
(A) rejeitar H0 e, assim, rejeitar o lote de peças por não atender às especificações.
(B) não rejeitar H0 e, assim, rejeitar o lote de peças por não atender às especificações.
(C) rejeitar H0 e, assim, aceitar o lote de peças por atender às especificações.
(D) não rejeitar H0 e, assim, aceitar o lote de peças por atender às especificações.
(E) chegar à conclusão alguma, pois não há dados suficientes para tal.
Memória de Cálculo:
n = 340
P= 54/340=0,16
Significância=95% = Z = 1,96
Cálculo:
𝐼𝐶 √
√
Resposta: É correto não rejeitar H0 este que tem padrão de qualidade da empresa (máximo 20%),
tendo atendido com no máximo 18%
21. (PS 2008.2) Um candidato a deputado estadual afirma que terá 60% dos votos dos eleitores de uma
cidade (teste bilateral). Um Instituto de Pesquisa coleta uma amostra de 300 eleitores dessa cidade,
encontrando 160 que votarão no candidato. Esse resultado mostra que:
(A) a afirmação do candidato é verdadeira, ao nível de 7,5%.
(B) a afirmação do candidato é falsa, ao nível de 1%.
(C) a afirmação do candidato é verdadeira, ao nível de 10%.
(D) a afirmação do candidato é falsa, ao nível de 5%.
(E) a afirmação do candidato é verdadeira, ao nível de 5%.
Memória de Cálculo:
n = 300
P= 160/300=0,533
60% de 300 = 180
Cálculo:
√
√
Resposta: Ou seja a um nível de significância de 5% o candidato fez uma afirmação falsa, pois o
máximo será votos de 56,2% e não 60%
22. (FGV P2 2010.1) O professor de Estatística afirma que o índice de reprovação da disciplina é de
33%. Foi coletada uma amostra aleatória de 40 alunos e observou-se que 17 foram reprovados. Ao
nível de significância de 5%, é correto dizer que a afirmação do professor:
(A) Está correta, pois ocorreu ⁄
(B) Não está correta, pois ocorreu ⁄
⁄
(C) Está correta, pois ocorreu ⁄
⁄
(D) Está correta, pois ocorreu ⁄
⁄
(E) Não está correta, pois ocorreu
Memória de Cálculo:
n = 40
P= 17/40= 0,425
Significância= 5% = Z = 1,96
Reprovação = 23 /40 = 0,575
Cálculo:
√
√
Resposta: Ou seja a um nível de significância de 5% é correto afirmar que o professor está correto
pois o nível de reprovação é aproximadamente 34%
23. (PS 2014.1) Em uma clínica de recuperação para indivíduos dependentes de álcool, foi realizado o
acompanhamento do número de pacientes que, após saída do tratamento, tiveram reincidência no
uso de bebida alcoólica. A OMS (Organização Mundial da Saúde), em seus relatórios, relata que
esse valor é de 20%. A clínica suspeitava que este valor divulgado pela OMS era menor do que os
funcionários realmente observavam em tal clínica. Para testar essa hipótese, observou-se, com
base numa amostra selecionada aleatoriamente, que 30 de 120 pacientes da clínica voltaram a ser
dependentes. Utilizando um nível de significância de 5%, o que se pode concluir com base nos
valores obtidos na clínica avaliada?
(A) Rejeita-se a H0 ao nível de significância de 5%, uma vez que a estatística do teste Z foi de 1,6693 e
o Z tabelado foi de 1,64. Nesse sentido, o resultado é consistente com o resultado divulgado pela
OMS.
(B) Não se rejeita a H0 ao nível de significância de 5%, uma vez que a estatística do teste Z foi de
1,3693 e o Z tabelado foi de 1,64. Nesse sentido, o resultado é consistente com o resultado
divulgado pela OMS.
(C) Rejeita-se H0 ao nível de significância de 5%, uma vez que a estatística do teste Z foi 3,5693 e o Z
tabelado foi de 1,64. Nesse sentido, o resultado não é consistente com o resultado divulgado pela
OMS.
(D) Rejeita-se H0 ao nível de significância de 5%, uma vez que a estatística do teste Z foi de 1,3693 e o
Z tabelado foi de 1,64. Nesse sentido, o resultado não é consistente com o resultado divulgado pela
OMS.
(E) Não se rejeita H0 ao nível de significância de 5%, uma vez que a estatística do teste Z foi de 1,3693
e o Z tabelado foi de 2,58. Nesse sentido, o resultado não é consistente com o resultado divulgado
pela OMS.
Memória de Cálculo:
n = 120
P= 30/120= 0,25
Significância= 5% = Z = 1,96
Cálculo:
√
√
Resposta: Não se rejeita a H0 ao nível de significância de 5%, uma vez que a estatística do teste Z foi
de 1,3693 e o Z tabelado foi de 1,64. Nesse sentido, o resultado é consistente com o resultado
divulgado pela OMS.
24. (P2 2008.1) Um medicamento-padrão é conhecido por ser eficiente em, aproximadamente, 80% dos
casos em que é utilizado para tratar de uma infecção. Uma nova droga se mostrou eficiente em 85
dos primeiros 100 casos testados. A superioridade da nova droga está clara a um nível de
significância de 5%?
(A) Sim, porque o Valor-P é maior do que o nível de significância do teste.
(B) Não, porque o Valor-P é menor do que o nível de confiança do teste.
(C) Não, porque, sendo o teste unilateral, o Valor-P é maior do que o nível de significância do teste.
(D) Sim, porque, sendo um teste bilateral, a metade do Valor-P é maior do que a significância do teste.
(E) Não, porque, sendo um teste bilateral, o Valor-P é menor do que o dobro do nível de significância
do teste.
Memória de Cálculo:
n = 100
P= 85/100= 0,25
Significância= 5% = Z = 1,96
Cálculo:
√
√
Resposta: A superioridade da nova droga não está clara a um nível de significância de 5% pois o valor
– p (13,75) é maior que o nível de significância, ou seja
O ENUNCIADO A SEGUIR SERÁ UTILIZADO PELAS QUATRO PRÓXIMAS QUESTÕES
(P2 2018.2) Uma cervejaria realizou uma pesquisa sobre o gosto dos consumidores por cervejas
encorpadas. Foram entrevistadas 1.500 pessoas escolhidas aleatoriamente, e, dessas, 525
declararam gostar desse tipo de cerveja.
25. Em face dos resultados obtidos na pesquisa, é correto afirmar que o estimador da proporção
populacional de consumidores que gostam de cervejas encorpadas é igual a:
(A) 0,15.
(B) 0,85.
(C) 0,35.
(D) 0,65.
(E) 0,75.
Cálculo:
P= 525/1500= 0,35
Resposta: O estimador da proporção populacional de consumidores que gostam de cervejas
encorpadas é iguala 0,35
26. Com base nesses dados, é correto afirmar que a distribuição amostral da população de
consumidores que gostam de cervejas encorpadas, a ser usada como aproximação da distribuição
binomial, é a distribuição:
(A) F.
(B) poisson.
(C) exponencial.
(D) log – normal.
(E) normal.
Resposta: Se o número de eventos de interesse (X) e o número de eventos que não são de interesse
(n – X) forem, cada um deles, pelo menos iguais a cinco, a distribuição de amostragens de uma
proporção, segue, aproximadamente, uma distribuição normal.
27. Semanas depois, a cervejaria precisou fazer uma pesquisa idêntica sobre consumidores de cervejas
maltadas. Considerando que foi usado um grau de confiança de 95% (Z = 1,96), um erro de
amostragem de 1% e uma estratégia conservadora para a proporção populacional, o tamanho da
amostra usada nessa nova pesquisa foi de:
(A) 9.604.
(B) 6.724.
(C) 97.
(D) 16.641.
(E) 10.604.
Memória de Cálculo:
n = 1500
P= 525/1500= 0,35
Significância= 5% = Z = 1,96
Cálculo:
Resposta: O tamanho da amostra usada nessa nova pesquisa foi de 9.604
28. Caso a diretoria precise testar se a proporção de consumidores que gostam de cervejas encorpadas
é de pelo menos 40%, a estatística de teste será de, aproximadamente:
(A) 5,15.
(B) 2,50.
(C) -5,28.
(D) -3,95.
(E) 0,80.
Memória de Cálculo:
n = 1500
P= 525/1500= 0,35
Cálculo:
√
√
Resposta: A estatística de teste será de, aproximadamente -3,95
O ENUNCIADO A SEGUIR SERÁ UTILIZADO PELAS TRÊS PRÓXIMAS QUESTÕES
(PS 2018.2) Um fabricante de refrigerantes realizou, nas cidades A e B, uma pesquisa de mercado
para descobrir a aceitação de seu refrigerante sabor cola. O resultado obtido foi o seguinte:
Cidade A Cidade B
Gosta 656 850
Não gosta 144 150
TOTAL 800 1000
29. Em um teste de hipóteses para comparação (igualdade) das proporções de consumidores que
gostam do refrigerante nas cidades A e B, a estimativa para a proporção comum é de,
aproximadamente:
(A) 0,63.
(B) 0,19.
(C) 0,51.
(D) 0,84.
(E) 0,37.
Cálculo:
Resposta: A estimativa para a proporção comum é de, aproximadamente 0,84
30. No caso do teste para comparação de proporções (teste de igualdade de proporções), a estatística
de teste (Z) é de, aproximadamente:
(A) 2,00.
(B) 2,93.
(C) 1,73.
(D) 0,15.
(E) 3,12.
Memória de Cálculo:
n = 1800
P= 0,84
Cálculo:
√
Resposta: A estatística de teste será de, aproximadamente 1,73
31. Se for utilizado um intervalo de confiança de 95% (Z = 1,96), então a diferença de proporções de
consumidores que gostam do refrigerante sabor cola, entre as cidades B e A, será de,
aproximadamente:
(A) 0,82 a 0,85.
(B) 0,03 a 0,6.
(C) 0,03 a 0,09.
(D) 0 a 0,06.
(E) 0,3 a 0,10.
Cálculo:
√
√
√
√
√
√
𝐼𝐶
𝐼𝐶
Resposta: Respectivamente o B é 0 e o A é 0,06
TESTES DO QUI-QUADRADO: ADERÊNCIA, INDEPENDÊNCIA E HOMOGENEIDADE
1. (P2 2016.2) Supondo que em um teste de aderência estão sendo consideradas seis
diferentes categorias, é correto afirmar que o grau de liberdade a ser considerado para a
determinação da estatística crítica é:
a. 3.
b. 4.
c. 6.
d. 2.
e. 5.
Resposta: grau de liberdade é n – 1, portanto 6-1 = 5.
2. (P2 2012.1) Na biblioteca de uma universidade, a quantidade de livros emprestados durante
os cinco dias úteis de uma determinada semana está indicada na tabela a seguir:
Dia da semana Número de livros emprestados
Segunda-feira 173
Terça-feira 180
Quarta-Feira 136
Quinta-Feira 177
Sexta-Feira 189
Esperando-se que a quantidade de livros seja igualmente distribuída entre esses cinco dias da
semana, o valor calculado do Teste da Aderência do Qui-Quadrado é:
a. 8,8360.
b. 9,2778.
c. 9,4350.
d. 9,6532.
e. 9,7661.
Cálculo:
Resposta: O valor calculado do Teste da Aderência do Qui-Quadrado é 9,7661
3. (P2 2010.1) Em uma pesquisa realizada em 2007, sobre a modalidade de transporte utilizada
para o trajeto de casa para o trabalho e vice-versa, 79,6% dos entrevistados disseram que
dirigiam sozinhos; 11,1% utilizavam carona; 5,1% utilizavam transporte público; e 4,2%
dependiam de outras modalidades de transporte. Foi perguntado recentemente a 1000
trabalhadores, selecionados aleatoriamente, a mesma coisa. A tabela a seguir apresenta o
resultado da pesquisa:
Modalidade de transporte Dirige sozinho Carona Transporte público Outra
Frequência 812 102 57 29
Ao nível de significância de 2,5%, pode-se afirmar que o padrão atual de utilização de transporte
é diferente do padrão apresentado em 2007?
a. não, pois o valor calculado 9,348 é menor que o valor crítico 11,143.
b. não, pois o valor calculado 5,782 é menor que o valor crítico 11,143.
c. não, pois o valor calculado 5,782 é menor que o valor crítico 9,348.
d. sim, pois o valor calculado 9,348 é menor que o valor crítico 11,143.
e. sim, pois o valor calculado 5,782 é menor que o valor crítico 9,348.
Cálculo:
Resposta: Não pois o valor calculado 5,782 é menor que o valor crítico 9,348.
4. (PS 2016.1) Uma cooperativa agroindustrial possui, atualmente, quatro produtos (A, B, C e D)
lançados no mercado. Cada produto tem a sua parcela de mercado. Essa cooperativa
implementou modificações nos produtos acima mencionados e, agora, o Diretor Presidente
precisa saber se a anterior distribuição das fatias de mercado pelos quatro produtos
permanece válida. Para tal, mandou realizar um teste qui-quadrado de aderência, o qual
gerou a seguinte tabela:
Produto
Frequência
Observada
Frequência
Esperada
A 25 20
B 20 15
C 25 40
D 30 25
Considerando a tabela apresentada, a estatística qui-quadrado relativa ao teste é,
aproximadamente, igual a:
a. 9,54.
b. 11,24.
c. 5,34.
d. 5,50.
e. 3,45.
Cálculo:
Resposta: A estatística qui-quadrado relativa ao teste é, aproximadamente, igual a 9,54
5. (PS 2008.2) A tabela a seguir resume a opinião de homens e mulheres quanto à instalação
de uma penitenciária de segurança máxima em uma região.
Gênero
Opinião
Concorda Não concorda
Homem 10 40
Mulher 40 70
Aplicando o teste qui-quadrado da independência, ao nível de significância de 5%, qual é o
resultado correto?
a. O qui-quadrado tabelado é igual a 4,24. Neste caso rejeita-se H0.
b. O qui-quadrado calculado é igual a 3,84. Neste caso aceita-se H0.
c. Como o qui-quadrado calculado é maior do que o tabelado, aceita-se H0 e conclui-se que há
independência entre as variáveis.
d. Como o qui-quadrado calculado é maior do que o tabelado, rejeita-se H0 e conclui-se que não
há independência entre as variáveis.
e. Como o qui-quadrado calculado é menor do que o tabelado, aceita-se H0 e conclui-se que as
variáveis são independentes.
Cálculo: Qui-quadrado calculado é > que o tabelado (8>3,841), portanto rejeito Ho
Resposta: Como o qui-quadrado calculado é maior do que o tabelado, rejeita-se H0 e conclui-se
que não há independência entre as variáveis.
6. (PS 2010.2) O gerente de recursos humanos de uma grande empresa do ramo metalúrgico
afirma que a satisfação de seus funcionários com o trabalho não tem qualquer ligação com o
grau de escolaridade dos mesmos. Uma amostra de 131 funcionários apresentou os
seguintes resultados:
Frequência observada
Satisfação trabalho
Alta Média Baixa
Anos deestudo
Superior 25 12 6
2º Grau 16 22 8
1º Grau 5 7 30
Tendo em vista tais resultados, e considerando de X²t = 46,42 e que X²cr = 9,4877, é
CORRETO:
a) Rejeita H0 ao nível de significância de 5% e concluir que o gerente está errado
b) Não rejeita H0 ao nível de significância de 5% e, então, concluir que o gerente está certo.
c) Não rejeita H0 ao nível de significância de 5% e, então, concluir que o gerente está errado.
d) Não rejeita H0 ao nível de significância de 5% e, então, mas não podemos concluir que o
gerente está certo.
e) Rejeita H0 ao nível de significância de 5% mas não podemos concluir que o gerente está
errado
Resposta: Como o qui-quadrado calculado é maior do que o tabelado, rejeita-se H0 ao nível de
significância de 5% e concluir que o gerente está errado
7. (PS 2010.1) Uma cadeia de supermercados deseja determinar se existe diferença entre
anunciar em jornal ou TV. Para isso avaliou a capacidade de o consumidor vir a se recordar
de um comercial de suas lojas após anúncio veiculado pelas duas mídias. O resultado do
estudo com 100 consumidores foi o seguinte:
Meio de comunicação
Capacidade de recordar Jornal TV Total
Recordam 20 10 30
Não recordam 10 60 70
Total 30 70 100
Ao nível de significância de 0,05, existem evidências de um efeito significativo de um meio de
comunicação sobre o outro?
a. sim, porque 2 = 27,4, enquanto o valor crítico 2 é 3,84.
b. sim, porque 2 = 27,4, enquanto o valor crítico 2 é 9,49.
c. não, porque 2 = 27,4, enquanto o valor crítico 2 é 9,49.
d. não, porque 2 = 27,4, enquanto o valor crítico 2 é 3,84.
e. sim, porque 2 = 27,4, enquanto o valor crítico 2 é 5,02.
Cálculo:
Resposta: Sabe-se que o X² é = a 27,4 pois todas as alternativas estão com este valor, portanto
o valor crítico sendo 3,84, existem evidências de um efeito significativo de um meio de
comunicação sobre o outro pois 27,4>3,84.
8. (PS 2014.2) Um professor de matemática da Faculdade Ômega insiste junto a seus
superiores (Diretores Pedagógicos) que os alunos das áreas de ciências sociais não
dominam tão bem os conteúdos de ciências exatas quanto os das áreas biológicas.
Buscando informações para embasar o pedido de aumento de carga horária em exatas para
os alunos matriculados em administração, ele propõe a aplicação de um teste de
conhecimento em matemática para os cursos de administração e odontologia, com o objetivo
de detectar o menor rendimento dos administradores. Selecionou aleatoriamente 100 alunos
dos dois cursos (50 de cada) que já tinham sido aprovados na matéria Matemática Básica.
Alunos que alcançaram a nota 8, foram considerados aprovados, os demais, reprovados.
Após correção da avaliação, foi obtida a seguinte distribuição de frequência:
Aprovação
Curso Sim Não
Administração 30 20
Odontologia 25 25
Utilizando nível de significância de 0,01, analise os dados e assinale a alternativa correta.
a. Rejeita-se H0, existe associação entre as duas variáveis em questão.
b. Aceita-se H1, não existe associação entre as duas variáveis em questão.
c. Rejeita-se H0, não existe associação entre as duas variáveis em questão.
d. Rejeita-se H0, não existe associação entre as duas variáveis em questão, existe associação
entre conhecimento em matemática básica e curso.
e. Aceita-se H0, não existe associação entre as duas variáveis em questão.
Cálculo:
Resposta: Como o qui- quadrado tabelado é maior que o qui-quadrado calculado aceita H0, não
existe associação entre as duas variáveis em questão.
9. (PS 2018.2) Em um teste de aderência, foi obtido um qui-quadrado observado = 15,25.
Considerando que, para o risco adotado, o quiquadrado crítico é igual a 5,99, pode-se afirmar
que, nesse teste de aderência, a hipótese nula:
a. será rejeitada, pois o qui-quadrado crítico é maior do que o risco.
b. não será rejeitada, pois o qui-quadrado observado é maior do que o qui-quadrado crítico.
c. não será rejeitada, pois o qui-quadrado observado não é negativo.
d. não será rejeitada, pois o qui-quadrado observado é maior do que 0,05.
e. será rejeitada, pois o qui-quadrado observado é maior do que o qui-quadrado crítico.
Resposta: Como o qui-quadrado observado é maior do que o tabelado, rejeita-se H0.
10. (P2 20182.) Um analista está trabalhando na simulação de um sistema de fila e precisa
verificar se determinada massa de dados obedece a uma distribuição exponencial. Para tal,
aplicou à massa de dados um teste qui-quadrado, a um risco de α = 0,05, tendo obtido um
qui-quadrado de teste igual a 11,45 e um qui-quadrado crítico igual a 23,68. Dessa forma, é
correto afirmar que:
a. rejeita-se H0, isto é, os dados se ajustam a uma distribuição exponencial, uma vez que o qui-
quadrado de teste é maior que o α = 0,05.
b. não se pode rejeitar H0, isto é, os dados não se ajustam a uma distribuição exponencial, uma
vez que o qui-quadrado de teste é maior que o risco α = 0,05.
c. não se pode rejeitar H0, isto é, os dados se ajustam a uma distribuição exponencial, uma vez
que o qui-quadrado de teste é menor que o qui-quadrado crítico.
d. rejeita-se H0, isto é, os dados se ajustam a uma distribuição exponencial, uma vez que o qui-
quadrado crítico é maior que o qui-quadrado para α = 0,12.
e. rejeita-se H0, isto é, os dados se ajustam a uma distribuição exponencial, uma vez que o qui-
quadrado de teste é menor que o qui-quadrado crítico.
Resposta: Como o qui-quadrado crítico é maior do que o teste, não rejeita-se H0, isto é, os
dados se ajustam a uma distribuição exponencial, uma vez que o qui-quadrado de teste é menor
que o qui-quadrado crítico.