Gabarito aula 2 de revisão

Estatística I

•

USP-SP

1

0

1

0

Estefan

21/03/2018

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 9 páginas

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Estatística I

57.686 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

MAE116 – Noções de Estatística 
Grupo B - 2º semestre de 2012 
Gabarito – Lista de Revisão para P2 – Classe 
Página 1 de 9 
http://www.ime.usp.br/~mae116 
 
 
Exercício 1 
 
Numa pesquisa de mercado deseja-se estimar a proporção de pessoas que compram o 
detergente Limpa-Bem. 
 
(a) Qual deve ser o tamanho da amostra, para que o erro de sua estimativa seja no 
máximo 0,04 com um nível de confiança de 0,92? 
 
 Como 
)1(
2
pp
Z
n −××





=
ε
γ
, 
 
 temos que: 
47925,0
04,0
75,125,0
04,0
22
92,0
=×





=×





=
Z
n
 
 
(b) A direção da Limpa-Bem acredita que a proporção p não seja superior a 30%. Com essa 
informação seria possível considerar em (a) uma amostra de tamanho menor? Se sim, 
de quanto? Se não, por quê? 
 
 Se 30,0≤p , então 
 
402)3,01(3,0
04,0
75,1 2
≅−××





=n . 
 
(c) Em um grupo de 400 pessoas consultadas verificou-se que 78 delas compraram o 
detergente. Calcule a estimativa pontual da proporção de pessoas que compram o 
detergente. 
A estimativa pontual para p é 195,0
400
78
ˆ ===
n
xp , ou seja, a proporção de pessoas 
que compram o detergente Limpa-Bem é estimada em 0,195. 
 
(d) Construa um intervalo de confiança para a proporção calculada no item anterior com 
coeficiente de confiança igual a 0,94. Qual é o comprimento do intervalo? 
 
Um intervalo de 94% de confiança para p é dado por [ ]ε±= ppIC ˆ)94,0;( , em que 
037,0
400
)195,01(195,088,1)ˆ1(ˆ ≈−××=−××=
n
ppZγε
 
(erro amostral da estimativa). 
 
[ ] ]232,0;158,0[037,0195,0)94,0;( =±=pIC . 
MAE116 – Noções de Estatística 
Grupo B - 2º semestre de 2012 
Gabarito – Lista de Revisão para P2 – Classe 
Página 2 de 9 
http://www.ime.usp.br/~mae116 
 
 
 
O comprimento do intervalo é dado por 
 
074,0037,022)ˆ(ˆ =×=×=−−+ εεε pp 
 
Interpretação do IC com γ=0,94 
 
Se sortearmos um grande número de amostras de tamanho n=400 e construirmos os 
respectivos intervalos de confiança com coeficiente de confiança de 94% espera-se que 
aproximadamente, 94% destes intervalos contenham o verdadeiro valor de p . 
 
 
Exercício 2 
 
Um criador de coelhos perde 10% de seus animais na primeira semana do período de cria. 
Com a finalidade de diminuir esta incidência, está utilizando atualmente uma nova ração 
vitaminada que, segundo seu fabricante, diminui o índice de mortalidade. Um grupo de 30 
animais foi alimentado com esta ração para verificar a afirmação do fabricante. 
 
a) Formule o problema como um teste de hipóteses. Qual é o significado do erro do tipo I e 
do erro do tipo II para o problema? 
 
Queremos testar se com a nova ração o criador perde animais numa proporção menor de 
acordo com a afirmação do fabricante. 
p = proporção de coelhos mortos na primeira semana do período de cria. 
H: p = 0,1 
A: p < 0,1 
 
Erro Tipo I: Rejeitar H quando H é verdadeira significa, neste problema em particular, 
afirmar que a ração diminui a mortalidade quando na verdade a ração não 
diminui a mortalidade 
 
Erro Tipo II: Não rejeitar H quando H é falsa significa, neste problema em particular, 
afirmar que a ração não diminui a mortalidade quando na verdade ela diminui a 
mortalidade. 
 
b) Construa a região crítica do teste ao nível de significância de 5%. 
 
Seja X: número de coelhos mortos dentre os 30 animais alimentados com a nova ração. 
Se H é verdadeira então a proporção de coelhos mortos é 0,1 e �~��30; 0,1
. 
Temos que determinar o valor de a tal que 
 
MAE116 – Noções de Estatística 
Grupo B - 2º semestre de 2012 
Gabarito – Lista de Revisão para P2 – Classe 
Página 3 de 9 
http://www.ime.usp.br/~mae116 
 
 
0,05 � 
����� �
 � 
��������� �|� ����������
 � 
�� � ��|� ����������
 � 
�� � �| 
� 0,1
 
 
Cumulative Distribution Function 
 
 
Binomial with n = 30 and p = 0,1 
 
 x P( X <= x ) 
 0 0,04239 
 1 0,18370 
 2 0,41135 
 3 0,64744 
 4 0,82451 
 5 0,92681 
 6 0,97417 
 7 0,99222 
 8 0,99798 
 9 0,99955 
10 0,99991 
11 0,99998 
12 1,00000 
Temos que 
�� � 0
 � 0,04239 e 
�� � 0
 $ 
�� � 1
 � 0,18370. 
 
Portanto, RC = {X=0}, que garante um nível de significância menor que 5% (( � 4,24%
. 
 
c) Se o criador de coelhos perde 1 coelho dentre os 30 animais alimentados com a nova 
ração, com base na região crítica do item b, o criador deve concordar com a afirmação 
do fabricante? 
 
Se X=1 então não pertence à região crítica e não há evidência para rejeitar a hipótese nula, 
isto é, se perder um animal conclui-se que a ração não diminui a perda de animais e o 
criador deve discordar da afirmação do fabricante. 
 
d) Se o criador resolve verificar a afirmação do fabricante com um grupo de 230 animais 
qual seria a região crítica ao nível de significância de 5%? 
 
Seja X: número de coelhos mortos dentre os 230 animais alimentados com a nova ração. 
Se H é verdadeira então a proporção de coelhos mortos é 0,1 e �~��230; 0,1
. 
Sendo �~��230; 0,1
, então: 
 
�*�+ � , � 230 - 0,1 � 23 e 
MAE116 – Noções de Estatística 
Grupo B - 2º semestre de 2012 
Gabarito – Lista de Revisão para P2 – Classe 
Página 4 de 9 
http://www.ime.usp.br/~mae116 
 
.��*�+ � , �1 / 
 � 230 - 0,1 - �1 / 0,1
 � 20,7. 
 
Logo, a distribuição de X é aproximadamente igual à distribuição de probabilidade de Y, em 
que 0 ~ 1�23; 20,7
. 
Temos que determinar o valor de k tal que 
 
0,05 � 
����� �
 � 
��������� �|� ����������
 � 
�� � ��|� ����������
� 
�� � 2| � 0,1
 3 
�0 � 2
 � 
 45 � 2 / 23√20,7 7⇒8 4
2 / 23
√20,7 7 � 8�9
 � 0,05 
A é tal que A(a)=1-0,05=0,95 e z=-a. 
Pela tabela da distribuição normal, obtemos que a=1,64, então 
 :;<=>√=?,@A � /1,64 ⇒ k � 15,5 
Portanto, �� � D� � 15E, que garante um nível de significância menor que 5% 
 
 
e) Se o criador de coelhos perde 13 coelhos dentre os 230 animais alimentados com a nova 
ração, com base na região crítica do item d, o criador deve concordar com a afirmação 
do fabricante? 
 
Como X=13 pertence à Região Crítica então há evidência para se rejeitar a 
hipótese nula, isto é, concluímos que há evidência para afirmar que a proporção 
de perda de animais, que usam a nova ração, na primeira semana do período de 
cria é menor que 10%. 
 
 
Exercício 3 
 
Sabe-se que 70% dos pacientes submetidos a certa cirurgia, através de uma técnica 
tradicional, não apresentam um problema pós-operatório. Uma equipe médica garante ter 
desenvolvido uma nova técnica que elimina esse problema em mais de 70% dos casos. Um 
hospital resolve pôr à prova a afirmação da equipe, aplicando a nova técnica a alguns 
pacientes. 
 
(a) Formule este problema como um problema de testes de hipótese (quem é p?). 
 
Sendo p a proporção de pacientes que não apresentam problema pós-operatório quando 
submetidos à nova técnica, podemos formular o teste da seguinte forma: 
 
7,0:
7,0:
>
=
pA
pH
 
 
MAE116 – Noções de Estatística 
Grupo B - 2º semestre de 2012 
Gabarito – Lista de Revisão para P2 – Classe 
Página 5 de 9 
http://www.ime.usp.br/~mae116 
 
(c) Se entre 19 pacientes submetidos à nova técnica 17 não apresentaram o problema, qual 
o nível descritivo e qual a decisão a ser tomada, adotando α=3% ? 
 
Seja X: número de pacientes que não apresentam problema pós-operatório dentre 19 
pacientes submetidos à nova técnica. 
 
Assim, )7,0;19(~ bX . Então, o nível descritivo do teste é dado por: 
 
0462,00011,00092,00358,0
)19()18()17()17()7,0|17(
=++=
=+=+==≥==≥= XPXPXPXPpXPIP
 
 
Portanto, como o nível descritivo é maior que o nível de significânciado teste (0,03) 
não rejeitamos a hipótese nula, podemos afirmar ao nível de 3%, que esta nova técnica 
não reduz a incidência de problema pós-operatório. 
 
Binomial with n = 19 and p = 0,7 
 
 x P( X = x ) 
 0 0,000000 
 1 0,000000 
 2 0,000000 
 3 0,000001 
 4 0,000013 
 5 0,000093 
 6 0,000509 
 7 0,002205 
 8 0,007719 
 9 0,022012 
10 0,051362 
11 0,098054 
12 0,152529 
13 0,191639 
14 0,191639 
15 0,149053 
16 0,086947 
17 0,035802 
18 0,009282 
19 0,001140 
 
(b) Se dentre os 100 pacientes submetidos à nova técnica 21 apresentarem o problema, 
qual a decisão a ser tomada, α=3% ? 
 
Neste caso, iremos utilizar a aproximação da distribuição binomial pela normal, dado 
que o tamanho da amostra é grande. Então, temos que 
 
21)1(][
707,0100][
=−××=
=×=×=
ppnXVar
pnXE
 
 
MAE116 – Noções de Estatística 
Grupo B - 2º semestre de 2012 
Gabarito – Lista de Revisão para P2 – Classe 
Página 6 de 9 
http://www.ime.usp.br/~mae116 
 
Assim, X tem distribuição aproximadamente normal de média 70 e variância 21. Como 
21 pacientes apresentam o problema pós-operatório, 79 não apresentaram. Assim, o 
nível descritivo é dado por: 
025,09752,01
)964,1(1)964,1()
21
7079()79()70,0|79(
=−
−=≥=−≥=≥==≥= AZPZPXPpXPIP
 
 
 
Portanto, como o nível descritivo é menor que o nível de significância do teste (0,03), 
podemos afirmar, ao nível de 3%, que a nova técnica reduz a incidência de problema 
pós-operatório. 
 
 
Exercício 4 
 
Um modelo de automóvel é vendido em quatro versões: 1: SX, 2: LX, 3: GLX, 4: GTX. Foi 
feita uma campanha publicitária para melhorar as vendas das versões 3 (GLX) e 4 (GTX). 
Posteriormente, foi verificada a escolha das versões em 500 vendas escolhidas ao acaso. Os 
resultados foram: 
 
 
Versão 
1. SX 2. LX 3. GLX 4. GTX 
Unidades vendidas 210 125 105 60 
 
De acordo com o fabricante, a participação de cada versão nas vendas deste modelo até a 
realização da campanha era 40% de SX, 30% de LX e 20% de GLX. 
(a) Se a campanha não mudou as proporções de vendas das diferentes versões, quantas 
unidades de cada versão esperaríamos ter vendido? 
(b) Você diria, através de um teste de hipótese estatístico adequado, a um nível de 
significância de 5%, que os resultados deste experimento indicam que, após a 
campanha, houve mudanças na participação de cada versão nas vendas deste modelo? 
Especifique o tipo de teste que você está utilizando, as hipóteses e conclua utilizando o 
nível descritivo. 
 
Resposta 
 
(a) 
 
Versão 
1. SX 2. LX 3. GLX 4. GTX 
Participação 
Valores esperados 
40% 
200 
30% 
150 
20% 
100 
10% 
50 
 
MAE116 – Noções de Estatística 
Grupo B - 2º semestre de 2012 
Gabarito – Lista de Revisão para P2 – Classe 
Página 7 de 9 
http://www.ime.usp.br/~mae116 
 
 
 
(b) 
Usaremos o teste de aderência para verificar se a distribuição das versões do modelo não 
sofreu alteração após a campanha publicitária, ou seja, testaremos as hipóteses 
 
H: A campanha publicitária não alterou a preferência pelas versões do modelo de 
automóvel 
A: A campanha publicitária alterou a preferência pelas versões do modelo de automóvel 
 
As hipóteses estatísticas correspondentes são: 
H: pSX=0,4; pLX=0,3; pGLX=0,2 e pGTX=0,1 
A: Ao menos uma das igualdades não se verifica. 
 
A tabela seguinte apresenta os valores observados e os valores esperados, se H é 
verdadeira. 
 
 
 
 
Versão Oi Ei=500 × poi 
SX 210 200 
LX 125 150 
GLX 105 100 
GTX 60 50 
Total 500 500 
 
O valor observado da estatística do teste de aderência, com k=4 é: 
 
50
)5060(
100
)100105(
150
)150125(
200
)200210()( 22224
1
2
2 −+
−
+
−
+
−
=
−
=∑
=i i
ii
obs E
EOχ 
 92,600,225,017,450,0 =+++= 
 
Utilizando a distribuição de qui-quadrado com q=k-1=3 graus de liberdade, podemos calcu-
lar o nível descritivo P 
 
P = P( ≥23χ 6,92) = 0,0745. 
 
MAE116 – Noções de Estatística 
Grupo B - 2º semestre de 2012 
Gabarito – Lista de Revisão para P2 – Classe 
Página 8 de 9 
http://www.ime.usp.br/~mae116 
 
Adotando nível de significância α=5%, temos P=0,0745 > α=0,05. Portanto, não rejeitamos a 
hipótese nula H e concluímos que, através dos resultados do experimento, não há 
evidências suficientes para afirmarmos que após a campanha publicitária tenha havido 
mudanças na preferência pelas versões do modelo do automóvel. 
 
Exercício 5 
Uma pesquisa deseja verificar se existe associação entre consumo de combustível e desem-
penho de carro. Cento e vinte e cinco proprietários de certa marca de automóvel foram en-
trevistados acerca do desempenho e do consumo de combustível de seus carros. O resulta-
do da pesquisa de opiniões é resumido na seguinte tabela: 
 
Consumo de 
combustível 
Desempenho do carro 
Total 
Mau Regular Bom 
Alto 29 27 42 98 
Baixo 4 6 17 27 
Total 33 33 59 125 
 
 
 
 
 
Através de um teste de hipóteses, verifique se é possível concluir que consumo de combus-
tível e desempenho do carro estão associados, a um nível de significância de 5%. (Especifi-
que as hipóteses adequadas, o número esperado de proprietários em cada casela se variá-
veis não estão associadas e conclua com base no nível descritivo). 
 
Resposta 
Para verificar se o desempenho do carro depende do consumo de combustível, ou vice-
versa, realizamos o teste de independência, para as hipóteses 
 
H: Desempenho do carro e consumo de combustível são independentes 
A: Desempenho do carro depende do consumo de combustível. 
 
A estatística do teste de independência é dada por: 
 
 
 
 sendo a frequência esperada na casela (i, j), e é a freqüência observada na casela 
(i,j). 
Os valores são calculados sob a hipótese de independência H, sendo 
 
MAE116 – Noções de Estatística 
Grupo B - 2º semestre de 2012 
Gabarito – Lista de Revisão para P2 – Classe 
Página 9 de 9 
http://www.ime.usp.br/~mae116 
 
Sendo 
: número esperado de automóveis com desempenho mau e consumo alto de combustí-
vel 
 
 
 
Para o cálculo da estatística , temos os seguintes resultados: 
 
Consumo de 
combustível 
Desempenho do carro 
Total 
Mau Regular Bom 
Alto 29(25,87) 27(25,87) 42(42,26) 98 
Baixo 4(7,13) 6(7,13) 17(12,74) 27 
Total 33 33 59 125 
 
Temos que 
Como r = 2 categorias da variável consumo e s = 3 categorias da variável desempenho, te-
mos q = (2 – 1) x (3 – 1) = 2 graus de liberdade. 
 
 
 
Assim, usando a distribuição de qui-quadrado com q=2 graus de liberdade, temos: 
 
 
 
 
Considerando nível de significância , então , e, portanto, não rejeita-
mos H, ou seja, concluímos que as variáveis consumo de combustível e desempenho do car-
ro não são associados.