Baixe o app para aproveitar ainda mais
Prévia do material em texto
MAE116 – Noções de Estatística Grupo B - 2º semestre de 2012 Gabarito – Lista de Revisão para P2 – Classe Página 1 de 9 http://www.ime.usp.br/~mae116 Exercício 1 Numa pesquisa de mercado deseja-se estimar a proporção de pessoas que compram o detergente Limpa-Bem. (a) Qual deve ser o tamanho da amostra, para que o erro de sua estimativa seja no máximo 0,04 com um nível de confiança de 0,92? Como )1( 2 pp Z n −×× = ε γ , temos que: 47925,0 04,0 75,125,0 04,0 22 92,0 =× =× = Z n (b) A direção da Limpa-Bem acredita que a proporção p não seja superior a 30%. Com essa informação seria possível considerar em (a) uma amostra de tamanho menor? Se sim, de quanto? Se não, por quê? Se 30,0≤p , então 402)3,01(3,0 04,0 75,1 2 ≅−×× =n . (c) Em um grupo de 400 pessoas consultadas verificou-se que 78 delas compraram o detergente. Calcule a estimativa pontual da proporção de pessoas que compram o detergente. A estimativa pontual para p é 195,0 400 78 ˆ === n xp , ou seja, a proporção de pessoas que compram o detergente Limpa-Bem é estimada em 0,195. (d) Construa um intervalo de confiança para a proporção calculada no item anterior com coeficiente de confiança igual a 0,94. Qual é o comprimento do intervalo? Um intervalo de 94% de confiança para p é dado por [ ]ε±= ppIC ˆ)94,0;( , em que 037,0 400 )195,01(195,088,1)ˆ1(ˆ ≈−××=−××= n ppZγε (erro amostral da estimativa). [ ] ]232,0;158,0[037,0195,0)94,0;( =±=pIC . MAE116 – Noções de Estatística Grupo B - 2º semestre de 2012 Gabarito – Lista de Revisão para P2 – Classe Página 2 de 9 http://www.ime.usp.br/~mae116 O comprimento do intervalo é dado por 074,0037,022)ˆ(ˆ =×=×=−−+ εεε pp Interpretação do IC com γ=0,94 Se sortearmos um grande número de amostras de tamanho n=400 e construirmos os respectivos intervalos de confiança com coeficiente de confiança de 94% espera-se que aproximadamente, 94% destes intervalos contenham o verdadeiro valor de p . Exercício 2 Um criador de coelhos perde 10% de seus animais na primeira semana do período de cria. Com a finalidade de diminuir esta incidência, está utilizando atualmente uma nova ração vitaminada que, segundo seu fabricante, diminui o índice de mortalidade. Um grupo de 30 animais foi alimentado com esta ração para verificar a afirmação do fabricante. a) Formule o problema como um teste de hipóteses. Qual é o significado do erro do tipo I e do erro do tipo II para o problema? Queremos testar se com a nova ração o criador perde animais numa proporção menor de acordo com a afirmação do fabricante. p = proporção de coelhos mortos na primeira semana do período de cria. H: p = 0,1 A: p < 0,1 Erro Tipo I: Rejeitar H quando H é verdadeira significa, neste problema em particular, afirmar que a ração diminui a mortalidade quando na verdade a ração não diminui a mortalidade Erro Tipo II: Não rejeitar H quando H é falsa significa, neste problema em particular, afirmar que a ração não diminui a mortalidade quando na verdade ela diminui a mortalidade. b) Construa a região crítica do teste ao nível de significância de 5%. Seja X: número de coelhos mortos dentre os 30 animais alimentados com a nova ração. Se H é verdadeira então a proporção de coelhos mortos é 0,1 e �~��30; 0,1 . Temos que determinar o valor de a tal que MAE116 – Noções de Estatística Grupo B - 2º semestre de 2012 Gabarito – Lista de Revisão para P2 – Classe Página 3 de 9 http://www.ime.usp.br/~mae116 0,05 � ����� � � ��������� �|� ���������� � �� � ��|� ���������� � �� � �| � 0,1 Cumulative Distribution Function Binomial with n = 30 and p = 0,1 x P( X <= x ) 0 0,04239 1 0,18370 2 0,41135 3 0,64744 4 0,82451 5 0,92681 6 0,97417 7 0,99222 8 0,99798 9 0,99955 10 0,99991 11 0,99998 12 1,00000 Temos que �� � 0 � 0,04239 e �� � 0 $ �� � 1 � 0,18370. Portanto, RC = {X=0}, que garante um nível de significância menor que 5% (( � 4,24% . c) Se o criador de coelhos perde 1 coelho dentre os 30 animais alimentados com a nova ração, com base na região crítica do item b, o criador deve concordar com a afirmação do fabricante? Se X=1 então não pertence à região crítica e não há evidência para rejeitar a hipótese nula, isto é, se perder um animal conclui-se que a ração não diminui a perda de animais e o criador deve discordar da afirmação do fabricante. d) Se o criador resolve verificar a afirmação do fabricante com um grupo de 230 animais qual seria a região crítica ao nível de significância de 5%? Seja X: número de coelhos mortos dentre os 230 animais alimentados com a nova ração. Se H é verdadeira então a proporção de coelhos mortos é 0,1 e �~��230; 0,1 . Sendo �~��230; 0,1 , então: �*�+ � , � 230 - 0,1 � 23 e MAE116 – Noções de Estatística Grupo B - 2º semestre de 2012 Gabarito – Lista de Revisão para P2 – Classe Página 4 de 9 http://www.ime.usp.br/~mae116 .��*�+ � , �1 / � 230 - 0,1 - �1 / 0,1 � 20,7. Logo, a distribuição de X é aproximadamente igual à distribuição de probabilidade de Y, em que 0 ~ 1�23; 20,7 . Temos que determinar o valor de k tal que 0,05 � ����� � � ��������� �|� ���������� � �� � ��|� ���������� � �� � 2| � 0,1 3 �0 � 2 � 45 � 2 / 23√20,7 7⇒8 4 2 / 23 √20,7 7 � 8�9 � 0,05 A é tal que A(a)=1-0,05=0,95 e z=-a. Pela tabela da distribuição normal, obtemos que a=1,64, então :;<=>√=?,@A � /1,64 ⇒ k � 15,5 Portanto, �� � D� � 15E, que garante um nível de significância menor que 5% e) Se o criador de coelhos perde 13 coelhos dentre os 230 animais alimentados com a nova ração, com base na região crítica do item d, o criador deve concordar com a afirmação do fabricante? Como X=13 pertence à Região Crítica então há evidência para se rejeitar a hipótese nula, isto é, concluímos que há evidência para afirmar que a proporção de perda de animais, que usam a nova ração, na primeira semana do período de cria é menor que 10%. Exercício 3 Sabe-se que 70% dos pacientes submetidos a certa cirurgia, através de uma técnica tradicional, não apresentam um problema pós-operatório. Uma equipe médica garante ter desenvolvido uma nova técnica que elimina esse problema em mais de 70% dos casos. Um hospital resolve pôr à prova a afirmação da equipe, aplicando a nova técnica a alguns pacientes. (a) Formule este problema como um problema de testes de hipótese (quem é p?). Sendo p a proporção de pacientes que não apresentam problema pós-operatório quando submetidos à nova técnica, podemos formular o teste da seguinte forma: 7,0: 7,0: > = pA pH MAE116 – Noções de Estatística Grupo B - 2º semestre de 2012 Gabarito – Lista de Revisão para P2 – Classe Página 5 de 9 http://www.ime.usp.br/~mae116 (c) Se entre 19 pacientes submetidos à nova técnica 17 não apresentaram o problema, qual o nível descritivo e qual a decisão a ser tomada, adotando α=3% ? Seja X: número de pacientes que não apresentam problema pós-operatório dentre 19 pacientes submetidos à nova técnica. Assim, )7,0;19(~ bX . Então, o nível descritivo do teste é dado por: 0462,00011,00092,00358,0 )19()18()17()17()7,0|17( =++= =+=+==≥==≥= XPXPXPXPpXPIP Portanto, como o nível descritivo é maior que o nível de significânciado teste (0,03) não rejeitamos a hipótese nula, podemos afirmar ao nível de 3%, que esta nova técnica não reduz a incidência de problema pós-operatório. Binomial with n = 19 and p = 0,7 x P( X = x ) 0 0,000000 1 0,000000 2 0,000000 3 0,000001 4 0,000013 5 0,000093 6 0,000509 7 0,002205 8 0,007719 9 0,022012 10 0,051362 11 0,098054 12 0,152529 13 0,191639 14 0,191639 15 0,149053 16 0,086947 17 0,035802 18 0,009282 19 0,001140 (b) Se dentre os 100 pacientes submetidos à nova técnica 21 apresentarem o problema, qual a decisão a ser tomada, α=3% ? Neste caso, iremos utilizar a aproximação da distribuição binomial pela normal, dado que o tamanho da amostra é grande. Então, temos que 21)1(][ 707,0100][ =−××= =×=×= ppnXVar pnXE MAE116 – Noções de Estatística Grupo B - 2º semestre de 2012 Gabarito – Lista de Revisão para P2 – Classe Página 6 de 9 http://www.ime.usp.br/~mae116 Assim, X tem distribuição aproximadamente normal de média 70 e variância 21. Como 21 pacientes apresentam o problema pós-operatório, 79 não apresentaram. Assim, o nível descritivo é dado por: 025,09752,01 )964,1(1)964,1() 21 7079()79()70,0|79( =− −=≥=−≥=≥==≥= AZPZPXPpXPIP Portanto, como o nível descritivo é menor que o nível de significância do teste (0,03), podemos afirmar, ao nível de 3%, que a nova técnica reduz a incidência de problema pós-operatório. Exercício 4 Um modelo de automóvel é vendido em quatro versões: 1: SX, 2: LX, 3: GLX, 4: GTX. Foi feita uma campanha publicitária para melhorar as vendas das versões 3 (GLX) e 4 (GTX). Posteriormente, foi verificada a escolha das versões em 500 vendas escolhidas ao acaso. Os resultados foram: Versão 1. SX 2. LX 3. GLX 4. GTX Unidades vendidas 210 125 105 60 De acordo com o fabricante, a participação de cada versão nas vendas deste modelo até a realização da campanha era 40% de SX, 30% de LX e 20% de GLX. (a) Se a campanha não mudou as proporções de vendas das diferentes versões, quantas unidades de cada versão esperaríamos ter vendido? (b) Você diria, através de um teste de hipótese estatístico adequado, a um nível de significância de 5%, que os resultados deste experimento indicam que, após a campanha, houve mudanças na participação de cada versão nas vendas deste modelo? Especifique o tipo de teste que você está utilizando, as hipóteses e conclua utilizando o nível descritivo. Resposta (a) Versão 1. SX 2. LX 3. GLX 4. GTX Participação Valores esperados 40% 200 30% 150 20% 100 10% 50 MAE116 – Noções de Estatística Grupo B - 2º semestre de 2012 Gabarito – Lista de Revisão para P2 – Classe Página 7 de 9 http://www.ime.usp.br/~mae116 (b) Usaremos o teste de aderência para verificar se a distribuição das versões do modelo não sofreu alteração após a campanha publicitária, ou seja, testaremos as hipóteses H: A campanha publicitária não alterou a preferência pelas versões do modelo de automóvel A: A campanha publicitária alterou a preferência pelas versões do modelo de automóvel As hipóteses estatísticas correspondentes são: H: pSX=0,4; pLX=0,3; pGLX=0,2 e pGTX=0,1 A: Ao menos uma das igualdades não se verifica. A tabela seguinte apresenta os valores observados e os valores esperados, se H é verdadeira. Versão Oi Ei=500 × poi SX 210 200 LX 125 150 GLX 105 100 GTX 60 50 Total 500 500 O valor observado da estatística do teste de aderência, com k=4 é: 50 )5060( 100 )100105( 150 )150125( 200 )200210()( 22224 1 2 2 −+ − + − + − = − =∑ =i i ii obs E EOχ 92,600,225,017,450,0 =+++= Utilizando a distribuição de qui-quadrado com q=k-1=3 graus de liberdade, podemos calcu- lar o nível descritivo P P = P( ≥23χ 6,92) = 0,0745. MAE116 – Noções de Estatística Grupo B - 2º semestre de 2012 Gabarito – Lista de Revisão para P2 – Classe Página 8 de 9 http://www.ime.usp.br/~mae116 Adotando nível de significância α=5%, temos P=0,0745 > α=0,05. Portanto, não rejeitamos a hipótese nula H e concluímos que, através dos resultados do experimento, não há evidências suficientes para afirmarmos que após a campanha publicitária tenha havido mudanças na preferência pelas versões do modelo do automóvel. Exercício 5 Uma pesquisa deseja verificar se existe associação entre consumo de combustível e desem- penho de carro. Cento e vinte e cinco proprietários de certa marca de automóvel foram en- trevistados acerca do desempenho e do consumo de combustível de seus carros. O resulta- do da pesquisa de opiniões é resumido na seguinte tabela: Consumo de combustível Desempenho do carro Total Mau Regular Bom Alto 29 27 42 98 Baixo 4 6 17 27 Total 33 33 59 125 Através de um teste de hipóteses, verifique se é possível concluir que consumo de combus- tível e desempenho do carro estão associados, a um nível de significância de 5%. (Especifi- que as hipóteses adequadas, o número esperado de proprietários em cada casela se variá- veis não estão associadas e conclua com base no nível descritivo). Resposta Para verificar se o desempenho do carro depende do consumo de combustível, ou vice- versa, realizamos o teste de independência, para as hipóteses H: Desempenho do carro e consumo de combustível são independentes A: Desempenho do carro depende do consumo de combustível. A estatística do teste de independência é dada por: sendo a frequência esperada na casela (i, j), e é a freqüência observada na casela (i,j). Os valores são calculados sob a hipótese de independência H, sendo MAE116 – Noções de Estatística Grupo B - 2º semestre de 2012 Gabarito – Lista de Revisão para P2 – Classe Página 9 de 9 http://www.ime.usp.br/~mae116 Sendo : número esperado de automóveis com desempenho mau e consumo alto de combustí- vel Para o cálculo da estatística , temos os seguintes resultados: Consumo de combustível Desempenho do carro Total Mau Regular Bom Alto 29(25,87) 27(25,87) 42(42,26) 98 Baixo 4(7,13) 6(7,13) 17(12,74) 27 Total 33 33 59 125 Temos que Como r = 2 categorias da variável consumo e s = 3 categorias da variável desempenho, te- mos q = (2 – 1) x (3 – 1) = 2 graus de liberdade. Assim, usando a distribuição de qui-quadrado com q=2 graus de liberdade, temos: Considerando nível de significância , então , e, portanto, não rejeita- mos H, ou seja, concluímos que as variáveis consumo de combustível e desempenho do car- ro não são associados.
Compartilhar