Prévia do material em texto
1 Lista de Exercícios – Estimação – ICT-UNIFESP Profa Dra. Luzia Pedroso de Oliveira Distribuição Amostral 1. (Bussab e Morettin) Obtenha a distribuição das possíveis amostras de tamanho 2 que podem ser selecionadas com reposição da população {1, 3, 5, 5, 7}, ou seja, a distribuição conjunta da variável bidimensional (𝑋1, 𝑋2). Obtenha também as distribuições amostrais das estatísticas �̅� = 𝑋1+𝑋22 , 𝑠2 = ∑ (𝑋𝑖−�̅�)22𝑖=1𝑛−1 e �̂�2 = ∑ (𝑋𝑖−�̅�)22𝑖=1 𝑛 . 2. Seja 𝑋1, 𝑋2, … , 𝑋𝑛 uma amostra aleatória com média µ e variância 2. Qual é a distribuição de �̅� para amostras grandes? Explique. 3. (Montgomery; Runger) Um fabricante de dispositivos semicondutores retira uma amostra aleatória de 100 chips e os testa, classificando cada chip em conforme ou não-conforme. Seja 𝑋𝑖 = 1, se o chip for não-conforme e X𝑖 = 0, se o chip for conforme e 𝑃(𝑋𝑖 = 1) = 𝑝. A proporção de chips não conformes na amostra é �̂� = 𝑋1 + 𝑋2 +⋯+ 𝑋100100 Qual é a distribuição amostral da variável aleatória �̂�? Estimadores Pontuais e Propriedades dos Estimadores 4. (Montgomery; Runger) Suponha que 𝜃1 𝑒 𝜃2 sejam estimadores não-tendenciosos do parâmetro 𝜃. Sabemos que 𝑉(𝜃1) = 10 𝑒 𝑉(𝜃2) = 4. Qual é o melhor estimador de 𝜃? Justifique. 5. (Montgomery; Runger) Suponha que temos uma amostra aleatória de tamanho 2𝑛, proveniente de uma população denotada por 𝑋, e 𝐸(𝑋) = µ e 𝑉(𝑋) = 𝜎². Sejam �̅�1 = 12𝑛∑𝑋𝑖2𝑛 𝑖=1 𝑒 �̅�2 = 1𝑛∑𝑋𝑖𝑛 𝑖=1 dois estimadores de µ. Qual deles é o melhor estimador de µ? Justifique. 6. (Montgomery; Runger) Seja 𝑋1, 𝑋2, … , 𝑋7 uma amostra aleatória proveniente de uma população com média µ e variância σ². Considere os seguintes estimadores de µ: 𝜃1 = 𝑋1 + 𝑋2 +⋯+ 𝑋77 𝜃2 = 2𝑋1 − 𝑋6 + 𝑋42 Os dois estimadores são não-tendenciosos? Qual deles é o melhor estimador de µ? Justifique. 7. (Montgomery; Runger) Dados sobre a força (libra-força) de remoção de conectores usados em um motor de automóveis são os seguintes: 79,3; 75,1; 78,2; 74,1; 73,9; 75,0; 77,6; 77,3; 73,8; 74,6; 75,5; 74,0; 74,7; 75,9; 72,9; 73,8; 74,2; 78,1; 75,4; 76,3; 75,3; 76,2; 74,9; 78,0; 75,1; 76,8. 2 a) Calcule a estimativa pontual da força média de remoção de todos os conectores na população. Que estimador você usou e por que? b) Calcule as estimativas pontuais da variância e do desvio-padrão da população. c) Calcule o erro-padrão da estatística (estimador pontual) usado no item a). Forneça uma interpretação do erro-padrão. d) Calcule uma estimativa pontual da proporção de todos os conectores na população cuja força de remoção é menor do que 73 libras-força. 8. Mostre que �̅� é um estimador não tendencioso e consistente de . 9. Mostre que S2= ∑ (𝑋𝑖−�̅�)2𝑛𝑖=1𝑛−1 é um estimador não tendencioso e consistente de 2. 10. Mostre que �̂�2 = ∑ (𝑋𝑖−�̅�)2𝑛𝑖=1𝑛−1 é um estimador tendencioso e consistente de 2. Qual é o viés desse estimador? 11. Seja 𝑋i = {1 se o i − ésimo elemento tem o atributo A 0 se o i − ésimo elemento não tem o atributo A. Considere que P(𝑋i=1)= 𝑝 e que os 𝑋i são independentes. Seja �̅� = ∑ 𝑋𝑖𝑛𝑖=1𝑛 = número de elementos na amostra com o atributo A𝑛 = �̂�. Pode-se mostrar que �̅� é o estimador de máxima verossimilhança de 𝑝. a) �̅� é um estimador não tendencioso de 𝑝? b) Encontre um estimador para a variância de �̂�. (Dica: use a propriedade de invariância dos estimadores de máxima verossimilhança). 12. (Montgomery; Runger) Suponha que 𝑋 seja o número de “sucessos” observados em uma amostra de 𝑛 observações, em que 𝑝 é a probabilidade de sucesso em cada observação. a) Mostre que P̂ = X/𝑛 é um estimador não-tendencioso de p. b) Mostre que o erro-padrão de P̂ é √𝑝(1 − 𝑝)/𝑛. Como você estimaria o erro-padrão? 13. (Montgomery; Runger) Dos 𝑛1 estudantes selecionados aleatoriamente na universidade A, 𝑋1 possuíam calculadora HP e dos 𝑛2 estudantes de engenharia selecionados aleatoriamente na universidade B, 𝑋2 possuíam calculadora HP. Sejam 𝑝1 𝑒 𝑝2 as probabilidades de que estudantes de engenharia das universidades A e B, selecionados aleatoriamente, possuam calculadoras HP, respectivamente. a) Mostre que uma estimativa não-tendenciosa para 𝑝1 − 𝑝2 é (𝑋1𝑛1) − (𝑋2𝑛2). b) Qual é o erro-padrão da estimativa pontual do item a)? c) Qual uma possível estimativa pontual do erro-padrão em b)? d) Suponha 𝑛1 = 200, 𝑋1 = 150, 𝑛2 = 250 𝑒 𝑋2 = 185. Use os resultados do item a) para calcular uma estimativa 𝑝1 − 𝑝2. e) Use os resultados dos itens b) a d) para calcular uma estimativa do erro-padrão da estimativa. 3 Estimador Intervalar 14. Para uma população normal com variância conhecida 𝜎²: a) Qual valor de 𝑧𝛼/2 fornece 95% de confiança? b) Qual valor de 𝑧𝛼/2 fornece 99% de confiança? c) Qual valor de 𝑧𝛼/2 fornece 90% de confiança? d) Qual valor de 𝑧𝛼/2 fornece 98% de confiança? 15. (Montgomery; Runger) Para uma população normal com variância conhecida 𝜎²: a) Qual é o nível de confiança para o intervalo �̅� − 2,14 𝜎√𝑛 ≤ 𝜇 ≤ �̅� + 2,14 𝜎√𝑛? b) Qual é o nível de confiança para o intervalo �̅� − 2,49 𝜎√𝑛 ≤ 𝜇 ≤ �̅� + 2,49 𝜎√𝑛? c) Qual é o nível de confiança para o intervalo �̅� − 1,85 𝜎√𝑛 ≤ 𝜇 ≤ �̅� + 1,85 𝜎√𝑛? 16. (Montgomery; Runger) Suponha que 𝑛 =100 amostras aleatórias de água proveniente de um lago com água fresca foram retiradas, sendo medida a concentração (miligramas por litro) de cálcio. Um IC de 95% para a concentração média de cálcio é (0,49; 0,82). a) Um IC de 99% calculado a partir dos dados da amostra seria maior ou menor? b) Considere a seguinte afirmação: há uma chance de 95% de µ estar entre 0,49 e 0,82. Esta afirmação é correta? Explique sua resposta. c) Considere a seguinte afirmação: se 𝑛 = 100 amostras aleatórias de água proveniente do lago forem tomadas e o IC de 95% para µ for calculado e esse processo for repetido 1000 vezes, 950 dos ICs conterão o valor verdadeiro de µ. Esta afirmação está correta? Explique sua resposta. 17. (Montgomery; Runger) O rendimento de um processo químico está sendo estudado. De experiências prévias com esse processo, sabe-se que o rendimento tem distribuição normal com 𝜎 = 3. Os últimos cinco dias de operação da planta resultaram nos seguintes rendimentos percentuais: 91,6; 88,75; 90,8; 89,95 e 91,3. Encontre um intervalo com 95% de confiança para o rendimento médio verdadeiro. 18. (Montgomery; Runger) Um fabricante produz anéis para pistões de um motor de um carro. Sabe- se que o diâmetro do anel tem distribuição normal com 𝜎 = 0,001 milímetro. Em uma amostra aleatória de 15 anéis foi obtido um diâmetro médio de �̅� = 74,036 milímetros. Construa um intervalo 99% de confiança para o diâmetro médio do anel do pistão. 19. (Montgomery; Runger) Sabe-se que a vida em horas de um bulbo de uma lâmpada de 75W tem distribuição normal com 𝜎 = 25 horas. Em uma amostra aleatória de 20 bulbos observou-se uma vida média de �̅� = 1014 horas. a) Construa um intervalo de 95% de confiança para a vida média. b) Suponha que quiséssemos estar 95% confiantes de que o erro na estimação da vida média, a partir de um IC, fosse menor do que 5 horas. Que tamanho de amostra deveria ser usado? c) E se quiséssemos que a amplitude do intervalo de confiança fosse 6 horas, com 95% de confiança? Que tamanho de amostra deveria ser usado? 4 d) De quanto o tamanho 𝑛 da amostra deverá ser aumentado para que o comprimento do IC para µ se reduza à metade, baseando-se no intervalo (�̅� − 𝑧𝛼2 ; �̅� + 𝑧𝛼/2 𝜎√𝑛)? 20. Se o tamanho 𝑛 da amostra for dobrado, de quanto será a redução na amplitude do IC para µ, baseando-se no intervalo para 𝜇 (�̅� − 𝑧𝛼2 𝜎√𝑛 ; �̅� + 𝑧𝛼/2 𝜎√𝑛) ? O que acontecerá ao comprimento do intervalo se o tamanho da amostra for aumentado 4 vezes? 21. Determine o percentilt que é requerido para construir cada um dos seguintes intervalos de confiança: a) Nível de confiança = 95%, graus de liberdade = 12 b) Nível de confiança = 95%, graus de liberdade = 24 c) Nível de confiança = 99%, graus de liberdade = 13 22. (Montgomery; Runger) Um engenheiro do setor de pesquisa de uma fábrica de pneus está investigando o tempo de vida útil do pneu em relação a um novo componente de borracha. Ele fabricou 16 pneus e testou-os até o final da vida em um teste na estrada. A vida média e o desvio- padrão da amostra foram 60139,7 e 3645,94km. Encontre um intervalo de 95% de confiança para a vida média do pneu. 23. (Montgomery; Runger) Uma marca particular de margarina dietética foi analisada para determinar o nível (em porcentagem) de ácidos graxos insaturados. Uma amostra de seis pacotes resultou nos seguintes dados: 16,8; 17,2; 17,4; 16,9; 16,5; 17,1. a) Verifique a suposição de que o nível de ácido graxo poliinsaturado segue uma distribuição normal. b) Obtenha um intervalo de 99% de confiança para a média µ. Forneça uma interpretação prática desse intervalo. 24. (Montgomery; Runger) Uma máquina produz bastões metálicos usados em um sistema de suspensão de automóveis. Uma amostra aleatória de 15 bastões foi selecionada, sendo o diâmetro medido. Os dados (em milímetros) resultantes são mostrados a seguir: 8,24 8,25 8,20 8,23 8,24 8,21 8,26 8,26 8,20 8,25 8,23 8,23 8,19 8,28 8,24 a) Verifique a suposição de normalidade para o diâmetro dos bastões. b) Encontre um intervalo de 95% de confiança para o diâmetro médio dos bastões. c) Encontre um intervalo de 95% de confiança para a variância dos diâmetros dos bastões. d) Encontre um intervalo de 95% de confiança para o desvio padrão dos diâmetros dos bastões. 25. (Montgomery; Runger) O conteúdo de açúcar na calda de pêssegos em lata segue uma distribuição normal. Uma amostra aleatória de 𝑛 = 10 latas resulta em um desvio padrão amostral 𝑠 = 4,8 mg. Obtenha um IC 95% para 𝜎. 5 26. (Montgomery; Runger)As pesquisas para a eleição presidencial de 2004 do estado de Ohio forneceram os seguintes resultados. Havia 2020 pessoas consultadas nas pesquisas e 768 eram pós- graduadas em faculdades. Das pós-graduadas em faculdades, 412 votaram em George Bush. Calcule um intervalo de 95% de confiança para a proporção de pessoas pós-graduadas em Ohio que votaram em G. Bush. 27. (Montgomery; Runger) Uma amostra aleatória de 50 capacetes de corredores de motos e de automóveis foi submetida a um teste de impacto, sendo observado algum dano em 18 desses capacetes. a) Encontre um intervalo 95% de confiança para a proporção populacional 𝑝 de capacetes desse tipo que mostraria algum dano se submetidas ao teste de impacto. b) Usando a estimativa pontual de 𝑝, obtida a partir da amostra preliminar de 50 capacetes, quantos capacetes precisam ser testados para estamos 95% confiantes de que o erro na estimação do valor verdadeiro de 𝑝 seja menor do que 0,02? c) Quão grande deverá ser a amostra, se desejarmos estar no mínimo 95% confiantes de que o erro na estimação de 𝑝 seja menor do que 0,02, independentemente do valor de 𝑝? Respostas 1. Seja 𝑋1 o número selecionado na 1a extração e 𝑋2 o número selecionado na 2a extração. Como as extrações são independentes então 𝑃(𝑋1 = 𝑥1 , 𝑋2 = 𝑥2) = 𝑃(𝑋1 = 𝑥1)𝑃(𝑋2 = 𝑥2) Distribuição de probabilidade das possíveis amostras de tamanho 2 que podem ser selecionadas com reposição da população {1, 3, 5, 5, 7}. Distribuição amostral de �̅� = 𝑋1+𝑋22 Distribuição amostral de 𝑠2 = ∑ (𝑋𝑖−�̅�)22𝑖=1𝑛−1 Distribuição amostral de �̂�2 = ∑ (𝑋𝑖−�̅�)22𝑖=1 𝑛 𝑋1 𝑋2 1 3 5 7 total 1 1/25 1/25 2/25 1/25 1/5 3 1/25 1/25 2/25 1/25 1/5 5 2/25 2/25 4/25 2/25 2/5 7 1/25 1/25 2/25 1/25 1/5 total 1/5 1/5 2/5 1/5 1 �̅� 1 2 3 4 5 6 7 total P(�̅� = �̅�) 1/25 2/25 5/25 6/25 6/25 4/25 1/25 1 s2 0 2 8 18 total P(𝑆2 = 𝑠2) 7/25 10/25 6/25 2/25 1 �̂�2 0 1 4 7 total P(�̂�2 = �̂�2) 7/25 10/25 6/25 2/25 1 6 2. Sendo 𝑋1, 𝑋2, … , 𝑋𝑛 uma amostra aleatória extraída de uma população extraída de uma população 𝑋 com média µ e variância 2 (qualquer que seja a distribuição de 𝑋), o teorema central do limite garante que �̅� tem distribuição normal com média µ (a mesma de 𝑋) e variância 2/ 𝑛, desde que as amostras sejam suficientemente grandes. Quanto mais distaste da distribuição normal for a distribuição de 𝑋 maior deve ser o tamanho de amostra para garantir a convergência para a distribuição normal pelo teorema central do limite. 3. 𝑋𝑖 ={1 se a 𝑖 − ésima peça é não conforme0 se a 𝑖 − ésima peça é conforme e 𝑃(𝑋𝑖 = 1) = 𝑝 𝑋𝑖 tem distribuição de Bernoulli. Como 𝑋1, 𝑋2, … , 𝑋100 é uma amostra aleatória, então 𝑋1, 𝑋2, … , 𝑋100 são independentes. A distribuição de 𝑋1 + 𝑋2 +⋯+ 𝑋100 é binomial, pois 𝑋1 + 𝑋2 +⋯+ 𝑋100 corresponde ao número de sucessos em 100 ensaios independentes de Bernoulli. Tem-se que: 𝑃(∑ 𝑋𝑖𝑛𝑖=1 = 𝑥𝑖) = 𝑃 (∑ 𝑋𝑖𝑛𝑖=1𝑛 = 𝑥𝑖𝑛) = 𝑃 (�̂� = 𝑥𝑖𝑛) , ou seja, a distribuição de �̂� é a mesma de ∑ 𝑋𝑖100𝑖=1 e, portanto, binomial com parâmetros 𝑛 = 100 e 𝑝. 4. O melhor estimador de 𝜃 é 𝜃2 pois 𝑉(𝜃2) < 𝑉(𝜃1). 5. Sabe-se que 𝐸(𝑋) = µ e 𝑉(𝑋) = 𝜎² 1º passo: Verificar se os estimadores são não tendenciosos. 𝐸(�̅�1) = 𝐸 ( 12𝑛∑𝑋𝑖2𝑛 𝑖=1 ) = 12𝑛 𝐸 (∑𝑋𝑖2𝑛 𝑖=1 ) = 12𝑛∑𝐸(𝑋𝑖) =2𝑛 𝑖=1 12𝑛∑𝜇 = 12𝑛 2𝑛𝜇 =2𝑛 𝑖=1 𝜇 𝐸(�̅�2) = 𝐸 (1𝑛∑𝑋𝑖𝑛 𝑖=1 ) = 1𝑛 𝐸 (∑𝑋𝑖𝑛 𝑖=1 ) = 1𝑛∑𝐸(𝑋𝑖) =𝑛 𝑖=1 1𝑛∑𝜇 = 1𝑛 𝑛𝜇 =𝑛 𝑖=1 𝜇 𝐸(�̅�1) = 𝜇 e 𝐸(�̅�2) = 𝜇 e, portanto, �̅�1 e �̅�2 são estimadores não tendenciosos de 𝜇. 2º passo: Verificar se os estimadores são consistentes. (Obs: as variâncias de �̅�1 e �̅�2 foram obtidas no 3º passo, a seguir). lim𝑛→∞𝐸 (�̅�1) = 𝜇 e lim𝑛→∞𝑉𝑎𝑟 (�̅�1) = lim𝑛→∞ 12𝑛 𝜎2 = 0 7 lim𝑛→∞𝐸 (�̅�2) = 𝜇 e lim𝑛→∞𝑉𝑎𝑟 (�̅�2) = lim𝑛→∞ 1𝑛 𝜎2 = 0 Assim sendo, os dois estimadores são consistentes. 3º passo: Verificar qual dos estimadores tem menor variância. 𝑉𝑎𝑟(�̅�1) = 𝑉𝑎𝑟 ( 12𝑛∑𝑋𝑖2𝑛 𝑖=1 ) = 1(2𝑛)2 𝑉𝑎𝑟 (∑𝑋𝑖2𝑛 𝑖=1 ) = = 1(2𝑛)2∑𝑉𝑎𝑟(𝑋𝑖) =2𝑛 𝑖=1 1(2𝑛)2∑𝜎2 = 1(2𝑛)2 2𝑛𝜎2 =2𝑛 𝑖=1 12𝑛 𝜎2. 𝑉𝑎𝑟(�̅�2) = 𝑉𝑎𝑟 (1𝑛∑𝑋𝑖𝑛 𝑖=1 ) = 1𝑛2 𝑉𝑎𝑟 (∑𝑋𝑖𝑛 𝑖=1 ) = 1𝑛2∑𝑉𝑎𝑟(𝑋𝑖) =𝑛 𝑖=1 1𝑛2∑𝜎2 = 1𝑛2 𝑛𝜎2 =𝑛 𝑖=1 1𝑛 𝜎2. Note que foi possível considerar Var(∑Xi ) = ∑Var(Xi) pois a amostra é aleatória. Tem-se que 𝑉𝑎𝑟(�̅�2)𝑉𝑎𝑟(�̅�1) = 1𝑛𝜎212𝑛𝜎2 = 2, ou seja, a variância de �̅�2 é o dobro da variância de �̅�1 e, portanto, �̅�1 é o melhor estimador de 𝜇. 6. 𝐸(𝜃1) = 𝐸 (17 (𝑋1 + 𝑋2 +⋯+ 𝑋7) ) = 17𝐸(𝑋1 + 𝑋2 +⋯+ 𝑋7 = 17 (𝐸(𝑋1) + 𝐸(𝑋2) + ⋯+ 𝐸(𝑋7)) = 17∑𝜇 = 177𝜇 =7 𝑖=1 𝜇 𝐸(𝜃2) = 𝐸 (12 (2𝑋1 − 𝑋6 + 𝑋4) ) = 12𝐸(2𝑋1 − 𝑋6 + 𝑋4) = 12 (2𝐸(𝑋1) − 𝐸(𝑋6) + 𝐸(𝑋4)) = = 12 (2𝜇 − 𝜇 + 𝜇) = 𝜇 Tem-se que 𝐸(𝜃1) = 𝜇 e 𝐸(𝜃2) = 𝜇 e, portanto, 𝜃1 e 𝜃2 são estimadores não tendenciosos de 𝜇. 𝑉𝑎𝑟(𝜃1) = 𝑉𝑎𝑟 (17 (𝑋1 + 𝑋2 +⋯+ 𝑋7) ) = 1(7)2 𝑉𝑎𝑟(𝑋1 + 𝑋2 +⋯+ 𝑋7) = = 1(7)2 (𝑉𝑎𝑟(𝑋1) + 𝑉𝑎𝑟(𝑋2) + ⋯+ 𝑉𝑎𝑟(𝑋7)) = 1(7)2 (𝜎2 + 𝜎2 +⋯+ 𝜎2) = 1(7)2 7𝜎2 = 17𝜎2. 8 𝑉𝑎𝑟(𝜃2) = 𝑉𝑎𝑟 (12 (2𝑋1 − 𝑋6 + 𝑋4) ) = 1(2)2 𝑉𝑎𝑟(2𝑋1 − 𝑋6 + 𝑋4) = = 1(2)2 (4𝑉𝑎𝑟(𝑋1) + 𝑉𝑎𝑟(𝑋6) + 𝑉𝑎𝑟(𝑋4)) = 1(2)2 (4𝜎2 + 𝜎2 + 𝜎2) = 1(2)2 6𝜎2 = 32𝜎2. Tem-se que 𝑉𝑎𝑟(�̂�2)𝑉𝑎𝑟(�̂�1) = 32𝜎217𝜎2 = 212 = 10,5; ou seja, a variância de 𝜃2 é 10,5 vezes maior do que a variância de 𝜃1 e, portanto, 𝜃1 é o melhor estimador de 𝜇. 7. a) �̅� = 75,6154 libras-força. O estimador utilizado foi �̅�, pois a média amostral é um estimador não tendencioso e de mínima variância de 𝜇. b) 𝑠2 = 2,7382 libras-força2 e 𝑠 = 1,6547 libras-força. c) O erro padrão de �̅� é dado por √𝑉𝑎𝑟(�̅�) = 𝜎√𝑛. Uma estimativado erro padrão de �̅� é 𝑠√𝑛 = 0,3245. O erro padrão de �̅� é o desvio padrão das médias das possíveis amostras de tamanho 𝑛 extraídas da população. d) �̂� = 126 = 0,0385. 8, 9 e 10. Ver anotações de aula. 11. a) 𝐸(�̅�) = 𝐸 (∑ 𝑋𝑖𝑛𝑖=1𝑛 ) = 1𝑛 𝐸 (∑𝑋𝑖𝑛 𝑖=1 ) = 1𝑛∑𝐸(𝑋𝑖𝑛 𝑖=1 ) = 1𝑛∑𝑝𝑛 𝑖=1 = 1𝑛 𝑛𝑝 = 𝑝 (∗) (∗) 𝐸(𝑋𝑖) = 0 × 𝑃(𝑋𝑖 = 0) + 1 × 𝑃(𝑋𝑖 = 1) = 𝑝 𝐸(�̅�) = 𝑝 portanto, �̅� é um estimador não tendencioso de 𝑝. b) 𝑉𝑎𝑟(�̅�) = 𝜎2𝑛 . 𝑋𝑖 tem distribuição de Bernoulli com parâmetro 𝑝 e, portanto, 𝐸(𝑋𝑖) = 𝑝 e 𝑉𝑎𝑟(𝑋𝑖) = 𝑝(1 − 𝑝). Logo, 𝑉𝑎𝑟(�̂�) = 𝑉𝑎𝑟(�̅�) = 𝑝(1−𝑝)𝑛 . Como o estimador de máxima verossimilhança de 𝑝 é �̅� e usando a propriedade de invariância dos estimadores de máxima verossimilhança, tem-se que 𝑉𝑎𝑟(�̂�)̂ = �̅�(1−�̅�)𝑛 é um estimador de 𝑉𝑎𝑟(�̂�). 12. ver resolução 11. 9 13. a) 𝐸 ((𝑋1𝑛1) − (𝑋2𝑛2)) = 𝐸 (𝑋1𝑛1) − E (𝑋2𝑛2) = 1𝑛1 𝐸(𝑋1) − 1𝑛2 𝐸(𝑋2) = 1𝑛1 𝑛1𝑝1 − 1𝑛2 𝑛2𝑝2 = = 𝑝1 − 𝑝2. b)√𝑉𝑎𝑟 ((𝑋1𝑛1) − (𝑋2𝑛2)) = √𝑉𝑎𝑟 (𝑋1𝑛1) + 𝑉𝑎𝑟 (𝑋2𝑛2) = √ 1𝑛12 𝑉𝑎𝑟(𝑋1) + 1𝑛22 𝑉𝑎𝑟(𝑋2) = = √ 1𝑛12 𝑉𝑎𝑟(𝑋1) + 1𝑛22 𝑉𝑎𝑟(𝑋2) = √ 1𝑛12 𝑛1𝑝1(1 − 𝑝1) + 1𝑛22 𝑛2𝑝2(1 − 𝑝2) = = √ 1𝑛12 𝑛1𝑝1(1 − 𝑝1) + 1𝑛22 𝑛2𝑝2(1 − 𝑝2) = √𝑝1(1 − 𝑝1)𝑛1 + 𝑝2(1 − 𝑝2)𝑛2 . c) Uma estimativa de √𝑝1(1−𝑝1)𝑛1 + 𝑝2(1−𝑝2)𝑛2 pode ser obtida substituindo 𝑝1 e 𝑝2, respectivamente, por 𝑋1𝑛1 e 𝑋2𝑛2. d) (𝑋1𝑛1) − (𝑋2𝑛2) = (150200) − (185250) = 0,01 e) √𝑋1𝑛1(1−𝑋1𝑛1)𝑛1 + 𝑋2𝑛2(1−𝑋2𝑛2)𝑛2 = √150200(1−150200)200 + 185250(1−185250)250 = 0,0413. 14. 1. 1,96 2. 2,575 3. 1,645 4. 2,325 15. a) z=2,14 pela tabela da distribuição normal P(0<Z<z)=0,4838 e assim sendo, /2=(0,5- 0,4838), =2(0,5- 0,4838), (1-)=0,9676, confiança do intervalo 96,76%. b) 98,72%. c) 93,56%. 10 16. a) O intervalo de confiança (1-𝛼)100% para 𝜇 é dado por �̅� − 𝑧𝛼2 𝜎√𝑛 ≤ 𝜇 ≤ �̅� + 𝑧𝛼2 𝜎√𝑛. Aumentando a confiança para 99% a amplitude do intervalo também aumenta, pois 𝑧0,052 = 1,96 e 𝑧0,012 = 2,575. b) A afirmação está incorreta, pois µ não é uma variável aleatória e sim uma constante desconhecida. Nesse caso µ ou estará ou não estará no intervalo. c) Sim, a afirmação está correta, o método é baseado na construção de intervalos de confiança para cada uma das possíveis amostras de mesmo tamanho, obtidas a partir do mesmo procedimento de seleção. Estabelecendo-se um erro de 5% tem-se que 95% dos intervalos conterão µ e o restante dos intervalos 5% não conterão µ. 17. IC 95% para µ: (87,8504; 93,1096). 18. IC 95% para µ: (74,0353; 74,0367). 19. a) IC 95% para µ: (1003,04; 1024,96). b) 𝑧𝛼/2 𝜎√𝑛 = 𝐸 𝑛 = 𝑧𝛼/22𝜎2𝐸2 = 96,04. Arredondando para o inteiro superior mais próximo 𝑛 = 97. 𝑐) �̅� + 𝑧𝛼/2 𝜎√𝑛− (�̅� − 𝑧𝛼2 𝜎√𝑛) = 2𝑧𝛼2 𝜎√𝑛 = 6𝑧𝛼2 𝜎√𝑛 = 3 𝑛 = 266,78, ou seja, 𝑛 = 267. d) Se amplitude = 2𝑧𝛼2 𝜎√𝑛 E=𝑧𝛼2 𝜎√𝑛 √𝑛 = 𝑧𝛼/2𝜎𝐸 𝑛 = 𝑧𝛼/22𝜎2𝐸2 Se amplitude é reduzida pela metade, ela passa a ser igual a 𝑧𝛼2 𝜎√𝑛 E= 12 (𝑧𝛼2 𝜎√𝑛) E=(𝑧𝛼2 𝜎√4𝑛) e, portanto, para reduzir a amplitude do intervalo pela metade é necessário aumentar o tamanho da amostra 4 vezes. 20. Se o tamanho 𝑛 da amostra for dobrado, a margem de erro passa a ser 𝑧𝛼/2 𝜎√2𝑛 = 1√2 𝑧𝛼/2 𝜎√𝑛, e a amplitude 2 1√2 𝑧𝛼/2 𝜎√𝑛 = √2𝑧𝛼/2 𝜎√𝑛 . Assim sendo, ao dobrar o tamanho da amostra a amplitude muda de 2𝑧𝛼/2 𝜎√𝑛 para √2𝑧𝛼/2 𝜎√𝑛 , ou seja, há uma redução de 29,29% na amplitude. 11 Se o tamanho 𝑛 da amostra for multiplicado por 4, a margem de erro passa a ser 𝑧𝛼/2 𝜎√4𝑛 =1√4 𝑧𝛼/2 𝜎√𝑛 = 12 𝑧𝛼/2 𝜎√𝑛 , ou seja, amplitude = 𝑧𝛼/2 𝜎√𝑛 , sendo portanto, reduzida pela metade. 21. a. 2,179 b. 2,064 c. 3,012 22. (�̅� − 𝑡𝛼2,𝑛−1 𝑠√𝑛 ; �̅� + 𝑡𝛼2,𝑛−1 𝑠√𝑛) = (60139,7 − 2,131 3645,94√16 ; 60139,7 + 𝑡𝛼2,𝑛−1 𝜎3645,94√16 ) = = (58197,33; 62082,07). 23. Há forte indicativo de que a amostra provém de uma distribuição normal de acordo com o diagrama de caixas. 𝑡0.012 ,5 = 4,032 IC 99% para µ: (�̅� − 𝑡𝛼2 ,𝑛−1 𝑠√𝑛 ; �̅� + 𝑡𝛼2 ,𝑛−1 𝑠√𝑛) = (16,4585; 17,5082). A chance desse intervalo conter o valor médio em % do nível de ácidos graxos é 99%. 24. a) Normalidade ok 12 b) 𝑡0.052 ,14 = 2,145 IC 95% para µ: (�̅� − 𝑡𝛼2 ,𝑛−1 𝑠√𝑛 ; �̅� + 𝑡𝛼2 ,𝑛−1 𝑠√𝑛) = (8,2200; 8,2480). c) 0,052 ,142 = 26,119 1− 0,052 ,142 = 5,629 ((𝑛 − 1)𝑆2 𝛼2,𝑛−12 ; (𝑛 − 1)𝑆2 1−𝛼2,𝑛−12 ) = (0,000343045; 0,00159757). 𝑑)(√(𝑛 − 1)𝑆2 𝛼2,𝑛−12 ; √(𝑛 − 1)𝑆2 1−𝛼2,𝑛−12 ) = (0,0185; 0,0399). 25. 0,052 ,92 = 19,023 1− 0,052 ,92 = 2,7 ( √(𝑛 − 1)𝑆2 𝛼2,𝑛−12 ; √(𝑛 − 1)𝑆2 1−𝛼2,𝑛−12 ) = (3,3016; 8,7636) 26. (�̂� − 𝑧𝛼2√�̂�(1 − �̂�)𝑛 ; �̂� + 𝑧𝛼2√�̂�(1 − �̂�)𝑛 ) = = (412768 − 1,96√412/768(1 − 412/768)768 ; 412768 + 1,96√412/768(1 − 412/768)768 ) = = (0,5012; 0,5717) 27. a) (�̂� − 𝑧𝛼2√�̂�(1 − �̂�)𝑛 ; �̂� + 𝑧𝛼2√�̂�(1 − �̂�)𝑛 ) = 13 = (0,36 − 1,96√0,36(1 − 0,36)50 ; 0,36 + 1,96√0,36(1 − 0,36)50 ) = (0,227; 0,493). b) 𝑧𝛼2√�̂�(1−�̂�)𝑛 = 𝐸 𝑛 = 𝑧𝛼22�̂�(1−�̂�)𝐸2 𝑛 = 1,962 × 0,36(1 − 0,36)0,022 = 2212,762 Arredondando para o inteiro superior mais próximo 𝑛 = 2213. c) 𝑛 = 𝑧𝛼22�̂�(1 − �̂�)𝐸2 𝑛 = 𝑧𝛼220,25𝐸2 = 2401.