Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Estatística Aplicada II – Professora Sandra Peres – 2018/1 Turma N1 – Engenharia de Produção – Universidade Salgado de Oliveira DISTRIBUIÇÕES AMOSTRAIS E ESTIMAÇÃO Neste momento, juntam-se os modelos de distribuição de probabilidade e as medidas que caracterizam uma amostra obtendo-se as distribuições amostrais dos principais estimadores (parâmetros). Entende- se por estimador qualquer função real definida a partir dos elementos que compõem uma amostra e o valor numérico de um estimador é denominado estimativa. As medidas de posição e dispersão estudadas na Estatística Descritiva são exemplos de estimadores. Lembremos que estatística ou estimador, denotado por 𝜃, é qualquer função de uma amostra aleatória (fórmula ou expressão), construída com o propósito de servir como instrumento para descrever alguma característica da amostra e para fazer inferência a respeito da característica na população. As mais comuns são: n x x n i i 1 : média da amostra 11 )( 2 1 22 12 n xx n xx s n i ii n i : variância da amostra )amostra da tamanho( )ticacaracterís a tamsenapre que amostra da elementos de número(Xˆ n p : proporção da amostra Agora, considere todas as amostras possíveis de tamanho n que podem ser extraídas de determinada população com N elementos. Se para cada uma delas se calcular um valor do estimador 𝜃, tem-se uma distribuição amostral desse estimador nas 𝑁 amostras de tamanho n. Como cada estimador é uma variável aleatória, ele pode ser descrito pela sua função de distribuição, que é chamada distribuição amostral do estimador, isto é, pode-se determinar suas características como a média, variância e desvio padrão. Assim, chamamos de distribuições amostrais de probabilidades as distribuições de probabilidades aplicadas na avaliação de parâmetros amostrais. Isso faz parte da inferência ou indução estatística, que é o processo de obter informações sobre uma população a partir dos resultados observados na amostra. DISTRIBUIÇÃO AMOSTRAL DA MÉDIA Vamos estudar a distribuição amostral do estimador X , a média da amostra. Consideremos uma população identificada pela variável aleatória X, cujos parâmetros: média populacional e variância populacional 2 são supostamente conhecidos. Vamos retirar todas as possíveis amostras casuais simples de tamanho n dessa população, e para cada uma calcular a média x . A partir disso construímos a distribuição amostral e estudamos suas propriedades. 2 Exemplo. Vamos ilustrar como a distribuição da média amostral pode ser determinada por uma situação simples, quando o tamanho da amostra é 2 (n = 2) e a distribuição da população é discreta: Suponha uma população hipotética formada por 3 indivíduos, cujos pesos sejam iguais a 80, 100 e 120 quilos. Neste caso a média populacional é 𝜇= ଼ାଵାଵଶ ଷ = 100 quilos e a variância populacional é 𝜎ଶ= (଼ିଵ) మା(ଵିଵ)మା (ଵଶିଵ)మ ଷ = ଼ ଷ 𝜎ଶ = 266,67 e σ = 16,33 quilos. Agora, simulamos todas as amostras diferentes possíveis com reposição, de tamanho n = 2: Amostra Indivíduos Média da Amostra 1 (80, 80) 80 2 (80, 100) 90 3 (80, 120) 100 4 (100, 80) 90 5 (100, 100) 100 6 (100, 120) 110 7 (120, 80) 100 8 (120, 100) 110 9 (120, 120) 120 e construímos a Distribuição de Frequências das Médias das Amostras da v.a. Xഥ = Média do peso de 2 indivíduos da população: {80, 100, 120} Note que o conjunto das médias de todas as amostras dá origem à Distribuição Amostral das Médias onde: a média é: 𝜇௫̅= ଼×ଵ ା ଽ×ଶ ା ଵ×ଷ ା ଵଵ×ଶ ା ଵଶ×ଵ ଽ = ଽ ଽ = 100 = 𝜇 𝜇௫̅ = 𝜇 e a variância é: 𝜎௫̅ଶ = (଼ିଵ )మ ା (ଽିଵ)మ⋅ଶ ା (ଵିଵ)మ⋅ଷ ା (ଵଵିଵ )మ⋅ଶ ା (ଵଶିଵ )మ ଽ 𝜎௫̅ଶ = ଵଶ ଽ = 133,33 = ଶ, ଶ 𝜎௫̅ଶ = ఙమ . Portanto, a Distribuição da Média Amostral, baseada em uma amostra aleatória simples com reposição de tamanho n, tem: )X(E (= média da população) n Var 2 )X( (= variância da população dividida pelo tamanho da amostra) xi fi 80 1 90 2 100 3 110 2 120 1 Total 9 3 n DP )X( (= desvio padrão da população dividida pela raiz quadrada do tamanho da amostra) Importante: O n DP x )X( é denominado erro padrão da média. O “erro padrão da média” e o “desvio padrão da média amostral” são termos equivalentes. “O erro padrão da média” é geralmente usado para evitar confusão com o desvio padrão () das observações. Esses resultados mostram que a distribuição da média amostral ( X ) é centrada na média populacional e que o cálculo de X produz uma estatística que é menos variável do que uma observação individual (X). Com o aumento do tamanho da amostra, o desvio padrão da distribuição de X diminui. Isto significa que quando n torna-se grande, podem-se esperar valores de X mais próximos de , a quantidade que se pretende estimar. Normalmente não se tem várias amostras para se obter estimativas múltiplas da média. No entanto, é possível estimar o erro padrão da média usando o tamanho da amostra (n) e desvio-padrão (s) de uma única amostra de observações. O erro padrão da média é, então, estimado pelo desvio padrão das observações dividido pela raiz quadrada do tamanho da amostra. À medida que o tamanho da amostra aumenta, o desvio padrão da amostra (s) irá flutuar, mas não vai aumentar ou diminuir de forma consistente. Torna-se uma estimativa mais precisa do desvio padrão paramétrico () da população. Em contraste, o erro padrão da média torna-se menor quando o tamanho da amostra aumenta. Com tamanhos amostrais maiores, a média da amostra torna-se uma estimativa mais precisa da média paramétrica (), pois o erro padrão da média torna-se menor. Saber que a média das médias amostrais fornece uma boa aproximação da média da população é importante para nos auxiliar a generalizar resultados da amostra para a população. Se X é a média de uma amostra aleatória simples com reposição, de tamanho n, de uma população normal, com média e variância 2 , sua distribuição é normal, com média 𝜇௫̅ = 𝜇 e variância 𝜎௫̅ଶ = n 2 . Essa tendência da média das médias amostrais de se igualar ao valor da média da população é conhecida como Teorema Central do Limite. Teorema Central do Limite (ou Teorema do Limite Central): Em uma amostra aleatória simples com reposição de uma população arbitrária, com média e variância 2 , a distribuição de X , quando n é grande, é aproximadamente normal, com média e variância n 2 . Em outras palavras, Z = n X é aproximadamente 𝑁 (0,1) 4 Uma ilustração gráfica do teorema limite central aparece na figura ao lado, onde a distribuição da população representada pela curva contínua é uma distribuição contínua assimétrica, com = 2 e = 1,41. As distribuições da média amostral X para tamanhos amostrais n = 3 e n = 10 são representadas no gráfico pelas curvas pontilhadas, indicando que, com um aumento de n, as distribuições amostrais tornam-se mais concentradas ao redor de , assemelhando-se a uma distribuição normal. Na prática, quando n 30, a distribuição de X é aproximadamente normal, indiferente da forma da população amostrada. Aplicação do teorema do limite central O teorema limite central tem muitos aspectos práticos úteis: se X é a média amostral, podemos calcular: P (𝑎 ≤ X ≤ 𝑏) = n bZn a / / P aproximadamente, usando tabelas da distribuição 𝑁 (0,1), qualquer que seja a distribuição de X. Exemplo: Seja uma máquina de empacotamento de um determinado sal mineral, cujos pesos (em kg) seguem uma distribuição 𝑁 (50, 2). Assim, se a máquina estiver regulada, qual a probabilidade, colhendo-se uma amostra de 100 pacotes, da média dessa amostra )(x diferir de 50 kg em menos de 0,2828 kg? Solução: P ( 49,7172 X 50,2828 ) = P ( 10/2 507172,49 ) 10/2 502828,50 / X n = P ( -2,0 Z 2,0 ) = 2 . P ( 0 Z 2,0 ) = 2 . 0,47725 = 0,9545 Ou seja, dificilmente 100 pacotes terão uma média fora do intervalo ]49,7172; 50,2828[. Caso apresentem uma média fora desse intervalo, pode-se considerar como sendo um evento raro, e será razoável desconfiar que a máquina esteja desregulada. 5 Amostras sem reposição de populações finitas Supondo uma população com N elementos, se a amostragem for feita sem reposição, E( )X = continua a valer, mas 1 )X( 2 N nN n Var Assim, a variância da média amostral com este tipo de amostragem é menor, pois ela é 1 N nN vezes a variância da média amostral, quando a amostragem for feita com reposição. Note que quando n se aproxima de N, o fator de correção se aproxima de zero, de modo que a )X(Var também se aproxima de zero. Isto é, se a população for grande quando comparada com o tamanho da amostra (n), o fator de correção 1 N nN será próximo de um, e )X(Var n 2 . O fator de correção 1 N nN deve ser usado se n 5% N, ou seja, se N 20 n). Isto indica que se ே 5% não é necessário o fator de correção. Exemplo1: Em uma população de 400 alunos de um curso, sabemos que a altura média dos alunos é de 175 cm e o desvio padrão, 5 cm. Retiramos uma amostra sem reposição de tamanho n =100. Determine )X(E e )X(Var . Solução: 𝑋: 𝑁(175, 25) = 175 cm e = 5 cm. Então )X(E = 𝜇௫̅ = 𝜇 = 175 )X(Var = 𝜎௫̅ = 1 . N nN n = 1400 100400. 100 5 = 399 300. 10 5 = 0,433554984 Exemplo2: Em uma população de 2500 alunos de um curso, sabemos que a altura média dos alunos é de 175 cm e o desvio padrão, 5 cm. Retiramos uma amostra sem reposição de tamanho n=100. Determine )X(E e )X(Var . Solução: X: 𝑁(175, 25) = 175 cm e = 5 cm. Então )X(E = 𝜇௫̅ = 𝜇 = 175 )X(Var = 𝜎௫̅ = 1 . N nN n = 12500 1002500. 100 5 = 2499 2400. 10 5 = 0,489995957 0,5 Note ainda que se X: 𝑁(175, 25), calculando )X(Var sem o fator de correção, temos: 𝜎௫̅ = n = 5,0 10 5 100 5 6 Comparando os exemplos 1 e 2 vemos que se a amostra é grande (N 20n), é indiferente calcular )X(Var usando o fator de correção 1 N nN para populações finitas, porque o erro é muito pequeno. Observações: Demonstra-se matematicamente que: a) se a população tem distribuição normal, a distribuição das suas médias amostrais será normal para qualquer tamanho de amostra; b) se a população tem distribuição não normal, a distribuição das suas médias amostrais será normal para grandes amostras (Na prática, uma amostra é considerada grande quando tem pelo menos 30 elementos). DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO Se a população é binomialmente distribuída - isso ocorre quando seus itens podem ser reunidos em dois grupos, um com e o outro sem uma determinada característica - um dos parâmetros passível de estudo é a proporção com que tal característica aparece na população e nas amostras com e sem reposição. Por exemplo, as peças de um lote podem ser analisadas em termos de boas e defeituosas, os atletas de um clube podem ser agrupados em casados e solteiros e os moradores de uma cidade abordados por serem eleitores ou não. Nesses casos, a relação entre o número de itens da população com a característica estudada e o número total de elementos da referida população é chamada de proporção populacional e o número de itens da amostra com essa característica e o total de elementos da mesma amostra é chamado de proporção amostral. A Distribuição amostral das proporções estuda a forma como uma característica aparece nas amostras. A distribuição amostral das proporções permite calcular diversos parâmetros amostrais, entre os quais se inclui a probabilidade de obter determinadas proporções nas amostras levantadas. Os dados necessários para tanto são o tamanho da amostra e a proporção populacional. Assim, a Distribuição Amostral da Proporção p de sucessos (característica que se estuda na população) é assim definida: A população pode ser definida como uma variável aleatória X no qual cada elemento corresponde a um ensaio de Bernoulli, onde há somente dois resultados possíveis: ticacaracteris a tem não população da elemento o seX ticacaracteris a tem população da elemento o seX 0 1 Tem-se: P(𝑋 = 1) = 𝑝, P(𝑋 = 0) = 𝑞, sendo 𝑝 + 𝑞 = 1. E também: )1()( )( 2 pppqXVar pXE Neste contexto, considerando n ensaios de Bernoulli independentes, 𝑋ଵ, 𝑋ଶ, . . . , 𝑋 constitui uma amostra aleatória simples com reposição dessa população. Como os resultados individuais são 0 (fracasso) ou 1 (sucesso), vale que n i iX 1 é o número de resultados em n elementos da amostra, que correspondem aos sucessos, ou seja, ao número de elementos amostrados que possuem a característica em estudo, porque aos resultados que correspondem aos fracassos estão associados ao valor 0. 7 Então, indicando por 𝑌 o total de indivíduos portadores da característica na amostra, temos que: 𝑌 = 𝑋ଵ + 𝑋ଶ + ⋯ + 𝑋 = n i iX 1 . Portanto, a proporção amostral de sucessos é X n X n Y p n i i n 1ˆ ou seja, �̂� é igual à média da v.a. Xi. Como 𝑌~𝐵(𝑛, 𝑝) com )1()( )(E 2 pnpnpqYVar npY n n e vale que P(𝑌 = 𝑘) = n k n YnP = n kpˆP , ou seja, a distribuição amostral de �̂� é obtida da distribuição de 𝑌, consequentemente: pnpn x nn xp 1)(E1E)ˆ(E n xVarpVar )ˆ( n pq n qppnp n xVar n )1()1(1)(1 22 O n pqpDP p ˆ)ˆ( é denominado erro padrão da proporção. Assim, pelo Teorema Central do Limite, quando o tamanho n da amostra é grande, a proporção amostral �̂� de sucessos em n ensaios de Bernoulli tem distribuição aproximadamente normal: �̂� ≅ 𝑁 ቀ𝑝, ቁ, e sua distribuição padronizada será: )1 ,0(ˆ N n pq ppZ . Exemplo 1: Suponha que se saiba que em uma certa população uma proporção de pessoas igual a p = 0,08 (8%) seja cega para cores. Se fizermos uma amostragem aleatória de 150 indivíduos da população, qual a probabilidade de que a proporção de pessoas dessa amostra que seja cega para cores seja menor que 0,15? Solução: Como 𝑛𝑝 = 150 × 0,08 = 12 > 5 e 𝑛𝑞 = 150 × 0,92 = 138 > 5, então �̂� é aproximadamente normal com média 𝜇ො = 𝑝 = 0,08 e desvio padrão 0222,000049,0150 92,008,0 ˆ n pq p . Portanto, 𝑃(�̂� < 0,15)= )15,3( 0222,0 08,015,0 ZPZP =0,5+𝑃(0 < 𝑍 < 3,15)=0,5+0,49918=0,99918 1 (100%) Exemplo 2: Sabe-se que 30% dos estudantes de certo curso são homens. Colhendo uma AAS de 10 estudantes dessa população, qual a probabilidade de que �̂� difira de p em menos de 1%? Solução: Seja p = 30% e �̂� = proporção de homens na amostra. Vamos obter 𝑃(−0,01 ≤ �̂� − 𝑝 ≤ 0,01). Sendo �̂� − 𝑝~𝑁 ቀ0, (ଵି) ቁ e 𝑝 = 0,30, temos: que 𝑉𝑎𝑟(�̂�)= 10 7,03,0 =0,021, e portanto, a probabilidade pedida é: )01,0ˆ01,0(P pp = 021,0 01,0ˆ 021,0 01,0P n pq pp = 021,0 01,0 021,0 01,0P z 07,007,0P z =0,056 5,6% 8 Amostras sem reposição de populações finitas Supondo uma população com N elementos, se a amostragem for feita sem reposição, pp )ˆ(E continua a valer, mas 1 )ˆ( N nN n pqpVar O fator 1 N nN pode ser considerado como o fator de eficiência da amostragem sem reposição sobre a amostragem com reposição. Evidentemente as considerações acima valem para populações pequenas. Essa distinção entre amostragem com e sem reposição não será necessária se 𝒏𝒑 ≥ 𝟓 e 𝒏(𝟏 − 𝒑) ≥ 𝟓, pois o fator de correção será “aproximadamente um” e não precisará ser utilizado, tendo em vista que o T.C.L. será válido uma vez que a distribuição amostral de �̂� será aproximadamente normal quando tanto 𝑛𝑝 como 𝑛(1 − 𝑝) forem maiores que 5. Importante: Quando p é desconhecida e a amostra com reposição é grande, determinamos a estimativa de p: n xp 0ˆ . EXERCÍCIOS – Lista 1 1. Qual das seguintes alternativas representa a melhor estimativa da média populacional? a) A média da amostra b) A média de várias médias amostrais c) A moda de várias médias amostrais d) A mediana de várias médias amostrais 2. A média da amostra é um estimador não tendencioso da média da população. Isto significa que: a) A média da amostra é sempre igual à média da população. b) A média das médias de todas as amostras possíveis é igual à média da população. c) A média da amostra é sempre muito próxima da média da população. d) A variabilidade da média amostral é sempre muito pequena. e) A média da amostra tem distribuição normal. 3. Em uma empresa com 3.000 funcionários, o salário médio é de R$2600,00 com desvio padrão de R$800,00. Calcule a probabilidade de que o salário médio de uma amostra constituída por 30 funcionários esteja entre: a) R$2500,00 e R$3000,00? b) R$3000,00 e R$3500,00? c) R$1800,00 e R$3400,00? d) Acima de R$3000,00? e) Abaixo de R$2800,00? 4. Em uma empresa com 500 funcionários, o salário médio é de R$2600,00 com desvio padrão de R$800,00. Calcule a probabilidade de que o salário médio de uma amostra constituída por 30 funcionários esteja entre: a) R$2500,00 e R$3000,00? b) R$3000,00 e R$3500,00? c) R$1800,00 e R$3400,00? d) Acima de R$3000,00? e) Abaixo de R$2800,00? 9 5. Uma variável aleatória X tem distribuição Normal com média 120 e desvio padrão 12. Calcule: a) P(90 < X < 120) b) P(100 < X < 130) c) P(70 < X < 100) d) P(130 < X < 180) e) P(X > 125) f) P(X < 200) 6. Se Xഥ é a média de uma amostra de 16 elementos retirados da população do exercício anterior, calcule: a) P(118 < Xഥ < 120) b) P(121 < Xഥ<122) c) P(115 < Xഥ < 125) d) P(119 < Xഥ < 121) e) P(Xഥ > 118) f) P(Xഥ < 122) 7. Tendo em mente estimar a proporção de alunos de um determinado "Campus" universitário que eram favoráveis à reestruturação das contas acadêmicas, um pesquisador social entrevistou uma amostra aleatória de 590 estudantes e constatou que 57% deles era de fato, favoráveis à citada reestruturação. a) Calcule a probabilidade de numa amostra de 49 alunos, menos de 50% sejam favoráveis à reestruturação das contas acadêmicas. b) Calcule a probabilidade de numa amostra de 36 alunos, mais de 55% sejam favoráveis à reestruturação das contas acadêmicas. 8. Uma empresa compra canetas esferográficas, em grande quantidade, de um certo distribuidor. Antes de aceitar os lotes remetidos, a empresa faz testes para verificar a sua qualidade. Se uma certa remessa contiver 5% de canetas defeituosas, qual a probabilidade de que uma amostra aleatória de 50 canetas, a) apresente mais do que 7% de defeituosas? b) apresente mais do que 5% de defeituosas? c) apresente menos do que 8% de defeituosas? d) apresente menos do que 3% de defeituosas? 9. Sabe-se que em uma eleição escolar, o candidato A possui 54% dos votos dos estudantes. Se uma pesquisa eleitoral realizada pelos seus concorrentes deseja apresentar números diferentes do que o candidato A realmente tem, qual é a probabilidade de que em uma amostra aleatória de 138 estudantes, o candidato A apareça com: a) mais do que 55% dos votos? b) mais do que 60% dos votos? c) menos do que 50% dos votos? d) menos do que 40% dos votos? e) entre 45 e 55% dos votos? f) entre 40 e 50% dos votos? 10. Com base em estatísticas históricas, sabe-se que 60% das compras feitas com cartão de crédito em um supermercado são para quantias acima de 100 reais. Se for escolhida uma amostra aleatória de 100 compras feitas com cartão de crédito em um certo dia no supermercado, qual a probabilidade de que a proporção de compras acima de 100 reais esteja entre 50% e 70%? 11. A proporção de eleitores do candidato A é 25%. Qual a probabilidade de uma amostra aleatória simples de 100 eleitores apresentar uma proporção de eleitores do candidato A entre 23% e 27%? 10 ESTIMAÇÃO (Intervalos de confiança) No tópico anterior estudamos as relações existentes entre os parâmetros populacionais e aqueles obtidos das distribuições amostrais. Tais relações são importantes na medida em que, com elas, podem-se dimensionar probabilisticamente os parâmetros populacionais com base nos resultados amostrais. O que estudaremos a seguir são métodos e processos disponíveis para tal fim. Os métodos e processos estatísticos que possibilitam avaliar, estimar ou prever parâmetros populacionais desconhecidos, tomando por base valores amostrais extraídos de uma ou mais das amostras representativas da população em estudo, são o objeto de estudo da chamada Teoria da Estimação. Essencialmente, qualquer característica de uma população pode ser estimada a partir de uma amostra aleatória. Uma estimativa de um parâmetro populacional pode ser dada como uma estimativa pontual ou uma estimativa por intervalo. Uma estimativa pontual do parâmetro é o próprio valor calculado para a amostra. Mas não se pode esperar que um estimador, estime um parâmetro populacional sem erro. Não se pode esperar, por exemplo, que �̅� estime exatamente , porém certamente se espera que também ele não esteja muito longe do verdadeiro valor. Uma estimativa intervalar do parâmetro é um intervalo do tipo a b, onde a e b dependem da estimativa pontual para uma particular amostra escolhida e também da distribuição amostral do estimador. A distribuição amostral do estimador possibilita encontrar valores de a e b para todas possíveis amostras tais que uma fração específica desses intervalos conterá o parâmetro . Portanto, se a e b são calculados de tal forma que 95% de todos os possíveis intervalos em amostragem repetida, conteriam , então teremos a probabilidade igual a 0,95 de escolher uma das amostras que fornecerão um intervalo contendo . Esse intervalo calculado a partir da amostra aleatória retirada, é chamado um intervalo de confiança de 95%. Em outras palavras, temos 95% de confiançaque o nosso intervalo calculado contenha realmente o parâmetro populacional . ESTIMAÇÃO DA MÉDIA DE UMA POPULAÇÃO Estimativa pontual : ( X ) = x (a) Caso em que n é grande e 2 conhecida Consideremos uma população normalmente distribuída (ou n 30). Quando o desvio padrão é conhecido, as estimativas pontual e intervalar da média populacional são: Estimativa intervalar : x z n ( X ) x z n Porque, sabe-se que, pelo Teorema Limite Central, se o tamanho da amostra n é grande, n XZ / é aproximadamente 𝑁(0,1). 11 A partir da estimativa pontual da média populacional, podemos construir alguns intervalos de confiança para a média amostral, exigindo-se que a probabilidade do intervalo seja de 1 (nível de confiança). O nível de confiança é a probabilidade de o intervalo conter o parâmetro estimado. Em termos da variável normal padrão z, isto representa a área central sob a curva normal entre os pontos 2 z e 2 z . Para facilidade de notação faremos 2 z = z. Exemplo1: A duração da vida de uma peça de equipamento é tal que = 5 horas. Foram amostradas 100 dessa peças obtendo-se a média de 500 horas. Deseja-se construir um intervalo de confiança para a verdadeira duração média da peça com um nível de 95%. Solução: Dados: n= 100 peças, �̅� = 500 horas, = 5 horas confiança desejada z fórmula 95% 1,96 _ x z n Cálculo: 500 1,96 . 10 5 = 500 0,98 Intervalo: 499,02 a 500,98, ou seja, [499,02; 500,98] Exemplo2: Considerando uma amostra de 100 cobaias utilizadas em um estudo comportamental, onde o peso médio é 171,70 g, encontre um IC de 99% para , supondo que o desvio padrão da população () seja igual a 7,79 g. Solução: confiança desejada z fórmula 99% 2,58 _ x z n g g g g IC 71,173;69,169 100 79,7.58,270,171%)99:( Amostras sem reposição de populações finitas Quando a população é finita com N elementos (ou amostragem sem reposição) e a amostra constitui mais de 5% da população, devemos aplicar o fator de correção finita para modificar os desvios padrões da fórmulas. Daí o intervalo de confiança para a média populacional é: 1 . N nN n zx ( X ) 1 . N nN n zx . 12 Vale observar que: Se, por exemplo, o nível de confiança é (1) = 0,95, sabemos que 95,0)( 22 zZzP para 1,96 2 z e então: 95,096,1 96,1 n x n xP . Esta expressão deve ser interpretada do seguinte modo: construídos todos os intervalos da forma xx 96,1 , 95% deles conterão (veja Figura abaixo). Lembrando que não é uma variável aleatória, mas um parâmetro, isto não é o mesmo que dizer que tem 95% de probabilidade de estar entre os limites indicados. Este intervalo pode ou não conter o parâmetro , mas, pelo exposto acima, têm-se 95% de confiança de que o contenha. (b) Caso em que n é grande e 2 desconhecida Para grandes amostras, a afirmação probabilística 1 n zx n zxP é ainda correta, mas como é desconhecido, o intervalo não pode ser construído. Entretanto, como n é grande (n 30), a substituição de pelo desvio padrão amostral (s) não afeta apreciavelmente essa afirmação probabilística, pois o valor numérico de s é uma estimativa acurada de , de modo que n s xZ é aproximadamente 𝑁(0, 1). Assim, o 𝐼𝐶( ∶ 1 ) é dado por: n szx n szx ; 13 (c) Caso em que n é pequeno (n < 30) Vimos acima que quando o desvio padrão da população (σ) é desconhecido é necessário utilizar sua estimativa (s). Só que ao substituir-se o desvio padrão populacional pela sua estimativa no quociente: n x não se terá mais uma distribuição normal padrão. De fato, conforme demonstrado pelo estatístico inglês W. S. Gosset, conhecido por “Student”, o comportamento do quociente: n s x segue uma distribuição simétrica em torno de zero, porém com uma variabilidade maior do que a da distribuição normal padrão. A distribuição do quociente acima é conhecida como distribuição “ t ” de Student. Na realidade existem infinitas distribuições t, uma para cada tamanho de amostra. Estas distribuições, a exemplo da normal padrão, encontram-se tabeladas. A tabela para a distribuição t segue uma metodologia um pouco diferente daquela da normal padrão. De fato, como existem muitas distribuições t de Student não seria possível tabelá-las da mesma forma que a da normal padrão. Assim cada linha de uma tabela representa uma distribuição diferente e cada coluna representa um valor de confiança que poderá ser “α“ ou “α/2”, isto é, a tabela poderá ser unilateral ou bilateral. A linha de cada tabela fornece a distribuição t com parâmetro “n1” denominado de graus de liberdade, isto é, o grau de liberdade gl = 𝜈 = n1 = linha da tabela. A qualificação “n–1 graus de liberdade” é necessária porque para cada diferente tamanho de amostra (n) ou valor (n–1), há uma diferente distribuição t. Neste caso, o intervalo de confiança com probabilidade 1α para a média será: 𝐼𝐶( ∶ 1 ) = n stx n stx ; para simplificar notação: 2 t =t onde: �̅� é a estimativa por ponto da média da população; s é o desvio padrão da amostra e uma estimativa do desvio padrão da população σ e tα/2 é o valor da distribuição na tabela t cuja área à direita é igual a α/2, isto é, é o valor de t tal que: P(t > 𝑡ఈ/ଶ) = α/2, ou seja: P(𝑡ఈ/ଶ < t < 𝑡ఈ/ଶ) = 1α. Pode parecer um pouco estranho que, com uma população distribuída normalmente, venhamos eventualmente a utilizar a distribuição t de Student para achar os valores associados ao nível de confiança; mas quando σ não é conhecido, a utilização de s incorpora outra fonte de erro. Por isso, para manter o grau desejado de confiança compensamos a variabilidade adicional ampliando o intervalo de confiança por esse processo que substitui o valor z por um valor maior, t. A equivalência entre as distribuições t e 𝑁(0, 1) quando n é grande, pode ser verificada comparando os valores da distribuição 𝑡, com infinitos (∞) graus de liberdade, com os da normal padrão. 14 Tabela com valores críticos de t (Student) Graus de Liberdade (gl) Nível de Confiança 0,50 0,80 0,90 0,95 0,98 0,99 Monocaudal )2( 0,25 0,10 0,05 0,025 0,01 0,005 Bicaudal )( 0,50 0,20 0,10 0,05 0,02 0,01 1 1,000 3,078 6,314 12,706 31,821 63,657 2 0,816 1,886 2,920 4,303 6,965 9,925 3 0,765 1,638 2,353 3,182 4,451 5,841 4 0,741 1,533 2,132 2,776 3,747 4,604 5 0,727 1,476 2,015 2,571 3,365 4,032 6 0,718 1,440 1,943 2,447 3,143 3,707 7 0,711 1,415 1,895 2,365 2,998 3,499 8 0,706 1,397 1,860 2,306 2,896 3,355 9 0,703 1,383 1,833 2,262 2,821 3,250 10 0,700 1,372 1,812 2,228 2,764 3,169 11 0,697 1,363 1,796 2,201 2,718 3,106 12 0,695 1,356 1,782 2,179 2,681 3,055 13 0,694 1,350 1,771 2,160 2,650 3,012 14 0,692 1,345 1,761 2,145 2,624 2,977 15 0,691 1,341 1,753 2,131 2,602 2,947 16 0,690 1,337 1,746 2,120 2,583 2,921 17 0,689 1,333 1,740 2,110 2,567 2,898 18 0,688 1,330 1,734 2,101 2,552 2,878 19 0,688 1,3281,729 2,093 2,539 2,861 20 0,687 1,325 1,725 2,086 2,528 2,845 21 0,686 1,323 1,721 2,080 2,518 2,831 22 0,686 1,321 1,717 2,074 2,508 2,819 23 0,685 1,319 1,714 2,069 2,500 2,807 24 0,685 1,318 1,711 2,064 2,492 2,797 25 0,684 1,316 1,708 2,060 2,485 2,787 26 0,684 1,315 1,706 2,056 2,479 2,779 27 0,684 1,314 1,703 2,052 2,473 2,771 28 0,683 1,313 1,701 2,048 2,467 2,763 29 0,683 1,311 1,699 2,045 2,462 2,756 (z) 0,674 1,282 1,645 1,960 2,326 2,576 15 Exemplo: Uma amostra de 10 cães sofrendo de uma determinada doença apresentou um tempo de sobrevivência médio de 46,9 meses e o desvio padrão de 43,3 meses. Determinar os limites de confiança de 90% para . Solução: ax = 46,9 meses, s = 43,3 meses , 1 − = 0,90, gl = n-1 = 9 833,1t Limites de confiança para : 0,728,21 10 3,43833,19,46 e n stx Portanto, 𝐼𝐶( ∶ 90%) = ]21,8; 72,0[ Erro da estimativa Chama-se erro da estimativa à diferença, ou desvio, entre a média amostral e a populacional. x z n x Erro logo E = z n Denomina-se: amostral) (erro médiadaestimativadaerro n zE médiadapadrãoerro n x Há três determinantes do tamanho ou quantidade de erro: a) a confiança desejada, representada pelo valor de z; b) a dispersão na população, ; c) o tamanho da amostra, n. Quando tratar-se de população finita, temos: E = 1 . N nN n z . Determinação do tamanho da amostra Conhecida a dispersão da população em estudo e definidos o nível de confiança e o erro máximo desejado para a estimativa, pode-se determinar o tamanho mínimo da amostra que atende tais condições. Isso é feito, conforme mostrado a seguir, desenvolvendo-se a expressão do erro em relação ao tamanho da amostra. a) para populações infinitas (e/ou amostragem com reposição): E = z n n = E z n = 2 E z 16 b) Para populações finitas (e/ou amostragem sem reposição) e variância 𝜎ଶ conhecida: 1 . N nN n z E 1 NE nNzn )NE z Nzn 2 1(22 22 c) Quando a variância não é conhecida: n ppzE )1( 2 2 )1( E ppzn , onde p deve ser previamente estimado. Logo, o tamanho da amostra dependerá: a) o grau de confiança desejada; b) a quantidade de dispersão entre os valores individuais da população; c) certa quantidade específica de erro tolerável. Exemplo: Que tamanho de amostra será necessário para produzir um intervalo de 90% de confiança para a verdadeira média populacional, com erro de 1,0 em qualquer dos sentidos, se o desvio padrão da população é 10,0? Solução: = 10 , E = 1, intervalo de 90% de confiança z = 1,65 Cálculo: n = 2 E z = 1,65 . 1 10 2 = 16,5 2 = 272,25 n = 273 ESTIMAÇÃO DA PROPORÇÃO DE UMA POPULAÇÃO Seja �̂� = proporção amostral. A estimativa pontual da proporção populacional é: 𝑝 = �̂�, pois sabe- se que para n 30 a distribuição amostral de �̂� é aproximadamente normal com média μ(�̂�) = 𝑝 e desvio padrão (erro padrão) n pp p 1(ˆ . Pode-se então utilizar a curva normal para estabelecer os limites para o intervalo de confiança. Lembrando que o que se quer é um intervalo que contenha o parâmetro populacional p com probabilidade “1α“ então tem-se: 𝑃 ൬−𝑧ഀ మ ≤ 𝑍 ≤ 𝑧ഀ మ ൰ = 1 − 𝛼, 17 onde 𝑧ఈ/ଶ é o valor da normal padrão com área à direita é igual a 𝛼/2. Mas sabemos que p ppZ ˆ ˆˆ , então substituindo na expressão acima vem: 1 ˆ 2ˆ ˆ 2 z p zP p p . Trabalhando esta desigualdade, segue que: 1ˆ 2 ˆˆ 2 ˆ zpzP ppp 1ˆˆ 2 ˆˆ 2 ˆ zpzpP ppp 1ˆˆ ˆ 2 ˆˆ 2 ppp zp zpP . Que é o intervalo procurado. Assim o intervalo de confiança (probabilidade) de “1α“ para a proporção “p” de uma população é dado por: pp zp zp pIC ˆˆ ˆ;ˆ)1:( ( notação: 2 z =z) Observando-se a expressão acima pode-se perceber que o intervalo de confiança para a proporção populacional p, depende dele mesmo, isto é, é necessário calcular o erro amostral que está expresso em função de p. Como o objetivo é estimar este valor, evidentemente ele não é conhecido. Assim é necessário utilizar, sua estimativa pˆˆ , isto é, é necessário substituir p por �̂� na expressão n pp p 1(ˆ . Desta forma o intervalo acima ficará: n ppzp n ppzpzp zp pp )ˆ1(ˆˆ;) ˆ1(ˆˆˆˆ;ˆˆ ˆˆ onde: �̂� é a estimativa por ponto da proporção populacional p. n pp p )ˆ1(ˆˆ ˆ é uma estimativa do erro padrão, isto é, do desvio padrão amostral e 𝑧ఈ/ଶ é o valor da distribuição normal padrão cuja área à direita é igual a 𝛼/2. É o valor de z tal que: 𝑃(𝑍 > 𝑧ఈ/ଶ) = 𝛼/2. 18 Exemplo 1: Numa pesquisa de mercado, 400 pessoas foram entrevistadas sobre sua preferência por determinado produto. Destas 400 pessoas,240 disseram preferir o produto.Determine um intervalo de confiança de 95% de probabilidade para o percentual de preferência dos consumidores em geral para este produto. Solução: Tem-se 1α = 95%, então α = 5% e α / 2 = 2,5%. O coeficiente de confiança que deve ser buscado na normal padrão é valor 𝑧ఈ/ଶ de Z tal que: P(Z > 𝑧ఈ/ଶ) = 2,5%, Este valor vale 1,96. A estimativa por ponto para a proporção populacional será: �̂�= 400 240 n x = 0,60 = 60%. Então o intervalo de confiança de 95% para a proporção populacional será: n ppzp n ppzpzp zp pp )ˆ1(ˆˆ;) ˆ1(ˆˆˆˆ;ˆˆ ˆˆ = 400 )60,01(60,096,160,0; 400 )60,01(60,096,160,0 = [60% - 4,80% ; 60% + 4,80%] = [55,20%; 64,80%], ou seja, pode-se afirmar com uma certeza de 95% de que este intervalo conterá a proporção populacional, isto é, a verdadeira percentagem dos consumidores que preferem o produto pesquisado. Exemplo 2: Numa pesquisa de mercado para estudar a preferência da população de uma cidade em relação ao consumo de um determinado produto, colheu-se uma amostra aleatória de 300 consumidores da cidade e observou-se que 180 consumiam o produto. Determinar um IC de 99% para a proporção populacional de consumidores do produto. Solução: Tem-se 1α = 99%, então α = 1% e α / 2 = 0,5%. O coeficiente de confiança que deve ser buscado na normal padrão é valor zα/2 de Z tal que: P(Z > zα/2) = 0,5%. Este valor vale 2,575. A estimativa por ponto para a proporção populacional será: p = f/n =180/300 = 0,60 = 60%. Então o intervalo de confiança de 99% para a proporção populacional será: 300 40,060,0575,260,0; 300 40,060,0575,260,0 = [60% - 7,28% ; 60% + 7,28%] = [52,72%; 67,28%], ou seja, pode-se afirmar com uma certeza de 99% de que este intervalo conterá a proporção populacional, isto é, a verdadeira percentagem dos consumidores que preferem o produto pesquisado. 19 Sugestões para estimação prévia de 𝝈 1. Usar estimativas de σ, de um estudo similar feito anteriormente ou de uma amostra piloto. 2. Em muitas situações, podemos considerar que 4 amplitude . O argumentoteórico para o uso desta aproximação está baseado na propriedade da Distribuição Normal com média µ e desvio-padrão σ, de que a área entre µ − 2σ e µ + 2σ é igual a 95,5%. Portanto esta aproximação não deve ser usada se a variável em estudo for muito assimétrica. Sugestões para estimação prévia de 𝒑 1. Usar estimativas de p de um estudo similar feito anteriormente ou de uma amostra piloto. 2. Substituir o produto 𝑝(1 − 𝑝) por 0,25 (ou seja: 𝑝 =0,5 e 1 − 𝑝 =0,5). Notamos que ao substituir por 0,25, o tamanho da amostra pode ser maior que o necessário. E por isso que chamamos de abordagem conservadora, quando fazemos esta substituição nas fórmulas do intervalo de confiança. Quando N (tamanho da população) é conhecido, o valor de n para estimar µ e p pode ser corrigido pela fórmula nN nNn * Se N é muito maior que n (N > 20n), então n* é aproximadamente n. EXERCÍCIOS – Lista 2 1. Qual a relação entre tamanho da amostra e erro amostral? a) Quanto maior o tamanho da amostra, maior o erro amostral. b) Quanto maior o tamanho da amostra, menor o erro amostral. c) O tamanho da amostra é igual ao erro amostral. d) O tamanho da amostra independe do erro amostral. 2. Uma pesquisa recente foi realizada para avaliar o percentual da população favorável à eleição de um determinado ponto turístico para constar no selo comemorativo de aniversário da cidade. Para isso, selecionou-se uma amostra aleatória simples extraída de uma população infinita. O resultado apurou 50% de intenção de votos para esse ponto turístico. Considerando que a margem de erro foi de 2 pontos percentuais, para mais ou para menos, e que o nível de confiança utilizado foi de 95%, foram ouvidas, aproximadamente a) 50 pessoas. b) 100 pessoas. c) 1.200 pessoas. d) 2.400 pessoas. e) 4.800 pessoas. 20 3. Seja X uma variável aleatória normalmente distribuída representando o salário dos empregados em um determinado ramo de atividade. Uma amostra aleatória de 100 empregados foi selecionada e apurou-se um intervalo de confiança de 95% para a média de X como sendo [760,80; 839,20], supondo a população de tamanho infinito e sabendo-se que o desvio padrão populacional é igual a R$ 200,00. Caso o tamanho da amostra tivesse sido de 1.600 e obtendo- se a mesma média anterior, o intervalo de confiança de 95% apresentaria uma amplitude igual a a) R$ 78,40. b) R$ 39,20. c) R$ 49,00. d) R$ 58,80. e) R$ 19,60. 4. Um jornal deseja estimar a proporção de jornais impressos com não conformidades. Em uma amostra aleatória de 100 jornais dentre todos os jornais impressos durante um dia, observou-se que 20 têm algum tipo de não conformidade. Para um nível de confiança de 90%, Z = 1,64. Então pode-se concluir que apresentam não conformidades a) 21,64%, no máximo. b) 26,56%, no máximo. c) 26,56%, no mínimo. d) 21,64%, no mínimo. e) 20%, no mínimo. 5. Considere uma amostra aleatória de 100 trabalhadores imigrantes, com a informação sobre X: salário mensal dessa amostra de trabalhadores. O salário médio mensal da amostra, �̅� = 1500 reais e é uma estimativa de µ, o salário médio mensal de todos os trabalhadores imigrantes. O desvio-padrão amostral de salário, s = 1200 reais. Os responsáveis pela pesquisa consideram que uma boa estimativa para o salário médio mensal deve ter no máximo um erro E de 200 reais. Calcule a probabilidade de o erro máximo ser de 200 reais, isto é, P (−200 ≤ �̅� −µ ≤200). 6. Suponha que as alturas dos alunos de nossa faculdade tenham distribuição normal com = 15 cm. Foi retirada uma amostra aleatória de 100 alunos obtendo-se x = 175 cm. Construir, ao nível de confiança de 95%, o intervalo para a verdadeira altura média dos alunos. 7. Em uma fábrica foi colhida uma amostra de certa peça e foram obtidas as seguintes medidas para os diâmetros: 10 - 11 - 11 - 11 - 12 - 12 - 12 - 12 - 13 - 13 - 13 - 13 - 13 - 13 - 13 13 - 13 - 13 - 13 - 13 - 14 - 14 - 14 - 14 - 14 - 15 - 15 - 15 - 16 - 16 a) Estimar a média e a variância; b) Construir um intervalo de 95% de confiança para a média. 8. Foram retiradas 25 peças da produção diária de uma máquina, encontrando-se para uma certa medida uma média de 5,2 mm. Sabendo-se que as medidas têm distribuição normal com desvio padrão populacional 1,2 mm, construir intervalos de confiança para a média aos níveis de 90%, 95% e 99%. 9. De uma distribuição normal com 2 = 1,96, obteve-se a seguinte amostra: 25,2 26,0 26,4 27,1 28,2 28,4. Determinar o intervalo de confiança para a média da população, sendo os níveis de confiança iguais a 95% e 90%. 10. Construir, ao nível de 95%, o intervalo de confiança para a média, admitindo-se a seguinte distribuição amostral: Classes 15 |-- 18 18 |-- 21 21 |--24 24 |-- 27 27 |-- 30 30 |-- 33 frequencia 8 9 12 15 7 4 21 11. Uma amostra aleatória de 8 elementos retirados de uma população normal com desvio padrão 5, apresentou os seguintes valores: 22, 17, 21, 24, 15, 18, 16, 19. Determine um intervalo de confiança de 90% para a média populacional. 12. A tabela abaixo representa uma amostra aleatória selecionada em uma população normal com variância 16 (unid)2. xi 2 3 5 6 fi 3 7 8 2 Determine um intervalo de confiança de 98% para a média populacional. 13. Um levantamento das cotações para o preço de um produto na bolsa de mercadorias apontou, a partir de uma amostra de 100 cotações, um preço médio de 2,40 u.m./kg. Sabe-se, por experiência anterior, que a variância para este tipo de cotação é aproximadamente constante de valor 0,16. Construa um intervalo de confiança de 90% para o preço médio deste produto. 14. Um comerciante que trabalha com o produto do problema anterior acredita que terá lucro se conseguir pagar um preço menor que o preço médio da bolsa. Qual é o preço máximo que poderá pagar ao nível de confiança de 80%? 15. Para estudar a situação salarial em uma empresa, um consultor levantou uma amostra aleatória de 50 salários recebidos na empresa. Sabe-se, por experiências com empresas similares, que o desvio padrão para os salários é aproximadamente constante de valor 40 u.m. O salário médio amostral foi calculado em 245 u.m. Determine um intervalo de confiança de 94% para o salário médio pago por esta empresa. 16. Um centro de ortodontia deseja conhecer a estimativa do tempo médio que um membro da equipe gasta para atender a cada paciente. Suponha que uma amostra de 38 especialistas revelou que a média foi de 45 minutos com um desvio-padrão de 6 minutos. Determine um intervalo de 99% de confiança para o parâmetro. 17. Uma rede de lanchonetes deseja estimar a quantia média que cada cliente gasta por lanche. Foram coletados dados de uma amostra de 22 clientes que revelou uma quantia média de R$ 15 com um desvio-padrão de 5. Construir um intervalo de confiança de 95% para a média populacional. 18. Um prefeito de certa cidade turística deseja estimar a média de gastos para os turistas que visitarem a cidade. Com este propósito, uma amostra aleatória de 120 turistas foi selecionada para a investigação e encontrou-se que a média foi igual a 800 u.m. (unidades monetárias) com desvio padrão de 200 u.m. Achar o intervalo de confiança, a 99%; 95% e 90% para a média de todos os gastos de turistas com a cidade. 19. Em uma pesquisa sobre comportamento condicionado, 17 ratinhos realizam uma experiência e os seus tempos (em segundos) são anotados: 5-5-6-7-7-7-7-8-9-9-9-9-10-10-11-11-12. a) Pede-se para construir os intervalos de confiança para a verdadeira média dos tempos, aos níveis de 99,9%; 93% e 75% de confiança; b) Se a amostra for acrescida dos seguintes tempos extraídos ao acaso de outros ratinhosdo mesmo laboratório (ou seja, da mesma população): 5-5-6-6-7-7-7-7-8-8-9-9-9-10-11-11. Pede- se para construir os intervalos de confiança para a verdadeira média dos tempos, a partir da nova amostra, aos níveis de 99,9%; 93% e 75% de confiança; 20. Um especialista em educação pretende avaliar a aceitação de um projeto educacional numa cidade. Depois de apresentá-lo às escolas do município, os responsáveis por sua execução desejam avaliar o valor aproximado do parâmetro p, a proporção de diretores favoráveis ao projeto, dentre as escolas do município. Para estimar este parâmetro, o especialista coleta uma amostra aleatória simples de n = 600 escolas e verifica que nesta amostra 420 são favoráveis. Usando um nível de 95% de confiança, obtenha o intervalo de confiança para o parâmetro p. 22 21. Em uma amostra de 500 acidentes de trânsito, observou-se que 368 foram provocados por bebidas alcoólicas. Com base nesses dados estime, com 99%; 95% e 90% de confiança, a proporção de acidentes devido às bebidas alcoólicas. 22. Um centro de estudos de pesquisa de opinião realizou uma pesquisa para avaliar a opinião dos telespectadores de uma região, sobre um certo comentarista esportivo. Para isso entrevistou 380 telespectadores, selecionados ao acaso da região, e constatou que 180 desejavam que o comentarista fosse afastado da TV. a) Determine uma estimativa pontual da proporção de telespectadores da região favoráveis ao afastamento do comentarista esportivo. b) Determine um intervalo de confiança de 90% para : proporção de telespectadores favoráveis ao afastamento do comentarista. c) Suponha agora que o centro decida que um intervalo de confiança, com coeficiente de 90% para , deve ter comprimento 0,05. Os dados do item (a) atingem esse objetivo? Justifique e comente. 23. Deseja-se saber qual a proporção de pessoas da população domina certo idioma e para isso retira-se uma amostra aleatória simples de 400 pessoas, obtendo-se 8 pessoas que dominam esse idioma. Definir limites de confiabilidade de 95% para a proporção populacional. 24. Perguntou-se a 643 jovens, entre 16 e 19 anos, quais os principais problemas que enfrenta a juventude atual. Os principais problemas apontados, com o número correspondente de respostas, foram: i. o uso e o abuso de tóxicos: 270; ii. a falta de comunicação com os pais: 220; iii. o uso e o abuso do álcool: 85 e iv. o desemprego: 68. Considerando os 643 jovens como uma amostra aleatória de todos os jovens naquela faixa etária, estime, através de um intervalo de 95% de confiança, a proporção de jovens da população considerada que cita o problema i), ii), iii) e iv) como o principal. 25. Líderes estudantis de uma faculdade querem conduzir uma pesquisa para determinar a proporção p de estudantes a favor de uma mudança no horário de aulas. Como é impossível entrevistar todos os 2000 estudantes em um tempo razoável, decide-se fazer uma amostragem aleatória simples dos estudantes: a) Determinar o tamanho de amostra (número de estudantes a serem entrevistados) necessário para estimar p com um erro máximo de 0,05 e nível de confiança de 95%. Assumir que não há nenhuma informação a priori disponível para estimar p. b) Os líderes estudantis também querem estimar a proporção de p de estudantes que sentem que a representação estudantil atende adequadamente as suas necessidades. Com um erro máximo de 7% e nível de confiança de 95%, determinar o tamanho de amostra para estimar p. Utilizar a informação de uma pesquisa similar conduzida a alguns anos, quando 60% dos estudantes acreditavam que estavam bem representados. c) Qual o tamanho de amostra adequado para atingir ambos os objetivos da pesquisa? 26. Qual é o tamanho de amostra necessário para estimar a renda média mensal das famílias de uma pequena comunidade, com um erro máximo de 100 reais com 95% de confiança, usando amostragem aleatória simples? Sabe-se que a renda mensal familiar está entre 50 e 1000 reais. 27. Em uma amostra, de variável contínua, com população infinita, foi desenvolvido uma pesquisa onde o tamanho da amostra calculado para esta população foi n0=469. Admita agora, que esta mesma população seja finita com N=2600, com desvio padrão 21, o erro amostral é 1,9 e o nível de confiança é 95%. Calcule o tamanho da amostra e aplique a fórmula de correção. 28. Determinar o tamanho de amostra necessário para estimar o volume médio de vendas de carros novos nacionais entre as concessionárias, fixando um nível de confiança de 99% para um erro de estimação igual a 1 automóvel. E conhecido que existem 200 concessionárias na região em 23 estudo. Em uma pesquisa similar feita 5 anos antes, o desvio-padrão amostral foi igual a 2,8. Supor que foi feita uma amostragem aleatória simples. 29. Um cientista resolve estimar a proporção p de indivíduos com certa doença numa região. Ele deseja que a probabilidade de que a sua estimativa não se desvie do verdadeiro valor de p por mais que 2% seja de pelo menos 95%. Qual deve ser o tamanho da amostra para que essas condições sejam satisfeitas? 30. Da população de crianças de determinada cidade, uma pré-amostragem apresentou quanto à incidência de cárie um percentual de 30%. Estime o número de elementos da amostra definitiva com 4% de precisão e 90% de confiança. Respostas – Lista 1 1. B 2. B 3.a) 0,7486 b) 0,0031 c) 1 d) 0,0031 e) 0,9147 4. a) 0,7587 b) 0,0024 c) 1 d) 0,0024 e) 0,9207 5. a) 0,4938 b) 0,7492 c) 0,0475 d) 0,2033 e) 0,3372 f) 1 6 7. a) 0,1611 b) 0,5948 8. a) 0,2578 b) 0,5 c) 0,8340 d) 0,2578 9. a) 0,4052 b) 0,0778 c) 0,1736 d) 0 e) 0,5778 f) 0,1736 10. 0,9586 11. 35,44% Respostas – Lista 2 1. c 2. d 3. e 4. b 5. 90,5% 6. [172,06; 177,94] 7. a) X =13,13 e S2 = 2,05 b) [12,60; 13,66] 8. [4,81; 5,59], [4,73; 5,67] e [4,58; 5,82] 9. [25,76; 28,00] e [25,94; 27,82] 10. [22,00; 24,55] 11. P(16,10 < < 21,90) = 0,90 12. P(1,86 < < 6,03) = 0,98 13. P(2,33 < < 2,47) = 0,90 14. preço < 2,35 15. P(234,37 < < 255,63) = 0,94 16. (42,49; 47,51) 17. (12,783; 17,217) 18. 19. 20. (0,663; 0,737) 21. 22. a) 0,47 b) 0,43 0,51 23. 24. 25. a) 384, 16 ≈ 385 b) 188,16=189 c) Resp.: Para atingir ambos os objetivos da pesquisa, devemos considerar a maior amostra, que é a de 385 estudantes. 26. n=22 27. n=397 28. n=52,19 e n*=41,90 29. n=2401 30. n=353 24
Compartilhar