Baixe o app para aproveitar ainda mais
Prévia do material em texto
Intervalo de Confiança Tamanho da amostra Estimativa pontual para a média ESTIMAR A MÉDIA DA POPULAÇÃO Média amostral (média das médias) Como foi visto anteriormente a média da população é igual à média das médias Como podemos estimar o verdadeiro valor da média da população se temos em mãos a média de uma amostra? Intervalo de Confiança É uma faixa de possíveis valores em torno da média amostral, e a probabilidade de que esta faixa realmente contenha o valor real da média da população O Intervalo de confiança terá uma certa probabilidade chamada de nível de confiança (simbolizada por 1 – ) de conter a média da população. x 1 – α /2 /2 Intervalo de confiança 1 – α = nível de confiança α = nível de significância (probabilidade de erro) Há uma probabilidade de 1 – da média estar contida no intervalo definido Há uma probabilidade de a média amostral estar fora do intervalo definido (área hachurada) Se usarmos um desvio padrão em torno da média (Z = 1), a chance de erro ao estimar a média será de 31,74%. Mas, se usarmos dois (Z = 2), a chance de erro será de 4,56%. Intervalo de Confiança Não é possível exibir esta imagem no momento. z2z1 Erro = z . Desvio padrão amostral n z.e s=intervalo errox errox (μ) = 1)( exexP α /2 α /2 = desvio padrão da população 1 - α = grau de confiança Distribuição das médias amostrais x 1 – α Intervalo de Confiança Se o desvio padrão da população é conhecido: A estimativa intervalar da média populacional se baseia na hipótese de que a distribuição amostral das médias amostrais é normal. Para grandes amostras isto não apresenta dificuldade especial, pois se aplica o teorema do limite central. Todavia, para amostras de 30 ou menos observações, é importante saber se a população tem distribuição normal ou aproximada. nzX /.: s n z.e s= Intervalo de Confiança Se o desvio padrão da população é desconhecido: Quando o desvio padrão da população não é conhecido (o que é o caso, geralmente), usa-se o desvio padrão da amostra como estimativa, substituindo-se x por Sx nas equações. Isto não acarreta maiores dificuldades, pois o desvio padrão amostral dá uma aproximação bastante razoável do verdadeiro valor, na maioria dos casos. Além disso, pelo teorema do limite central, sabemos que, quando a amostra é maior que 30, a distribuição das médias é aproximadamente normal. Para amostras menores que 30, a aproximação normal não é adequada. Devemos então usar a distribuição t. A forma da distribuição t é bem parecida com a normal. nzX /.: s Intervalo de Confiança exouexex = Quando tem n > 30 e é conhecido Quando tem n > 30 e σ é desconhecido Substitui o desvio padrão da população pelo desvio padrão da amostra s Região Crítica Região Crítica Z/2 Z/2 Zcrítico Zcrítico 1 - α x nX s s = XzX s .: n ze s.= n Sze X.= n SzX X.= Intervalo de Confiança X50403020 807060Amostra 1 2 3 ... 45 46 47 ... 98 99 100 =50 Se em um estudo, forem retiradas várias amostras aleatórias de tamanho n da população e que, para cada amostra, seja construído um intervalo de (1-) de confiança para a variável desejada. Os intervalos obtidos serão diferentes, mas (1-)% destes intervalos conterão entre os seus intervalos o valor real do parâmetro. Ao nível de 95% de confiança espera-se que em 100 intervalos para as amostras, 95 deles contenham a média μ Interpretação: Intervalo de Confiança E quando o tamanho da amostra é menor que 30 (n < 30) e o desvio padrão da população () é desconhecido? Neste caso não podemos usar a distribuição normal (a distribuição das médias não é normal). Devemos usar a distribuição t (t de student). A distribuição t é similar à distribuição normal, mas tem maior variação nas caudas (nas pontas da curva). Distribuição t de Student Distribuição t de student com n = 3 Distribuição t de student com n = 12 Distribuição normal padronizada A curva t nos dá a probabilidade de ocorrer um evento a t desvios padrão da média (para mais ou para menos) os valores de t (valores correspondentes à área sob a curva nas caudas) são tabelados e dependem de dois fatores: n-1 = graus de liberdade grau de confiança desejado (1- α) Intervalo de Confiança exouexex = n ste n 1,2/ = n ste ncrítico 1, =n ste = Quando tem n < 30 e σ é desconhecido Substitui o desvio padrão da população pelo desvio padrão da amostra s ouou Intervalo de Confiança Imagine que tivéssemos uma amostra de tamanho tão grande que tendesse ao infinito. O que ocorreria? O erro seria próximo de zero (desconsiderável) e a média da amostra seria igual a média da população, sem a necessidade de estimar um intervalo. Exercícios Resolução: 0,01 2,58 0,10 1,65 0,08 1,75 0,06 1,88 Grau de Confiança (1 – α) Valor Crítico (Z α/2) 99% 94% 92% 90% Exercícios Um dos principais produtos de uma indústria siderúrgica é a folha de flandres. Havia uma preocupação com a possibilidade de haver um número de folhas fora da faixa de especificação de dureza (LIE = 58,0 HR e LSE = 64,0 HR). A partir desta informação a empresa decidiu estimar a dureza média das folhas de flandres () coletando uma amostra aleatória de 49 folhas. 61,0 60,2 60,3 60,3 60,0 61,0 60,3 60,0 60,0 60,9 61,0 61,2 59,2 60,9 60,0 60,5 59,8 59,3 61,0 59,6 59,8 59,6 60,1 58,0 59,8 58,9 57,6 58,0 60,5 60,1 61,6 61,1 59,7 58,3 61,6 59,5 59,0 60,3 58,7 59,6 54,2 60,3 61,0 59,7 59,9 59,9 60,0 58,6 59,9 Medidas de dureza (HR) das folhas-de-flandres fabricadas pela siderúrgica 61,0 21,60 = = s X Para um grau de confiança de 95%, determine a margem de erro (E) e o intervalo de confiança para média populacional (). Exercícios 49 61,0 21,60 = = = n s X n sZe 2 = Margem de erro: 17,01708,0 49 61,0.96,1 ===e Dados: Grau de confiança de 95% implica em: 1 – = 95%, logo α = 5% = 0,05 e α/2 = 0,025. Z α/2 = Z0,025 = 1,96 -Z/2 Z/2 1 - α 0 /2 /2 Exercícios exex Intervalo de confiança: 17,021,6017,021,60 [60,04 ; 60,38]HR Interpretação: Se fôssemos selecionar muitas amostras de 49 elementos da produção de folhas e construíssemos um intervalo de 95% de confiança para cada amostra, 95% desses intervalos conteriam a média populacional . 38,6004,60 Exercícios Uma máquina automática de suco industrial é regulada de modo que a quantidade suprida de cada vez, tenha distribuição aproximadamente normal com desvio- padrão de 35ml. Determine um intervalo de 96% de confiança para a quantidade média de toda produção, sabendo que uma amostra de 30 embalagens teve um conteúdo médio de 290 ml. mls mlX 35 290 = = n = 30 n sZe . 2 = 10,13 30 35.05,2 ==e Grau de confiança de 96% implica em: 1 - = 96% = 4% = 0,04 05,202,0 2 == ZZ exex 10,1329010,13290 [276,90 ; 303,10] ml Dados: -Z/2 Z/2 1 - α 0 /2 /2 10,30390,276 Cálculo do Tamanho da Amostra • O conceito de nível de confiança pode ser utilizado para o cálculo do tamanho da amostra, necessário para fazermos inferências confiáveis. • Se a amostra empregada for muito pequena, a margem de erro será grande, o que impossibilita ou inviabiliza a tomada de decisão. • Por outro lado, se a amostra for muito grande, o intervalo obtido pode ser mais estreito do que o necessário (gastos desnecessários); Como o tamanho da amostra afeta o erro de amostragem? 2 2/ . = e sZn n sZe . 2 = Cálculo do Tamanho da Amostra500 1000 1500 2000 2500 3000 Tamanho da amostra M ar ge m d e er ro (E ) 0,5 1,0 1,5 3,0 2,0 2,5 Tamanho de amostra e margens de erro mantendo fixos (s=10 e 95% de confiança) • Os ganhos em precisão conseguidos com aumentos fixos dos tamanhos das amostras não são constantes; • Tamanho de amostra 5.000 podem ser um perda de tempo e dinheiro porque elas fornecem pouca precisão adicional; Exercícios Em um estudo para a determinação do perfil dos alunos da Faculdade Pitágoras, a característica de maior interesse tem s = 0,3. Qual deve ser o tamanho da amostra para que tenhamos 95% de confiança em que o erro da estimativa da correspondente a esta característica não supere 0,05? 2 2/ . = e sZn 139 05,0 )3,0).(96,1(. 222/ = = = e sZn Dados: e = 0,05 s = 0,3 =0,05 Refaça o cálculo supondo que se deseja ter 98% de confiança. Conclusões • Intervalos de confiança são muito mais informativos do que as estimativas pontuais; • Toda estimativa intervalar está associada a um grau de confiança; • Quando se tem n < 30 ou não se conhece o desvio-padrão da população usamos a distribuição t. Referência Bibliográfica Triola – Introdução a Estatística, p.144-158; Stevenson - Estatística aplicada à Administração Slack – Estatística para Administração; p. 262-277. Soares et al.; - Introdução a Estatística; p.132 –155 Cálculo de Amostra para Populações Finitas Quando a população pesquisada não supera 100.000 elementos, a fórmula para o cálculo do tamanho da amostra é a seguinte: e2 (N-1) + 2 p.q 2. p . q . N n = onde: n =Tamanho da amostra. 2 = Nível de confiança escolhido, expresso em número de desvios-padrão. p = Percentagem com a qual o fenômeno se verifica. q = Percentagem complementar (100-p). N = Tamanho da população. e2 = Erro máximo permitido. Cálculo de Amostra para Populações Finitas Exemplo: Uma pesquisa que tenha por objetivo verificar quantos dos 10.000 empregados de uma fábrica são sindicalizados. Presume-se que esse número não seja superior a 30% do total, deseja-se um nível de confiança de 95,44% (dois desvios) e tolera-se um erro de até 3%. e2 (N-1) + 2 p.q 2. p . q . N n = NC=95,44 DP=2 853 98.391 84.000.000 4.30.70 9.(9.999) .0004.30.70.10n == = Cálculo de Amostra para Populações Infinitas A fórmula básica para o cálculo do tamanho de amostras para populações infinitas passa a ser a seguinte: onde: n = Tamanho da amostra = Nível de confiança escolhido, expresso em número de desvios- padrão p = Percentagem com a qual o fenômeno se verifica q = Percentagem complementar (100 - p) e2 = Erro máximo permitido e2 2. p. q n = Cálculo de Amostra para Populações Infinitas Exemplo: Verificar o número de protestantes residentes em determinada cidade com uma população superior a 100.000 habitantes. A percentagem com que o fenômeno se verifica é de 10%. O nível de confiança bastante alto (superior a 99,74%), aplica-se à fórmula 3 desvios e o erro máximo tolerado de 2%. e2 2. p. q n = NC=99,74 DP=3 2.025 4 8.100 4 9.10.90n === calculoamostra.xls
Compartilhar