Baixe o app para aproveitar ainda mais
Prévia do material em texto
Distribuição Amostral das Médias. Unidade III - Aula 11 Disciplina: Cálculo das Probabilidades e Estatística I Professor: ELMIRO 2015-1 UNIVERSIDADE FEDERAL DA PARAÍBA CENTRO DE CIÊNCIA EXATAS E DA NATUREZA DEPARTAMENTO DE ESTATÍSTICA Distribuições Amostrais. Introdução. A Inferência Estatística é um conjunto de técnicas que objetiva estudar a população através de evidências fornecidas por uma amostra É a amostra que contém os elementos que podem ser observados e, a partir daí, quantidades de interesse podem ser medidas. Continuação... O que precisamos saber: A Distribuição Amostral: Retrata o comportamento de uma estatística (média, proporção, entre outras), caso retirássemos todas as possíveis amostras de tamanho “n” de uma população. Uma estatística: É uma função da amostra. Uma amostra consiste de observações de uma variável aleatória. Assim, estatísticas também são variáveis aleatórias e, por isso, possuem uma distribuição de probabilidade. Continuação... Uma Distribuição Amostral é a distribuição de probabilidade de uma estatística da amostra formada quando amostras de tamanho “n” são colhidas várias vezes de uma população. Se a estatística da amostra for a média, então a distribuição obtida será a “distribuição amostral das médias amostrais”. De forma idêntica: se a estatística de amostra for a proporção, então a distribuição obtida será a “distribuição amostral das proporções amostrais”. x2 x3 x7x5 x6 x9 x10 x11 x14 x13 x4 x15 x8 x12 .... Amostra 1 Amostra 2 Amostra 3 Amostra 4 Amostra 5 Amostra 6 Amostra 7 Amostra 8 Amostra 9 𝑥1 𝑥2 𝑥3 𝑥4 𝑥5 𝑥6 𝑥7 𝑥8 𝑥9População A distribuição amostral é formada pela médias de todas a amostras: 𝑥1, 𝑥2, 𝑥3, 𝑥4, 𝑥5, 𝑥6, 𝑥7, 𝑥8, 𝑥9, ..... Continuação... Como funciona: Considere uma população de 5 elementos (N = 5): 2, 3, 4, 5 e 6. Represente-a graficamente. Calcule sua média e desvio padrão. Determine todas as amostras possíveis com reposição e calcule a média e a variância. Na população, temos que µ=4 e σ2=2. Valor de x f fr 2 1 0,2 3 1 0,2 4 1 0,2 5 1 0,2 6 1 0,2 5 1,0 Continuação... Amostras 𝒙 f fr (2,2) 2,0 1 0,04 (2,3)(3,2) 2,5 2 0,08 (2,4)(3,3)(4,2) 3,0 3 0,12 (2,5)(3,4)(4,3)(5,2) 3,5 4 0,16 (2,6)(3,5)(4,4)(5,3)(6,2) 4,0 5 0,20 (3,6)(4,5)(5,4)(6,3) 4,5 4 0,16 (4,6)(5,5)(6,4) 5,0 3 0,12 (5,6)(6,5) 5,5 2 0,08 (6,6) 6,0 1 0,04 - 25 1,00 Construção da distribuição das médias Continuação... O que se pode concluir: A distribuição de frequência dos valores de x, em uma população de 5 valores, é igualmente prováveis; Apesar dos 5 valores de x serem igualmente frequentes (fr = 0,20 para cada um) na população original, as médias amostrais com valor próximo de 4,0 são mais frequentes do que as médias mais extremas. A distribuição de frequência das médias de 2 elementos, obtidas dessa população, se aproxima da curva da distribuição normal; Continuação... Quando as amostras são grandes, as médias de todas as amostras possíveis, de igual tamanho, retiradas aleatoriamente de uma população, distribuem-se segundo uma curva normal Teorema do Limite Central. Curva Normal Continuação... Formalizando: Considere uma variável aleatória com qualquer distribuição de probabilidade, tendo media 𝜇 e variância 𝜎2. Se amostras de tamanho “n” forem retiradas aleatoriamente desta população, e se forem analisadas a distribuição das médias de todas estas amostra, observaremos que, a medida que o tamanho da amostra aumenta, a distribuição amostral das média tende a uma distribuição normal, cuja média será dada por: 𝜇𝑥 = 𝜇 e variância, (denominada erro padrão da média) dada por: 𝜎𝑥 2 = 𝜎2 𝑛 Observações importantes. Se amostras de qualquer tamanho forem retiradas uma população com distribuição normal com media 𝜇 e variancia 𝜎2, então: a distribuição amostral das média terá distribuição normal, com média 𝜇𝑥 = 𝜇 e variância e 𝜎𝑥 2 = 𝜎2 𝑛 Continuação... 𝜇 𝜇𝑥 Continuação... Se amostras de tamanho n≥30, forem retiradas de uma população com qualquer tipo de distribuição, com media 𝜇 e variância 𝜎2 então: a distribuição amostral das média terá distribuição normal, com média 𝜇𝑥 = 𝜇 e variância e 𝜎𝑥 2 = 𝜎2 𝑛 Continuação... Seja (X1, X2, ..., Xn ) uma amostra aleatória simples retirada de uma população qualquer. Se X1, X2,...,Xn são independentes, com E(Xi) = e Var(Xi) = 2. Então, se X tem distribuição normal, ou n≥30, (Teorema do Limite Central), temos que: 𝑋~𝑁 𝜇; 𝜎2 𝑛 , logo 𝑍 = 𝑋−𝜇 𝜎 𝑛 ~𝑁 0; 1 onde 𝜇𝑥 = 𝜇 e 𝜎𝑥 2 = 𝜎2 𝑛 . Assim teremos: 𝜇 e 𝜎 média e desvio padrão da população e 𝜇𝑥 e 𝜎𝑥 média e desvio padrão da distribuição amostral das média. Continuação... Observação: Se forem extraídas todas as amostras de tamanho n (sem reposição) de uma população finita de tamanho N, então temos que: A quantidade é conhecida como o fator de correção amostral para população finita, ou simplesmente “Fator de Correção”. Observação: Uma população, que tem um limite superior definido, é chamada de finita. Em estatística, consideramos como população finita aquela em que (n/N) > 0,05, ou seja, quando a fração amostral é superior a 5 %. 1N nN n e X X 1N nN Continuação... Exemplo: A altura dos estudantes da turma de Cálculo das Probabilidades e Estatística tem distribuição normal com média 172 cm e desvio padrão 9 cm. Uma amostra de 25 estudantes é retirada. a) Qual a probabilidade de que a média amostral seja acima de 175 cm? b) Qual a probabilidade de que a média amostral esteja entre 170 e 176 cm? c) Qual deve ser a altura média dos estudantes que permita que em 90% das vezes a média amostral seja inferior a este valor. Continuação... Distribuição amostral da proporção Considere uma população em que cada elemento é classificado de acordo com a presença ou ausência de determinada característica. Por exemplo, podemos pensar em eleitores escolhendo entre 2 candidatos; pessoas classificadas de acordo com o sexo, etc. Assim desta forma vamos considerar uma população em que a proporção de elementos com uma certa característica é p. Logo, podemos definir uma variável aleatória X como: 𝑋 = 1, 𝑠𝑒 𝑜 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜 𝑝𝑜𝑠𝑠𝑢𝑖 𝑎 𝑐𝑎𝑟𝑎𝑐𝑡𝑎𝑟í𝑠𝑡𝑖𝑐𝑎, 0, 𝑠𝑒 𝑜 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜 𝑛ã𝑜 𝑝𝑜𝑠𝑠𝑢𝑖 𝑎 𝑐𝑎𝑟𝑎𝑐𝑡𝑎𝑟í𝑠𝑡𝑖𝑐𝑎 Continuação... População: 𝑵 = 𝑵𝑨 +𝑵𝑨 Parâmetro: p = proporção de elementos que tem a característica A Amostra X1, X2, ..., Xn 0 ou 1 1=com o atributo 0=sem o atributo Continuação... Retira-se uma amostra aleatória simples de tamanho n dessa população. Seja 𝑆𝑛 = 𝑖=1 𝑛 𝑋𝑖 o número de indivíduos com a característica de interesse na amostra, então teremos que Sn ~ Binomial(n, p). A variável aleatória Sn tem distribuição binomial com parâmetros n e p. Desta forma, probabilidades envolvendo a proporção amostral podem ser calculadas de modo exato usando esta distribuição. Caso o valor de n seja muito grande, essas probabilidades darão algum trabalho para serem calculadas e torna-se conveniente utilizarmos a aproximação Normal como aproximação. Continuação... Como usar este resultado A Distribuição Amostral de 𝒑 pode ser aproximada por uma distribuição normal sempre que o tamanho da amostra for grande, ou seja, pode-se utilizar essa aproximação se as seguintes condições são satisfeitas: • np ≥ 5 • n(1-p) ≥ 5 Sabemos que 𝑋 = 𝑆𝑛𝑛 tem distribuição normal para n suficientemente grande. Seja então 𝑝 = 𝑋 , a proporção amostral, então teremos que: 𝑝~𝑁 𝑝; 𝑝(1−𝑝) 𝑛 logo 𝑍 = 𝑝−𝑝 𝑝(1−𝑝) 𝑛 ~𝑁 0; 1 onde 𝜇 𝑝 = 𝑝 e 𝜎 𝑝 2 = 𝑝(1−𝑝) 𝑛 Continuação... Suponha que podemos extrair todas as amostras de tamanho n (sem reposição) de uma população finita de tamanho N, neste caso temos que: A quantidade 𝑁−𝑛 𝑁−1 é denominada de fator de correção amostral para população finita, ou simplesmente “Fator de Correção”. Se o tamanho da população for muito grande, infinito, ou ainda se a amostragem for feita com reposição, os resultados acima passam a ser: 1 )1( ˆˆ N nN n pp p pp e n pp pp )1( ˆˆ p e Continuação... Exemplo 1: De acordo com os estudos realizados pela Cagepa, no município de João Pessoa, o consumo mensal de água por residência tem distribuição normal com média 20 m3 e variância de 144 m3. a) Em uma amostra de 36 residências, qual a probabilidade de que a média amostral não se afaste da verdadeira média populacional por mais de 2 m3? b) Devida a escassez de água nos reservatórios, a empresa deseja estipular um consumo médio de forma que em 95% das vezes o consumo médio amostral seja inferior a este valor. Qual deve ser o valor estipulado pela Cagepa? Continuação... Exemplo 2 Com base em dados obtidos em uma pesquisa de mercado, observou-se que a aceitação de um determinado sabonete é de 70%. a) Que tamanho da amostra deve ser retirada para se ter um nível de confiança de 95% e um erro amostral de no máximo 3%? b) Se a empresa entrevistou 100 consumidores, qual a probabilidade de que a proporção amostral de aceitação do sabonete esteja entre 65% e 78%?
Compartilhar