Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Inferência Estatística Distribuição Amostral Situação Uma semeadora deve ser regulada de tal modo que a distribuir 10 sementes de milho a cada metro. Como verificar se a semeadora esta bem regulada? Impossível analisar a população Usaremos amostragem aleatória de tamanho n=36 m estimamos a média amostral de 9,6 sementes/m A partir do resultado amostral, que inferência podemos fazer sobre o valor do parâmetro (µ)? Será que µ=10 sementes/metro? Como responder? A inferência estatística permite a obtenção de informações a respeito do parâmetro populacional (µ, σ2, ...) a partir de uma amostra. A inferência pode ser dividida em: Estimação de Parâmetros Consiste em avaliar uma medida populacional, a partir da informação amostral Por ponto (ex.: média, moda, mediana, ...) Por intervalo (ex: intervalos de confiança) Testes de Hipóteses Consiste em julgar hipóteses sobre populações usando os conhecimentos amostrais Alguns Conceitos Importantes Parâmetros As quantidades da população, em geral desconhecidas e sobre as quais temos interesse, são denominadas de parâmetros e usualmente representadas letras gregas tais como , e , entre outras. Estimadores À combinação dos elementos da amostra, construída com a finalidade de representar, ou estimar, um parâmetro de interesse na população, são denominamos de estimador. Em geral denotamos os estimadores por símbolos com acento circunflexo: ˆ,ˆ,ˆ Alguns Conceitos Importantes Estimativas => Valores numéricos assumidos pelos estimadores são denominados estimativas pontuais ou simplesmente estimativas. OBS: Note que um estimador é uma função das variáveis aleatórias da amostra, isto é: Portanto, um estimador também é uma variável aleatória e a correspondente distribuição de probabilidade formará a base das argumentações probabilísticas utilizadas na extrapolação da informação da amostra para os parâmetros da população. ˆ )X,...,X,(Xˆ n21fθ Algumas Propriedades dos Estimadores (i) Vício => Um estimador é não viciado ou não viesado para um parâmetro se . Em outras palavras um estimador é não viciado ou não viesado se seu valor esperado coincide com o parâmetro de interesse. (ii) Consistência Um estimador é consistente se, à medida que o tamanho da amostra aumenta, seu valor converge para o parâmetro de interesse e sua variância converge para zero. Ou seja, é consistente se duas propriedades são satisfeitas: ˆ θθE n )ˆ(lim 0)ˆ(lim θVar n e ˆ )ˆ(θE ˆ 2 Algumas Propriedades dos Estimadores (iii) Eficiência => Dado dois estimadores e , não viciados para um parâmetro , dizemos que é mais eficiente que se : 1ˆ )ˆ()ˆ( 21 θVarθVar 2ˆ 1ˆ 2ˆ Definição 1: Uma amostra aleatória simples com reposição (AAS) de tamanho n de uma variável aleatória X (população), com dada distribuição, é o conjunto de n variáveis aleatórias independentes X1, X2, ... , Xn, cada uma com a mesma distribuição de X. Definição 2: Uma estatística é uma característica da amostra, ou seja, uma estatística T é uma função de X1, X2, ... , Xn Média amostral: Variância amostral: n XXX X n ...21 1 )( 1 2 2 n XX S n i i Distribuições Amostrais Vamos usar uma amostra aleatória de n elementos sorteados da população. Nossa afirmação será baseada numa estatística T, função da amostra (X1, X2, ... , Xn). Na amostra observamos um particular valor de T e, com base nesse valor, fazemos afirmações sobre um parâmetro θ, por exemplo. A validade de nossas afirmações é melhor compreendida quando sabemos o comportamento de T. retiramos todas as possíveis amostras de tamanho n da população. A distribuição de todos os valores de T é denominada distribuição amostral de T . Distribuição Amostral da Média Objetivo Estimar a média µ de uma variável aleatória X, que representa uma característica de interesse de uma população, a partir de uma amostra. Propriedades Obs: se n cresce, erro padrão decresce n σ μNXσμNXiii n σ σ n σ σii μXEμi XX X 2 2 2 2 ;;) ) ) Teorema do Limite Central iv) Se a população tem uma distribuição qualquer com média µ e variância σ2, para n suficientemente grande (n>30), então a média amostral tem distribuição aproximadamente normal. n σ μNX σXVar μXE a 2 2 ; )( )( Exemplo Considere a seguinte população: {1, 3, 5, 7} Seja X a v.a. o valor assumido por um elemento sorteado ao acaso dessa população Obter a função de distribuição Considerar todas as possíveis amostras de tamanho n=2 com reposição dessa população. Sejam X1 (primeiro número) e X2 (segundo número) as variáveis aleatórias. Obter a distribuição Amostral da estatística média x P(X=x) 1 ¼ 3 ¼ 5 ¼ 7 ¼ 3 Distribuições amostrais O problema básico da Inferência Estatística consiste em se fazer uma afirmação sobre parâmetros através de resultados obtidos na amostra. Colhida uma amostra particular x1, x2, ..., xn calculamos o valor da estatística T (t1, por exemplo) e baseado neste valor faremos uma afirmação (ou inferência) sobre o parâmetro θ. A afirmação sobre o parâmetro θ será melhor compreendida se soubermos o que acontece com a estatística T quando retiramos todas as possíveis amostras de tamanho n da população. A distribuição dos possíveis valores da estatística T é chamada de distribuição amostral ou por amostragem da estatística T. Distribuições amostrais O procedimento utilizado para a obtenção da distribuição amostral da estatística T pode ser resumido da seguinte maneira: i) Da população X, estamos interessados no parâmetro θ. ii) De acordo com um certo procedimento de amostragem, retiramos todas as amostras de tamanho n da população X. iii) Para cada amostra (Xi1, Xi2, ...,Xin) calculamos o valor ti da estatística T, i = 1, 2, ...**** iv) Os valores ti formam uma nova população cuja distribuição de probabilidades recebe o nome de distribuição amostral da estatística T. A DISTRIBUIÇÃO AMOSTRAL DA MÉDIA Teorema 1. Seja X uma população com média µ e variância σ2 e seja (X1, ..., Xn) uma amostra casual simples de tamanho n retirada desta população. Se X é uma v.a. com distribuição normal de média µ e variância σ2, pode-se demonstrar que a distribuição da média também será normal de mesma média, µ, mas com variância σ2/n, isto é: X ~ N(, 2) ~ N(, 2/n) X A DISTRIBUIÇÃO AMOSTRAL DA MÉDIA Teorema 2. Para amostras casuais simples de tamanho n retiradas de qualquer população com média e variância 2, a distribuição amostral da média aproxima-se de uma distribuição normal com média e variância 2/n, quando n tende para infinito (Teorema do Limite Central). Se (X1, X2, ...,Xn) é uma a.c.s. de tamanho n da população X que tem média µ e variância σ2, então a variável ~ N(0, 1) quando n tende para infinito. n X Z 2 Exercício Considere uma semeadora regulada de tal modo a distribuir em média µ=9,6 sementes/m. Sabe-se que X tem variância 0,81 (sementes/m) 2. Calcular a probabilidade da média amostral de X de uma amostra aleatória de tamanho n=36: Ser menor do que 10 sem/m? P( <10)=? Estar entre 9,4 e 10 sem/m? Ser maior que 9,9 sem/m? Obter tal que: P( < )=0,985 P( < )=0,975 Dica: lembrar do teorema do limite central X X X X x x Estimação de Parâmetros – Intervalos de Confiança Quando estamos interessados em um determinado parâmetro de uma população lançamos mão de uma amostra extraída dessa população procuramos, através dessa amostra, estimar o parâmetro populacional. 4 Logo... A partir da amostra de tamanho n estimamos os parâmetros populacionais e 2 através dos estimadores (ao lado) Que produzem, para a amostra selecionada, as estimativas pontuais são chamadas pontuais, pois são únicas para cada amostra selecionada n i ix n X 1 1 n x x n S n i in i i 2 1 1 22 1 1 Assim... Vejamos agora como obter estimativas intervalares para o parâmetro de interesse isto é, como determinar intervalos com limites que abranjam o valor do parâmetro populacional com uma margem de segurança prefixada Intervalo de confiança Intervalo de confiança para a média populacional )1;0(~;~);(~ 2 2 2 N n X Z n NXNX População normal, variância populacional 2 conhecida α-1=)z<Z<P(-z=)x<μ<xP( tt21 Intervalo de confiança para a média populacional n zX n zXPz n X zP cccc 2 n zx n zx n zxCI ccc 222 1 ;.. Fixando uma probabilidade , iremos considerar um intervalo simétrico em relação à origem, tal que = P(-zc < Z < zc), onde zc pode ser obtido em tabela e o seu valor depende exclusivamente da confiança () que desejamos na estimativa por intervalo. Então: e o I.C. para a média populacional, , com um coeficiente de confiança , é Vimos que para uma amostra suficientemente grande, a distribuição das médias amostrais em torno da média populacional é Normal com desvio padrão n . Chamamos de n de erro padrão (EP) da média, uma vez que quanto menor seu valor tanto mais próximas estarão as médias amostrais da média populacional (i.e. tanto menor será o erro). Intervalo de Confiança para uma Média 5 Isto significa que 68,3% de todas as médias amostrais cairão dentro de 1 EP da média populacional . Considerando: média populacional = desvio-padrão populacional = E.P. da média = Similarmente 95% de todas as médias amostrais cairão dentro 1,96 x EP de . Então intervalos da forma: conterão a verdadeira média populacional em 95% das vezes. Intervalo de Confiança para uma Média n n X n XCI .96,1,.96,1%)95,.(. Intervalo de confiança para a média populacional Dizemos que o intervalo contem o verdadeiro valor da média populacional com uma confiança de 100%. Note que este I.C. é centrado na média e a sua amplitude é igual a . O coeficiente de confiança () deve ser entendido da seguinte maneira: “se a partir de K amostras independentes de tamanho n, calculamos K intervalos de confiança (diferentes) para a média µ, pelo menos K* desses intervalos deverão cobrir (incluir) o verdadeiro valor de ”. X n zc 2 Exemplo Para uma amostra de 36 observações de uma população normal com variância conhecida e média desconhecida, seja a média amostral. Construir os intervalos de 95 e 99% de confiança para μ. Interpretação: Temos 95% de confiança de que o intervalo ( ; ) contenha a média populacional . Temos 99% de confiança de que o intervalo ( ; ) contenha a média populacional . 22 kg36,0 kgX 6,59 IC para população normal, variância populacional 2 desconhecida Neste caso, o intervalo de confiança é calculado utilizando-se uma nova estatística: sendo S2 o estimador da variância populacional. Esta estatística, tem distribuição t de Student com (n 1) graus de liberdade. n S X T 2 Note que quanto menor o v, maiores os valores de t; Note ainda que à medida que o v cresce, o valor de t torna-se próximo a 1,96, por exemplo. 6 Intervalo de confiança Nesse caso, o intervalo de confiança para a média populacional , supondo que a população tem distribuição normal com variância desconhecida é dada por: Sendo S2 é o estimador da variância populacional );().(. 222 1 n S tx n S tx n S txCI TTT Consulta a tabela t de Student Exemplo Considere a seguinte amostra: Brix (%) – cana-de-açucar 19,68 19,91 19,61 19,58 19,31 19,61 19,88 20,11 20,21 20,01 19,31 19,41 Encontre a média e variância amostral Determine o intervalo de confiança para a média (95%) Graus de liberdade=n-1 População com distribuição não normal, grandes amostras (n>30) Vimos como construir intervalos de confiança para a média populacional µ Supondo a v.a. com distribuição normal na população Variância desconhecida E quando a distribuição da v.a. não é normal na população? Saída: utilizar o Teorema do Limite Central Assim... Pelo teorema do limite central, se a amostra for suficientemente grande (n>30), então a estatística (T) de interesse pode ser obtida por: );(N~ n S X Z a 10 2 O novo intervalo de confiança! n S zX n S zX n S zXCI ccc 222 1 ;).(. Uso e aplicação como para o caso de amostra com variância conhecida, porém a estatística será obtida a partir da variância amostral.
Compartilhar