Baixe o app para aproveitar ainda mais
Prévia do material em texto
Introduc¸a˜o a` Infereˆncia Estat´ıstica 1 Introduc¸a˜o Em linhas gerais a Infereˆncia estat´ıstica tem por objetivo produzir afirmac¸o˜es a respeito de uma populac¸a˜o, baseado em uma amostra. E´ a amostra que conte´m os elementos observa´veis e e´ onde as quantidades de interesse podem ser medidas. 1.1 Populac¸a˜o e Amostra Populac¸a˜o: e` um conjunto de ind´ıv´ıduos ou objetos que possuem uma certa caracter´ıstica em comum. Amostra e´ um subconjunto da populac¸a˜o. 1.2 Estat´ısticas e Paraˆmetros 1.2.1 Paraˆmetro: Um paraˆmetro e´ uma medida usada para descrever uma caracter´ıstica da populac¸a˜o. Assim, se a populac¸a˜o e´ representada pela v.a. X, alguns paraˆmetros sa˜o a esperanc¸a E(X) e a variaˆncia V ar(X) de X. Os s´ımbolos mais comuns sa˜o: Denominac¸a˜o Populac¸a˜o (Paraˆmetro) Amostra (Estimador) Me´dia µ = E(X) X Variaˆncia σ2 = V ar(X) S2 Proporc¸a˜o P p Soma ou diferenc¸a entre duas me´dias µ1 ± µ2 X1 ±X2 Quociente entre duas Variaˆncias σ21 ÷ σ22 S21 ÷ §22 Nu´mero de elementos N n Quartis Q1, Q2, Q3 q1, q2, q3 1.2.2 Estimador ou Estat´ıstica: Uma estat´ıstica amostral ou estimador T e´ qualquer func¸a˜o da amostra X1, X2, . . . , Xn, isto e´, T = f(X1, X2, . . . , Xn), onde f e´ uma func¸a˜o qualquer. As estat´ısticas mais comuns sa˜o: • Me´dia Amostral: X = 1n ∑n i=1Xi • Variaˆncia da Amostra: S2 = 1n−1 ∑n i=1 ( Xi −X )2 • A frequeˆncia relativa: f = p̂ = xn = NCF na amostraNTC na amostra • A soma, ou diferenc¸a, entre duas me´dias amostrais (X1 ±X2) • O quociente entre duas variaˆncias amostrais (S21 ÷ S22) 1 1.2.3 Estimativa O valor nume´rico de um estimador e´ chamado de estimativa de seu respectivo paraˆmetro. 2 Distribuic¸o˜es Amostrais O problema da infereˆncia estat´ıstica e´ fazer uma afirmac¸a˜o sobre os paraˆmetros da pop- ulac¸a˜o atrave´s da amostra. Digamos que nossa afirmac¸a˜o deva ser feita sobre um paraˆmetro θ da populac¸a˜o. Usando uma AAS de n elementos sorteado dessa populac¸a˜o. Nossa decisa˜o sera´ baseada na estat´ıstica T , que sera´ uma func¸a˜o da amostra (X1, X2, . . . , Xn) , ou seja T = f(X1, X2, . . . , Xn) . Colhida essa amostra, teremos observado um particular valor de T , digamos t0, e baseado nesse valor e´ que faremos a afirmac¸a˜o sobre θ , o paraˆmetro populacional. A validade da resposta sera´ melhor compreendida se soubermos o que acontece com a es- tat´ıstica T , quando retiramos todas as amostras de uma populac¸a˜o conhecida segundo o plano amostral adotado. Isto e´, qual a distribuic¸a˜o de T quando X1, X2, . . . , Xn assume todos os val- ores poss´ıveis. Essa distribuic¸a˜o e´ chamada distribuic¸a˜o amostral da estat´ıstica e desempenha papel fundamental na teoria da infereˆncia estat´ıstica. Procedimento: a) Uma populac¸a˜o X, com determinado paraˆmetro de interesse θ; b) Todas as amostras retiradas da populac¸a˜o, de acordo com certo procedimento; 2 c) para cada amostra, calculamos o valor t da estat´ıstica T ; e d) os valores t formam uma nova populac¸a˜o, cuja distribuic¸a˜o recebe o nome de distribuic¸a˜o amostral de T . O exemplo abaixo ilustra como a distribuic¸a˜o da me´dia amostral pode ser determinada por uma situac¸a˜o simples, quando o tamanho da amostra e´ 2, n = 2 e a distribuic¸a˜o da populac¸a˜o e´ discreta. Exemplo 1: Considere a populac¸a˜o (1, 3, 5, 5, 7). Uma amostra aleato´ria simples com reposic¸a˜o (X1, X2) de tamanho (n = 2) e´ tomada nesta populac¸a˜o. Qual a distribuic¸a˜o do nu´mero me´dio amostral, ou seja: X = X1 +X2 2 2.1 Distribuic¸a˜o Amostral da Me´dia 2.1.1 Me´dia e variaˆncia da distribuic¸a˜o amostral da me´dia Teorema 1: Seja (X1, X2, . . . , Xn) uma amostra aleato´ria simples de tamanho n de uma populac¸a˜o representada pela varia´vel aleato´ria X com me´dia µ e variaˆncia σ2. Enta˜o: E(X) = µ Se a populac¸a˜o e´ infinita (ou muito grande) OU se a amostragem e´ com reposic¸a˜o, a varia˜ncia da distribuic¸a˜o amostral das me´dias, denotada por σ2(X), e´ dada por: V ar(X) = σ2(X) = σ2 n Como decorreˆncia, o desvio-padra˜o das me´dias e´ dado por: σ(X) = σ√ n , tambe´m chamado erro padra˜o de X. 2.1.2 Distribuic¸a˜o amostral da me´dia para populac¸o˜es Normais com Variaˆncia conhecida Teorema 2: Seja (X1, X2, . . . , Xn) uma amostra aleato´ria simples de tamanho n de uma populac¸a˜o normal, isto e´, uma populac¸a˜o representada por uma varia´vel aleato´ria normal X com media µ e variaˆncia σ2. Entao: X ∼ N ( µ; σ2 n ) ⇒ Z = X − µσ√ n ∼ N(0, 1) Na Figura abaixo ilustra-se o comportamento da distribuic¸a˜o amostral da me´dia amostral com base em amostras de tamanho n = 4 para uma populacao normal com media 2 e variancia 9. A titulo de comparac¸a˜o, apresenta-se ai a distribuic¸a˜o populacional. Pode-se observar que ela e mais dispersa que a distribuic¸a˜o amostral de X, mas ambas esta˜o centradas no verdadeiro valor populacional µ = 2. 3 2.2 Distribuic¸a˜o Amostral da Me´dia para populac¸o˜es quaisquer 2.2.1 Teorema Central do Limite Seja (X1, X2, . . . , Xn) uma amostra aleato´ria simples de uma populac¸a˜o X tal que E(X) = µ e V ar(X) = σ2. Enta˜o, a distribuic¸a˜o de X converge para a distribuic¸a˜o normal com me´dia µ e variaˆncia σ2/n quando n→∞, em geral, n ≥ 30. Ou seja, X ∼ N ( µ; σ2 n ) ⇒ Z = X − µσ√ n ∼ N(0, 1) Se σ desconhecido, pode ser substitu´ıdo por sua estimativa S, o desvio padra˜o amostral, e mesmo assim, podemos enta˜o dizer que: X ∼ N ( µ; S2 n ) ⇒ Z = X − µ S√ n ∼ N(0, 1) Chamemos de e a v.a que mede a diferenc¸a entre a estat´ıstica X e o paraˆmetro µ, isto e´, e = X − µ e´ chamamdo o erro amostral da me´dia. Enta˜o: √ ne σ ∼ N(0, 1) A interpretac¸a˜o pra´tica do teorema limite central e´ a seguinte: para amostras “grandes” de qualquer populac¸a˜o, podemos aproximar a distribuic¸a˜o amostral de X por uma distribuic¸a˜o normal com a mesma me´dia populacional e variaˆncia igual a` variaˆncia populacional dividida pelo tamanho da amostra. Na Figura abaixo ilustra-se esse teorema para a distribuic¸a˜o exponencial, ou seja, para uma populac¸a˜o distribu´ıda segundo uma exponencial com paraˆmetro λ = 1. O grafico superior representa a distribuic¸a˜o populacional e os histogramas representam a distribuic¸a˜o amostral de X ao longo de 5000 amostras de tamanhos 10, 50, 100 e 250. Assim, podemos ver que, 4 embora a populac¸a˜o seja completamente diferente da normal, a distribuic¸a˜o amostral de X vai se tornando cada vez mais proxima da normal a medida que n aumenta. Exemplos: 1. Uma v.a. X tem distribuic¸a˜o normal com me´dia 100 e desvio padra˜o 10. a) Calcule P (90 < X < 110) b) Se X e´ a me´dia de uma amostra aleato´ria simples de 16 elementos retirados dessa populac¸a˜o, calcule P (90 < X < 110). 5 c) Que tamanho deveria ter a amostra para que P (90 < X < 110) = 0, 95? 2. A capacidade ma´xima de um elevador e´ de 500kg. Se a distribuic¸a˜o dos pesos dos usua´rios e´ N(70; 100), qual e´ a probabilidade de que 7 pessoas ultrapassem este limite? E de 6 pessoas? 2.3 Distribuic¸a˜o Amostral da Proporc¸a˜o - Amostras grandes Considere uma populac¸a˜o em que cada elemento e´ classificado de acordo com a presenc¸a ou auseˆncia de determinada caracter´ıstica. Em termos de varia´vel aleato´ria, essa populac¸a˜o e´ representada por uma v.a. de Bernoulli, isto e´: X = { 1 se o indiv´ıduo for portador da caracter´ıstica 0 se o indiv´ıduo na˜o for portador da caracter´ıstica (1) Denotando por p a proporc¸a˜o de elementos da populac¸a˜o que possuem a caracter´ıstica de interesse. Enta˜o, P (X = 1) = p e P (X = 0) = 1 − p, E(X) = p e V ar(X) = p(1 − p). Em geral, esse paraˆmetro e´ desconhecido e precisamos estima´-lo a partir de uma amostra. Suponha, enta˜o, que dessa populac¸a˜o seja extra´ıda uma amostra aleato´ria simplesX1, X2,. . . , Xn com reposic¸a˜o. Essas n extrac¸o˜es correspondem a n varia´veis aleato´rias de Bernoulli indepen- dentes e, como visto, Sn = ∑n i=1Xi tem distribuic¸a˜o binomial com paraˆmetros n e p. Com relac¸a˜o a` proporc¸a˜o p̂ de elementos na amostra que possuem a caracter´ıstica de inter- esse, temos que: p̂ = Sn n = X1 +X2 + . . .+Xn n (2) e E(p̂) = p e V ar(p̂) = p(1− p) n (3) Pelo Teorema Limite Central temos que: p̂ ∼ N ( p; p(1− p) n ) → p̂− p√ p(1−p) n ∼ N(0, 1) (4) Como essa aproximac¸a˜o e´ uma consequ¨eˆncia direta da aproximac¸a˜o normal da binomial, as mesmas regras continuam valendo: a aproximac¸a˜o deve ser feita se np ≥ 5 e n(1− p) ≥ 5. 6
Compartilhar