Baixe o app para aproveitar ainda mais
Prévia do material em texto
Universidade de Bras´ılia Departamento de Estat´ıstica Campus Universita´rio Darcy Ribeiro, Pre´dio de Cieˆncia da Computac¸a˜o e Estat´ıstica - CIC/EST, CEP:70910-900 - Bras´ılia/DF Probabilidade e Estat´ıstica Roberto Vila 18/10/2017 Noc¸o˜es de Amostragem e Estimac¸a˜o Assuma que o comportamento probabil´ıstico de certa caracter´ıstica de interesse da populac¸a˜o e´ representado por uma v.a. X : Ω→ R. Definic¸a˜o 0.1 (Amostra aleato´ria). Diremos que o vetor aleato´rio (X1, X2, . . . , Xn) : Ω→ Rn e´ uma amostra aleato´ria (simples) de tamanho n (notac¸a˜o, a.a.) da v.a. X se (I) X1, X2, . . . , Xn sa˜o v.a.’s independentes e (II) X1, X2, . . . , Xn sa˜o v.a.’s identicamente distribu´ıdas com X. Por exemplo, quando X e´ discreta teremos que ∀i = 1, 2, . . . , n : P(Xi = x) = P(X = x), ∀x ∈ R. Os valores correspondentes a` a.a. (X1, X2, . . . , Xn) sera˜o representados por (x1, x2, . . . , xn). Observac¸a˜o 0.2. Para uma v.a. discreta X com f.p. pX(·), a f.p. conjunta p da a.a. (X1, X2, . . . , Xn) e´ p(x1, x2, . . . , xn) (I) = n∏ i=1 pXi(xi) (II) = n∏ i=1 pX(xi), ∀(x1, x2, . . . , xn) ∈ Rn. Teorema 0.3. Se (X1, X2, . . . , Xn) e´ uma a.a. da v.a. X , onde X possui me´dia µ e variaˆncia σ 2, enta˜o E(Xi) = µ e Var(Xi) = σ2, ∀i = 1, 2, . . . , n. 1 Estat´ısticas e Paraˆmetros Definic¸a˜o 1.1 (Estat´ıstica). Uma estat´ıstica1 T e´ uma func¸a˜o da a.a. (X1, X2, . . . , Xn). Isto e´, a v.a. T := h(X1, X2, . . . , Xn) e´ uma estat´ıstica, que para essa amostra toma o valor t := h(x1, x2, . . . , xn). 1Uma estat´ıstica pode ser interpretada como uma caracter´ıstica da a.a. Probabilidade e Estat´ıstica Definic¸a˜o 1.2 (Paraˆmetro). Um paraˆmetro e´ uma medida usada para descrever a caracter´ıstica da populac¸a˜o. Exemplo 1.3. Denominac¸a˜o Paraˆmetro Estat´ıstica me´dia µ := E(X) X := ∑n i=1Xi/n variaˆncia σ2 := Var(X) S2 := ∑n i=1(Xi −X)2/(n− 1) mediana Md = Q2 md = q2 proporc¸a˜o p pˆ := qi = ni/n Quantil Q(p) q(p) Quartis Q1, Q2, Q3 q1, q2, q3 Distaˆncia Interquartil dQ = Q3 −Q1 dq = q3 − q1 Problema Central da Infereˆncia Estat´ıstica Atrave´s da amostra tirar concluso˜es e afirmac¸o˜es relevantes sobre os paraˆmetros da populac¸a˜o. 2 Distribuic¸o˜es amostrais Teorema 2.1. Se (X1, X2, . . . , Xn) uma a.a. da v.a. X, onde X possui me´dia µ e variaˆncia σ 2, enta˜o E(X) = µ e Var(X) = σ2/n. 2.1 Distribuic¸a˜o amostral da me´dia A distribuic¸a˜o amostral da me´dia, aproximadamente, pode ser obtido pelo Teorema do Limite Central (TLC). O TLC e´ um importante resultado da Estat´ıstica. Em teoria das probabilidades, esse teorema afirma que, a distribuic¸a˜o amostral da me´dia aproxima-se cada vez mais de uma distribuic¸a˜o normal, quando o tamanho da amostra aumenta. Na infereˆncia estat´ıstica o TLC e´ muito u´til para estimar os paraˆmetros como a me´dia ou o desvio padra˜o populacional, a partir de uma amostra aleato´ria dessa populac¸a˜o. Teorema 2.2 (TLC). Para a.a.’s (X1, X2, . . . , Xn) retiradas de uma v.a. X, onde X possui me´dia µ e variaˆncia σ2 ambas finitas, se satisfaz Zn := √ n ( X − µ σ ) ∼ N(0, 1) a medida que n→∞. (1) Proposic¸a˜o 2.3. Sob as condic¸o˜es do TLC, (1) e´ equivalente a X ∼ N(µ, σ2/n) a medida que n→∞. Observac¸a˜o 2.4. Por definic¸a˜o, (1) e´ equivalente a` ∀z ∈ R : FZn(z) ≈ Φ(z) a medida que n→∞, onde Φ(z) := P(Z 6 z) com Z ∼ N(0, 1). 2/4 Probabilidade e Estat´ıstica 2.2 Distribuic¸a˜o amostral de uma proporc¸a˜o Suponha que uma populac¸a˜o, que possui uma caracter´ıstica de interesse, e´ modelada probabilis- ticamente por uma v.a. X : Ω→ R. Assim, X e´ uma v.a. dicotoˆmica e pode ser escrita como X = { 1, se o indiv´ıduo possui a caracter´ıstica 0, c.c. Seja N ≈ tamanho da populac¸a˜o, D ≈ node indiv´ıduos na populac¸a˜o que possuem a caracter´ıstica. Considere (X1, X2, . . . , Xn) uma a.a. da v.a. X. Logo ∀i = 1, 2, . . . , n : Xi = { 1, se o indiv´ıduo possui a caracter´ıstica 0, c.c Seja Sn ≈ no de indiv´ıduos na amostra que possuem a caracter´ıstica = n∑ i=1 Xi. 2.2.1 Proporc¸a˜o populacional A proporc¸a˜o populacional (denotada por p) e´ um paraˆmetro que descreve o valor percentual (frac¸a˜o) associado a` populac¸a˜o. Exemplo 2.5. Um determinado censo mostrou que 23, 7% da populac¸a˜o norte-americana foi identi- ficada como sendo hispana ou latina. O valor 0, 237 e´ a proporc¸a˜o da populac¸a˜o. Definic¸a˜o 2.6 (Proporc¸a˜o populacional). A proporc¸a˜o populacional p e´ definida como p := D N . Assim, X ∼ Bern(p) e portanto, E(X) = p e Var(X) = p(1− p). 2.2.2 Proporc¸a˜o amostral A proporc¸a˜o amostral (denotada por pˆ) e´ um paraˆmetro que descreve o valor percentual associado a` amostra da populac¸a˜o. Exemplo 2.7. Assuma que temos uma amostra de 4 animais: 1 pa´ssaro, 1 coelho, 1 peixe e 1 cachorro. A proporc¸a˜o amostral de animais de 4 patas e´ 0, 5. Definic¸a˜o 2.8 (Proporc¸a˜o amostral). A proporc¸a˜o amostral pˆ e´ definida como pˆ := Sn n = ∑n i=1Xi n = X. 3/4 Probabilidade e Estat´ıstica Observac¸a˜o 2.9. Note que ∑n i=1Xi ∼ bin(n, p). Pelo TLC sabemos que pˆ ∼ N(p, p(1− p)/n) a medida que n→∞. Note, tambe´m, que no caso de proporc¸o˜es o TLC e´ nada mais que o Teorema de Laplace-Moivre. Exemplo 2.10. Em uma populac¸a˜o, 40% apresentam certa propriedade. Uma a.a. de tamanho 200 sera´ tomada e calculada a respectiva proporc¸a˜o. Determine a probabilidade de que a proporc¸a˜o da amostra esteja dentro de ±3% da proporc¸a˜o da populac¸a˜o. Rpta. (Use o TLC) = 0, 61. 4/4
Compartilhar