Introdução à Inferência Estatística

•

UFPI

Allan Guedes

31.01.2014

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Probabilidade e Estatística

29.429 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Introduc¸a˜o a` Infereˆncia Estat´ıstica
1 Introduc¸a˜o
Em linhas gerais a Infereˆncia estat´ıstica tem por objetivo produzir afirmac¸o˜es a respeito de
uma populac¸a˜o, baseado em uma amostra. E´ a amostra que conte´m os elementos observa´veis
e e´ onde as quantidades de interesse podem ser medidas.
1.1 Populac¸a˜o e Amostra
Populac¸a˜o: e` um conjunto de ind´ıv´ıduos ou objetos que possuem uma certa caracter´ıstica em
comum. Amostra e´ um subconjunto da populac¸a˜o.
1.2 Estat´ısticas e Paraˆmetros
1.2.1 Paraˆmetro:
Um paraˆmetro e´ uma medida usada para descrever uma caracter´ıstica da populac¸a˜o.
Assim, se a populac¸a˜o e´ representada pela v.a. X, alguns paraˆmetros sa˜o a esperanc¸a E(X)
e a variaˆncia V ar(X) de X.
Os s´ımbolos mais comuns sa˜o:
Denominac¸a˜o Populac¸a˜o (Paraˆmetro) Amostra (Estimador)
Me´dia µ = E(X) X
Variaˆncia σ2 = V ar(X) S2
Proporc¸a˜o P p
Soma ou diferenc¸a entre duas me´dias µ1 ± µ2 X1 ±X2
Quociente entre duas Variaˆncias σ21 ÷ σ22 S21 ÷ §22
Nu´mero de elementos N n
Quartis Q1, Q2, Q3 q1, q2, q3
1.2.2 Estimador ou Estat´ıstica:
Uma estat´ıstica amostral ou estimador T e´ qualquer func¸a˜o da amostra X1, X2, . . . , Xn, isto e´,
T = f(X1, X2, . . . , Xn), onde f e´ uma func¸a˜o qualquer.
As estat´ısticas mais comuns sa˜o:
• Me´dia Amostral: X = 1n
∑n
i=1Xi
• Variaˆncia da Amostra: S2 = 1n−1
∑n
i=1
(
Xi −X
)2
• A frequeˆncia relativa: f = p̂ = xn = NCF na amostraNTC na amostra
• A soma, ou diferenc¸a, entre duas me´dias amostrais (X1 ±X2)
• O quociente entre duas variaˆncias amostrais (S21 ÷ S22)
1
1.2.3 Estimativa
O valor nume´rico de um estimador e´ chamado de estimativa de seu respectivo paraˆmetro.
2 Distribuic¸o˜es Amostrais
O problema da infereˆncia estat´ıstica e´ fazer uma afirmac¸a˜o sobre os paraˆmetros da pop-
ulac¸a˜o atrave´s da amostra. Digamos que nossa afirmac¸a˜o deva ser feita sobre um paraˆmetro
θ da populac¸a˜o. Usando uma AAS de n elementos sorteado dessa populac¸a˜o. Nossa decisa˜o
sera´ baseada na estat´ıstica T , que sera´ uma func¸a˜o da amostra (X1, X2, . . . , Xn) , ou seja
T = f(X1, X2, . . . , Xn) . Colhida essa amostra, teremos observado um particular valor de T ,
digamos t0, e baseado nesse valor e´ que faremos a afirmac¸a˜o sobre θ , o paraˆmetro populacional.
A validade da resposta sera´ melhor compreendida se soubermos o que acontece com a es-
tat´ıstica T , quando retiramos todas as amostras de uma populac¸a˜o conhecida segundo o plano
amostral adotado. Isto e´, qual a distribuic¸a˜o de T quando X1, X2, . . . , Xn assume todos os val-
ores poss´ıveis. Essa distribuic¸a˜o e´ chamada distribuic¸a˜o amostral da estat´ıstica e desempenha
papel fundamental na teoria da infereˆncia estat´ıstica.
Procedimento:
a) Uma populac¸a˜o X, com determinado paraˆmetro de interesse θ;
b) Todas as amostras retiradas da populac¸a˜o, de acordo com certo procedimento;
2
c) para cada amostra, calculamos o valor t da estat´ıstica T ; e
d) os valores t formam uma nova populac¸a˜o, cuja distribuic¸a˜o recebe o nome de distribuic¸a˜o
amostral de T .
O exemplo abaixo ilustra como a distribuic¸a˜o da me´dia amostral pode ser determinada por
uma situac¸a˜o simples, quando o tamanho da amostra e´ 2, n = 2 e a distribuic¸a˜o da populac¸a˜o
e´ discreta.
Exemplo 1: Considere a populac¸a˜o (1, 3, 5, 5, 7). Uma amostra aleato´ria simples com
reposic¸a˜o (X1, X2) de tamanho (n = 2) e´ tomada nesta populac¸a˜o. Qual a distribuic¸a˜o do
nu´mero me´dio amostral, ou seja:
X =
X1 +X2
2
2.1 Distribuic¸a˜o Amostral da Me´dia
2.1.1 Me´dia e variaˆncia da distribuic¸a˜o amostral da me´dia
Teorema 1: Seja (X1, X2, . . . , Xn) uma amostra aleato´ria simples de tamanho n de uma
populac¸a˜o representada pela varia´vel aleato´ria X com me´dia µ e variaˆncia σ2. Enta˜o:
E(X) = µ
Se a populac¸a˜o e´ infinita (ou muito grande) OU se a amostragem e´ com reposic¸a˜o, a varia˜ncia
da distribuic¸a˜o amostral das me´dias, denotada por σ2(X), e´ dada por:
V ar(X) = σ2(X) =
σ2
n
Como decorreˆncia, o desvio-padra˜o das me´dias e´ dado por: σ(X) = σ√
n
, tambe´m chamado
erro padra˜o de X.
2.1.2 Distribuic¸a˜o amostral da me´dia para populac¸o˜es Normais com Variaˆncia
conhecida
Teorema 2: Seja (X1, X2, . . . , Xn) uma amostra aleato´ria simples de tamanho n de uma
populac¸a˜o normal, isto e´, uma populac¸a˜o representada por uma varia´vel aleato´ria normal X
com media µ e variaˆncia σ2. Entao:
X ∼ N
(
µ;
σ2
n
)
⇒ Z = X − µσ√
n
∼ N(0, 1)
Na Figura abaixo ilustra-se o comportamento da distribuic¸a˜o amostral da me´dia amostral
com base em amostras de tamanho n = 4 para uma populacao normal com media 2 e variancia
9. A titulo de comparac¸a˜o, apresenta-se ai a distribuic¸a˜o populacional. Pode-se observar que
ela e mais dispersa que a distribuic¸a˜o amostral de X, mas ambas esta˜o centradas no verdadeiro
valor populacional µ = 2.
3
2.2 Distribuic¸a˜o Amostral da Me´dia para populac¸o˜es quaisquer
2.2.1 Teorema Central do Limite
Seja (X1, X2, . . . , Xn) uma amostra aleato´ria simples de uma populac¸a˜o X tal que E(X) = µ e
V ar(X) = σ2. Enta˜o, a distribuic¸a˜o de X converge para a distribuic¸a˜o normal com me´dia µ e
variaˆncia σ2/n quando n→∞, em geral, n ≥ 30. Ou seja,
X ∼ N
(
µ;
σ2
n
)
⇒ Z = X − µσ√
n
∼ N(0, 1)
Se σ desconhecido, pode ser substitu´ıdo por sua estimativa S, o desvio padra˜o amostral, e
mesmo assim, podemos enta˜o dizer que:
X ∼ N
(
µ;
S2
n
)
⇒ Z = X − µ
S√
n
∼ N(0, 1)
Chamemos de e a v.a que mede a diferenc¸a entre a estat´ıstica X e o paraˆmetro µ, isto e´,
e = X − µ e´ chamamdo o erro amostral da me´dia. Enta˜o:
√
ne
σ
∼ N(0, 1)
A interpretac¸a˜o pra´tica do teorema limite central e´ a seguinte: para amostras “grandes”
de qualquer populac¸a˜o, podemos aproximar a distribuic¸a˜o amostral de X por uma distribuic¸a˜o
normal com a mesma me´dia populacional e variaˆncia igual a` variaˆncia populacional dividida
pelo tamanho da amostra.
Na Figura abaixo ilustra-se esse teorema para a distribuic¸a˜o exponencial, ou seja, para uma
populac¸a˜o distribu´ıda segundo uma exponencial com paraˆmetro λ = 1. O grafico superior
representa a distribuic¸a˜o populacional e os histogramas representam a distribuic¸a˜o amostral
de X ao longo de 5000 amostras de tamanhos 10, 50, 100 e 250. Assim, podemos ver que,
4
embora a populac¸a˜o seja completamente diferente da normal, a distribuic¸a˜o amostral de X vai
se tornando cada vez mais proxima da normal a medida que n aumenta.
Exemplos:
1. Uma v.a. X tem distribuic¸a˜o normal com me´dia 100 e desvio padra˜o 10.
a) Calcule P (90 < X < 110)
b) Se X e´ a me´dia de uma amostra aleato´ria simples de 16 elementos retirados dessa
populac¸a˜o, calcule P (90 < X < 110).
5
c) Que tamanho deveria ter a amostra para que P (90 < X < 110) = 0, 95?
2. A capacidade ma´xima de um elevador e´ de 500kg. Se a distribuic¸a˜o dos pesos dos usua´rios
e´ N(70; 100), qual e´ a probabilidade de que 7 pessoas ultrapassem este limite? E de 6
pessoas?
2.3 Distribuic¸a˜o Amostral da Proporc¸a˜o - Amostras grandes
Considere uma populac¸a˜o em que cada elemento e´ classificado de acordo com a presenc¸a ou
auseˆncia de determinada caracter´ıstica.
Em termos de varia´vel aleato´ria, essa populac¸a˜o e´ representada por uma v.a. de Bernoulli,
isto e´:
X =
{
1 se o indiv´ıduo for portador da caracter´ıstica
0 se o indiv´ıduo na˜o for portador da caracter´ıstica
(1)
Denotando por p a proporc¸a˜o de elementos da populac¸a˜o que possuem a caracter´ıstica de
interesse. Enta˜o, P (X = 1) = p e P (X = 0) = 1 − p, E(X) = p e V ar(X) = p(1 − p). Em
geral, esse paraˆmetro e´ desconhecido e precisamos estima´-lo a partir de uma amostra.
Suponha, enta˜o, que dessa populac¸a˜o seja extra´ıda uma amostra aleato´ria simplesX1, X2,. . . , Xn
com reposic¸a˜o. Essas n extrac¸o˜es correspondem a n varia´veis aleato´rias de Bernoulli indepen-
dentes e, como visto, Sn =
∑n
i=1Xi tem distribuic¸a˜o binomial com paraˆmetros n e p.
Com relac¸a˜o a` proporc¸a˜o p̂ de elementos na amostra que possuem a caracter´ıstica de inter-
esse, temos que:
p̂ =
Sn
n
=
X1 +X2 + . . .+Xn
n
(2)
e
E(p̂) = p e V ar(p̂) =
p(1− p)
n
(3)
Pelo Teorema Limite Central temos que:
p̂ ∼ N
(
p;
p(1− p)
n
)
→ p̂− p√
p(1−p)
n
∼ N(0, 1) (4)
Como essa aproximac¸a˜o e´ uma consequ¨eˆncia direta da aproximac¸a˜o normal da binomial, as
mesmas regras continuam valendo: a aproximac¸a˜o deve ser feita se np ≥ 5 e n(1− p) ≥ 5.
6