Buscar

amostragem e estimação

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

Universidade de Bras´ılia
Departamento de Estat´ıstica
Campus Universita´rio Darcy Ribeiro, Pre´dio de Cieˆncia da Computac¸a˜o e Estat´ıstica - CIC/EST, CEP:70910-900 - Bras´ılia/DF
Probabilidade e Estat´ıstica
Roberto Vila
18/10/2017
Noc¸o˜es de Amostragem e Estimac¸a˜o
Assuma que o comportamento probabil´ıstico de certa caracter´ıstica de interesse da populac¸a˜o e´
representado por uma v.a. X : Ω→ R.
Definic¸a˜o 0.1 (Amostra aleato´ria). Diremos que o vetor aleato´rio (X1, X2, . . . , Xn) : Ω→ Rn e´ uma
amostra aleato´ria (simples) de tamanho n (notac¸a˜o, a.a.) da v.a. X se
(I) X1, X2, . . . , Xn sa˜o v.a.’s independentes e
(II) X1, X2, . . . , Xn sa˜o v.a.’s identicamente distribu´ıdas com X. Por exemplo, quando X e´ discreta
teremos que
∀i = 1, 2, . . . , n : P(Xi = x) = P(X = x), ∀x ∈ R.
Os valores correspondentes a` a.a. (X1, X2, . . . , Xn) sera˜o representados por (x1, x2, . . . , xn).
Observac¸a˜o 0.2. Para uma v.a. discreta X com f.p. pX(·), a f.p. conjunta p da a.a. (X1, X2, . . . , Xn)
e´
p(x1, x2, . . . , xn)
(I)
=
n∏
i=1
pXi(xi)
(II)
=
n∏
i=1
pX(xi), ∀(x1, x2, . . . , xn) ∈ Rn.
Teorema 0.3. Se (X1, X2, . . . , Xn) e´ uma a.a. da v.a. X , onde X possui me´dia µ e variaˆncia σ
2,
enta˜o
E(Xi) = µ e Var(Xi) = σ2, ∀i = 1, 2, . . . , n.
1 Estat´ısticas e Paraˆmetros
Definic¸a˜o 1.1 (Estat´ıstica). Uma estat´ıstica1 T e´ uma func¸a˜o da a.a. (X1, X2, . . . , Xn). Isto
e´, a v.a. T := h(X1, X2, . . . , Xn) e´ uma estat´ıstica, que para essa amostra toma o valor t :=
h(x1, x2, . . . , xn).
1Uma estat´ıstica pode ser interpretada como uma caracter´ıstica da a.a.
Probabilidade e Estat´ıstica
Definic¸a˜o 1.2 (Paraˆmetro). Um paraˆmetro e´ uma medida usada para descrever a caracter´ıstica da
populac¸a˜o.
Exemplo 1.3.
Denominac¸a˜o Paraˆmetro Estat´ıstica
me´dia µ := E(X) X :=
∑n
i=1Xi/n
variaˆncia σ2 := Var(X) S2 :=
∑n
i=1(Xi −X)2/(n− 1)
mediana Md = Q2 md = q2
proporc¸a˜o p pˆ := qi = ni/n
Quantil Q(p) q(p)
Quartis Q1, Q2, Q3 q1, q2, q3
Distaˆncia Interquartil dQ = Q3 −Q1 dq = q3 − q1
Problema Central da Infereˆncia Estat´ıstica
Atrave´s da amostra tirar concluso˜es e afirmac¸o˜es relevantes sobre os paraˆmetros da populac¸a˜o.
2 Distribuic¸o˜es amostrais
Teorema 2.1. Se (X1, X2, . . . , Xn) uma a.a. da v.a. X, onde X possui me´dia µ e variaˆncia σ
2,
enta˜o
E(X) = µ e Var(X) = σ2/n.
2.1 Distribuic¸a˜o amostral da me´dia
A distribuic¸a˜o amostral da me´dia, aproximadamente, pode ser obtido pelo Teorema do Limite Central
(TLC). O TLC e´ um importante resultado da Estat´ıstica. Em teoria das probabilidades, esse teorema
afirma que, a distribuic¸a˜o amostral da me´dia aproxima-se cada vez mais de uma distribuic¸a˜o normal,
quando o tamanho da amostra aumenta.
Na infereˆncia estat´ıstica o TLC e´ muito u´til para estimar os paraˆmetros como a me´dia ou o desvio
padra˜o populacional, a partir de uma amostra aleato´ria dessa populac¸a˜o.
Teorema 2.2 (TLC). Para a.a.’s (X1, X2, . . . , Xn) retiradas de uma v.a. X, onde X possui me´dia
µ e variaˆncia σ2 ambas finitas, se satisfaz
Zn :=
√
n
(
X − µ
σ
)
∼ N(0, 1) a medida que n→∞. (1)
Proposic¸a˜o 2.3. Sob as condic¸o˜es do TLC, (1) e´ equivalente a
X ∼ N(µ, σ2/n) a medida que n→∞.
Observac¸a˜o 2.4. Por definic¸a˜o, (1) e´ equivalente a`
∀z ∈ R : FZn(z) ≈ Φ(z) a medida que n→∞,
onde Φ(z) := P(Z 6 z) com Z ∼ N(0, 1).
2/4
Probabilidade e Estat´ıstica
2.2 Distribuic¸a˜o amostral de uma proporc¸a˜o
Suponha que uma populac¸a˜o, que possui uma caracter´ıstica de interesse, e´ modelada probabilis-
ticamente por uma v.a. X : Ω→ R. Assim, X e´ uma v.a. dicotoˆmica e pode ser escrita como
X =
{
1, se o indiv´ıduo possui a caracter´ıstica
0, c.c.
Seja
N ≈ tamanho da populac¸a˜o,
D ≈ node indiv´ıduos na populac¸a˜o que possuem a caracter´ıstica.
Considere (X1, X2, . . . , Xn) uma a.a. da v.a. X. Logo
∀i = 1, 2, . . . , n : Xi =
{
1, se o indiv´ıduo possui a caracter´ıstica
0, c.c
Seja
Sn ≈ no de indiv´ıduos na amostra que possuem a caracter´ıstica =
n∑
i=1
Xi.
2.2.1 Proporc¸a˜o populacional
A proporc¸a˜o populacional (denotada por p) e´ um paraˆmetro que descreve o valor percentual (frac¸a˜o)
associado a` populac¸a˜o.
Exemplo 2.5. Um determinado censo mostrou que 23, 7% da populac¸a˜o norte-americana foi identi-
ficada como sendo hispana ou latina. O valor 0, 237 e´ a proporc¸a˜o da populac¸a˜o.
Definic¸a˜o 2.6 (Proporc¸a˜o populacional). A proporc¸a˜o populacional p e´ definida como
p :=
D
N
.
Assim, X ∼ Bern(p) e portanto, E(X) = p e Var(X) = p(1− p).
2.2.2 Proporc¸a˜o amostral
A proporc¸a˜o amostral (denotada por pˆ) e´ um paraˆmetro que descreve o valor percentual associado a`
amostra da populac¸a˜o.
Exemplo 2.7. Assuma que temos uma amostra de 4 animais: 1 pa´ssaro, 1 coelho, 1 peixe e 1
cachorro. A proporc¸a˜o amostral de animais de 4 patas e´ 0, 5.
Definic¸a˜o 2.8 (Proporc¸a˜o amostral). A proporc¸a˜o amostral pˆ e´ definida como
pˆ :=
Sn
n
=
∑n
i=1Xi
n
= X.
3/4
Probabilidade e Estat´ıstica
Observac¸a˜o 2.9. Note que
∑n
i=1Xi ∼ bin(n, p). Pelo TLC sabemos que
pˆ ∼ N(p, p(1− p)/n) a medida que n→∞.
Note, tambe´m, que no caso de proporc¸o˜es o TLC e´ nada mais que o Teorema de Laplace-Moivre.
Exemplo 2.10. Em uma populac¸a˜o, 40% apresentam certa propriedade. Uma a.a. de tamanho 200
sera´ tomada e calculada a respectiva proporc¸a˜o. Determine a probabilidade de que a proporc¸a˜o da
amostra esteja dentro de ±3% da proporc¸a˜o da populac¸a˜o. Rpta. (Use o TLC) = 0, 61.
4/4

Outros materiais