Buscar

M- ¦ódulo 2

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1
2 – Estimação Pontual de 
Médias e Totais Populacionais
2.1 – Objetivo Geral da Estimação
Dado um plano amostral probabilístico, 
digamos p, e um parâmetro-alvo θ, definir:
1) Estimador Pontual não Viciado para θ
2) Variância (Teórica) do Estimador de θ
3) Estimador da Variância do Estimador de θ
Neste módulo do curso, abordaremos o 
problema da estimação pontual. A 
estimação de variâncias e o cálculo de 
medidas de precisão estarão no módulo 3.
2.2 - Distribuição Amostral
A distribuição amostral de um estimador 
é a sua distribuição de probabilidade. 
Ela representa o comportamento dos 
valores assumidos pelo estimador, 
quando consideramos todas as 
amostras de tamanho n que poderiam 
ser selecionadas da população U.
Pode parecer complicado obter a 
distribuição de probabilidade do estimador 
sem fazer nenhuma hipótese acerca da 
distribuição de probabilidade de y.
Todavia, esta distribuição pode ser obtida 
usando a distribuição de aleatorização, ou 
seja, as probabilidades de seleção p(s).
Exemplo 2.1 - considere a população-matriz 
do exemplo 1 do módulo 1, repetida a 
seguir:
34
33
52
41
yiU
Obtenha a distribuição amostral de , 
considerando uma AAS com n = 2.
y
Solução:
O espaço amostral é S = 
{(1,2);(1,3);(1,4);(2,3);(2,4);(3,4)}.
Estas amostras, suas probabilidades e os 
respectivos valores de são dados a seguir.y
2
1/6
1/6
1/6
1/6
1/6
1/6
p(s)
3(3,4)
4(2,4)
4(2,3)
3,5(1,4)
3,5(1,3)
4,5(1,2)
s y
A distribuição amostral de é: y
3/1)4y(p)5,3y(p
6/1)5,4y(p)3y(p
====
====
Um estimador não viciado é aquele cujo 
valor esperado é igual ao parâmetro.
Ou seja, um estimador é não 
viciado para um parâmetro θ se:
θˆ
.)ˆ(E θ=θ
2.3 - Estimador Não Viciado Um estimador sem vício é aquele que, em algumas amostras “erra para baixo”, em outras 
“erra para cima”, mas, “em média”, acerta θ, 
como ilustram as figuras apresentadas a seguir:
viciado viciadonão viciado
O vício de é dado por:
Evidentemente, se um estimador 
é não viciado, seu vício é zero.
.)ˆ(E)ˆ(B θ−θ=θ
θˆ
Do inglês: bias = vício.
Exemplo 2.1 (cont.) - Calcule e 
verifique se é um estimador não viciado 
para .
Solução:
.
.75,35,4
6
14
3
15,3
3
13
6
1)y(E =+++=
.75,3Y =
O estimador é não viciado!
),y(E
Y
y
3
Suponha agora que tenha sido 
selecionada a amostra s = (2,3). 
Neste caso, a estimativa de é
Perceba que 4 é maior que ou seja, 
estamos sobrestimando Isto significa 
que haja um problema com o estimador?
Não confunda isto com vício. Os estimadores 
usados são não viciados. O que ocorreu foi um 
erro amostral ou de estimação = diferença 
entre estimativa e parâmetro em uma amostra. 
Y .4y =
,Y
.Y
2.4 - Estimador Linear
Um estimador linear é aquele que é 
dado por uma combinação linear das 
observações y na amostra, ou seja:
Exemplos de estimadores lineares?
.yˆ i
si
i∑
∈
ω=θ
A média amostral é um estimador linear, 
com pesos ωi = 1/n, ∀i ∈s.
O total amostral é um estimador linear, 
com pesos ωi = 1, ∀i ∈s.
A teoria apresentada a seguir busca um 
bom estimador (não viciado) para total e 
média populacionais, restringindo os 
candidatos aos estimadores lineares.
Note que isto não é restritivo, pois não 
faria sentido buscar estimadores não 
lineares para parâmetros que são funções 
lineares dos valores de y na população.
2.5 - Estimadores de Horvitz-Thompson
Dois pesquisadores (Horvitz e Thompson) 
desenvolveram, na década de 50, uma 
teoria que define estimadores lineares não 
viciados para total e média para qualquer
plano amostral que seja probabilístico.
Os estimadores resultantes são chamados 
estimadores de Horvitz-Thompson.
Demonstração do Estimador de HT 
para o Total Populacional:
Seja o parâmetro total populacional:
E um estimador linear genérico:
∑
∈
=
Ui
iyY
∑
∈
ω=
si
ii yYˆ
4
Nosso problema é obter os pesos ωi tais 
que este estimador seja não viciado.
Em princípio, isto poderia ser feito 
diretamente, resolvendo a equação:
∑ ∑
∑∑
∈ ∈
∈∈
=ω
=ω
=
si Ui
iii
Ui
i
si
ii
y)y(E
y)y(E
Y)Yˆ(E
Problema: quanto vale E(yi)?
Uma forma elegante de resolver este 
problema passa pela definição da 
seguinte variável binária:
Esta variável, definida ∀ i∈U, é 
chamada variável indicadora de 
inclusão na amostra.
s.i se 0, 
s;i se 1,δi
∉=
∈=
δi é utilizada para escrever o estimador 
de forma equivalente, como um 
somatório na população:
(a equivalência vem do fato de que, se 
i∉s, então δi = 0, e assim ωiyiδi = 0)
.yyYˆ
Ui
iii
si
ii ∑∑
∈∈
δω=ω=
A vantagem desta nova representação 
é que yi não é mais variável aleatória 
(pois está associada a uma unidade 
populacional, fixa). A única variável 
aleatória no novo somatório é δi, assim:
.)(Ey)Yˆ(E
Ui
iii∑
∈
δω=
pii, pois δi ~ Bernoulli(pii).
Assim, para que seja não viciado, 
é necessário que:
Yˆ
.Si ,11
yy
Y)Yˆ(E
i
iii
Ui
ii
Ui
ii
∈∀
pi
=ω⇔=piω
=piω
=
∑∑
∈∈
pesos amostrais para o estimador de total.
Estimador de HT para o Total:
Estimador de HT para a Média:
∑
∈
=
si
i
i
HT y
π
1Yˆ
∑
∈
=
si
i
i
HT yNπ
1Yˆ
no caso da 
média, os pesos 
amostrais são 
ωi = 1/Npii, ∀i∈s.
5
Perceba a importância dos resultados do slide 
anterior: ele permite totais e médias sem vício, 
sob qualquer plano amostral probabilístico, 
desde que tenhamos as probabilidades de 
inclusão (e já aprendemos como calculá-las).
Os estimadores obtidos são os únicos não 
viciados, dentre os não lineares.
• Interpretação do Peso Amostral
O peso ωi é o número de unidades 
populacionais que estão sendo representadas 
na amostra pela i-ésima unidade amostral.
• Expansão da Amostra
O processo de multiplicar os valores de y na 
amostra pelos respectivos pesos, para fins 
cálculo de estimadores, chama-se expandir 
a amostra. A expansão da amostra é 
necessária para que os parâmetros 
populacionais sejam estimados sem vício.
Exemplo 2.2 - considere novamente os 
dados do exemplo 2.1 e a amostra s = 
(2,3), obtida pelo seguinte plano amostral: 
p(1,2) = p(3,4) = 0;
p(1,3) = ½;
p(1,4) = p(2,3) = p(2,4) = 1/6.
Estime sem vício a média 
e o total populacionais.
Solução:
.5,193*
2
35*3y
2
3y3y1y1Yˆ 323
3
2
2
HT =+=+=
pi
+
pi
=
.875,4
4
5,19
N
YˆYˆ HT ===
Perceba que as estimativas ficaram bem
maiores do que os valores dos respectivos 
parâmetros. 
Por que isto ocorreu? 
Como se chamam estas diferenças?

Continue navegando