Buscar

M- ¦ódulo 3


Continue navegando


Prévia do material em texto

1
3 - Estimação de Variâncias 
e Medidas de Precisão
3.1 - Objetivo Principal
Estimar as variâncias dos estimadores 
derivados no módulo 2 sob cada plano, 
para, a partir delas, calcular medidas de 
variabilidade associadas às estimativas.
Lembrem-se: estimativas pontuais sem 
medida de variabilidade não dizem nada.
3.2 - Comparando Estratégias Não Viciadas
Cada plano amostral probabilístico gera um 
estimador não viciado diferente (módulo 2).
O conjunto plano amostral + respectivo 
estimador não viciado para θ, é chamado 
estratégia de estimação não viciada para θ.
Assim, podemos ter várias estratégias de 
estimação não viciadas para um parâmetro, 
e, portanto, precisamos saber compará-las.
Esta comparação é feita a partir das 
variâncias teóricas das estratégias de 
estimação, ou seja, dos estimadores não 
viciados sob cada plano amostral.
Ilustração - estratégia 1 melhor que a 2:
θ-ε θ+εθ
11 p sob,ˆ de ãodistribuiç θ
22 p sob ,ˆ de ãodistribuiç θ
Formalmente, a comparação é feita via Efeito 
do Plano Amostral, ou EPA (design effect), 
que nada mais é do que a razão das 
variâncias teóricas dos estimadores.
• Efeito do Plano Amostral (EPA) 
O EPA (Efeito do Plano Amostral) é 
a razão entre as variâncias teóricas 
correspondentes a duas estratégias não 
viciadas de estimação, quando utilizadas 
para estimar um mesmo parâmetro-alvo.
2
EPA > 1 ⇒ Estratégia E1 mais eficiente.
EPA < 1 ⇒ Estratégia E2 mais eficiente.
.)θˆ(V
)θˆ(V)E,EPA(E
:por dado é elas entreEPA O
1P
2P
21
1
2
=
).θˆ;P(:E e )θˆ;P(:E
 : viciadas)(não sestratégia as Sejam
222111
Para calcular o EPA, precisamos de uma 
fórmula para obter as variâncias teóricas.
3.3 - Variâncias Teóricas dos Estimadores de HT
As variâncias dos estimadores de Horvitz-
Thompson dependem dos piis e das 
probabilidades de inclusão conjuntas ou 
de segunda ordem: piij = p[(i∈s)∩(j∈s)]. 
Começaremos apresentando a variância do 
estimador de total. A variância do estimador 
de média pode ser obtida a partir dele.
Note que o estimador de total, escrito na 
forma de um somatório na população, fica:
Por outro lado, a variância da combinação 
linear de v.a.`s apresentada acima é:
.),(Covyy2)(Vy
ji
ji
j
j
i
i
Ui
i
2
i
i ∑∑∑
<∈
δδ








pi






pi
+δ





pi
.
yYˆ
Ui
i
i
i∑
∈
δ
pi
=
Sendo δi ~ Bernoulli(pii), verifica-se que:
Substituindo na fórmula do slide anterior, 
obtemos a expressão final da variância, 
apresentada no slide seguinte.
V(δi) = pii(1-pii) 
e 
Cov(δi,δj) = piij-piipij. 
Variância do Estimador de Total:
sendo piij = p[(i∈s)∩(j∈s)].
∑∑∑
<∈
pipi−pi








pi






pi
+pi−pi





pi
=
ji
jiij
j
j
i
i
Ui
ii
2
i
i
HT )(
yy2)1(y)Yˆ(V
3
Para obter a variância do estimador da 
média, basta dividir por N2.
Variância do Estimador da Média:








pipi−pi








pi






pi
+pi−pi





pi
==
∑∑∑
<∈ ji
jiij
j
j
i
i
Ui
ii
2
i
i
2
2
HT
HT
)(yy2)1(y
N
1
N
)Yˆ(V)Yˆ(V
3.4 – Estimação das Variâncias
Na prática, o que fazemos é calcular as 
estimativas das variâncias, a partir das 
fórmulas dos próximos slides.
Estimador da Variância do Estimador do Total:
Este estimador é não viciado para 
∑∑∑
<∈ pi
pipi−pi








pi






pi
+pi−





pi
==
ji ij
jiij
j
j
i
i
si
i
2
i
i
HTHT
)(yy2)1(y
)Yˆ(v)Yˆ(Vˆ
).Yˆ(V HT
Estimador da Variância do Estimador da 
Média:








pi
pipi−pi








pi






pi
+pi−





pi
==
∑∑∑
<∈ ji ij
jiij
j
j
i
i
si
i
2
i
i
2
2
HT
HT
)(yy2)1(y
N
1
N
)Yˆ(Vˆ)Yˆ(Vˆ
Este estimador é não viciado para 
).Yˆ(V HT
Exemplo 3.1 – Considere novamente os 
dados do exemplo 1 e o plano amostral: 
p(1,2) = p(3,4) = 0;
p(1,3) = ½;
p(1,4) = p(2,3) = p(2,4) = 1/6.
Baseado na amostra s = (2,3), obtenha as 
estimativas da variância dos estimadores 
de total e média populacionais, usando os 
estimadores não viciados apresentados. 
4
Relembrando os dados do exemplo 1:
34
33
52
41
yiU
Respostas - piij = 1/6 (que é a própria 
probabilidade da amostra s = (2,3)) e:
.98,6
16
75,111
N
)Yˆ(Vˆ)Yˆ(Vˆ
.75,111)Yˆ(Vˆ
2
HT
HT
HT
===
=
Obs - uma crítica aos estimadores de variância 
reportados é que, em situações não tão raras, 
podem gerar estimativas negativas.
Um estimador alternativo, também não viciado, 
e que gera valores negativos com frequência 
menor, foi definido por Sen-Yates-Grundy:
2
j
j
i
i
si ji ij
ijji
HTSYG
yy)()Yˆ(Vˆ








pi
−
pipi
pi−pipi
=∑∑
∈ <
3.5 - Medidas de Precisão
A partir da variância, podemos obter 
importantes medidas de precisão
associadas às estimativas, como:
- erros padrão (desvios padrão dos 
estimadores – para que servem?)
- coeficientes de variação (CV`s)
• Erro Padrão
O erro padrão de um estimador é o seu 
desvio padrão, isto é, a raiz quadrada da 
sua variância: 
)Yˆ(V)Yˆ(EP =
)Yˆ(V)Yˆ(EP =
Na prática, o erro padrão teórico não 
é conhecido. Entretanto, dada uma 
amostra, podemos estimá-lo :
)Yˆ(v)Yˆ(ep =
)Yˆ(v)Yˆ(ep =
5
• Coeficiente de Variação
Outra medida usual é o coeficiente de 
variação (CV). O CV (teórico) é:
Y
)Yˆ(EP)Yˆ(CV =
Y
)Yˆ(EP)Yˆ(CV =
são iguais, 
sempre!
O CV expressa o erro padrão em relação 
ao parâmetro (proporção ou percentual 
dele), permitindo comparar a variabilidade 
de estimadores de diferentes magnitudes. 
Por exemplo:
- estimadores de renda média e idade 
média 
- estimadores de renda total e de alguma 
proporção (p.ex., de desocupados)
Exemplo 3.2 - Suponha que estejamos 
interessados em estimar o salário médio 
em diferentes ramos de atividade 
profissional. Como um caso extremo, 
considere a comparação entre os salários 
médios de gerentes e de office-boys.
Suponha que o salário médio dos gerentes 
seja de R$ 5.000,00 e o dos office-boys 
seja de R$ 500,00. 
Um erro padrão igual a 100 indica 
variabilidade alta ou baixa?
No caso dos auxiliares de escritório, este 
erro padrão é 20% do salário médio, portanto 
é relativamente alto. CV = 0,2 = 20%.
Por outro lado, no caso dos gerentes, este 
erro padrão representa 2% do salário médio, 
sendo relativamente baixo. CV = 0,02 = 2%. 
A dispersão relativa é bem menor!
O coeficiente de variação estimado é:
Yˆ
)Yˆ(ep)Yˆ(cv =
Yˆ
)Yˆ(ep)Yˆ(cv =
O coeficiente de variação estimado
fornece uma medida do erro padrão 
em relação ao valor da estimativa.
são iguais, 
sempre!
Exemplo 3.3 - Considere agora 
a seguinte população:
35
54
23
22
31
yiU
Baseado na amostra s = (2,3,4), obtida por 
AAS, estime sem vício média e total, com as 
respectivas estimativas de erro padrão e cv.