Buscar

aula_7_estratificada_intro

Prévia do material em texto

15/5/2013
1
AE Rosa Maria Salani Mota 1
Amostragem Estratificada
Frequentemente a população de interesse é composta de 
subpopulações disjuntas e bem definidas, por exemplo, sexo, 
idade, condição socioeconômica, região geográfica, onde a 
variável de interesse apresenta um comportamento com maior 
homogeneidade entre as unidades amostrais dentro das 
subpopulações (estrato) do que entre as unidades amostrais de 
estratos diferentes. 
AE
Rosa Maria Salani Mota
2
Amostragem Estratificada
• Estudo da prevalência da hanseníase em Fortaleza e região 
metropolitana, 2006
http://fr.wikipedia.org/wiki/R%C3%A9gion_m%C3%A9tropolitaine_de_Fortaleza
Région métropolitaine
Ville
Population1
(hab.)
Superficie
(km²)
Fortaleza 2 416 920 313
Caucaia 303 970 1228
Maracanaú 193 879 106
Maranguape 98 429 591
Aquiraz 69 343 481
Pacatuba 60 701 132
Pacajus 51 757 254
Horizonte 43 505 160
São Gonçalo do 
Amarante
39 569 834
Eusébio 38 448 79
Itaitinga 33 221 151
Guaiúba 21 339 267
Chorozinho 20 721 278
Total 3 415 455 4 872
AE Rosa Maria Salani Mota 3
�A amostragem estratificada (AE) consiste:
1. Na divisão de uma população em grupos (chamados estratos).
2. Esta divisão é feita segundo alguma(s) característica(s) 
conhecida(s) na população sob estudo. 
3. Geralmente, em proporções convenientes, em cada um desses 
estratos é selecionado uma amostra Casual Simples com ou sem 
reposição.
Amostragem EstratificadaAmostragem Estratificada
AE Rosa Maria Salani Mota 4
Se a coleta da amostra for realizado sem levar em 
consideração a existência dos estratos, pode acontecer que os 
diversos estratos não sejam convenientemente representados na 
amostra. Neste caso, a amostra poderia estar mais influenciada 
pelas características da variável nos estratos mais favorecidos 
pelo sorteio. Além disso, a tendência à ocorrência de tal fato será 
tanto maior quanto menor o tamanho da amostra. 
Amostragem Estratificada
AE Rosa Maria Salani Mota 5
� O tamanho da amostra em cada estrato pode ser:
� Uniforme: sorteia-se igual número de elementos de cada 
estrato (Amostragem estratificada Uniforme).
• A amostragem estratificada uniforme será recomendável se os 
estratos da população forem pelo menos aproximadamente 
do mesmo tamanho. Caso contrario, será preferível a 
estratificação proporcional pelo fato de fornecer uma amostra 
mais representativa da população.
Amostragem Estratificada
AE Rosa Maria Salani Mota 6
� Proporcional: quando o número de elementos sorteados em 
cada estrato é proporcional ao tamanho do estrato 
(Amostragem estratificada Proporcional).
• No entanto se a variabilidade de um estrato é elevada, implica 
que um estrato com maior variância poderá levar à seleção de 
um maior número de unidades amostrais, quando comparado 
com um estrato com a mesma dimensão populacional mas 
menor variância (maior homogeneidade).
Amostragem Estratificada
15/5/2013
2
AE Rosa Maria Salani Mota 7
�Ótima: quando em cada estrato um número de elementos 
sorteados é proporcional ao número de elementos do estrato e 
também a variação (desvio padrão) da variável de interesse no 
estrato (Amostra estratificada ótima).
• O tipo de amostragem estratificada mais comum são as 
amostragem uniforme e amostragem proporcional .
Amostragem Estratificada
AE Rosa Maria Salani Mota 8
� Essencialmente, os objetivos da AE são:
• com amostras de pequena dimensão produzir estimativas mais 
precisas que, por exemplo, a ACS. 
• produzir estimativas para a população como um todo e para as 
subpopulações.
� Em geral, quanto mais os elementos de cada estrato forem 
parecidos entre si e diferentes entre os estratos, maior será a precisão 
dos estimadores.
Amostragem Estratificada
Exemplo 20: Considere uma pesquisa feita em uma população 
com N = 8 domicílios, onde deseja-se estudar a renda domiciliar 
(Y) e são conhecidas as regiões, A e B dos domicílios (X).
população 1 2 3 4 5 6 7 8 ῩῩῩῩ (µ) 2222
renda 13 17 6 5 10 12 19 6 11 24
região A B A A A B B A - -
AE Rosa Maria Salani Mota 9
Amostragem Estratificada
Para uma ACSc com n=4 qual o valor da var (Ȳ) ?????
• Em uma ACSc com n=4 ⇒ var(ῩACSc) = = 6.
n
2σ
Considere as regiões A e B como estratos e considerando uma 
ACSc de tamanho 2 em cada estrato,
ESTRATO 
(REGIÃO)
A 
(N=5)
B 
(N=3)
Subpopulação 1 3 4 5 8 2 6 7
renda 13 6 5 10 6 17 12 19
Para nA= nB =2 µA = 8 µB = 16
e a ACSc em 
cada estrato
22 = 2,2 ; 
222(Ῡ2)=2,2/2=2,2 
22 =2,2 ; 
222(Ῡ2)=2,2/2=2,22 
Rosa Maria Salani Mota 10
�Com base em Ῡ A eῩB é preciso construir um estimador para µ.
AE
Amostragem Estratificada
AE Rosa Maria Salani Mota 11
8
35 BA µµ +
Fazendo Ῡestr= (média ponderada)
Encontramos: Ῡestr = = 11
Além disso, pela propriedade da var, 
var (Ῡestr ) = ⇒ var(Ῡest)=2,4086
e, como var(ῩACSc) = 6 então
= 222 ≅ 2,2 ⇒
Com uma amostra de tamanho n=4, a amostragem estratificada
reduz em 60% a variabilidade do estimador Ῡ de μ quando
comparada com a ACSc.
)( BA
BBAA
NNN
NN
+=
+ µµ
) var()( ) var()( B2A2 YN
NY
N
N BA +
)var(
)var(
ACSc
estr
Y
Y
Na pratica: Retire uma ACSc de tamanho ni do estrato i, i=1,2...L.
Calcule a estimativa da média e da variância populacional
e a ; 
Utilize essa mesma amostra para calcular a estimativa da média 
e da variância populacional supondo a ACSc .
= 222
Exercício: Retire uma ACSc de tamanho 2 de cada estrato, 
calcule o EPA . Que conclusão você chegou? 
AE
Rosa Maria Salani Mota
12
)var(
)var(
ACSc
estr
Y
Y
Wh =
Nh
N
 : peso relativo do estrato h com ∑ Wh��ℎ=1 = 1 
15/5/2013
3
Rosa Maria Salani Mota 13
• EFEITO DO PLANO AMOSTRAL (EPA) DE KISH (em inglês, design 
effect (deff )).
Definição: O EFEITO DO PLANO AMOSTRAL :EPA= 
onde 
var(θverd ) = variância do estimador do parâmetro θ obtida 
considerando o plano amostral da pesquisa (plano B)
e
var(θA ) = variância do estimador do parâmetro θ obtida por um 
plano amostral A diferente do plano B.
)var(
)var(
ACS
verd
θ
θ
EFEITO DO PLANO AMOSTRAL (EPA)
AE AE Rosa Maria Salani Mota 14
�O EPA de Kish é, então, uma razão entre variâncias de um 
estimador, de θ calculadas para dois planos amostrais 
alternativos.
�Sem emprego de fórmulas complicadas. Os valores do EPA são 
úteis como informação de apoio ao planejamento de novas 
pesquisas por amostragem, antes que as respectivas amostras 
sejam efetivamente selecionadas.
⇒⇒⇒⇒ COMO ?????
AE Rosa Maria Salani Mota 15
�O EPA compara planos amostrais alternativos da pesquisa 
considerando a precisão do estimador do parâmetro θ. 
•considerando um estimador de θ - calcular a variância de sua 
distribuição induzida pelo plano amostral verdadeiro (VERD) e a 
variância da distribuição induzida pelo plano de amostragem 
aleatória simples (ACS) .
AE Rosa Maria Salani Mota 16
• EPA < 1 ⇔ var(θverd ) < var(θACS ) e, neste caso, o plano 
amostra “verdadeiro” é mais eficiente que o da ACS.
• EPA > 1 ⇔ var(θverd ) > var(θACS ) e, neste caso, o plano 
amostra “verdadeiro” é menos eficiente que o da ACS.
• EPA = 1 ⇔ var(θverd ) = var(θACS ) e, neste caso, o plano 
amostra “verdadeiro” e o plano amostra ACS são igualmente
eficiente.
AE Rosa Maria Salani Mota 17
Observação: 
� A simples estratificação, por si só, não produz necessariamente
estimativas mais eficientes do que a ACS.
� O resultado (estimativa) será mais eficaz quanto maior for a
habilidade do pesquisador em produzir subpopulações 
(estratos) homogêneos dentro e heterogêneo entre elas.
Exemplo21: Estratificação Inapropriada: Considere as regiões A 
e B como estratos e sorteando uma ACSc de tamanho 2 em cada 
estrato 
ESTRATO 
(REGIÃO)
A 
(N=4)
B 
(N=4)
Subpopulação 1 2 3 4 5 6 7 8
renda 13 17 6 5 10 12 19 6
Para nA= nB =2 ῩA = 10,25 ῩB = 11,75
e a ACSc em 
cada estrato
22 = 22,22 ; 
222(Ῡ2)=22,22 
22 =22,22; 
222(Ῡ2)=22,22 
Rosa Maria Salani Mota 18
�Com base em Ῡ A e ῩB⇒ Ῡestr = = 11
AE
8
*4*4 BA YY +
15/5/2013
4
AE Rosa Maria Salani Mota 19
Além disso , NA = NB = 4 , N = 8; nA = nB = 2 ; n = 4 
var (Ῡestr ) = ⇒ var(Ῡest) =5,86
⇒ EPA= = ≅ 0,98 ⇒
Com uma amostra de tamanho n=4, a amostragem 
estratificada reduz de forma insignificante a variabilidade do 
estimador Ῡ de μ quando comparada com a ACSc.
) var()( ) var()( B2A2 YN
NY
N
N BA +
)var(
)var(
ACSc
estr
Y
Y
6
86,5

Continue navegando