Baixe o app para aproveitar ainda mais
Prévia do material em texto
Tecnologia de Amostragem I • Amostragem Estratificada • Divisão da população em grupos chamados de estratos, motivada por: – melhora da precisão das estimativas – estimativas independentes para estratos além da população como um todo – questões administrativas, estratos naturais • Motivação técnica: • Erro diminui quando amostra cresce mas cresce quando a variabilidade é grande! • Saída: dividir a população em grupos (estratos) o mais homogêneos possíveis V AAS ( y¯ )=(1−f ) S y 2 n Tecnologia de Amostragem I • Exemplo numérico: • Seja uma população P8 onde se conhece as variáveis renda domiciliar (y) e bairro de moradia (x) como na tabela abaixo: Y¯=22,5 σ2=153 S2=174,857 Y¯ A=36,67 σ A 2 =11,56 S A 2=17,33 Y¯ B=14 σ B 2=56,5 SB 2=45,2 i 1 2 3 4 5 6 7 8 Yi 24 32 10 12 40 38 5 19 Xi B A B B A A B B Estrato A Estrato B i 2 5 6 i 1 3 4 7 8 Yi 32 40 38 Yi 24 10 12 5 19 Xi A A A Xi B B B B B Tecnologia de Amostragem I • Vamos selecionar amostras de tamanho 4 da seguintes maneiras: – AAS na população PN – AAS de tamanho 2 no estrato A e AAS de tamanho 2 no estrato B • Pode-se então calcular: V AAS ( y¯ )=(1− f ) S2 n V AAS ( y¯A )=(1− f A ) SA 2 nA V AAS ( y¯B)=(1− f B) SB 2 nB Tecnologia de Amostragem I • Pode-se calcular a média da população como uma média ponderada das médias dos grupos A e B • Propomos como estimador da média populacional a seguinte estatística: • Portanto: • O efeito da estratificação é dado por: • Escolha do método de amostragem: melhor método é o que tem menor variância para o estimador y N N y N N yes A A B B V ( y¯es)=(N AN ) 2 V ( y¯A)+( NBN ) 2 V ( y¯ B) EPA= V ( y¯es) V ( y¯) Tecnologia de Amostragem I • Nem tudo são flores! • Vamos supor que ao invés de usar a variável bairro para estratificar, fosse usada outra variável tal que: • Será isso razoável? • EPA = ? Y¯ A=23 ,5 σ A 2 =164 ,75 SA 2 =219 ,67 Y¯ B=21 ,5 σ B 2=139 ,25 SB 2=185 ,67 Estrato 1 Estrato 2 i 5 2 3 4 i 1 6 7 8 Yi 40 32 10 12 Yi 24 38 5 19 Xi A A B B Xi B A B B Tecnologia de Amostragem I • Formalizando • Seja a população PN={U1, U2,..., UN} • Dividida nos estratos: • De maneira que: P U U U P U U U P U U U N N N N N H H HNH H 1 1 2 2 11 12 1 21 22 2 1 2 = { , ,..., } = { , ,..., } = { , ,..., } PN=PN1∪PN2∪.. .∪PN H e PN1∩PN 2∩. ..∩PNH=∅ Tecnologia de Amostragem I • Pode-se representar uma população estratificada por: Estrato Total Média Variância 1 ... ... ... ... h ... ... ... ... H População 1 h H 1 1 Y h hY H HY 1 2 1 2ou S h hou S2 2 H Hou S2 2 Y 2 2ou S Tecnologia de Amostragem I • Alguma notação: população Nh : Tamanho do estrato h τh=∑ i=1 Nh Y hi Total do estrato h μh=Y¯ h= 1 N h ∑ i= 1 Nh Y hi Média do estrato h Sh 2=1 Nh−1 ∑ i=1 N h (Y hi−μh) 2 Variância do estrato h W h= Nh N Peso do estrato h,∑ h=1 H W h=1 N=∑ h=1 H Nh Tamanho da População τ=∑ h=1 H τh Total da População μ=1 N ∑h=1 H ∑ i=1 Nh Y hi Média da População S2=1 N−1 ∑h=1 H ∑ i=1 Nh (Y hi−μ)2 Variância Populacional Tecnologia de Amostragem I • Alguma notação: amostra nh : Tamanho da amostra no estrato h yhi : i−ésima observação do estrato h μh=Y¯ h= 1 N h ∑ i= 1 Nh Y hi Média do estrato h f h= nh N h Fração amostral do estrato h y¯h= 1 nh ∑ i=1 nh yhi Média amostral do estrato h sh 2=1 nh−1 ∑ i=1 nh ( yhi− y¯h) 2 Variância amostral h n=∑ h=1 H nh Tamanho total da amostra Tecnologia de Amostragem I • Alguns resultados interessantes e úteis • Ou seja: a variância pode ser vista como uma soma das variâncias dentro dos grupos (estratos) mais uma medida da variância entre os grupos, onde: • ou: 2 2 2 d e σd 2=∑ h=1 H W hσ h 2 σe 2=∑ h=1 H W h(Y¯ h−Y¯ ) 2 σ2=∑ h=1 H W hσh 2+∑ h=1 H W h (Y¯ h−Y¯ ) 2 S2=∑ h=1 H Nh−1 N−1 Sh 2+∑ h=1 H Nh N−1 (Y¯ h−Y¯ ) 2 Tecnologia de Amostragem I • Estimador da média populacional ou média global: • onde é o estimador da média no estrato h • Se todos os são estimadores não viciados tem- se que: • Em particular isso ocorre se os estimadores de cada média de estrato for a correspondente média amostral y¯es= 1 N∑h=1 H N h y¯h=∑ h=1 H W h y¯h yh yh E ( y¯es)=Y¯ Tecnologia de Amostragem I • Exemplo: Uma vila foi dividida (estratificada) em três conjuntos de domicílios segundo suas características: 1- região onde moram trabalhadores da industria, 2- moradores mais antigos, 3-área rural. Foi selecionada uma amostra em cada estrato e investigado o número de horas em que se assiste televisão por semana em cada domicílio. – Estimar a média de horas por semana em cada estrato e na população – Existe evidência que o número de horas difere em cada estrato? Estrato 1 Estrato 2 Estrato 3 35 28 26 41 27 4 49 10 8 15 21 43 29 32 37 15 41 25 30 14 30 20 36 25 29 31 12 32 34 39 38 40 45 28 27 35 34 155 62 93N1= N2= N3= Tecnologia de Amostragem I • Importante: o estimador sugerido para a média populacional na amostragem estratificada não é a média amostral • A média amostral é dada por: • Então: y n y n n y w y w n n h H hi i n h H h h h H h h h H h h h 1 1 1 2 11 1 1 , , , ,...,onde y y w W h Hes h h se para todo 1 2, ,..., Tecnologia de Amostragem I • Um estimador para o total populacional seria dado por: • Variância dos estimadores: • Média: • Total: • E se em todos os estratos tivermos AAS? Y^=∑ h=1 H Y^ h=∑ h=1 H N h y¯h=N y¯es V AE ( y¯es)=∑ h=1 H W h 2V ( y¯h) V AE(Y^ es)=N2∑ h=1 H W h 2V ( y¯h)=∑ h=1 H N h 2V ( y¯h) Slide 1 Slide 2 Slide 3 Slide 4 Slide 5 Slide 6 Slide 7 Slide 8 Slide 9 Slide 10 Slide 11 Slide 12 Slide 13 Slide 14
Compartilhar