Baixe o app para aproveitar ainda mais
Prévia do material em texto
Amostragem Com Probabilidades Desiguais • Em alguns casos na amostragem, associa-se probabilidades distintas de cada unidade da população ser incluída na amostra – Unidades distintas em importância para o fenômeno estudado – Unidades com tamanhos muito variados – Estimativas mais precisas • As diferentes probabilidades de seleção serão levadas em conta na estimativa dos parâmetros e de sua respectiva precisão Amostragem com Probabilidades Desiguais • Caso de seleção com reposição • Seja uma população PN qualquer onde a probabilidade de ser selecionada a unidade Ui para a amostra seja pi • Um estimador não viciado para o total da população é dado por (Hansen-Hurwitz): 1 ( ) , 1, 2 ,..., 1, 0, 1, 2 ,..., i i N i i i P U p i N p p i N = = = = > =å Y^ HH=∑ i=1 n yi π i =1 n∑i=1 n yi pi π i=npi , ∑ i=1 N π i=n Amostragem com Probabilidades Desiguais • Variância do estimador de HH: • Pode ser estimada por: • Estimador da média: • Variância e seu estimador: V (Y^ HH )=1n∑i=1 N pi(Y ip i−Y) 2 v (Y^ HH )= 1n(n−1)∑i=1 n ( y ip i−Y^ HH) 2 μ^HH= y¯HH= 1 nN∑i=1 n y i pi = Y^ HH N V ( μ^HH )= 1 N 2 V (Y^ HH ) e v ( μ^HH )= 1 N2 v (Y^ HH ) Amostragem com Probabilidades Desiguais • Exemplo: Estimar total de animais numa área de 100km2 que foi dividida em lotes com 1km de largura e com comprimento variável. Uma amostra de 4 lotes, com reposição, foi retirada. Os resultados estão na tabela abaixo: Animais Probabilidade 60 0,05 60 0,05 14 0,02 1 0,01 1 Amostragem com Probabilidades Desiguais • Caso particular: Probabilidade Proporcional ao Tamanho (PPT) • Suponha que se tenha a informação sobre uma variável, X, que possa ser entendida como tamanho da unidade amostral • Ex: valor do faturamento de uma empresa; número de pés de café de uma fazenda; área plantada de lavoura; número de alunos da escola; etc... • Pode-se, então, associar probabilidades de seleção de cada unidade proporcionais a sua medida de tamanho (ou importância). • No exemplo anterior tínhamos a área dos lotes Amostragem com Probabilidades Desiguais • Dessa maneira define-se: • O estimador de HH para o total fica: • A variância é dada por: • Estimativa da variância: 1 , 1, 2,...,i ii N i i X Xp i N NXX = = = = å Y^ PPT= N X¯ n ∑i=1 n y i X i v (τ^ PPT )= 1 n(n−1)∑i=1 n ( y iX i N X¯−Y^ PPT) 2 V ( y^PPT )= 1 nX∑i=1 N X i( Y i X i X−Y ) 2 Amostragem com Probabilidades Desiguais • Algoritmo para seleção: – Acumular os tamanhos – Determinar os intervalos de seleção – Aleatório entre 1 e tamanho total – Selecionar unidade correspondente ao intervalo onde caiu o aleatório – Repetir 3 e 4 até selecionar n unidades • Exemplo: Estimar a despesa total das fazendas, usando uma amostra de n=2 Area acumulada Inferior Superior 1 50 50 1 50 1/15 50 2 500 550 51 550 2/3 700 3 200 750 551 750 4/15 180 DespesaIntervaloFazenda Área pi • Todas as amostras possíveis de tamanho 2 Amostragem com Probabilidades Desiguais Amostras y1 y2 P(y1) P(y2) P(y1;y2) YPPT YPPT*P(y1;y2) (YPPT-Y)^2*P(y1;y2) YAAS 11 50 50 1/15 1/15 1/225 750,00 3,33 144,00 150,00 12 50 700 1/15 2/3 2/45 900,00 40,00 40,00 1 125,00 13 50 180 1/15 4/15 4/225 712,50 12,67 841,00 345,00 21 700 50 2/3 1/15 2/45 900,00 40,00 40,00 1 125,00 22 700 700 2/3 2/3 4/9 1 050,00 466,67 6 400,00 2 100,00 23 700 180 2/3 4/15 8/45 862,50 153,33 810,00 1 320,00 31 180 50 4/15 1/15 4/225 712,50 12,67 841,00 345,00 32 180 700 4/15 2/3 8/45 862,50 153,33 810,00 1 320,00 33 180 180 4/15 4/15 16/225 675,00 48,00 4 624,00 540,00 930,00 14 550,00 930,00 399 262,50 Amostragem com Probabilidades Desiguais • Seleção sistemática 1- Acumular os tamanhos 2- Determinar os intervalos de seleção 3- Intervalo de amostragem: 4- Aleatório entre 1 e k 5- Selecionar a unidade correspondente ao aleatório 6- Somar k ao aleatório e selecionar a unidade correspondente até ter a amostra desejada • Sistemática aleatorizada 1- Reordenar aleatoriamente as unidades (Hajek) 2- Proceder uma seleção sistemática k Tamanho total acumulado Tamanho da amostra NX n Amostragem com Probabilidades Desiguais Estimador de Horvitz-Thompson • Pode ser utilizado para amostras retiradas com ou sem reposição • Baseado na probabilidade de inclusão da unidade na amostra • Seja i a probabilidade da unidade i ser incluída na amostra i = 1, 2, ..., N • Estimador não viciado para o total populacional dado por: • Onde é o número de unidades não repetidas na amostra Y^ HT=∑ i=1 v yi πi Amostragem com Probabilidades Desiguais • Será o estimador de HT não viciado? • Seja a variável aleatória z tal que: • • Então z tem distribuição Bernoulli • Pode-se ver que o estimador HT é não viciado redefinindo-o: E (zi)=P (zi=1)=π i V ( zi)=π i (1−π i) Cov (zi ,z j)=π ij−π i π j Y^ HT=∑ i=1 N Y i πi zi z i={1,Se u_i pertence à amostra0,caso contrário Amostragem com Probabilidades Desiguais • Pode-se ainda calcular a variância do estimador: • Cujo estimador é: • Problema sério: pode dar < 0 (!) V (Y^ HT )=∑ i=1 N 1−π i π i Y i 2+∑ i=1 N ∑ j≠i π ij−π i π j π iπ j Y iY j v (Y^ HT )=∑ i=1 ν 1−π i π i 2 yi 2+∑ i=1 ν ∑ j≠i π ij−π i π j π i π j yi y j π ij Amostragem com Probabilidades Desiguais • Estimador alternativo: • Seja • Então • Pode-se estimar a variância de por • Onde t i=v yi πi Y^ HT= 1 v∑i=1 v t i Y^ HT , ~v (Y^ HT)= N−v N st 2 v st 2= 1 v−1∑i v (t i−Y^ ht) 2 Amostragem com Probabilidades Desiguais Uso do estimador de HT para seleção com reposição • Já vimos que a probabilidade de seleção da unidade i é pi, i = 1, 2,..., N • A probabilidade de inclusão da unidade i na amostra é: • ... E a probabilidade de inclusão das unidades i e j simultaneamente: • No caso geral (sem reposição) os valores de i não são simples de se obter a priori • Nos livros de Cochran e de Thompson são citadas vária alternativas (complicadas) de tratar o problema π i=1−(1−pi) n π ij=πi+π j−[1−(1−p i−p j)n ] Amostragem com Probabilidades Desiguais • Exemplo: estimar o pessoal ocupado total usando amostragem PPT, onde a variável de tamanho é a Receita e tamanho da amostra n = 3 Empresa Pessoal ocupado Receita pi i 1 25 800 0,0816 0,2255 2 35 1200 0,1224 0,3242 3 17 600 0,0612 0,1727 4 31 1000 0,1020 0,2759 5 16 500 0,0510 6 35 1800 0,1837 0,4560 7 38 1800 0,1837 0,4560 8 15 400 0,0408 0,1175 9 27 900 0,0918 0,2510 10 24 800 0,0816 0,2255 Empresa Pessoal Ocupado Receita pi i 1 25 800 0,0816 0,2255 2 35 1200 0,1224 0,3242 3 17 600 0,0612 0,1727 4 31 1000 0,1020 0,2759 5 16 500 0,0510 0,1454 6 35 1800 0,1837 0,4560 7 38 1800 0,1837 0,4560 8 15 400 0,0408 0,1175 9 27 900 0,0918 0,2510 10 24 800 0,0816 0,2255 Total 263 9800 Empresa Pessoal ocupado Receita pi i 1 25 800 0,0816 0,2255 2 35 1200 0,1224 0,3242 3 17 600 0,0612 0,1727 4 31 1000 0,1020 0,2759 5 16 500 0,0510 6 35 1800 0,1837 0,4560 7 38 1800 0,1837 0,4560 8 15 400 0,0408 0,1175 9 27 900 0,0918 0,2510 10 24 800 0,0816 0,2255 Empresa Pessoal Ocupado Receita pi i 1 25 800 0,0816 0,2255 2 35 1200 0,1224 0,3242 3 17 600 0,0612 0,1727 4 31 1000 0,1020 0,2759 5 16 500 0,0510 0,1454 6 35 1800 0,1837 0,4560 7 38 1800 0,1837 0,4560 8 15 400 0,0408 0,1175 9 27 900 0,0918 0,2510 10 24 800 0,0816 0,2255 Total 263 9800 Slide 1 Slide 2 Slide 3 Slide 4 Slide 5 Slide 6 Slide 7 Slide 8 Slide 9 Slide 10 Slide 11 Slide 12 Slide 13 Slide 14 Slide 15
Compartilhar