Baixe o app para aproveitar ainda mais
Prévia do material em texto
Amostra aleatória simples sem reposição - AAS • Método básico de muitos planos amostrais • O algoritmo base é: • Para uma AAS de tamanho n: 1. Selecione uma unidade da população com equiprobabilidade 2. Retire a unidade selecionada da população 3. Repita os passos 1 e 2 até ter selecionado n unidades • Esse esquema garante que todas as amostras possíveis de tamanho n têm a mesma probabilidade de serem escolhidas • Garante que todas as unidades têm a mesma probabilidade de seleção e de inclusão AAS • A probabilidade de seleção da unidade Ui em qualquer uma das n seleções é 1/N – P(Ui ser selecionada na 1ª)=1/N – P(Ui ser selecionada na 2ª)=(1-1/N)[1/(N-1)]=1/N – P(Ui ser selecionada na 3ª)=(1-1/N) [1-1/(N-1)][1/(N-2)]=1/N – ..... • A probabilidade de inclusão da unidade Ui na amostra, dessa forma, será igual a probabilidade dela ser selecionada em pelo menos uma das n seleções, ou seja: π i=P(U i⊂s)=∑ i= 1 n 1 N = n N AAS • A probabilidade de inclusão das unidades Ui e Uj na amostra, será igual a probabilidade de Ui ser selecionada em pelo menos uma das n seleções, e Uj ser selecionada em uma das n-1 outras seleções, ou seja: π ij=P(U i⊂s;U j⊂s )=∑ i=1 n 1 N ∑j≠i n 1 N−1 = n N n−1 N−1 AAS •Estimador do total populacional •Vamos usar o estimador de Horvitz-Thompson •Onde wi é o peso amostral dado pelo inverso da probabilidade de inclusão •Variância do estimador do total •Precisamos estimar a variância do estimador do total •Para isso é necessário, também, um estimador para S2 V ( Y^ AAS )=N 2(1−f ) S 2 n Y^ HT=Y^ AAS=∑ i= 1 n wi y i=∑ i=1 n y i π i =N n ∑i=1 n y i =N y¯ AAS • Um estimador não viciado de S2 é dado pela variância amostral: • Um estimador não viciado para a variância do estimador do total será: V^ ( Y^ AAS )=v (Y^ AAS )=N 2(1− f ) s 2 n s2= 1 n−1∑i=1 n ( yi− y¯ )2= 1 n−1 [∑i=1n y i2−1n (∑i=1n y i) 2] AAS • Obs.: a letra f da fórmula é a fração amostral: • O termo (1-f) é chamado de fator de correção para populações finitas • Repare que se , o fator de correção para populações finitas será aproximadamente 1 f= nN N→∞ AAS • Estimador da média populacional • Variância do estimador da média • Estimador da variância do estimador da média y¯ AAS= y¯= Y^ AAS N =1 n∑i=1 n y i V ( y¯ )=(1− f ) S 2 n v ( y¯ )=(1− f ) s 2 n Exemplo - AAS (Cochran) Foram coletadas assinaturas para um abaixo assinado em 676 folhas. Cada folha tinha espaço para 42 assinaturas, mas em muitas das folhas foi coletado um número menor de assinaturas. Uma AAS de 50 folhas foi selecionada, e os resultados estão na tabela abaixo: a. Estimar o total de assinaturas do abaixo assinado e a variância do estimador b. Estimar o número médio de assinaturas por folha e a variância do estimador Seleção de uma AAS • Como selecionar uma AAS de um cadastro? • Algoritmo natural é pouco eficiente do ponto de vista computacional • Vamos dar 2 exemplos de algoritmos • Algoritmo de Hàjek e Algoritmo de Fan, Muller e Rezucha AAS - Hàjek • Algoritmo de Hàjek 1. Selecionar um número aleatório da distribuição uniforme U(0;1), para cada unidade da população PN 2. Ordenar a população segundo os valores dos aleatórios gerados 3. Selecionar as n primeiras unidades da população nessa nova ordem • Muito fácil de programar - EXCEL • A PROC SURVEYSELECT, do SAS, usa esse método para populações pequenas • Qualquer pacote já tem pelo menos uma rotina de ordenação e geração de pseudo aleatórios AAS • Algoritmo de Fan, Muller e Rezuch • Seja uma população com N unidades 1. i 0 2. i i+1 3. Para a unidade Ui gere um número aleatório Ai ~ U(0;1) 4. Se Ai < n/N Se Ai >= n/N 1. Se n = 0 ou N = 0 pare 2. Retorne ao passo 2 • Processamento sequencial • Pode não precisar percorrer todo o cadastro 4.1 Inclua Ui na amostra 4.2 Faça n n-1 4.3 Faça N N-1 4.1 Faça N N-1 AAS – usando Excel • Usando o Excel – Pode-se gerar U(0;1) com a função ALEATÓRIO() – Caixa de diálogo AMOSTRAGEM • AASc ou Sistemática (veremos mais tarde) – Fácil implementação do método de Hàjek – Fan, Muller e Rezuch também pode ser implementado • Usando o SAS – Fácil implementação do método de Hàjek – Pode-se implementar o método de Fan, Muller e Rezuch – Usar a PROC SURVEYSELECT Seleção de uma AAS • Exemplo usando o Excel para Hàjek – Na célula correspondente a U1 do universo gerar um aleatório usando ALEATÓRIO() – Arrastar até o final da população – Copiar a coluna de aleatórios o COLAR ESPECIAL VALORES para fixar os números aleatórios – Usando DADOSCLASSIFICAR, ordenar o arquivo segundo a coluna dos aleatórios (pode ser crescente ou decrescente) – Pegar as n primeiras linhas como amostra • Pode-se demonstrar (não vamos fazer isso!) que todas as unidades têm a mesma chance de seleção • Exemplo usando o Excel para Hàjek AAS- usando o SAS para Hàjek Data UNIVERSO; Set UNIVERSO; ALEAT=RANUNI(semente); /* gerando números aleatórios */ Run; Proc sort data=UNIVERSO; by ALEAT; /* ordenando arquivo segundo números aleatórios */ Run; Data AMOSTRA; Set UNIVERSO; output AMOSTRA; If _n_=namost then stop; /* selecionando a amostra */ Run; Data AMOSTRA; Set UNIVERSO(obs=NAMOST); /* selecionando a amostra */ Run; Seleção de uma AAS • Exemplo usando o SAS para Fan, Muller e Rezuch Data AMOSTRA; Retain NA namost NU; Set UNIVERSO NOBS=NU; if ranuni(SEMENTE)<NA/NU then do; output AMOSTRA; NA=NA-1; NU=NU-1; if NA=0 OR NU=0 then stop; end; else do; NU=NU-1; if NU=0 then stop; end; Run; Seleção de uma AAS • Exemplo usando o a PROC SURVEYSELECT Proc surveyselect data=UNIVERSO out=AMOSTRA n=20 m=SRS seed=SEMENTE; Run; • O SAS também tem procedimentos para estimação de parâmetros e respectivas precisões • Outros pacotes, como o SPSS, STATA, também estão desenvolvendo ferramentas para trabalhar com amostragem Amostra aleatória simples com reposição-AASc • Algoritmo natural da AASc: 1. Selecione uma unidade da população com equiprobabilidade; 2. Reponha a unidade selecionada na população; 3. Repita os passos 1 e 2 até ter feito n seleções. • Para uma variável de interesse y, temos que os valores amostrais y1, y2, ... , yn serão: – Independentes; – Identicamente distribuídos; – P(yi=Yj)=1/N, i=1, 2, 3, ... , n , j=1, 2, 3, ... , N; AASc • Distribuição amostral de yi: • Temos: • Conclusão: yi é estimador não viciado para a média da população, mas a variância é “grande”! y i Y 1 Y 2 Y 3 ... Y j ... Y N P(y i=Y j) 1/N 1/N 1/N ... 1/N ... 1/N 2( ) e ( )AASc i AASc iE y Y V y AASc • Vamos analisar a média amostral: • Então a média amostral também é estimador não viciado para a média da população • Vantagem: a variância é menor! • Comparação com a AAS: 2 21( ) e ( )AASc AASc N SE y Y V y n N n ( ) ( )AAS AAScV y V y AASc • Estimador da variância da média amostral • Ou seja, na AASc temos que: • Para o total populacional: 2 ( )AASc sv y n 2 2 21( )AASc NE s S N 2 2 2 2ˆ ˆ ˆ, ( ) , ( )AASc AASc AASc sY Ny V Y N v Y N n n Slide 1 Slide 2 Slide 3 Slide 4 Slide 5 Slide 6 Slide 7 Slide 8 Slide 9 Slide 10 Slide 11 Slide 12 Slide 13 Slide 14 Slide 15 Slide 16 Slide 17 Slide 18 Slide 19 Slide 20
Compartilhar