Baixe o app para aproveitar ainda mais
Prévia do material em texto
� PAGE \* MERGEFORMAT �1� ESTIMADORES TIPO RAZÃO AMOSTRA ALEATÓRIA SIMPLES Os estimadores de medias e totais foram desenvolvidas para amostragem aleatoria simples e amostragem estratificada a partir dos dados de uma variável de interesse Y e, em amostragem aleatória, vimos também a estimativa de uma razão entre duas variáveis . Em estatística é conhecido, principalmente em delineamentos de experimentos, o termo covariavel, dado a uma variável secundaria correlacionada com a variável de interesse; em amostragem, temos também algo semelhante e que chamamos de variável auxiliar. Se a variável de interesse é Y e, se existe uma variável secundaria X correlacionada com Y, fácil de ser observada e da qual sabemos quanto vale a media da população , então podemos usá-la para melhorar a estimativa de . A informação sobre Y contida em X pode ser explicada com um exemplo, citado no livro de Cochran. Desejava-se estimar a população das maiores 196 cidades americanas em 1930, mediante uma amostra aleatória simples de 49 coidades e, o censo de 1920 fornecia a população das 196 cidades( ), ou seja o objetivo era estimar o total da população em 1930, conhecendo-se a população de 1920. A população de cada cidade da amostra foi obtida em 1930 mas a de 1920 já existia assim, a população de 1920 era uma variável auxiliar X e Y, o número de habitantes de cada cidade, é a variavel de interesse. Sejam e as medias da amostra; então o estimador tipo razão do total T da população é dada por Como vimos anteriormente, é um estimador viezado de da razão e assim, tambem é um estimador viezado de . O viez é pequeno se o tamanho da amostra ;e grande. A variância de é dada por Como , então Caso a media de Y fosse de interesse, então e Um estimador de é dado por e dai podemos estimar a variância em ambos casos, e tambem é um estimador viezado de , entretanto, para grandes amostras o viez é pequeno. Lembrar que a variância da estimativa de uma razão foi desenvolvida na primeira apostila, sobre amostragem aleatória simples e que o intervalo de confiança é baseado na distribuição normal No exemplo do Cochran, citado anteriormente, e e (cifras em milhões). O estimador simples do total da população é , com 2988. A estimativa tipo razão do total foi ErroPadrão Nota-se a diferença de precisão entre as duas estimativas, advinda do uso da informação da variável auxiliar X. AMOSTRAGEM ESTRATIFICADA Se a amostragem é estratificada e aleatória simples em cada estrato, temos duas forma de estimador tipo razão: Estimador tipo razão separado e estimador tipo razão combinado. Para a primeira forma temos a seguinte representação para a população: … Estratos … … .. valores conhecidos E para a amostra … … … .. … Em cada estrato i obtemos o estimador tipo razão . O estimador tipo razão separado da media da população é dado por: com Sendo Uma estimativa de é dada por O estimador combinado é construido a partir das estimativas das medias e e, conhecendo-se a media da população , o estimador é dado por: A é dada por e as variancias de Y e X da população no estrato i e a correlação de Pearson entre Y e X no estrato i. O estimador para do total da população é e sua variancia é dada por O desenvolvimento destes resultado estão em Cochran. Em ambos casos é estimado por , i=1,2, … L e assim temos uma estimativa para a variancia . EXEMPLO Para aplicar estes resultados vamos usar os dados de KISH( ), onde X é o numero de casas de um bloco residencial e Y é o numero de casas alugadas. O objetivo da amostragem é estimar o total de casas alugadas . Um programa SAS foi aplicado para a obtenção das estimativas e foi enviado para o APRENDER. 1)Estimativa simples com amostragem aleatória ; erro padrão=984; 2)Amostragen estratificada ; erro padrão=245; 3)Amostragem aleatória e estimador tipo razão ; erro padrão=268; 4)Amostragem estratificada – tipo razão separado ; erro padrão=137; 5)Amostragem estratificada – tipo razão combinadao ; ero padrão=153; O estimador tipo razão separado usa a informação de e de para se obter o estimador final , enquanto que o estimador combinado usa somente a media da população e da razão , portanto, espera-se que o primeiro tenha variância menor do que o segundo. Se a variabilidade entre os é pequena , então os dois resultados são próximos. Fica para o leitor comparar os resultados. OBS: A amostra que foi usada no caso 1), foi diferente da amostra estratificada, entretanto, o programa evidencia uma forma em que o SAS pode ser utilizado. REFERENCIAS Cochran,W. G. (1997). Sampling Techniques . Third edition. Wiley. SAS. (2003). Statistical Analysis System Institute Inc. Cary. North Carolina: SAS Institute. Inc. Version 9.3. Kish, L. (1965) Survey sampling. Wiley. AMOSTRAGEM SISTEMATICA Amostragem aleatoria simples é irrestrita: Se N é o tamanho da população, uma das possíveis amostras, de um total de , é selecionada com probabilidade uniforme; sobre os elementos da população não existe nenhuma restrição. Na amostragem sistemática, começamos por caracterizar a população da seguinte forma: 1) , , …, , (população) 2) Faça N=nk, onde n é o tamanho da amostra e k um numero inteiro. A forma de seleção da amostra é a seguinte. Ordene a população de 1 a N; escolha aleatoriamente um numero entre 1 e k; seja este numero , então os elementos da amostra são: , , , …., . Assim, o numero de possiveis amostras é apenas k e um elemento da população pertence a apenas uma amostra, isto é, as amostras são mutuamente excludentes em relação aos seus elementos, diferente da amostragem aleatória simples. Para melhor representar o processo, construiremos a seguinte tabela: Amostras 1 2 ....... i .... k …. .... …. .... ................................................. …. .... ………………………………… …. ..... Onde a ordem , , …, , foi transformada em uma ordem com dois índices. Para representar os valores de uma variável de interesse Y, temos a seguinte tabela Amostras 1 2 ....... i .... k …. .... …. .... ................................................. …. .... ………………………………… …. ..... ---------------------------------------- …. ..... Possiveis Medias Usamos duplo índice para facilitar o entendimento: i representa a amostra e j o elemento de cada amostra. Neste caso, como um elemento de uma amostra não aparece em outra, podemos usar letras minúsculas para a amostra ou maiúsculas. Por exemplo, se N=20 e n=5, então 20=(5)(4) e temos 4 amostras. Seja , então os valores de Y da amostra são , , , , , que pela tabela acima ficaria , , , , . entretanto, de uma forma mais simples, os valores da variável Y na amostra podem ser representados por , , , , . Para uma amostra de tamanho n, o estimador da media da população é , onde o indice s significa sistemática, um estimador não viesado. �� EMBED Equation.3 = = A variancia de pode ser deduzida usando a técnica de analise da variância; examinando a tabela anterior com as possíveis amostras e medias podemos imaginar um modelo de analise de variância com uma classificação,sendo o fator classe as amostras. A tabela da ANOVA é a seguinte : FV GL SQ QM Amostras k-1 =SQA Erro k(n-1) =SQE = Total nk-1 =SQT = FV= fontes de variação GL=grau de liberdade SQ=soma de quadrados QM=quadrado médio A soma de quadrados entre amostras(SQA) reflete a variabilidade entre suas medias enquanto que a soma de quadrados do erro(SQE) reflete a variabilidade dentro de cada amostra. Observamos que , a variancia da população, usando a ordenação natural e considerando que as amostras são mutuamente excludentes. Por sua vez, é o quadrado medio do erro. Como sabemos da analise da variância, SQT=SQA+SQE; assim, = . A variancia de é dada por e, substituindo na expressão anterior, = , e = . Simplificando, temos que Esta forma da variancia da media de uma amostra sistematica evidencia que quanto maior , menor é a variância ou, quanto maior a variabilidade dentro das amostras, menor a variância da media. A forma de ordenar a população influencia a variabilidade dentro das amostras. Como exemplo, vamos supor que uma empresa tem 2000 funcionarios e que esta sendo discutido a implantação de um novo plano de saúde, o qual será pago, em parte, pelos empregados. Deseja-se fazer uma pesquisa por amostragem com o objetivo de avaliar a preferência por este plano. Se ordenarmos a população pelo salário dos funcionários, uma amostragem sistemática pode apresentar uma variabilidade grande entre os elementos das amostras, que conterá funcionários com os mais variados salários. Um resultado derivado desta característica as amostragem sistemática é o seguinte: A variância da media de uma amostra sistematica , , é menor do que a variância de uma amostra aleatória simples se e somente se . Para provar este resultado, compare com . Existe outra forma de evidenciar esta propriedade da amostragem sistemática e para chegar a ela precisamos definir correlação intra classe. A correlação intraclasse é dada por : . Este coeficiente reflete a heterogeneidade dos elementos das amostras, isto é, quanto maior a variabilidade entre eles, menor é . Vamos dar dois exemplos. Exemplo1. Suponha que para a variável de interesse(Y), a ordem de uma população com N=10 é: 1,6,2,7,3,8,4,9,5,10(valores de Y) Com n=5, as duas possíveis amostras são 1,2,3,4,5 e 6,7,8,9,10.(valores de Y) Qual o valor de ?. Como esta no livro de Lohr(,..), baseado na analise de variância que vimos anteriormente, é dado pela formula , A analise de variância dos dados é a seguinte: FV GL SQ QM Amostras 1 62.50 62.50 Error 8 20.00 2.50 Total 9 82.50 No nosso caso : Como sabemos, a variabilidade entre os elementos das amostras é baixa. Exemplo 2. Suponha que para a variável de interesse(Y), a ordem da mesma população com N=10 é: 1,8,10,4,2,7,9,5,3,6(valores de Y) As possíveis amostras com n=5 são: 1,10,2,9,3 e 8,4,7,5,6(valores de Y). A ANOVA forneceu os seguintes dados: FV GL SQ QM Amostras 1 2.50 2.50 Erro 8 80.00 10.00 Total 9 82.50 9.17 Este resultado evidencia a grande variabilidade entre os elementos das amostras. Com este conhecimento, temos o seguinte resultado: Em amostragem sistematica, Este resultado esta provado no livro de Cochran. Quanto menor , menor a , isto é, quanto maior a variabilidade entre os elementos das amostras, menor será . No exemplo 2, , . No exemplo 1, , . Se a amostra fosse aleatoria simples, . O que vimos ate aqui sobre amostragem sistemática, permite tirar as seguintes conclusões: 1)Pode ser mais fácil e rápida do que AAS 2)Sua eficiência depende da ordenação da população. O ponto negativo que falta é a estimativa da . Não há um estimador para . Entretanto, na maior parte dos casos, a amostragem sistemática da resultado comparavel ao da amostragem aleatória simples e os metodos associados à AAS podem ser usados em amostragem sistemática(Lohr-1999). O livro de Cochran contem um estudo mais amplo de amostragem sistemática. REFERENCIAS Cochran,W. G. (1997). Sampling Techniques . Third edition. Wiley. Sharon, L. L.(1999). Sampling: Design and Analysis. Duxbury Press. . LUCIO JOSE VIVALDI. TECNICAS DE AMOSTRAGEM. DEPART. EST. UnB _1524184745.unknown _1524231417.unknown _1524231449.unknown _1524231466.unknown _1524231482.unknown _1524231490.unknown _1524231494.unknown _1524231498.unknown _1524231500.unknown _1524231502.unknown _1524231504.unknown _1524231505.unknown _1524231503.unknown _1524231501.unknown _1524231499.unknown _1524231496.unknown _1524231497.unknown _1524231495.unknown _1524231492.unknown _1524231493.unknown _1524231491.unknown _1524231486.unknown _1524231488.unknown _1524231489.unknown _1524231487.unknown _1524231484.unknown _1524231485.unknown _1524231483.unknown _1524231474.unknown _1524231478.unknown _1524231480.unknown _1524231481.unknown _1524231479.unknown _1524231476.unknown _1524231477.unknown _1524231475.unknown _1524231470.unknown _1524231472.unknown _1524231473.unknown _1524231471.unknown _1524231468.unknown _1524231469.unknown _1524231467.unknown _1524231458.unknown _1524231462.unknown _1524231464.unknown _1524231465.unknown _1524231463.unknown _1524231460.unknown _1524231461.unknown _1524231459.unknown _1524231454.unknown _1524231456.unknown _1524231457.unknown _1524231455.unknown _1524231452.unknown _1524231453.unknown _1524231450.unknown _1524231433.unknown _1524231441.unknown _1524231445.unknown _1524231447.unknown _1524231448.unknown _1524231446.unknown _1524231443.unknown _1524231444.unknown _1524231442.unknown _1524231437.unknown _1524231439.unknown _1524231440.unknown _1524231438.unknown _1524231435.unknown _1524231436.unknown _1524231434.unknown _1524231425.unknown _1524231429.unknown _1524231431.unknown _1524231432.unknown _1524231430.unknown _1524231427.unknown _1524231428.unknown _1524231426.unknown _1524231421.unknown _1524231423.unknown _1524231424.unknown _1524231422.unknown _1524231419.unknown _1524231420.unknown _1524231418.unknown _1524231401.unknown _1524231409.unknown _1524231413.unknown _1524231415.unknown _1524231416.unknown _1524231414.unknown _1524231411.unknown _1524231412.unknown _1524231410.unknown _1524231405.unknown _1524231407.unknown _1524231408.unknown _1524231406.unknown _1524231403.unknown _1524231404.unknown _1524231402.unknown _1524231393.unknown _1524231397.unknown _1524231399.unknown _1524231400.unknown _1524231398.unknown _1524231395.unknown _1524231396.unknown _1524231394.unknown _1524185186.unknown _1524231391.unknown _1524231392.unknown _1524231390.unknown _1524185014.unknown _1524185062.unknown _1524184870.unknown _1524021448.unknown _1524030452.unknown _1524147200.unknown _1524148278.unknown _1524149027.unknown _1524184692.unknown _1524184731.unknown _1524149934.unknown _1524148883.unknown _1524148868.unknown _1524147347.unknown _1524147383.unknown _1524147263.unknown _1524030892.unknown _1524031142.unknown _1524031223.unknown _1524031107.unknown _1524030549.unknown _1524030679.unknown _1524030492.unknown _1524029428.unknown _1524030054.unknown _1524030298.unknown _1524030416.unknown _1524030124.unknown _1524030276.unknown _1524029478.unknown _1524029602.unknown_1524029460.unknown _1524029214.unknown _1524029338.unknown _1524029351.unknown _1524029310.unknown _1524029157.unknown _1524029188.unknown _1524021572.unknown _1523981217.unknown _1523981911.unknown _1523982147.unknown _1524021361.unknown _1524021390.unknown _1524020610.unknown _1524020808.unknown _1524020391.unknown _1523982028.unknown _1523982099.unknown _1523981959.unknown _1523981998.unknown _1523981734.unknown _1523981790.unknown _1523981839.unknown _1523981772.unknown _1523981340.unknown _1523981492.unknown _1523981294.unknown _1522062671.unknown _1523967597.unknown _1523981050.unknown _1523981161.unknown _1523980995.unknown _1522394658.unknown _1523966201.unknown _1523967494.unknown _1522394708.unknown _1523965922.unknown _1522394718.unknown _1522394693.unknown _1522394645.unknown _1522394652.unknown _1522394638.unknown _1522046052.unknown _1522046093.unknown _1522062442.unknown _1522062459.unknown _1522062405.unknown _1522046076.unknown _1522045913.unknown _1522046019.unknown _1522045886.unknown
Compartilhar