Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Tecnologia da Amostragem I Eduardo Campos Principais Referências Bibliográficas Utilizadas: (1) Cochran, W.G., Sampling Techniques, 3rd ed. (1977). (2) Thompson, S.K., Sampling (1992). (3) Notas de Aula do Professor (2013). (4) Bolfarine, H., Bussab, W.O., Elementos de Amostragem (2005). (5) Sarndal, C.E., Swensson, B., Wretman, J., Model Assisted Survey Sampling (1992). 1 – Conceitos Básicos • População - conjunto U de N unidades sobre as quais queremos conhecer algo. • Parâmetro-Alvo - quantidade populacional desconhecida, na qual temos interesse. • Amostra - subconjunto s de n unidades selecionadas da população. Exemplo 1.1: População → N = 4 domicílios. Característica/variável de interesse: y = renda domiciliar (em R$ 1000,00). Parâmetro-alvo - renda média: . N y Y Ui i∑ ∈ = • Definição de Amostragem Conjunto de técnicas para selecionar uma amostra, a partir de uma população, com o propósito de obter informações acerca de uma ou mais características de interesse, que permitam formular conclusões acerca de um ou mais parâmetros-alvo. • Amostragem x Inferência Diferenças da teoria da amostragem em relação à teoria da inferência estatística clássica: 1 - Em amostragem, a população é tratada como finita, e sem a suposição de uma distribuição de probabilidade para a variável de interesse. 2 2 - A seleção das unidades é sem reposição, o que é bem mais coerente com aplicações reais. (em inferência, o plano amostral subjacente era a Amostragem Aleatória Simples com reposição) 3 - A Notação é diferente: Parâmetros e demais quantidades populacionais → letra maiúscula (em inferência: letra grega). Estimadores e demais quantidades amostrais → letra minúscula (em inferência: maiúscula). Exemplo 1.1 (cont.) - suponha que os valores da renda y na população sejam: U yi 1 4 2 5 3 3 4 3 Vamos considerar primeiramente que o parâmetro-alvo seja a média, e passamos a abordar o problema da estimação deste parâmetro, a partir de uma amostra. • Estimador - função dos valores de y na amostra, utilizada para obter uma estimativa para o parâmetro-alvo. Obs - qual a diferença entre estimador e estimativa? . n y y si i∑ ∈ = letra minúscula (releia o segundo slide desta página) Um estimador “natural” para a média populacional seria a média amostral. 3 Exemplo 1.1 (cont.) - suponha que a amostra selecionada tenha sido: s = (2,3). Não entraremos ainda no mérito de como selecionar esta amostra (plano amostral). Calcule a estimativa correspondente ao estimador do slide anterior. R: 4. Retornando ao exemplo 1.1, considere agora um novo parâmetro-alvo, ao qual chamaremos total populacional: .yY Ui i∑ ∈ = Note que este parâmetro não é definido (e nem faria sentido) na inferência clássica! Considere o seguinte estimador para Y, ao qual chamaremos total amostral: .yt si i∑ ∈ = Este estimador parece razoável? Que problema você acha que ele apresentaria? Outros parâmetros de interesse em amostragem: - Proporção Populacional (P) - Razão Populacional (R): . x y R Ui i Ui i ∑ ∑ ∈ ∈ = A definição dos parâmetros-alvo em uma pesquisa é um passo muito importante, e que está atrelado aos objetivos da pesquisa. Por exemplo: Em uma pesquisa sobre poder de compra, a renda familiar total em uma localidade é um parâmetro que certamente interessa. Já em uma pesquisa sobre remuneração trabalhista, o que seria importante é a renda média por trabalhador (razão). • Censo x Pesquisa por Amostragem Um censo é uma pesquisa na qual todas as unidades populacionais são investigadas, de tal forma que os valores da variável de interesse tornem-se conhecidos para toda a população. Em uma pesquisa por amostragem, os valores de y são obtidos apenas para um subconjunto da população: a amostra. 4 Exemplos de Pesquisas Amostrais no IBGE: - Pesquisa Nacional por Amostra de Domicílios (PNAD) - Pesquisa Mensal de Emprego (PME) - Pesquisa Anual de Serviços (PAS) - Pesquisa Mensal de Comércio (PMC) - Pesquisa Industrial Anual (PIA) Recentemente, o IBGE criou o Sistema Integrado de Pesquisas Domiciliares (SIPD), que integra PNAD, PME e POF. • Cadastro (ou Sistema de Referência) Um cadastro é uma lista das unidades populacionais utilizada, quando disponível, para selecionar a amostra. Um bom cadastro deve identificar clara e inequivocamente as unidades populacionais, e permitir localizá-las. Etapas de uma Pesquisa por Amostragem: 1 – Definição dos Objetivos; 2 – Elaboração de um Cadastro; 3 – Seleção da Amostra; 4 – Coleta das Informações; 5 – Estimação dos Parâmetros; 6 – Compilação das Informações. Obs - podemos definir 3 tipos de população: - população-alvo: aquela para a qual queremos ou gostaríamos de fazer inferências (objetivo). - população de referência: aquela da qual temos um cadastro, e que, portanto, serve de base para a seleção da amostra (ou seja, é aquela para a qual podemos fazer inferências). - população amostrada: a que é efetivamente pesquisada, dependendo de situações de campo (isto é, para a qual conseguimos inferir). Isto leva a definir 3 tipos de unidades: As unidades da população-alvo são chamadas unidades de análise. As unidades da população de referência são chamadas unidades de referência. As unidades da população amostrada são chamadas unidades amostrais. Doravante, será considerado que as populações do slide anterior coincidem, e faremos alusão a ela como população-alvo. • Estratégia de Estimação Cada plano amostral levará a um estimador adequado para o parâmetro-alvo. O conjunto plano+estimador é chamado estratégia de estimação. Claramente, podemos ter diversas estratégias de estimação para um mesmo parâmetro. 5 Uma questão importante: o que é uma boa amostra? Uma boa amostra é aquela que representa adequadamente o universo que queremos estudar, chamada amostra representativa. • Amostra Representativa É a que representa com fidedignidade o comportamento da variável de interesse na população, de tal forma que seja possível generalizar as conclusões da amostra para esta população. Esta definição, aparentemente simples, pode levar à confusão em situações específicas, como no exemplo a seguir. Exemplo 1.2 (amostra representativa x estratificada com alocação proporcional) Considere uma população com N = 1.000 indivíduos, sendo 100 da classe A (ricos), 300 da classe B (média) e 600 da classe C (pobres). Se nosso interesse for estimar a renda média nesta população a partir de uma amostra de tamanho 50, o que seria uma amostra representativa da população? • Planos Amostrais Probabilísticos Seja S o conjunto de todas as amostras s de mesmo tamanho n, possíveis de serem selecionadas da população U. S é denominado espaço amostral. Um plano amostral é chamado probabilístico se as 3 condições a seguir são satisfeitas: 1) Cada amostra s⊂S tem uma probabilidade de seleção p(s) conhecida ou possível de ser calculada. Obs - se p(s) = cte, ∀ s⊂S, temos uma Amostragem Aleatória Simples (AAS). Obs - as probabilidades p(s) são chamadas probabilidades de seleção. Estas probabilidades necessariamente somam 1. A distribuição das probabilidades de seleção é chamada distribuição de aleatorização (tradução encontrada para design distribution). Esta distribuição define o plano amostral. 6 2) Cada unidade da população tem probabilidade de inclusão estritamente positiva, ou seja: pii = P(i∈s) > 0, ∀ i∈U. 3) A seleção da amostra s é feitaa partir de um esquema de seleção que garanta que cada amostra s seja selecionada com a probabilidade p(s) definida no plano amostral. falaremos mais sobre esquemas de seleção no módulo 4 do curso. Exemplo 1.3 - Considere o plano amostral a seguir: p(1,2) = p(3,4) = 0; p(1,3) = ½; p(1,4) = p(2,3) = p(2,4) = 1/6. Obtenha as probabilidades de inclusão e verifique se o plano é probabilístico. Obs - na prática, a condição a ser verificada é a 2. Solução: s p(s) (1,2) 0 (1,3) 1/2 (1,4) 1/6 (2,3) 1/6 (2,4) 1/6 (3,4) 0 pi1 = 0+ 1/2+1/6 = 2/3. pi2 = 0+ 1/6+1/6 = 1/3. Analogamente: pi3 = 2/3 e pi4 = 1/3. Como todos os pii`s são >0, o plano é probabilístico. Obs - note que: Isto não é coincidência! É uma propriedade da soma das probabilidades de inclusão sob planos amostrais probabilísticos, válida para qualquer população. n Ui i∑ ∈ =pi Exemplos de Planos Não-Probabilísticos: - Amostragem por Julgamento - Amostragem por Conveniência - Amostragem de Voluntários - Amostragem Intencional - Amostragem por Quotas (Cotas) Obs - o uso de amostragem por quotas/cotas em pesquisas eleitorais gera uma das críticas mais contundentes à validade destas pesquisas: não é possível calcular a margem de erro! Sobre este assunto, disponibilizo para discussão o artigo dos professores José Carvalho e Cristiano Ferraz.
Compartilhar