Prévia do material em texto
PúbCEDERJ – CENTRO DE EDUCAÇÃO SUPERIOR A DISTÂNCIA DO ESTADO DO RIO DE JANEIRO DISCIPLINA: Estatística Aplicada à Segurança Pública CONTEUDISTA: Doriam Borges Aula 8- Noções de Amostragem em Pesquisa Social Metas Apresentar princípios e métodos de estatística essenciais da amostragem. Esta aula fornece orientações básicas para o aluno desenhar um plano amostral para uma pesquisa de survey, possibilitando ao mesmo mais agilidade e confiança no desenvolvimento de pesquisas na área de segurança pública. Objetivos Ao final desta aula, você deverá ser capaz de: 1. Identificar e descrever os quatro tipos de amostragem aleatória. 2. Descrever três tipos de amostragem não aleatória. 3. Apresentar os conceitos para definição do tamanho da amostra. 1 – Por quê selecionar alguns? Qual a ideia da Amostragem? Em geral, os pesquisadores não podem realizar observações de todos os indivíduos na população estudada. Em vez disso, eles coletam dados de um subconjunto da população – uma amostra – e usam essas observações para fazer estimativas sobre todo o conjunto do grupo que quer estudar. Idealmente, a amostra corresponde à população no que se refere às características de interesse da pesquisa. Nesse caso, as conclusões que o pesquisador chegar com os dados da amostra são, provavelmente, aplicáveis a toda a população. Esse tipo de correspondência entre a amostra e a população é muito importante, pois quando o pesquisador quer saber qual a proporção da população tem uma determinada especialidade – como uma opinião particular ou uma característica demográfica – ele pode utilizar os resultados do levantamento amostral. Pesquisas de opinião pública que tentam descrever o percentual da população que pretende votar em um determinado candidato, por exemplo, exigem uma amostra que seja representativa da população. Existem duas abordagens gerais que são usadas para a seleção de amostras nas pesquisas em ciências sociais: amostragem probabilística e amostragem não probabilística. Com a amostragem probabilística, todos os elementos (por exemplo, pessoas, policiais, batalhões, etc.) na população têm alguma chance (ou probabilidade) de ser incluído na amostra, e essa probabilidade de que qualquer um deles seja selecionado pode ser calculada. Já a amostragem não probabilística, por outro lado, os elementos da população são selecionados com base na sua disponibilidade (por exemplo, porque eles se ofereceram para participar da pesquisa) ou por causa do julgamento pessoal do pesquisador de que eles são representativos e devem compor a amostra. A consequência com esse tipo de amostragem é que uma parte desconhecida da população é excluída (por exemplo, aqueles que não são voluntários). Um dos tipos mais comuns de amostragem não probabilísticas é chamado de amostragem por conveniência. Este tipo de amostragem é comum não porque a amostra é necessariamente fácil de ser recrutada, mas porque o pesquisador trabalha com as pessoas que estão disponíveis, ao invés de selecionar a partir de toda a população. Dessa forma, numa amostragem por conveniência, alguns membros da população não têm chance de serem selecionados para a amostra, independentemente da sua dimensão e distribuição na população –, isso significa que na verdade, com uma amostragem não probabilística, os resultados da pesquisa não representa toda a população, mas apenas aqueles que foram entrevistados. Selecionar uma amostra probabilística nem sempre é uma prioridade para os investigadores, quando se pretende descrever um grupo em particular de um modo experimental. Por exemplo, entrevistando 30 pessoas com HIV sobre suas experiências com o vírus pode fornecer informações valiosas sobre estresse e enfrentamento, mesmo que não produza dados sobre a proporção de aidéticos na população em geral que compartilham essas experiências. Até por que, qual é a população de portadores do vírus HIV no Brasil? Não sabemos. Nesta aula você verá que a maneira como se seleciona uma amostra é fundamental para a pesquisa. Qual o tipo de amostragem que deve ser utilizada? Os resultados da amostra serão representativos para a população? Ou, qual o erro máximo das estimativas para os resultados encontrados na pesquisa? Essas são questões importantes que devem ser definidas antes de se desenhar um plano amostral. Os procedimentos que forem usados para definir a amostragem podem determinar o viés nos resultados da pesquisa. Se o pesquisador fizer um mau trabalho na fase da amostragem, a integridade de todo o projeto estará em risco. Se o seu interesse é analisar o efeito da violência na televisão sobre as crianças, então, que crianças você vai observar? De onde elas vêm? Quantas devem ser observadas? Como elas serão selecionadas? Estas são perguntas importantes. Cada uma das técnicas de amostragem que serão descritas nesta aula tem vantagens e desvantagens. Vamos discutir isso a seguir. 2 - Distinguindo População e Amostra Antes de descrever os procedimentos de amostragem, é preciso definir alguns termos- chaves. O termo população significa todos os membros que possuem pelo menos uma característica em comum. Por exemplo, a população brasileira é definida como todas as pessoas que residem no Brasil. A população de Nova Friburgo (RJ) significa todas as pessoas que vivem dentro dos limites desta cidade. Uma população de objetos inanimados também pode existir, tal como todos os automóveis fabricados em Porto Real (RJ) no ano de 2010. O censo é a contagem completa de todos os componentes (pessoas ou objetos) na população. Muitas vezes, os pesquisadores querem conhecer algumas características da população, mas não tem os dados para cada pessoa. Por exemplo, se uma empresa quisesse saber se os seus clientes ficaram satisfeitos com a qualidade dos produtos comprados, não seria prático (ou até mesmo possível) entrar em contato com todos os indivíduos que compraram o produto nesta empresa. Em vez disso, a empresa pode selecionar uma amostra da população. A amostra é um pequeno grupo de membros de uma população selecionada para representar a população. A amostragem é o processo de dimensionamento e coleta de informações de parte da população usando métodos de seleção adequados. Um parâmetro é uma característica de uma população. Um estimador (ou estatística) é uma característica de uma amostra. Estatística inferencial permite que você faça um palpite sobre um parâmetro populacional com base em uma estatística calculada a partir de uma amostra sorteada aleatoriamente de que a população (ver Figura 1). Figura 1 – Ilustração da relação entre a amostra e a população Elaboração própria PARÂMETROS: ESTIMADORES: Amostragem (Média da População é um exemplo de Parâmetro) (Média da Amostra é um exemplo de Estimador) Por exemplo, digamos que um pesquisador quisesse saber o rendimento médio dos assinantes de uma determinada revista – o parâmetro de uma população. Para isso, ele resolveu selecionar uma amostra aleatória de n=500 assinantes para determinar qual a renda média, e descobriu que essa estatística era de R$ 2.500,00 (uma estimativa do valor real). Com base nesse resultado, o pesquisador concluiu que a média da população de renda μ (parâmetro) provavelmente é um valor muito parecido com R$ 2.500,00. Este foi um exemplo de inferência estatística. Definições Básicas: Unidade é um único indivíduo ou objeto a ser medido na pesquisa A população (ou universo) é o conjunto de todas as unidades para a qual queremos obter informações. A amostra é o conjunto de unidades que selecionamos para medir. O cadastro é a lista de unidades de onde a amostra é selecionada.Em um survey, as mensurações são tomadas a partir de uma parte, ou amostra, de unidades da população. O Censo é uma pesquisa na qual todas as unidades da população são entrevistadas. Quando você for realizar um levantamento (uma pesquisa ou coleta de informações), a questão básica é: fazer uma amostragem (estudar algumas unidades) ou fazer um censo (todas as unidades)? Algumas pessoas acreditam que se as perguntas forem aplicadas somente a algumas pessoas, então o resultado pode fornecer uma visão incompleta da realidade. De fato, existe um risco amostral, mas se o pesquisador utilizar procedimentos de amostragem bem estabelecidos e selecionar uma amostra representativa, as chances de que os resultados possam gerar estimativas muito precisas sobre a população são grandes. A amostra deve ter um perfil que acompanha o da população e sua obtenção deve obedecer a uma série de cuidados. A amostragem é normalmente utilizada quando se pretende maximizar precisão e minimizar custo. Por exemplo, seria muito caro realizar uma pesquisa eleitoral entrevistando toda a população brasileira. Já o censo pode ser utilizado quando a população é pequena ou quando é necessário trabalhar com as informações individuais de todos. Quando se deseja selecionar quais indivíduos de uma população farão parte da amostra, deve-se escolher o tipo de amostragem mais adequado, com base nas características da população-alvo. A seleção pode ser determinística (ou intencional, tendenciosa, não- aleatória) ou aleatória (probabilística, ao acaso). No primeiro caso, o pesquisador define um critério que deverá ser seguido por todos os membros de uma dada população-alvo. Neste caso, as conclusões serão válidas apenas para o grupo selecionado, e não para a população como um todo. Este tipo de amostragem é utilizado, por exemplo, quando se trabalha com doenças raras e não se dispõe de muitos casos observáveis. No segundo caso, alguns elementos serão sorteados (escolhidos ao acaso) para compor a amostra. Neste tipo de amostragem, o problema passa a ser como sortear estes elementos. Se a população for considerada homogênea (ou seja, todos os elementos são similares entre si na população), duas são as possibilidades: a amostragem aleatória simples e a amostragem aleatória sistemática. No entanto, se a população for avaliada como heterogênea (ou seja, com grande variabilidade), então as amostragens sugeridas são a amostragem aleatória estratificada e a amostragem por conglomerados. A seguir os diferentes tipos de amostragem serão apresentados. 3 – Tipos de Amostragem TIPOS DE AMOSTRAGEM PARA POPULAÇÕES HOMOGÊNEAS Amostragem Aleatória Simples A amostragem aleatória simples (AAS) consiste no sorteio direto de elementos da população, como se a cada indivíduo tivesse sido dado um papel com um número. Todos os papéis são colocados em uma urna e, então, seria realizado um sorteio de n indivíduos entre os N daquela população. Se não existe a urna, pode-se trabalhar com sorteio de bolas numeradas (como os da LOTERJ). Existem ainda tabelas de números aleatórios, gerados através de rotinas computacionais, que também são úteis para a seleção de amostras aleatórias simples quando as populações são pequenas. Para populações maiores, apenas a geração de números aleatórios através de algoritmos computacionais, pode ser usada. Exemplo: Imagine que você precise selecionar uma amostra de policiais civis de uma delegacia para a realização de uma pesquisa sobre a percepção acerca da criminalidade na circunscrição de atuação desses profissionais. Considerando que neste exemplo todos os policiais pertencem a mesma Delegacia de Polícia Civil (DP), ou seja, atuam na mesma região e trocam as mesmas experiências (ou experiências similares), acreditamos que esta população seja homogênea. Lembramos que uma população homogênea não significa que todas as pessoas irão responder as mesmas coisas, mas vão variar pouco em suas respostas, neste caso, devido ao pertencimento a mesma DP. Tendo concluído que a população é homogênea, você pode escolher o tipo de amostragem. Supondo que você tenha escolhido a Amostragem Aleatória Simples, será necessário ter o cadastro de todos os policiais civis da delegacia e uma tabela de números aleatórios. Sendo o número total de policiais civis na DP N=100 e o tamanho da amostra de n=50, então é preciso criar um procedimento para fazer a seleção na tabela de números aleatórios. Não há uma regra para a leitura desse tipo de tabela. Os números podem ser lidos em grupo ou isoladamente, por coluna, por linha ou pela diagonal, também pode ser lidos em qualquer ordem. Entretanto, uma coisa é importante: o procedimento de leitura deve ser definido antes do processo ser iniciado, e o mesmo deve ser levado até o fim. Neste exemplo, o procedimento de leitura da tabela de números aleatórios para você selecionar a amostra de policiais civis foi a escolha da terceira linha de cada bloco, iniciando a leitura da esquerda para a direita. Se houver números repetidos eliminar da amostra. Lembrando que o total da amostra é n=50 Tabela de Números Aleatórios A tabela de números aleatórios contabiliza os policiais de 00 a 99, ou seja, 100 policiais. Utilizando o procedimento proposto, os policiais selecionados para a pesquisa foram: 92; 59; 18; 52; 87; 30; 48; 86; 97; 48; 35; 25; 18; 88; 74; 03; 62; 98; 38; 58; 65; 86; 42; 41; 03; 79; 44; 92; 62; 02; 96; 86; 64; 30; 00; 94; 56; 69; 30; 20; 59; 87; 87; 35; 44; 22; 50; 97; 78; 19; 27; 07; 81; 88. Os números que estão tachados (riscados) são aqueles que estavam repetidos na tabela de números aleatórios. Amostragem Aleatória Sistemática A amostragem aleatória sistemática (AASis) também está baseada na suposição de que a população é homogênea. Ela é mais empregada quando os dados dos indivíduos já estão armazenados em registros (em computadores, ficha de chamada ou algo semelhante). A facilidade que ela introduz é colocar a aleatoriedade do sorteio apenas na definição de um primeiro número aleatório e, somando-se sistematicamente um mesmo valor (chamado de passo ou distância) a este número, seriam obtidos os demais números aleatórios do sorteio. Assim, todos os números sorteados guardariam a mesma distância entre si (com exceção, provavelmente, da distância entre o primeiro sorteado e o último sorteado). O sorteio do primeiro número aleatório é idêntico ao sorteio realizado pela amostragem aleatória simples. As etapas para tal “sorteio” são: 1. Determinar o tamanho populacional (N); 2. Determinar o tamanho da amostra (n); 3. Calcular a distância d = (N/n), correspondente ao tamanho de população N e de amostra n; 4. Sortear o primeiro número aleatório da tabela (entre 1 e d); 5. Obter o próximo número aleatório somando ao número do passo 4 o valor da distância calculada em 3; 6. Obter o próximo número aleatório somando ao número do passo 5 o valor da distância calculada em 3,... e assim em diante até fechar o tamanho da amostra em n; 7. Cada número sorteado corresponde a um indivíduo que comporá a amostra. Vale ressaltar que o cadastro da população (registro dos indivíduos que compõem a população) deve estar ordenado por alguma variável relevante, como a idade, de modo que essa técnica de sorteio seja eficiente e selecione todos os grupos etários da população estudada. Exemplo: Numa população constituída por 40 pessoas e a amostra por 10 elementos, onde N = 40 e n = 10, divide-se N por n, isto é, 40 por 10, obtendo-se d = (N/n) = (40 / 10) = 4. Em seguida, sorteia-se um número da primeira dezena e, a partir dele, escolhem-se os demais, observando-se que se o número sorteado for, por exemplo, quatro, o segundo será 8, o terceiro 12, e assim por diante, até obterem-se os dez elementos que constituirãoa amostra, conforme a figura a seguir. Elaboração própria As pessoas sorteadas nessa amostra foram: 4; 8; 12; 16; 20; 24; 28; 32; 36; 40. TIPOS DE AMOSTRAGEM PARA POPULAÇÕES HETEROGÊNEAS Amostragem Aleatória Estratificada Este tipo de amostragem é utilizado quando dispomos de informações de que a população apresenta características heterogêneas, isto é, grande número de fatores ou variáveis que podem comprometer nossas conclusões se não eliminarmos através de um procedimento. Na Amostragem Aleatória Estratificada (AAE), a população heterogênea é transformada em subpopulações homogêneas. Essas subpopulações têm o nome de estratos. Os estratos devem ser homogêneos internamente e heterogêneos entre si. Dentro de cada estrato são selecionados nestrato elementos para compor a amostra total (n). A seleção da 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 amostra dentro do estrato pode ser feita por amostragem sistemática ou amostragem aleatória simples, já que o estrato é uma subpopulação homogênea. Elaboração própria O tamanho da amostra será determinado em função da variância da característica a estudar em cada estrato, ou então considerando o número de seus elementos e procedendo-se a um percentual de cada estrato – com isso, obtemos uma amostra estratificada proporcional. A amostragem aleatória estratificada (AAE) é mais adequada, levando a uma maior precisão final que os dois tipos de amostragem anteriores. Usos da estratificada Amostragem Aleatória - A amostragem aleatória estratificada pode ser utilizada quando o pesquisador quer destacar um subgrupo específico dentro da população. Esta técnica é útil em tais pesquisas porque garante a presença do subgrupo chave dentro da amostra. - Os pesquisadores também utilizam amostragem aleatória estratificada quando querem observar as relações existentes entre dois ou mais subgrupos. Com uma técnica de amostragem aleatória simples, o pesquisador não tem certeza de que os subgrupos que Estrato 1 Estrato 2 Estrato 3 ele quer observar estarão representados igualmente ou proporcionalmente dentro da amostra. - Com a amostragem estratificada o pesquisador pode, representativamente, trabalhar com os menores e mais inacessíveis subgrupos da população. Isso permite que o pesquisador possa estudar os casos raros da população dada. - Com essa técnica, o pesquisador tem uma precisão estatística mais elevada em comparação com a amostragem aleatória simples. Isto acontece porque a variabilidade dentro dos subgrupos é menor em comparação com as variações quando se lida com toda a população. Exemplo: Se você estiver interessado em estudar o desempenho escolar das crianças do ensino fundamental da cidade do Rio de Janeiro, a primeira coisa que você deverá fazer é dividir as escolas em públicas municipais, públicas federais e particulares, já que o desempenho escolar, em média, pode ser bastante distinto entre os tipos de escola. O segundo passo é tomar uma amostra aleatória simples em cada estrato. Desta forma, uma amostra probabilística aleatória será selecionada em cada estrato. Cada estrato deve ser mutuamente exclusivo (ou seja, cada elemento da população pode ser atribuído a somente um estrato), e nenhum elemento da população pode ser excluído na construção de estratos. Dessa forma, o plano amostral foi construído e a seleção pode ser realizada. Amostragem por Conglomerados Neste tipo de amostragem a população é dividida em diferentes conglomerados (grupos), extraindo-se uma amostra apenas dos conglomerados selecionados, e não de toda a população. O ideal seria que cada conglomerado representasse tanto quanto possível o total da população. Na prática, selecionam-se os conglomerados geograficamente. Escolhem-se aleatoriamente algumas regiões, em seguida algumas sub-regiões e finalmente, alguns lares. Esse processo possibilita ao pesquisador entrevistar apenas poucas pessoas. Na amostragem por conglomerados, diferente da amostragem estratificada, os grupos devem ser heterogêneos internamente e homogêneos entre si. Elaboração própria A amostragem por conglomerados pode ser usada quando é difícil ou impraticável para compilar uma lista exaustiva de elementos que compõem a população alvo. Normalmente, os elementos da população já são agrupados em subpopulações. Por exemplo, digamos que a população alvo em um estudo seja o perfil socioeconômico da população da cidade do Rio de Janeiro. Não existe uma lista de todos os moradores da capital carioca. O pesquisador, no entanto, poderia dividir a cidade por Regiões Administrativas (RAs), escolher uma amostra de RAs; e em seguida, obter uma lista de setores censitários dentro da RA, por amostragem aleatória simples ou por amostragem sistemática; no setor censitário selecionar uma amostra de domicílios, quer por amostragem aleatória simples ou por amostragem sistemática (se o conglomerado for pequeno, o pesquisador pode optar por incluir todos os domicílios na amostra); dentro do domicílio seleciona todos os moradores. O IBGE (Instituto Brasileiro de Geografia e Estatística) aplica um plano amostral muito parecido com o descrito neste exemplo. Bairro 1 Bairro 2 Bairro 3 Bairro 4 Bairro 5 Glossário Regiões Administrativas (RAs): são agregados de bairros – o Rio de Janeiro possui 33 RAs Setor Censitário: é uma unidade de controle cadastral formada por área contínua, formada por, em média, 300 domicílios. Este tipo de amostragem reduz precisão nas estimativas, em relação à amostragem estratificada, mas ganha em tempo com a diminuição das tarefas. Vantagens da Amostragem por Conglomerados Uma das vantagens da amostragem por conglomerados é que ela é barata, rápida e fácil. Se a amostra fosse selecionada por amostragem aleatória simples em todo o país, por exemplo, o custo seria muito mais alto. Com a amostragem por conglomerado, a pesquisa poderia alocar poucos recursos em grupos selecionados aleatoriamente. Outra vantagem da amostragem por conglomerado é que o pesquisador pode ter um tamanho de amostra maior do que se ele utilizasse uma amostragem aleatória simples. Isso se deve ao fato do pesquisador ter que tomar a amostra a partir dos conglomerados, assim ele pode selecionar mais casos, uma vez que os dados estão mais acessíveis ao pesquisador (por exemplo, se o conglomerado for dividido por bairro, o acesso a um número maior de casos em cada uma dessas áreas será operacionalmente mais simples). Desvantagens da Amostragem por Conglomerados Uma das principais desvantagens da amostragem por conglomerados é o fato dela ser a menos representativa da população em comparação aos outros tipos de amostragem probabilística. É comum que os indivíduos dentro de um conglomerado tenha características semelhantes, por isso, quando um pesquisador utiliza amostragem por conglomerados, há uma chance de que ele possa ter um conglomerado sobrerepresentado ou subrepresentado em termos de certas características. Isto pode distorcer os resultados do estudo. Outra desvantagem da amostragem por conglomerados é que ele pode ter um elevado erro de amostragem. Isto é causado pelos agregados limitados incluídos na amostra, o que deixa uma proporção significativa da população sem amostragem. ATIVIDADE 1 Atende ao objetivo 1: Um pesquisador supõe que o local de residência influencia na percepção quanto à legislação sobre o controle de armas. Ele obtém uma listagem de eleitores no seu estado e divide a lista em sub-populações de homens que moram em cidades pequenas, mulheres em cidades pequenas, homens em cidades grandes e mulheres em cidades grandes. Ele então seleciona uma amostra aleatória de cada sub-população considerando a proporção decada grupo na população. Que tipo de amostragem você acha que é este? Como você avalia a operacionalidade desta pesquisa? E o custo? Você sugere alguma alternativa de amostragem? RESPOSTA COMENTADA A amostragem que o pesquisador utilizou foi a estratificada, sendo as sub-populações (homens que moram em cidades pequenas; mulheres que moram em cidades pequenas; homens que moram em cidades grandes; e mulheres que moram em cidades grandes) os estratos. Esse tipo de amostragem é bem eficiente, pois controla as diferenças (variabilidade) consideradas na hipótese do pesquisado. Entretanto, no que se refere a operacionalidade, a forma como esse pesquisador desenhou o plano amostral torna o trabalho de campo mais difícil. A divisão por municípios grandes e pequenos é fácil, mas a separação por sexo torna a seleção da amostra mais demorada e mais cara. Como alternativa, o pesquisador poderia utilizar a amostragem por conglomerado. Neste caso em particular, a diferença não seria muito grande. O primeiro conglomerado seria o tipo de município (grande ou pequeno); dentro destes conglomerados poderiam ser selecionados alguns municípios, através de amostragem aleatória simples (com uma tabela de números aleatórios); dentro dos municípios; poderiam ser selecionados setores censitários por amostragem sistemática; dentro do setor censitário poderiam ser selecionados alguns domicílios por amostragem sistemática; dentro dos domicílios poderia ser selecionada uma pessoa. FIM DA ATIVIDADE 1 AMOSTRAGEM NÃO PROBABILÍSTICA (NÃO ALEATÓRIA) As amostragens não probabilísticas ou não aleatórias focam a seleção de voluntários, unidades facilmente disponíveis, ou aqueles que só estarão presentes quando a pesquisa for feita. As amostras não probabilísticas são úteis para estudos rápidos e baratos, para os estudos de caso e para o desenvolvimento de hipóteses para futuras pesquisas. Tipos de Amostragem Não Probabilística Amostragem por conveniência: também chamada de amostragem "acidental". O pesquisador seleciona as unidades que são convenientes, ou que estão à sua disposição, mais acessíveis para serem entrevistadas, etc. A amostragem por conveniência é uma opção quando não é necessário ter uma amostra representativa da população de interesse ou quando há restrições orçamentárias para a realização da pesquisa. Por exemplo, o objetivo da pesquisa é conhecer a opinião dos turistas que visitam o Rio de Janeiro sobre a violência na cidade. Para isso, o pesquisador seleciona os respondentes da pesquisa em um ponto turístico da cidade, o Pão de Açúcar. Amostragem por Cotas: neste tipo de amostragem o pesquisador constrói cotas para diferentes tipos de unidades. Um número fixo e pré-determinado de sujeitos que possuem características particulares são selecionados. Por exemplo, para entrevistar um número fixo de compradores em um shopping, a amostra será composta por metade de pessoas do sexo masculino e a outra metade do sexo feminino; 20% com mais de 50 anos e 80% com menos de 50 anos, etc. Amostragem por Bola de Neve: A amostragem por bola de neve é muitas vezes usado para pesquisas em que a população é de difícil acesso. Neste tipo de amostragem o pesquisador entra em contato com alguns membros da população alvo, em seguida, pede a esses indivíduos que forneçam informações necessárias para localizar outros membros da população, e assim sucessivamente. Por exemplo, se você está entrevistando mulheres profissionais do sexo, durante as entrevistas, você pediria a entrevistada se ela conhece outras profissionais do sexo que poderiam conceder a entrevista; você vai continuar até atingir uma cota pré-determinada ou não obter mais novas indicações. ATIVIDADE 2 Atende ao objetivo 2: Um Gestor Público de um estado está interessado em conhecer as experiências de vitimização da população homossexual (LGBT) para desenvolver políticas públicas nessa área. Para isso, ele desenvolveu junto a sua equipe um questionário com perguntas relacionadas à vitimização, ao agressor, etc. Você foi convocado para ajuda-lo a construir o plano amostral desta pesquisa. Considerando a população alvo, qual o tipo de amostragem mais adequado? RESPOSTA COMENTADA Tendo em vista que a população alvo da pesquisa é a LGBT, é importante ter clareza que não se conhece o número total de membros. Além disso, não existe um cadastro desta população. Não obstante, o tema da pesquisa ainda é polêmico nos dias de hoje. Nem todos os homossexuais se autodeclaram dessa forma. Ainda assim, se perguntássemos a orientação sexual para todas as pessoas da amostra, perderíamos muitos casos em nossa análise, pois um percentual significativo (e ainda desconhecido) dos respondentes seria composto por heterossexuais, e não servira para o estudo do gestor público. Então como selecionar uma amostra da população homossexual? A maneira mais eficiente é através da Amostragem por Bola de Neve. Os pesquisadores poderiam procurar contatos em diferentes grupos organizados, locais de convivência da população homossexual, etc, e estes indicariam outros homossexuais, que indicariam outros, até completar o tamanho da amostra definido pelo gestor. Vale ressaltar que os resultados dessa pesquisa não serão representativos da população homossexual, mas quanto mais grupos diferentes o pesquisador buscar mais eficiente a amostra será. FIM DA ATIVIDADE 2 4 – Tamanho da Amostra Uma das perguntas mais comuns no planejamento de uma pesquisa é o tamanho da amostra. A resposta para essa pergunta depende de uma série de fatores como o erro máximo, o tamanho da população o nível de confiança, etc. A determinação do tamanho da amostra é uma questão muito importante, porque as amostras que são muito grandes podem desperdiçar tempo, recursos e dinheiro, enquanto as amostras que são muito pequenas podem levar a resultados imprecisos. Ao trabalhar com grandes amostras, o pesquisador consegue detectar as pequenas diferenças existentes nos seus dados, e realizar muitas análises. Por outro lado, se a amostra for pequena, a análise não poderá ser tão minuciosa e precisa, mas será muito mais rápida e barata. Em pesquisas de opinião realizadas com cuidado, o tamanho da amostra determina o quão perto os valores da amostra se aproximam dos valores populacionais. Supondo que os procedimentos de amostragem são válidos, quanto maior a amostra, mais perto (em média) os valores da amostra serão dos valores da população. No entanto, a relação entre o tamanho da amostra e a sensibilidade é uma curva de rendimentos decrescentes (Gráfico 1). É errado pensar que o tamanho da amostra deve ser equivalente a uma proporção da população. Até certo ponto, o custo e o esforço necessários para alcançar uma maior sensibilidade tornam-se desproporcionalmente grandes. Gráfico 1 – Relação entre o tamanho da amostra e o tamanho da população Geralmente, há uma compensação entre a precisão da amostra em representação de valores da população e os custos associados com o tamanho da amostra. Quanto maior a amostra, mais confiante podemos estar de que ela reflete com precisão o que existe na população. Entretanto, grandes amostras podem ser extremamente caras e demoradas. Uma amostra menor é mais barata e rápida, porém ela não será tão precisa. Portanto, em situações que exigem um erro mínimo e uma grande precisão na estimação dos valores da população, grandes amostras são necessárias. Já nos casos em que os erros podem ser tolerados, pequenas amostras podem ser consideradas. Não é incomum o uso de amostras relativamente pequenas para generalizar milhões de indivíduos. Por exemplo, diferentes pesquisas de representatividade nacional foram realizadas com amostras de tamanho n=1.000. Lembrando que a população brasileira é composta por 200,4 milhões de habitantes,ou seja, uma grande diferença entre o tamanho da amostra e da população. Ainda assim, essas pesquisas tiveram resultados representativos para o Brasil. Início do Box Erro Amostral O Erro Amostral pode ocorrer durante o processo de amostragem. Ele pode ser tanto sistemático quanto aleatório. O erro amostral sistemático é causado pela investigação, enquanto que o erro de amostragem aleatório não é. Quando os erros são sistemáticos, há um viés na amostra para alguma direção. Nestas circunstâncias, a amostra não representa verdadeiramente a população de interesse. O erro sistemático ocorre quando a amostra não é desenhada corretamente, como por exemplo, em uma pesquisa do tipo domiciliar o pesquisador só entrevistar as pessoas que ele encontrar em casa durante o horário comercial. Nessa situação haverá um viés (um erro sistemático), pois todas as pessoas que trabalham fora serão excluídas da amostra. Já o erro aleatório é decorrente do próprio fenômeno. Final do Box Tamanho da Amostra Nós mencionado brevemente a questão do tamanho da amostra anteriormente, quando discutimos o exemplo do estudo da violência na TV. Como já foi dito, para definir o tamanho da amostra é preciso considerar diferentes questões: a variabilidade da população, fatores económicos, a disponibilidade dos entrevistados em participar da pesquisa, bem como a importância do problema. Agora você vai aprender a calcular o tamanho da amostra através de uma equação simples. Mas antes, você precisa conhecer algumas definições importantes: - Tamanho da população (N) – Número total de pessoas da população. Por exemplo, se você quer saber sobre mães que vivem no Brasil, o tamanho da população seria o número total de mães que vivem no Brasil. Não se preocupe se você não tem certeza sobre este número. É comum que a população seja desconhecida ou aproximada. Margem de erro (Intervalo de Confiança) – Nenhuma amostra será perfeita, então você precisa decidir o quanto de erro vai permitir. A margem de erro é a diferença entre o valor do parâmetro da população (verdadeiro valor da estatística) e a sua estimativa a partir da amostra. Para que seja significativo, a margem de erro deve ser qualificada por uma indicação de probabilidade (frequentemente expressa sob a forma de um nível de confiança). Se você já viu uma pesquisa de intenção de votos (pesquisas políticas), você já ouviu falar de margem de erro. Vai ser algo como isto: "68% dos eleitores disseram sim ao Candidato A, com uma margem de erro de +/- 5%". Nível de confiança – O quão confiante você quer ser que o verdadeiro valor da estatística esteja entre a margem de erro. Os níveis de confiança mais comuns são 90% de confiança, 95% confiante, e 99% de confiança. Seu nível de confiança corresponde a um z-escore, encontrado em uma tabela Normal Padronizada. Este é um valor constante necessário para esta equação. Aqui estão os escores z para os níveis de confiança mais comuns: 90% - Z escore = 1,64 95% - Z escore = 1,96 99% - Z escore = 2,33 Se você escolher um nível de confiança diferente, use a Tabela Normal Padronizada para encontrar a sua pontuação (veremos como trabalhar com esta tabela na Aula 9). Em seguida, para calcular o tamanho da amostra (n), aplique o seu Z escore (z), a variância (𝜎2) da variável que está querendo estimar e a margem de erro na seguinte equação: 𝑛 = 𝑧2 × 𝜎2 (𝑀𝑎𝑟𝑔𝑒𝑚 𝑑𝑒 𝐸𝑟𝑟𝑜)2 Exemplo: Imagine que você tenha que realizar uma pesquisa de vitimização em um determinado bairro. Logo, uma das principais perguntas da pesquisa é a proporção de pessoas que foi vitimizada por roubo nos últimos 12 meses. Supondo que você tenha escolhido um nível de confiança de 95% e uma margem de erro de +/- 5%. Tendo em vista que você não conhece a variância da proporção de vitimizados por roubo, então você pode trabalhar com a hipótese de 𝜎2 = 0,5 (como a variável que estamos trabalhando é uma proporção – vitimização por roubo – então podemos supor uma variância de valor 0,5). 𝑛 = 1,962 × 0,5 (0,05)2 = 3,84 × 0,5 0,0025 = 768 Logo, o tamanho da amostra deve ser de 768 entrevistados. ATIVIDADE 3 Atende ao objetivo 3: Exemplo: O responsável pelo setor de saúde de uma instituição policial militar está interessado em realizar uma pesquisa sobre a qualidade de vida dos profissionais de segurança pública ligados a esta instituição. O planejamento amostral escolhido foi o estratificado segundo o posto/graduação na instituição. Ele quer que os resultados da amostra tenha um nível de confiança de 95% e uma margem de erro de +/- R$ 250,00. Para o cálculo do tamanho da amostra, o chefe do setor de saúde entrou em contato com o setor de recursos humanos e descobriu que a variância da renda dos policiais é de 19.143.744,90. RESPOSTA COMENTADA 𝑛 = 1,962 × 19.143.744,90 (250)2 = 3,84 × 19.143.744,90 62.500 = 1.177 Logo, o tamanho da amostra deve ser de 1.177 policiais entrevistados. FIM DA ATIVIDADE 3 5 – Conclusão A amostragem pode ser uma poderosa ferramenta para medir com precisão as opiniões e as características de uma população. No entanto, existe um verdadeiro potencial de abuso dessa ferramenta por pesquisadores que não entendem as limitações de vários procedimentos de amostragem. As diferenças entre amostragem probabilística e não probabilística são muitas vezes difíceis de discernir, mas são extremamente importantes para determinar a forma como os resultados da pesquisa podem ser analisados. Os procedimentos de amostragem não probabilística podem fornecer informações valiosas, mas os seus resultados não podem ser generalizados para uma população. As amostras selecionadas por técnicas probabilísticas bem conduzidas fornecem ao pesquisador a capacidade de reunir informações de um número relativamente pequeno de membros de uma população grande e generalizar os resultados para toda a população. RESUMO Se um pesquisador deseja obter informações sobre uma população através de questionários, ele tem duas opções básicas: 1. Todos os membros da população podem ser entrevistados, ou seja, aplicar um censo; ou 2. Selecionar uma amostra; isto é, selecionar uma fração dos membros da população para a realização das entrevistas. Entrar em contato e obter informações a partir de uma grande parte da população, tal como todos os Policiais Civis e Militares do Brasil, é extremamente difícil, demorado e caro. Uma forma seria o planejamento de uma amostra probabilística, que fornecerá um meio confiável de inferir informações sobre a população sem entrevistar todos os policiais civis e militares do Brasil. Muitas vezes, os pesquisadores estão trabalhando sob rigorosas restrições de tempo e dinheiro que tornam a realização de um censo inviável. Quando bem conduzida, uma pesquisa amostral fornece informações confiante com uma margem muito pequena de erro. Os tipos de amostragem podem ser classificados em duas categorias gerais: 1. Amostragem probabilística ou aleatória; 2. Amostragem não probabilística ou não aleatória. No primeiro caso, o pesquisador conhece a exata possibilidade de seleção de cada membro da população; no segundo, a chance de ser incluindo na amostra não é conhecida. As amostras probabilísticas tendem a ser mais difícil e dispendiosas, no entanto, elas são a única forma de encontrar resultados que podem ser generalizados de uma amostra para a população. Os três tipos comuns de amostras não probabilística são: amostragem por conveniência, por cota e bola de neve. A. Amostragem por conveniência: como o nome indica, na amostragem por conveniência a seleção é realizada segundo a conveniência do pesquisador. B. Amostragem por Cotas: Na amostragem por cotas a seleção é feita a partir de classes ou grupos previamentedivididos. À medida que cada grupo preenche ou atinge a sua cota, respondentes adicionais são rejeitados na amostra C. Bola de Neve: Na amostragem por bola de neve a seleção da amostra é feita a partir de indicações dos próprios entrevistados. Assim, o grupo de amostra parece crescer como uma bola de neve rolando. Os quatro tipos básicos de amostragem probabilística são: amostragem aleatória simples, sistemática, estratificada e por conglomerados. A. amostragem aleatória simples: Para a realização de seleção por amostragem aleatória simples, o pesquisador deve primeiro preparar uma lista exaustiva (cadastro) de todos os membros da população. A partir dessa lista, a amostra é desenhada de modo que cada pessoa tenha a mesma chance de ser selecionada. C. Amostragem Estratificada: A amostragem estratificada envolve a divisão da população em subpopulações homogêneas. Dentro de cada subpopulação é realizada a seleção de uma amostra, compondo a amostra total. D. Amostragem por Conglomerados: A amostragem por conglomerados é semelhante a amostragem estratificada porque a população é subdividida grupos. No entanto, esses grupos ou conglomerados são construídos de modo a manter a heteroerogeneidade da população. Em geral, os conglomerados são definidos por áreas geográficas. B. amostragem sistemática: Na amostragem sistemática o pesquisador seleciona uma pessoa a cada d=N/n casos. Neste tipo de amostragem os dados podem ficar mais espalhados e mais uniformes em relação a população do que em uma seleção feita por amostragem aleatória simples.