Prévia do material em texto
UNIVERSIDADE FEDERAL DE SÃO JOÃO DEL REI DEPARTAMENTO DE MATEMÁTICA E ESTATÍSTICA. INTRODUÇÃO À AMOSTRAGEM Profª Luciane Teixeira Passos Giarola 2016 AMOSTRAGEM 1. Introdução Quando se deseja estudar uma ou mais características (variáveis) de uma população, nem sempre é possível fazer um levantamento da população por completo. Isso ocorre por diversas razões, tais como: a população é infinita, os custos de coleta das informações para toda a população são muito altos, o tempo de coleta é muito grande inviabilizando a pesquisa, deseja-se analisar características da população para as quais é necessário submeter as unidades observacionais a testes destrutivos. Daí surge a necessidade de se investigar apenas uma parte da população, através da coleta de uma amostra, de modo que os resultados possam ser inferidos (generalizados) o mais legitimamente possível para os resultados da população total, caso esta fosse observada (censo). A amostragem apresenta vantagens em relação ao censo1. Como os dados são referentes a uma parte da população, a amostragem é mais barata que o censo. A Pesquisa Nacional por Amostragem de domicílios (PNAD) é feita pelo Instituto Brasileiro de Geografia e Estatística (IBGE) em menos de 1% das residências. Os institutos de pesquisa avaliam a opinião pública em pesquisas de mercado utilizando poucos milhares de pessoas e em certos casos até mesmo algumas centenas de consumidores (Muniz e Abreu, 1999). A amostragem também apresenta maior rapidez que o censo em decorrência do menor volume de dados. Também a utilização de uma equipe bem treinada e equipamento sofisticado para obtenção dos dados pode ser necessária e isto pode inviabilizar o censo. Nesse sentido, em situações nas quais o censo é inviável, a amostragem pode ser utilizada, dado sua flexibilidade. Em decorrência da possibilidade de trabalhar com uma equipe de melhor nível, mais bem treinada e ainda de se poder acompanhar melhor a coleta e a tabulação dos dados, em virtude da redução do volume de trabalho, a amostragem pode proporcionar maior exatidão nos resultados (Muniz e Abreu, 1999). Mas, como selecionar essa amostra? Para a seleção das amostras de tal forma que elas sejam representativas da população é necessário a utilização de técnicas específicas denominadas Técnicas de Amostragem. Assim, o problema da amostragem consiste em “escolher” uma amostra que represente a população. Existem dois caminhos diferentes no processo de 1 Censo: Estudo de todos os elementos da população. amostragem para se determinar uma amostra: amostragem probabilística e amostragem não probabilística. Quando se planeja uma pesquisa por amostragem, considera-se que todas as amostras possíveis da população tem probabilidade diferente de zero de serem selecionadas. Assim, a seleção da amostra é feita de modo aleatório, permitindo a aplicação da teoria da Probabilidade Estatística e a obtenção de uma estimativa do erro amostral. Nesse caso, diz-se que a amostragem é probabilística. Em situações nas quais restrições práticas impedem que a seleção da amostra seja totalmente aleatória, obtém-se amostras não probabilísticas. A amostragem não probabilística é a amostragem subjetiva, ou por julgamento, na qual a variabilidade amostral não pode ser estabelecida com precisão. O uso da Amostragem só não é interessante quando: � população pequena: não há necessidade de utilizar técnicas estatísticas, pois neste caso é aconselhável realizar o censo. (Análise de toda a população); � característica de fácil mensuração: talvez a população não seja tão pequena, mas a variável que se quer observar é de tão fácil mensuração, que não compensa investir num plano de amostragem. Por exemplo, para verificar a porcentagem de funcionários favoráveis à mudança no horário de um turno de trabalho, podemos entrevistar toda a população no próprio local de trabalho. Esta atitude pode ser politicamente mais recomendável. � necessidade de alta precisão: a cada dez anos o IBGE realiza um Censo Demográfico para estudar diversas característica da população brasileira. Dentre estas características têm-se o número de habitantes do país, que é fundamental para o planejamento do país. Desta forma, o número de habitantes precisa ser avaliado com grande precisão e, por isto, se pesquisa toda a população. 2. Conceitos Básicos Amostragem: Estudo da relações existentes entre a amostra e a população de onde foi extraída. A amostragem é utilizada usualmente com o objetivo de estimar parâmetros da população, como por exemplo a média (µ) e a variância (σ2) ou a proporção (p) de uma determinada característica. A estimação com base nas propriedades estatísticas dos estimadores. População (universo do estudo) : Conjunto de elementos com uma ou mais características em comum. Amostra: Parte da população em que o estudo será conduzido. Um exemplo é um grupo tamanho n=30 dos estudantes da UNIPAC-SJDR, os quais foram escolhidos por sorteio. Parâmetro: Valor desconhecido associado a uma característica da população. a média (µ) e a variância (σ2) ou a proporção (p). Estimador: Função que estima o valor de um parâmetro baseando-se nas observações de uma amostra. As expressões: ( ) n x p N Xx S N x X i i i i = − − == ∑∑ , 1 , 2 2 São respectivamente estimadores da média (µ), da variância (σ2) e da proporção (p). Estimativa: Valor obtido pelo estimador para os dados de uma amostra. Inferência estatística: Consiste em concluir sobre a população com base nos dados obtidos na amostra. È importante salientar que inferências em estudos de amostragem são feitas sempre considerando a margem de erro. 3. Amostragem não probabilística De acordo com Muniz e Abreu (1999), como exemplo de amostra não probabilística podem ser citados os seguintes casos: a) Acessibilidade A amostra atinge apenas a parte acessível da população. Ex: num vagão com carga de minério, a amostra é feita apenas nos 20 cm superiores, por dificuldade de atingir todos os pontos. b) Amostra tomada a esmo A amostra é constituída pelos elementos que se consegue tomar de uma população. Ex: num galpão de aves, a amostra pode ser constituída das aves que forem tomadas no instante da coleta de dados, sem ter havido sorteio prévio. c) Amosta intencional O pesquisador escolhe ao seu juízo os elementos que julgar representativo em uma população, sem fazer sorteio. d) Amostra voluntária Casos onde o processo de obtenção dos dados é desagradável. Exemplo: pesquisa com portadores de doenças sexualmente transmissíveis, estudo com doadores de sangue. 4. Amostragem probabilística 4.1 Amostra aleatória simples (AAS) A amostragem se diz aleatória quando cada “elemento” da população tem a mesma probabilidade de ser selecionado, isto é, se a população tem tamanho N, cada elemento tem probabilidade 1/N de ser selecionado. Desse modo, a probabilidade de incluir um elemento que seja membro de um subgrupo da população numa amostra aleatória é proporcional ao tamanho do subgrupo. Grandes subgrupos tem maior probabilidade de ter um ou mais itens na amostra do que pequenos subgrupos, enquanto que subgrupos de tamanhos iguais tem probabilidades iguais. Por isso é que a amostragem tende a produzir amostras representativas da população. Quando se extrai uma amostra aleatória, o que é aleatório é o processo de escolha e não o elemento em si (Stevenson, 1981). Amostragem aleatória simples é o método mais simples e mais importante para a seleção de umaamostra. Se a população for infinita (ex: toda produção futura de uma máquina), seleciona-se a amostra anotando-se os elementos na ordem em que ocorrem, considerando-se o processo aleatório. Exemplos de processos aleatórios: chegada de carros a um posto de pedágio, chamadas telefônicas numa mesa de operação, chegada de clientes aos caixas de supermercado,... Se a população é finita, para a seleção de uma AAS precisamos ter uma lista completa dos elementos da população e selecionar a amostra através de um sorteio. Assim, deve-se: 1) numerar todos os elementos da população (N elementos); 2) efetuar sucessivos sorteios até completar o tamanho da amostra (n). Para realizar este sorteio, podemos utilizar urnas, tabelas de números aleatórios ou algum software que gere números aleatórios. As tabelas de números aleatórios contêm os 10 algarismos (0, 1, ..., 9) que podem ser lidos em qualquer ordem (por colunas, por linhas, diagonalmente, isolados, em grupos,...). As tabelas de números aleatórios satisfazem as condições de aleatoriedade exigidas em um processo de amostragem. Para mais detalhes veja Stevenson, 1981. USO DA TABELA DE NÚMEROS ALEATÓRIOS Para usar uma tabela de números aleatórios: 1) Faça uma lista dos itens da população; 2) Numere consecutivamente os itens na lista, a começar do zero (0, 00, 000,...) 3) Leia os números na tabela de modo que o número de algarismos em cada um seja igual ao número de algarismos do último número da sua listagem; 4) Despreze quaisquer números que não correspondam a números da lista ou que sejam repetições de números lidos anteriormente. Continue o processo até obter o número desejado de observações; 5) Use os números assim escolhidos para identificar os itens da lista a serem incluídos na amostra É importante ressaltar que a opção de leitura, deve ser feita antes de iniciado o processo. Exemplo: Estamos interessados em estudar os alunos de um determinado ano. Ao todo são 34 pessoas, que devemos numerar de 00 a 33. Para selecionarmos uma amostra casual simples de 5 elementos, basta escolhermos uma posição da tabela de números aleatórios e extrairmos conjuntos de dois algarismos, até completarmos os 5 elementos da amostra. Se o número sorteado não existir, simplesmente não consideramos e prosseguimos o processo. Escolhendo as colunas 03 e 04 da Tabela de Números Aleatórios, temos: 53 58 13 57 71 73 66 41 76 54 51 57 49 31 43 21 04 13. Assim a amostra será composta pelos elementos: {13, 31, 21, 04, 13} (amostra com reposição). Se a amostra for sem reposição, continua-se a leitura da tabela: ...68 35 32. Nesse caso, a amostra sem reposição é composta pelos elementos {13, 31, 21, 04, 32}. 4.2 Amostragem Sistemática (AS); É utilizada quando a população está naturalmente ordenada, de tal forma que cada um de seus elementos possa ser unicamente identificado pela sua localização ou por outro critério qualquer. Como exemplos de populações naturalmente ordenadas são listas telefônicas, fichas de cadastramento, produção de garrafas da Brahma, etc. Para a seleção da amostra proceda da seguinte forma: 1) Seja N o tamanho da população e n o tamanho amostral. Calcula-se o intervalo da amostragem i = N/n, arredondando para o número inteiro mais próximo. 2) Sorteia-se, utilizando a tabela de números aleatórios, um número x entre 1 e i formando a amostra: x, (x + i), (x + 2*i), ... , (x + (n-1)*i). Exemplo: Suponha que ainda estamos interessados em estudar a mesma população anterior de N = 34 elementos, mas agora ela já está numerada. Vamos extrair novamente n = 5 elementos desta população utilizando a técnica de amostragem sistemática. 1) Calcular: N/n = 34/5 = 6,8 ≅≅≅≅ 7; 2) Observar a Tabela de Números Aleatórios e retirar um número entre 1 e 7. Escolhendo a terceira coluna e fazendo a leitura de baixo para cima (da 39ª linha em direção à 1ª) temos que o primeiro número é 6, que está entre 1 e 7. Logo a amostra será composta dos elementos: {6,13, 20, 27, 34} 4.3 Amostragem Estratificada (AE) Quando a população for heterogênea não se deve utilizar a AAS devido à baixa precisão das estimativas obtidas. Neste caso, a população é dividida em subgrupos, denominados estratos (por exemplo, pelo sexo, renda, bairro, etc.) e a AAS é utilizada na seleção de uma amostra de cada estrato. Esses estratos devem ser internamente mais homogêneos do que a população toda, com respeito às variáveis em estudo. Aqui, um conhecimento prévio sobre a população em estudo é fundamental. A AE tem as seguintes características: • dentro de cada estrato há uma grande homogeneidade, ou então uma pequena variabilidade; • entre os estratos há uma grande heterogeneidade, ou então uma grande variabilidade. Amostragem Estratificada Proporcional Neste caso, a proporcionalidade do tamanho da amostra de cada estrato da população é mantida na amostra. Por exemplo, se um estrato corresponde a 20% do tamanho da população, ele também deve corresponder a 20% da amostra. Amostra Estratificada Subgrupo 1 da amostra Subgrupo 2 da amostra .... Subgrupo k da amostra Estrato 1 Estrato 2 Estrato k ... Exemplo: Com o objetivo de realizar uma pesquisa de opinião sobre a gestão atual da reitoria em uma determinada universidade, realizaremos um levantamento por amostragem. A população é composta por 10 professores, 10 servidores técnicos administrativos e 30 alunos, que identificaremos da seguinte forma: População Professores P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 Servidores S1 S2 S3 S4 S5 S6 S7 S8 S9 S10 Alunos A01 A02 A03 A04 A05 A06 A07 A08 A09 A10 A11 A12 A13 A14 A15 A16 A17 A18 A19 A20 A21 A22 A23 A24 A25 A26 A27 A28 A29 A30 Supondo que a opinião sobre a gestão atual da reitoria possa ser relativamente homogênea dentro de cada categoria, realizaremos uma amostragem estratificada proporcional por categoria, para obter uma amostra global de tamanho n = 10. A tabela a seguir mostra as relações de proporcionalidade. Estrato Proporção na População Tamanho do subgrupo na amostra Professores 10/50 = 0,20 (ou 20%) np = ( 0,20)*10 = 2 Servidores 10/50 = 0,20 (ou 20%) ns = ( 0,20)*10 = 2 Alunos 30/50 = 0,60 (ou 60%) na = ( 0,60)*10 = 6 Para selecionar aleatoriamente dois professores, podemos usar a Tabela de Números Aleatórios, tomando valores com um algarismo. 4.4 Amostragem por Conglomerados (AC) Utilizada quando a população é muito dispersa, tornando inviável a organização de um rol com todos os elementos. Neste caso, a população é dividida em subpopulações (conglomerados) distintas (quarteirões, residências, famílias, bairros, etc.). Alguns dos conglomerados são selecionados segundo a AAS e todos os indivíduos nos conglomerados selecionados são observados. Em geral, é menos eficiente que a AAS ou AE, mas por outro lado é bem mais econômica. Tal procedimento amostral é adequado quando é possível dividir a população em um grande número de pequenas subpopulações. A AC tem as seguintes características: • dentro de cada conglomerado há uma grande heterogeneidade, ou então uma grande variabilidade; • entre os conglomerados há uma pequena variabilidade; ou então uma grande homogeneidade. Exemplo: Realização de uma pesquisa eleitoral em uma cidade com 12 zonas eleitorais. Usando a técnica de amostragem por conglomerados, podemos selecionar aleatoriamente 2 zonas eleitorais e, em seguida, entrevistar todos os eleitores dessas zonas selecionadas Obs.: É fácil confundir amostragem estratificadacom amostragem por conglomerado, porque ambas envolvem a formação de subgrupos. A diferença é que a amostragem por conglomerado usa todos os membros de uma Zona 1 2 3 4 5 6 7 8 9 10 11 12 Entrevistar todos os eleitores dessas zonas Zona 1 2 3 4 5 6 7 8 9 10 11 12 Zona 1 2 3 4 5 6 7 8 9 10 11 12 Entrevistar todos os eleitores dessas zonas amostra de conglomerados, enquanto a amostragem estratificada usa uma amostra de membros de todos os estratos. Curiosidade Também podemos encontrar na prática a Técnica de Amostragem de Conveniência que simplesmente usa resultados que sejam muito fáceis de obter. Ei! Você é a favor da pena de morte? Ei! Você é a favor da pena de morte? 6. Exercícios 1) Os dados do quadro abaixo correspondem às áreas cultivadas com milho, em ha, de 194 propriedades do município de Lavras, MG, na safra de 1998. Quadro: Área cultivada com milho, em ha, de 194 propriedades do município de lavras, MG, na safra de 1998. 40,2 4,5 5,1 1,4 1,2 1,5 12,0 22,30 125,4 8,3 25,0 53,0 9,2 7,5 1,9 1,0 3,7 20,8 62,0 7,0 28,2 72,0 5,3 8,9 1,2 1,0 1,6 11,4 34,0 97,0 13,0 28,0 54,0 5,8 8,1 1,2 1,2 1,8 14,0 28,3 1,8 12,4 27,0 64 7,3 6,3 1,5 2,4 3,6 17,3 1,3 1,2 16,6 28,6 82,0 7,3 4,2 1,4 0,8 1,3 1,2 2,4 3,9 12,0 31,0 88,0 5,7 7,5 1,3 1,6 8,2 1,7 1,3 1,4 18,2 38,4 85,0 4,8 6,3 1,3 6,4 8,2 1,2 1,5 1,0 12,8 30,0 88,0 5,4 7,2 62,0 7,6 4,9 2,4 1,0 1,0 15,4 39,6 90,0 6,9 39,0 10,1 8,5 4,2 1,8 1,4 3,9 14,6 32,0 75,0 7,8 13,0 34,0 8,2 8,8 15,7 37,3 4,5 7,4 15,4 33,0 19,3 29,7 14,8 38,0 14,2 37,0 17,8 29,0 17,3 6,1 1,2 1,8 1,2 11,0 1,8 15,0 38,0 87,0 6,8 4,8 1,4 1,2 1,6 10,3 3,8 1,5 12,2 35,0 112,0 6,5 9,0 1,8 3,6 3,8 1,3 1,2 1,5 17,0 32,0 74,0 4,7 4,9 0,7 1,1 5,9 1,6 1,8 1,8 15,7 35,3 83,0 9,7 5,4 1,2 7,3, 7,4 15,0 34,0 5,0 11,4 27,0 96,0 5,7 7,5 34,9 7,3 16,2 35,0 14,3 19,8 13,8 13,7 15,6 a) Faça o sorteio de uma amostra aleatória simples (AAS) com 25 elementos (n=25) na população de produtores. b) Considere a seguinte estratificação: Estrato Área (ha) 1 < 4,0 2 [4,0; 10,0) 3 [10,0; 20,0) 4 [20,0; 40,0) 5 ≥ 40,0 Faça o sorteio de uma amostra estratificada de 25 elementos, sendo 5 do 1º estrato, 6 do segundo, 6 do terceiro, 4 do quarto e 4 do quinto estrato. 2) Um administrador especialista em avaliar através de sistemas informatizados as ações da BOVESPA, está interessado em fazer uma pesquisa nos preços das ações, para indicar aos seus clientes se hoje é um dia favorável a fazer investimentos. Ele sabe que existe N = 500 ações em venda. Como o tempo de estudo de cada ação é de aproximadamente 20 minutos, decidiu-se verificar apenas n = 25 ações. Utilizando as técnicas de amostragem aleatória simples e sistemática, quais ações serão selecionadas? 3) Num depósito em uma determinada empresa produtora de materiais eletrônicos possui N = 100 computadores que estão separados em duas qualidades. N1 = 40 computadores são Pentium 3 ao lado direito e os N2 = 60 computadores são Pentium 4 ao lado esquerdo. O custo para verificar se cada computador está sob controle é muito alto. O administrador responsável disse que a empresa tem condições de verificar apenas n = 12 computadores. Utilizando a técnica de amostragem estratificada proporcional, quais computadores serão selecionados? 4) Uma certa cidade possui N = 200 zonas eleitorais. Uma empresa destinada a fazer uma pesquisa eleitoral vai selecionar aleatoriamente n = 15 zonas e entrevistar todos os elementos que estão dentro dessas zonas eleitorais, isto é, foi utilizada amostragem por conglomerado. Apresentem quais serão as 15 zonas amostradas. 5) Os prontuários dos pacientes de um hospital estão organizados em um arquivo, por ordem alfabética. Qual a maneira mais rápida de amostrar 1/3 do total de prontuários? 6) Um pesquisador tem 10 gaiolas, cada uma com 6 ratos. Como o pesquisador pode selecionar 10 ratos para uma amostra? 7) Para levantar dados sobre o número de filhos por mulher, em uma comunidade, um pesquisador organizou um questionário que enviou, pelo correio, a todas as residências. A resposta ao questionário era facultativa, pois o pesquisador nõa tinha condições de exigir a resposta. Nesse questionário perguntava-se o número de filhos por mulher moradora na residência. Você acha que os dados assim obtidos seriam tendenciosos? 8) Um pesquisador pretende levantar dados sobre o número de moradores por domicílio, usando a técnica de amostragem sistemática. Para isso, o pesquisador visitará cada domicílio selecionado. Se nenhuma pessoa estiver presente na ocasião da visita, o pesquisador excluirá o domicílio da amostra. Esta última determinação torna a amostra tendenciosa. Por que? 9) Muitas pessoas acreditam que as famílias se tornaram menores. Suponha que, para estudar esta questão, um pesquisador selecionou uma amostra de 2000 casais e perguntou quantos filhos eles tinham, quantos filhos tinham seus pais e quantos filhos tinham seus avós. O procedimento produz dados tendenciosos. Por quê? 10) Para estudar atitudes religiosas, um sociólogo sorteia 10 membros de uma grande igreja para compor uma amostra casula simples. Nota, então, que a amostra ficou composta por 9 mulheres e 1 homem. O sociólogo se espanta: “ A amostra não é aleatória. Quase só tem mulher.” O que você diria? 11) Para avaliar a expectativa de pais de adolescentes em relação às possibilidades de estudo de seus filhos, forma distribuídos 5000 questionários pelos estados do sul do Brasil. Retornaram 1032. Cerca de 60% dos respondentes diziam que a maior preocupação deles era com o preço que se paga para um jovem cursar a universidade. Você considera esse resultado uma boa estimativa para o número de pais preocupados com essa questão? 12) um dentista quer levantar o tipo de documentação que seus colegas arquivam, quando fazem um tratamento ortodôntico. A documentação depende do caso, mas também envolve questões legais e de bom senso do ortodontista. Para essa pesquisa, o dentista elabora um questionário que envia, por correio, a todos os profissionais inscritos no conselho de odontologia. O dentista provavelmente não receberá resposta de todos. Você saberia dizer algumas das razões disso acontecer? 13) Para estudar o uso de serviços de saúde por mulheres em idade reprodutiva moradoras de uma grande capital, um pesquisador buscou na Fundação Instituto Brasileiro de Geografia e Estatística (IBGE) as subdivisões da cidade utilizadas em censos, conhecidas como setores censitários. Como você procederia para tomar uma amostra de mulheres moradoras nesses setores e em idade reprodutiva? 14) Um fiscal precisa verificar se as farmácias da cidade estão cumprindo um novo regulamento. A cidade tem 40 farmácias, mas como a fiscalização demanda muito tempo, o fiscal resolveu optar por visitar uma amostra de 10 farmácias. O cumprimento do regulamento, que é, evidentemente, desconhecido do fiscal, está apresentado na tabela abaixo. Cumprimento do regulamento 1. Sim 11. Não 21. Sim 31. Sim 2. Sim 12. Sim 22. Sim 32. Sim 3.Não 13. Não 23. Não 33. Não 4. Sim 14. Não 24. Sim 34. Sim 5. Sim 15. Sim 25. Não 35. Sim 6. Não 16. Não 26. Não 36. Não 7. Sim 17. Sim 27. Não 37. Não 8. Não 18. Não 28. Sim 38. Não 9. Não 19. Não 29. Não 39. Sim 10. Sim 20. Sim 30. Não 40. Sim Com base na tabela: a) Escolha uma amostra para o fiscal b) Estime, com base na amostra, a proporção de farmácias que estão cumprindo o regulamento; c) Com base nos dados da população estime o parâmetro; d) Você obteve uma boa estimativa?REFERÊNCIAS: MARCONI, M. A.; LAKATOS, E. M. Técnicas de pesquisa: planejamento e execução de pesquisas; amostragens e técnicas de pesquisa; elaboracao, análise e interpretação de dados. Sao Paulo: Atlas, 1988. MUNIZ, J. A.; ABREU, A. R. Técnicas de amostragem. Lavras: UFLA/FAEPE, 1999. ROCHA, R. C. Notas de aula. 2015 STEVENSON, W. J. Estatística aplicada à Administração. São Paulo: Harper & Row do Brasil, 1981. TOREZANI, W. Apostila de estatística I. Vila Velha; 2004. Disponível em: http://www.ifba.edu.br/dca/Corpo_Docente/MAT/ICCL/APOSTILA_DE_ESTAT_ STICA.pdf. Acesso em: 10/05/2016. VIEIRA, S. Introdução à Bioestatística. 4ed. Rio de Janeiro: Elsevier, 2008.