Baixe o app para aproveitar ainda mais
Prévia do material em texto
População e Amostra POPULAÇÃO A palavra “população”, na sua acepção mais comum, representa o conjunto de habitantes de uma dada região em determinado período. Em estatística, população (ou universo) é o conjunto de todos os elementos (pessoas ou objetos) cujas propriedades o pesquisador está interessado em estudar. Quando é feito um levantamento completo sobre uma determinada população temos o que se chama de censo1. AMOSTRA A amostra é um subconjunto - representativo ou não - da população em estudo. Essa representatividade da amostra, que é uma propriedade altamente desejada em estatística, ocorre quando ela apresenta as mesmas características gerais da população da qual foi extraída. AMOSTRAGEM A amostragem é a técnica para obter uma amostra de uma população. A coleta de uma amostra faz-se necessária quando se pretende saber informações sobre a população em estudo. O levantamento por amostragem apresenta algumas vantagens em relação ao levantamento de toda a população. A amostragem implica em custo menor e resultado em menor tempo. Há casos em que só a amostragem é conveniente, como testes de resistência de materiais. A seleção dos elementos, que serão efetivamente observados, deve ser feita sob uma metodologia adequada, de modo que os resultados da amostra sejam informativos para avaliar características de toda a população. É necessário que a amostra seja representativa da população na qual ela está inserida, de modo que os valores das estatísticas avaliadas nesta amostra sejam uma boa aproximação dos parâmetros populacionais correspondentes2. Para a escolha do processo de amostragem deve-se levar em consideração: O tipo de pesquisa; A acessibilidade aos elementos da população; Representatividade desejada ou necessária; A disponibilidade de tempo e recursos (financeiros ou humanos por exemplo); A decisão sobre o tipo de amostragem a ser escolhida cabe ao pesquisador, contudo este deve ser sincero ao explicitar o tipo adotado. TIPOS DE AMOSTRAGEM A coleta de dados numa amostragem pode ser classifica de duas formas: I. Amostra probabilística: cada unidade amostral na população tem uma probabilidade (conhecida e diferente de zero) de pertencer à amostra. II. Amostra não-probabilística: o processo de seleção não leva em conta as probabilidades de cada elemento ser incluído na amostra. AMOSTRAGEM PROBABILÍSTICA OU ALEATÓRIA A escolha dos elementos da amostra é realizada de forma aleatória, permitindo o cálculo das probabilidades na seleção. O que facilita análise dos dados e possibilita maiores inferências sobre a população. Os principais tipos de amostragem aleatória são: aleatória simples, sistemática, estratificada e por conglomerados. 1. Amostragem aleatória simples É um processo onde cada elemento da população tem probabilidade conhecida, diferente de zero e idêntica à dos outros elementos, de ser selecionado para fazer parte da amostra. Cada elemento recebe uma numeração e a seleção é feita aleatoriamente. Seja uma população numerada de 1, 2, 3,... , N, e deseja-se obter uma amostra de tamanho . Então, cada elemento terá probabilidade de pertencer à amostra. A amostragem aleatória simples também é conhecida como amostragem ocasional, acidental, casual ou randômica. Quando cada elemento da população pode ser selecionado apenas uma vez, o mecanismo aleatório é dito sem reposição. Quando o elemento pode ser selecionado mais de uma vez, o mecanismo aleatório é dito com reposição. Há desvantagens de usar amostragem aleatória simples, pode ser muito cara e necessita que todos os elementos da amostra sejam identificados de antemão. 2. Amostragem sistemática É usada quando a população está naturalmente ordenada (exemplo: listas telefônicas, prontuários, quarteirões de uma cidade). Às vezes, a amostragem sistemática é preferível à amostragem aleatória simples, por ser mais fácil, menor custo e menos sujeita a erros. Passos para a seleção de uma amostra sistemática: Numerar os elementos da população de 1 a N (tamanho da população) Estabelecer o número de elementos que farão parte da amostra ( ). Definir o intervalo de seleção: Escolher um número aleatório (r) entre 1 e . O 1º número selecionado na amostra seria r, o 2º seria r + o 3º seria r + 2 , o 4º seria r + 3 , etc. Deve-se usar os números escolhidos para identificar os elementos da lista selecionados na amostra. Exemplo: A população tem 1000 (N) indivíduos amostra pretendida é de 100 (n). Então, o intervalo é de 10 em 10. Se o número aleatório inicial é 7, então recolho informação das observações 7, 17, 27, 37, 47,... Nesse tipo de amostragem, deve-se ter o cuidado de verificar se a ordenação das unidades amostrais não apresenta periodicidade, não pode haver certas características se repetindo em intervalos iguais. 3. Amostragem estratificada A população é subdividida em subgrupos ou estratos, mutuamente excludentes e coletivamente exaustivos. Em seguida os elementos dentro dos estratos são selecionados aleatoriamente. Visa aumentar a precisão sem elevar os custos. Os elementos dentro de um estrato devem ser o mais homogêneos quanto possível, ao passo em que os elementos de diferentes estratos devem ser o mais heterogêneos quanto possível. Amostragens aleatórias devem ser realizadas de forma independente em cada estrato da população, e a amostra completa será obtida através da agregação das amostras de cada estrato. Amostragem estratificada proporcional: a amostra de cada estrato é proporcional ao número de indivíduos que compõem a população do mesmo. 4. Amostragem por conglomerados Esta técnica é usada quando a identificação dos elementos da população é extremamente difícil, porém pode ser relativamente fácil dividir a população em conglomerados (subgrupos) heterogêneos representativos da população global. A seguir, é descrito o procedimento de execução desta técnica: 1º) Seleciona uma amostra aleatória simples dos conglomerados existentes; 2º) Realizar o estudo sobre todos os elementos do conglomerado selecionado. Na amostra por conglomerados, cada conglomerado é visualizado como uma espécie de miniatura da população; portanto, será tanto melhor quanto maior a heterogeneidade da população. Amostragem por etapa dupla: é uma modificação da amostragem por conglomerados. Na primeira etapa são selecionados conglomerados, e na segunda etapa são sorteadas as unidades amostrais que se encontram dentro de cada conglomerado selecionado. AMOSTRAGEM NÃO-PROBABILÍSTICA Quando não se dispõe de uma lista dos elementos da população ou de lista de conglomerados, podem-se usar procedimentos não aleatórios para seleção de amostra que representem razoavelmente bem a população. Os tipos de amostragem não- probabilística mais usados são: amostragem por cotas, por julgamento, conveniência. 1. Amostragem por cotas A amostragem por cotas consiste em obter uma amostra que seja semelhante, em alguns aspectos, à população. É importante que o pesquisador conheça algumas características da população que deseja estudar para selecionar uma amostra adequada. A amostragem por cotas é feita em 2 estágios. No primeiro, o pesquisador desenvolve categorias ou cotas de controle de elementos da população, como por exemplo, sexo, idade e raça. “Em geral, as cotas são atribuídas de modo que a proporção dos elementos da amostra que possuem as características de controle seja a mesma que a proporção de elementos da população com essas características” (Malhotra 2001). No segundo estágio, seleciona-se elementos da amostra com base na conveniência e no julgamento. Amplamente utilizada em pesquisa social e de mercado, este procedimento é usualmente aplicado em levantamentos de mercado e em prévias eleitorais. Tem como principal vantagem o baixo custo e o fato de conferir alguma estratificação à amostra. Dentre as amostragens nãoprobabilística é a que apresenta maior rigor estatístico. 2. Amostragem por julgamento Os elementos da amostra são escolhidos por um perito na matéria. Os elementos selecionados são aqueles julgados como típicos ou representativos da população que se deseja estudar. Esta amostragem é barata, conveniente e rápida, contudo, por depender do julgamento do pesquisador não permite amplas inferências populacionais. 3. Amostras por conveniência São selecionadas por alguma conveniência do pesquisador. É o tipo menos confiável, pois não é representativa da população, apesar de mais barato, rápida e simples. São úteis para pesquisas exploratórias, mas jamais para pesquisa conclusiva. Não permite que se façam generalizações. Ex: entrevistas com estudantes de determinada escola, questionários incluídos em revistas, intercepção de pessoas na rua. 4. Amostragem Tipo Bola-de-Neve Um grupo inicial de elementos é selecionado aleatoriamente. Estes elementos, após terem sido entrevistados, identificam outros elementos que pertençam à mesma população-alvo. Este processo pode ser executado em ondas sucessivas, obtendo-se referências ou informações a partir de referências ou informações. Este tipo de amostragem é muito utilizado para estimar características raras na população. Sua principal vantagem é aumentar substancialmente a possibilidade de localizar a característica desejada na população. Seus custos são relativamente baixos. Tipos de Variáveis Variável é a característica de interesse que é medida em cada elemento da amostra ou população. Como o nome diz, seus valores variam de elemento para elemento. As variáveis podem ter valores numéricos ou não numéricos. CLASSIFICAÇÃO: VARIÁVEIS QUALITATIVAS OU CATEGÓRICAS: 1. Variáveis nominais: não existe ordenação dentre as categorias. Exemplos: sexo, cor dos olhos, fumante/não fumante, doente/sadio. 2. Variáveis ordinais: existe uma ordenação entre as categorias. Exemplos: escolaridade (1o, 2o, 3o graus), estágio da doença (inicial, intermediário, terminal), mês de observação (janeiro, fevereiro,..., dezembro). VARIÁVEIS QUANTITATIVAS OU NÚMERICAS: 1. Variáveis discretas: características mensuráveis que podem assumir apenas um número finito ou infinito contável de valores e, assim, somente fazem sentido valores inteiros. Geralmente são o resultado de contagens. Exemplos: número de filhos, número de bactérias por litro de leite, número de cigarros fumados por dia. 2. Variáveis contínuas: características mensuráveis que assumem valores em uma escala contínua (na reta real), para as quais valores fracionais fazem sentido. Usualmente devem ser medidas através de algum instrumento. Exemplos: peso (balança), altura (régua), tempo (relógio), pressão arterial, idade. Tipos de variáveis Qualitativa ou categórica Nominal ex: sexo Ordinal ex: nível de instrução Quantitativa ou numérica Discreta ex: número de casos de dengue Contínua ex: peso
Compartilhar