Baixe o app para aproveitar ainda mais
Prévia do material em texto
AULA 2 – POPULAÇÃO E AMOSTRAGEM. DEFINIÇÃO DE VARIÁVEIS. DEFINIÇÕES POPULAÇÃO: Uma população é um conjunto de pessoas, itens ou eventos sobre os quais você quer fazer inferências. Nem sempre é conveniente ou possível examinar todos os membros de uma população inteira. Por exemplo, não é prático para contar os amassados em todas as maçãs colhidas em um pomar. É possível, no entanto, para contar os amassados em um conjunto de maçãs tomadas a partir dessa população. Este subconjunto de população é chamado de uma amostra. População Estatística x População Geográfica: Na maioria das vezes, a população Estatística não coincide com a população Geográfica. Por exemplo: se quisermos realizar uma pesquisa para saber a intenção de voto para presidente da república, a nossa população estatística corresponde a todos os brasileiros? A resposta é NÃO! A população Estatística corresponde a todos os brasileiros que são eleitores. Ou seja, pessoas com menos de 16 anos, por exemplo, não fazem parte da população Estatística (embora pertençam à população Geográfica) População estatística ou universo estatístico é o conjunto de entes portadores de pelo menos uma característica em comum. Por exemplo, os estudantes constituem uma população com uma característica em comum: são os que estudam. Muitas vezes, por motivos práticos ou econômicos, limitam-se os estudos estatísticos somente a uma parte da população, a amostra. A amostra é um subconjunto finito de uma população. Como toda a análise estatística será inferida a partir das características obtidas da amostra, é importante que a amostra seja representativa da população, isto é, que as suas características de uma parte (amostra) sejam em geral as mesmas que do todo (população). AMOSTRA: Uma amostra é um subconjunto de pessoas, itens ou eventos de uma população maior que você coleta e analisa para fazer inferências. Para representar a população bem, uma amostra deve ser coletada aleatoriamente e ser adequadamente grande. AMOSTRAGEM: é a técnica especial de escolher amostras que garanta o acaso na escolha. Assim cada elemento da população tem a mesma chance de ser escolhido, o que garante à amostra um caráter de representatividade da população. O princípio básico desta teoria é ter o máximo de precisão na avaliação das quantidades de interesse com o mínimo tamanho de amostra. Nem sempre é possível ponderar estas duas questões de forma a obter amostras representativas. Sendo assim, diferentes métodos de seleção de amostras foram desenvolvidos para situações específicas. Apresentamos e discutimos alguns deles. Amostragem Aleatória Simples; Amostragem Aleatória Estratificada; Amostragem Sistemática; Amostragem por Conglomerados (Clusters); Amostragem por Cotas; Amostragem de Conveniência; AMOSTRAGEM CASUAL OU ALEATÓRIA SIMPLES Pesquisa da estatura de uma escola com 90 alunos (população: 90 alunos) usando uma amostra de 10% da população: 1. Numeram-se os alunos de 1 a 90; 2. Sorteiam-se 9 números (10% de 90) usando algum mecanismo aleatório ou através de uma Tabela de Números Aleatórios. tem-se: 14 35 30 19 66 27 77 45 38 3. Os alunos numerados de acordo com a lista acima são escolhidos e tomados os valores das suas estaturas, obtendo assim uma amostra da população dos 90 alunos. AMOSTRAGEM PROPORCIONAL ESTRATIFICADA Quando a população se divide em subpopulações – estratos – é necessário utilizar uma amostragem proporcional estratificada, que considera os estratos (subgrupos) e obtém a amostragem proporcional a estes. Exemplo: Suponha que no exemplo anterior, dos noventa alunos, 54 sejam meninos e 36 sejam meninas. Neste caso precisamos obter a amostra estratificada. Serão dois estratos (sexo masculino e sexo feminino) e queremos uma amostra de 10% da população. Assim, 1. Definimos a amostra em estratos: 2. Numeram-se os alunos de 1 a 90 sendo que 1 a 54 correspondem a meninos e de 55 a 90, a meninas. Tomando a 2 coluna, de cima para baixo, tem-se: 3. Neste caso serão obtidas as características dos seguintes alunos: 56 05 46 74 90 - masculino 17 75 63 31 - feminino AMOSTRAGEM SISTEMÁTICA Quando os elementos da população já estão ordenados, não é necessário construir um sistema de referência ou de amostragem. Neste caso a amostragem é sistemática. Exemplo: Suponha uma rua que tenha 500 prédios e desejamos obter uma amostra de 40 prédios (8%). Como os prédios já estão ordenados na rua, podemos usar o seguinte procedimento: 1. Como 500:40 = 12,5, então temos de selecionar um prédio para a amostra a cada 12. 2. Sorteamos um número entre 1 e 12 inclusive, digamos que seja 5. 3. Vamos amostrando os prédios iniciando pelo 5º. e pulando de 12 em 12. Assim, iniciamos pelo prédio 5, depois usamos o prédio 12+5, depois 12+12+5, e assim por diante. 4. No final teremos amostrado os 40 prédios. AMOSTRAGEM POR CONGLOMERADOS (CLUSTERS) Neste m´método, ao invés da seleção de unidades da população, são selecionados conglomerados (clusters) destas unidades. Esta é uma alternativa para quando não existe o cadastro. Se a unidade de interesse, por exemplo, for um aluno, pode ser que não exista um cadastro de alunos, mas sim de escolas. Portanto, pode-se selecionar escolas e nelas investigar todos os alunos. Este tipo de amostragem induz indiretamente aleatoriedade na seleção das unidades que formarão a amostra e tem a grande vantagem de facilitar a coleta de dados. AMOSTRAGEM POR COTAS A amostragem por cotas assemelha-se é amostragem estratificada, embora dentro dos estratos não seja feita a amostragem aleatória simples. É uma alternativa para casos em que não há a existência de um cadastro, mas há informação disponível sobre o perfil desta população em relação a um fator de estratificação que pode auxiliar a representatividade da amostra (exemplo: 50% de homens e 50% de mulheres). AMOSTRAGEM DE CONVENIÊNCIA Esta é uma forma de amostragem não probabilística que leva em conta as restrições envolvidas no levantamento amostral. A unidades amostrais são incluídas por algum tipo de conveniência, em geral ausência de tempo e recursos materiais para o levantamento dos dados. Embora não sejam feitas inferências em amostras de conveniência, estas podem ser importantes para levantar hipóteses e formular modelos. Outras definições CENSO – é a coleção de dados relativos a todos os elementos da população. Exame de todos os elementos da população. PARÂMETRO – é a medida numérica que descreve uma característica da população. VARIÁVEIS E SUAS CLASSIFICAÇOES Em um levantamento de dados, censitário ou por amostragem, investiga-se uma ou mais características de interesse que supostamente variam de uma unidade para outra. Estas características serão chamadas a partir de agora de variáveis. A variável pode ser uma quantidade, sobre a qual podem ser realizadas operações aritméticas, ou pode ser um atributo como cor de pele, zona de moradia ou classe social. No primeiro caso, a variável é classificada como quantitativa e na outra situação ela é dita ser qualitativa. • Variáveis quantitativas Discretas: numero de filhos, numero de plantas, quantidade de peças e número de assaltos. Contínuas: as variáveis contínuas podem assumir infinitos valores (índice de preços, salário, peso, altura e pressão sistólica). Toda variável que não é quantitativa será classificada como qualitativa. Os valores que a variável pode assumir são chamados de níveis ou categorias. Caso estes níveis sejam ordenáveis, a variável é dita ser ordinal, caso contrário ela é classificada como nominal. É importante ressaltar que esta ordenação nos níveis (categorias) da variável é natural tal como ocorre com a variável classe social. Nesta situação, Classe A > Classe B > Classe C > Classe D. Como já foi comentado, o tipode variável determina o tipo de análise e, para variáveis qualitativas ordinais, um resumo numérico, uma t´técnica gráfica ou uma tabela de frequência deve incorporar a ideia de ordenação. • Variáveis qualitativas (atributos) Ordinais (ex: classe social, cargo na empresa e classificação de um filme.) Nominais (ex: sexo, bairro, cor de pele e canal de TV preferido.) Além das classificações mencionadas, vamos destacar uma outra situação em que a característica de interesse ´e investigada ao longo do tempo (espaço) constituindo o que chamamos de uma série temporal. A analise de uma variável que é medida ao longo do tempo deve considerar aspectos específicos como tendência e sazonalidade. Ao resumir estas variáveis, quando ha´ a presença de tendência o valor médio modifica-se ao longo do tempo, enquanto a sazonalidade pode explicar variações periódicas, como o aumento de venda de televisores nos meses de novembro e dezembro. Série temporal Conjunto de observações ordenadas no tempo (índice mensal de inflação, tempera- tura máxima diária, cotação diária do dólar e número de nascimentos diários.).
Compartilhar