Baixe o app para aproveitar ainda mais
Prévia do material em texto
Amostragem e distribuições de amostragem. Prof. D.Sc. Igor Lima Universidade do Estado do Rio de Janeiro Instituto de Química – Depto. de Química Analítica Objetivos de aprendizagem Ao final do capítulo, o aluno deverá ser capaz de calcular probabilidades a partir: Distinguir os diferentes métodos de amostragem em pesquisa. O conceito de distribuição de amostragens. Calcular probabilidades relacionadas a média da amostra e a proporção da amostra. A importância do Teorema do Limite Central (TLC). 2 3 Selecionar uma amostra é menos demorado do que selecionar todos os itens de uma população (censo). Selecionar uma amostra é menos dispendioso do que selecionar todos os itens de uma população. Uma análise de uma amostra é menos complicada e mais prática do que uma análise de toda a população. Amostragem: importância 4 Tipos de amostras Tipo de amostras utilizadas Amostras não-probabilísticas Amostra por julgamento Amostra por Quota Amostra por Blocos Amostra por Conveniência Amostras probabilísticas Amostra Aleatória Simples (A.A.S.) Amostra Sistemática Amostra Estratificada Amostra por Conglomerados 5 Em uma amostra não-probabilística, os itens incluídos são escolhidos sem levar em conta a sua probabilidade de ocorrência. Na amostragem por conveniência, os itens são selecionados com base apenas no fato de que eles são fáceis, baratos ou convenientes para amostragem. Na amostragem por julgamento, você coleta as opiniões dos especialistas pré-selecionados no assunto. Tipos de amostras 6 Na amostragem probabilística, os itens da amostra são escolhidos com base em probabilidades conhecidas. Tipos de amostras Amostras probabilísticas Aleatória simples Sistemática Estratificada Conglomerado 7 Cada indivíduo ou item de uma grade tem uma chance igual de ser selecionado A seleção pode ser com a substituição (indivíduo selecionado retorna à grade para uma possível reseleção) ou sem substituição (indivíduo selecionado não é devolvido para a grade). Amostras podem ser obtidas a partir da tabela de números aleatórios (tabela E.1 livro do Levine) ou através da geração de números aleatórios gerados pelo computador. Amostragem aleatória simples 8 Decida o tamanho da amostra: n Divida a grade de N indivíduos em grupos de k indivíduos : k=N/n Aleatoriamente selecione um indivíduo do primeiro grupo . Depois disso, selecione cada k-iésimo indivíduo. Amostragem sistemática. 9 Amostragem sistemática Exemplo: Para obter uma amostra de sistemática com n=40 de uma população N=800 empregados. k=N/n=800/40=20. Selecione um número aleatório a partir dos 20 primeiros indivíduos e inclui cada vigésimo indivíduo posterior à 1ª seleção. Logo, se o primeiro número selecionado for 008, suas seleções subsequentes serão 028, 048, 068, 088, 108, ..., 768 e 788. 10 Divida a população em dois ou mais subgrupos (chamados estratos) de acordo com alguma característica comum. Uma amostra aleatória simples é selecionada a partir de cada subgrupo, com tamanhos de amostra proporcionais ao tamanho dos estratos. Amostras de subgrupos são combinados em um. Esta é uma técnica comum quando se faz a amostragem da população de eleitores, estratificando-se através das linhas raciais ou sócio-econômicas. Amostragem estratificada 11 A população é dividida em vários "conglomerados", cada um representativo da população. Uma amostra aleatória simples de conglomerados é selecionada. Todos os itens nos conglomerados selecionados podem ser usados, ou os itens podem ser escolhidos a partir de um conglomerado usando uma outra técnica de amostragem probabilística. Uma aplicação comum de amostragem por conglomerados envolve pesquisas eleitorais, onde certos distritos eleitorais são selecionados e amostrados. Amostragem por conglomerados 12 Amostragem aleatória simples e Amostragem sistemática Simples de usar Pode não ser uma boa representação das características subjacentes à população Amostragem estratificada Assegura a representação de indivíduos de toda a população Amostragem por conglomerados Mais rentável Menos eficiente (necessidade de amostra maior para adquirir o mesmo nível de precisão). Vantagens e desvantagens entre os métodos 13 Qual é o objetivo da pesquisa? Os dados foram coletados por meio de uma amostra não-probabilística ou uma amostra probabilística? Erro de cobertura - estrutura adequada? Erro de falta de resposta – dar sequência Erro de medição – boas perguntas proporcionam boas respostas Erros de amostragem – sempre existem Avaliando a validade da pesquisa 14 Erro de cobertura ou viés de seleção Existe se alguns grupos são excluídos do quadro e não tem chance de serem selecionados Erro por falta de resposta ou viés Pessoas que não respondem podem ser diferentes daquelas que respondem Erro de amostragem Reflete (sorte do sorteio) a variação de amostra para amostra. Erro de medição Devido a deficiências no projeto em questão, erro do entrevistado ou impacto do entrevistador sobre o entrevistado (evitem perguntas indutivas!) Erros em pesquisas 15 Formulação ambígua de questões. Uma questão mau formulada pode levar à conclusões inadvertidas. Efeito “halo” Ocorre quando o entrevistado se sente obrigado a agradar o entrevistador. Erro do respondente Ocorre como resultado do excesso de ou falta de zelo do entrevistado Para minimizar: 1) examinar minuciosamente os dados e realizar uma rechamada daqueles que deram respostas estranhas e 2) estabelecer um programa de rechamada aleatória, para confirmar a confiabilidade das respostas. Erros de medição: fontes 16 A distribuição amostral é uma distribuição de todos os valores possíveis de uma estatística para uma amostra de determinado tamanho selecionada de uma população. Por exemplo, suponha que você faça uma amostragem com 50 estudantes de sua universidade para obter o coeficiente de rendimento (CR) médio. Se você obteve muitas amostras distintas de 50 estudantes, você irá obter uma média diferente para cada amostra. Estamos interessados na distribuição do CR médio, portanto podemos calcular o CR médio para qualquer amostra com 50 estudantes. Distribuições de amostragens 17 Corresponde à distribuição das médias aritméticas de todas as amostras possíveis. Suponha que a sua população (simplificado) foi de quatro pessoas em sua instituição. Tamanho da população N=4 Variável aleatória, X, é a idade dos indivíduos Valores de X: 18, 20, 22, 24 (anos) Distribuições de amostragens: Média Aritmética da População, µ 18 Distribuições de amostragens: Média Aritmética da População, µ Medidas resumo para a distribuição da população: 21 4 24222018 N X μ i = +++ = = 2,236 N μ)(X σ 2 i = − = 0,3 0,2 0,1 0,0 18 20 22 24 A B C D P(x) x Distribuição Uniforme Média aritmética da população Desvio-padrão da população 19 Distribuições de amostragens: Média Aritmética da População, µ 1a Obs. 2a Observação 18 20 22 24 18 18/18 18/20 18/22 18/24 20 20/18 20/20 20/22 20/24 22 22/18 22/20 22/22 22/24 24 24/18 24/20 24/22 24/24 Agora, considere todas as possíveis amostras com tamanho n=2 1a Obs. 2a Observação 18 20 22 24 18 18 19 20 21 20 19 20 21 22 22 20 21 22 23 24 21 22 23 24 16 Médias Amostrais 16amostras possíveis (amostragem com reposição) 20 Distribuições de amostragens: Média Aritmética da População, µ 21 16 24211918 N X μ i X = ++++ == 1,58 16 21)-(2421)-(1921)-(18 N )μX( σ 222 2 X i X = +++ = − = Medidas resumo para esta distribuição de amostragem: 21 Distribuições de amostragens: Média Aritmética da População, µ População N = 4 1,58σ 21μ X == X 2,236σ 21μ == Distribuição de amostragem da média n = 2 18 20 22 24 A B C D 0,0 0,1 0,2 0,3 P(X) X 18 19 20 21 22 23 24 0,0 0,1 0,2 0,3 P(X) X _ _ 22 Diferentes amostras do mesmo tamanho da mesma população produzirá médias amostrais diferentes. A medida da variabilidade na média de amostra para amostra é dada pelo Erro-Padrão da Média Aritmética: Obs.: o erro-padrão da média diminui com o aumento do tamanho da amostra. Erro-padrão da média aritmética n σ σ X = 23 Se uma população é normal com média μ e desvio padrão σ, a distribuição amostral da média também é normalmente distribuída com e (Isso pressupõe que a amostragem é com reposição ou a amostragem é sem reposição de uma população infinita). Erro-padrão da média aritmética, µ μμ X = n σ σ X = 24 Valor de Z para a distribuição de amostragem da média amostral: Encontrando Z-escore: População normal n σ μ)X( σ )μX( Z X X −= − = onde: = média amostral = média populacional = desvio padrão populacional n = tamanho da amostra X μ σ 25 Propriedades: População Normal (i.e. é não viesado ) Distribuição da População Normal Distribuição de Amostragem Normal (tem a mesma média) μμx = x x x μ xμ 26 Para amostragem com reposição: Quando n aumenta, diminui Propriedades: População Normal xσ Tamanho da amostra maior Tamanho da amostra menor x μ 27 O Teorema do Limite Central, TLC, estabelece que quando o tamanho da amostra (isto é, o número de valores em cada amostra) fica grande o suficiente, a distribuição amostral da média tem distribuição aproximadamente normal. Isto é verdade independentemente da forma da distribuição dos valores individuais da população. Medidas da distribuição de amostragem: Distribuição de amostragem cuja distribuição não é normal: Teorema do Limite Central μμx = n σ σ x = 28 Distribuição de amostragem cuja distribuição não é normal: Teorema do Limite Central Distribuição Populacional Distribuição Amostral (torna-se normal quando n aumenta) x x Tamanho da amostra maiorTamanho da amostra menor xμ μ 29 Para a maioria das distribuições, n> 30 vai produzir uma distribuição amostral que é quase normal Para distribuições bastante simétrica, n> 15 vai produzir uma distribuição amostral que é quase normal Para as distribuições da população normal, a distribuição amostral da média é sempre normalmente distribuída Distribuição de amostragem cuja distribuição não é normal 30 Suponha que uma população tem média μ = 8 e desvio padrão σ = 3. Suponha que uma amostra aleatória de tamanho n = 36 seja selecionada. Qual é a probabilidade de que a média amostral fique entre 7,75 e 8,25? Mesmo que a população não for normalmente distribuída, o teorema do limite central pode ser utilizado (n> 30). Assim, a distribuição da média da amostra é aproximadamente normal com: Distribuição de amostragem: exemplo 8μx = 0,5 36 3 n σ σx === 31 Distribuição de amostragem: exemplo 5,0 36 3 8-8,25 5,0 36 3 8-7,75 == −== Z Z Primeiro, calcule os valores de Z para 7,75 e 8,25. Verificar a tabela normal padronizada (tabela E.2, livro Levine) acumulada para calcular a probabilidade correta. 0,38303085,06915,00,5)ZP(-0,5 8,25) μ P(7,75 X =−== pnorm(0.5)-pnorm(-0.5) [1] 0.3829249 32 Distribuição de amostragem: exemplo = 2(0,5000- 0,3085) = 2(0,1915) = 0,3830 Z -0,5 0,5 Distribuição Normal Padronizada 0μz = 7,75 8,25 Distribuição de Amostragem Amostra 8μ X = x Distribuição Populacional 8μ = X Sumário do Capítulo Descrito diferentes tipos de amostras Examinado o mérito da pesquisa e os tipos de erros de pesquisa Introduzido a distribuição de amostragem Descrito a distribuição de amostragem da média Para população normal Usado o Teorema do Limite Central Calculado probabilidades usando a distribuição de amostragem 33
Compartilhar