Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
Amostragem e Dimensionamento da Amostra Prof(a):Dra. Silvana Ligia Vincenzi Slides confeccionados pelos Alunos: Genilso Gomes de Proença Ivan Coltro Matheus Goedert PÓS-GRADUAÇÃO EM TECNOLOGIAS COMPUTACIONAIS PARA O AGRONEGÓCIO - PPGTCA Uma população é uma coleção completa de todos os elementos (valores, pessoas, medidas etc.) a serem estudados. Uma amostra é uma sub coleção de elementos extraídos de uma população População e Amostra Conjunto de procedimentos através dos quais se seleciona uma Amostra de uma População. A coleta de uma amostra faz-se necessária quando se pretende saber informações sobre a população em estudo. O levantamento por amostragem apresenta algumas vantagens em relação ao levantamento de toda a população. A amostragem implica em custo menor e resultado em menor tempo. Amostragem Possibilidade de Inferência Apenas se a amostragem for Probabilística Na Amostragem Não-Probabilística a escolha dos elementos da amostra é feita de forma não aleatória, existindo um procedimento de seleção dos elementos da população segundo critérios e julgamentos estabelecidos pelo pesquisador. Neste caso ela pode ser classificada como: De Conveniência ou Acidental Intenção ou por Julgamento Por cotas ou Proporcional Por tráfego Amostragem Não Probabilística Por não ser aleatória não permite inferência Todos os elementos da amostra têm probabilidade conhecida diferente de zero, podendo ser incluído na amostra. Neste caso ela pode ser classificada como: Aleatória Simples Aleatória Estratificada Aleatória por Conglomerado ou Cluster Sistemática Amostragem Probabilística Amostragem Aleatória Simples Faz-se uma lista da população e sorteiam-se os elementos que farão parte da amostra. Cada subconjunto da população com o mesmo nº de elementos tem a mesma chance de ser incluído na amostra. pr = n/N Amostragem Estratificada É utilizada quando a população pode ser dividida em subgrupos (estratos) relativamente homogêneos. Exemplos: Pesquisa de Mercado (homens e mulheres; faixas etárias; Pesquisas eleitorais (região demográfica; cidades pequenas médias e grandes; área rural e urbana). A seleção em cada estrato deve ser aleatória. Os elementos da população apresentam-se ordenados e são retirados periodicamente (de K elementos, um é escolhido) Sendo N= tamanho da população e n tamanho da amostra. N/n= x, Sortear um número y de 1 a x, para começar a amostra e os demais serão obtidos, y, y+ x, y+2x,… Amostragem Estratificada Amostragem por Conglomerados Utilizada quando a população pode ser naturalmente dividida em vários subgrupos (conglomerados). Ao contrário dos estratos, espera-se que os conglomerados sejam quase tão heterogêneos quanto à população toda. Num primeiro estágio, a amostragem é feita sobre os conglomerados, e não mais sobre os indivíduos da população. Um erro amostral é a diferença entre um resultado amostral e o verdadeiro resultado populacional; tais erros resultam de flutuações amostrais aleatórias. Ocorre um erro não amostral quando os dados amostrais são coletados, registrados ou analisados incorretamente. Tais erros resultam de um erro que não seja uma simples flutuação amostral aleatória, como a escolha de uma amostra não aleatória e tendenciosa, a utilização de um instrumento de mensuração defeituoso, uma questão formulada de modo tendencioso, um grande número de recusas de resposta ou a cópia incorreta dos dados amostrais. Fontes de erros Dimensionamento de Amostras Significado do Z nas Fórmulas A letra Z depende do nível de confiança fixado podendo ser obtida diretamente da Tabela, ou ser calculado no Excel por meio do comando =INV.NORMP.N(0,95) o que resulta em valores aproximados. Níveisde Confiança recomendados Valor tabelado 95% Z = 1,96 95,5% Z = 2,00 99% Z = 2,57 http://www.statsoft.com/Textbook/Distribution-Tables#f025 Significado do 𝛔 nas Fórmulas A letra 𝛔 representa o desvio padrão da população a ser amostrada para saber qual é o seu valor pode-se: Procurar especificações técnicas; Resgatar o valor em estudos semelhantes; Conduzir um estudo piloto para obter um valor aproximado; Estimar pela fórmula com base nos valores máximos e mínimos para a variável. Significado do d nas Fórmulas A letra d representa o erro amostral, ou seja a máxima diferença que o investigador admite entre a média da população e a média da amostra: Onde: 𝛍 é a verdadeira média da população e ẋ é a média amostral obtida a partir da amostra Significado do N nas Fórmulas A letra N representa o tamanho da população, só é utilizada nas fórmulas quando a população de onde se pretende fazer a amostragem é finita. Por exemplo, o número de pessoas que estudam em determinada escola. Significado do p e do q nas Fórmulas A letra p representa a verdadeira proporção de um dos níveis da variável, por exemplo ao se avaliar um setor de atividade se sabe quantos por cento de empresas estão ligadas àquele setor em todo o País. Assim se o setor representar 15% p = 0,15. O q representa o valor complementar ou seja q = 1 – p que no exemplo citado resultaria em q = 0,85. Quando p for desconhecido, usar o valor 50% ou seja p = 0,5 porque isso corresponde a um erro padrão máximo. Exemplo 01 – Variável Quantitativa Uma empresa do ramo de agronegócios precisa saber, com grau de confiança de 99%, qual a média diária de produção de leite de vacas da raça Holandesa. Sabe-se diante mão, com base em estudos de outros pesquisadores que o desvio padrão de produção leiteira para essa raça, seria em média 3,46 e pretende-se aceitar um erro amostral máximo de 0,5 litros para mais ou para menos. Qual seria o número de animais que precisam ser amostrados para uma população infinita e também para a população de 15.000 animais, acompanhados pelo laticínio que solicitou a pesquisa? 1) População Infinita: 2) População Finita (15.000): Exemplo 02 – Variável Qualitativa A mesma empresa ainda pretende saber, com grau de confiança de 95%, qual a quantidade de vacas da raça Holandesa nos planteis, pois não se tem ideia desse percentual. O máximo erro amostral que pretende aceitar para essa informação é de 2% para mais e para menos. Dessa forma precisa também saber qual seria o número de propriedades que precisam ser amostrados para uma população infinita e também para as 500 propriedades, acompanhadas pelo laticínio que solicitou a pesquisa? 1) População Infinita: Quando não se tem dados supõe-se p e q = 50% = 0,05 2) População Finita (500): Exemplo 03 - Variável Quantitativa Exemplo 04 - Variável Qualitativa Exemplo 05 - Variável Qualitativa Como ferramenta para alavancar as vendas o diretor comercial de uma indústria solicitou ao setor de vendas que fosse realizado um serviço de consulta via telefone aos possíveis clientes (lojas) em esfera nacional para traçar seu perfil e identificar quantos conhecem os produtos da fábrica. Para isso, faz-se necessário determinar a quantidade de lojas que será realizada a pesquisa, partindo da premissa que em outra oportunidade uma pesquisa preliminar apontou que aproximadamente 70% das lojas conhecem os produtos. Considerar um nível de confiança de 95% e um erro amostral de 5%. Exemplo 05 -Variável Qualitativa Tamanho da Amostra - Outra forma Média Se N não for muito grande e for conhecido Se N é muito grande n = no Proporção Se não conhecemos p, usamos o valor máximo Se conhecemos o p, usamos Exemplo: Planeja-se um levantamento por amostragem para avaliar diversas características da população das N= 200 famílias moradoras de um certo bairro. Qual deve ser o tamanho mínimo de uma amostra aleatória simples, tal que possamos admitir, com alta confiança, que os erros amostrais não ultrapassem 4%? Exemplo cálculo do tamanho da amostra N = 200 famílias E0 = erro amostral tolerável = 4% (E0 = 0,04) n0 = 1/(0,04)2 = 625 famílias n (tamanho da amostra corrigido) = n = 200x625/200+625 = 125000/825 = 152 famílias E se a população fosse de 200.000 famílias? n = (200.000)x625/(200.000 +625) = 623 famílias Referencia Bibliográfica FONSECA, J.S.; MARTINS, G.A. Curso de Estatística. 6.ed. São Paulo: Atlas, 2010. BARBETTA, Pedro Alberto. Estatística Aplicada às Ciências Sociais. 7. ed. Florianópolis: Editora da UFSC, 2007.
Compartilhar