Baixe o app para aproveitar ainda mais
Prévia do material em texto
Métodos Estatísticos 1 –Amostragem e Distribuições Amostrais Professor Luciano Barboza da Silva Problema Introdutório • A Oxford Cereais abastece milhares de caixas de cereais durante um turno de oito horas. Como gerente de operações da unidade de produção, você é responsável por monitorar a quantidade de cereal colocada em cada caixa. Para manter coerência com o conteúdo especificado na embalagem, as caixas devem conter uma média aritmética de 368 gramas 2 Estatística 2 Prof. Luciano Barboza da Silva Problema Introdutório de cereal. Em razão da velocidade do processo, o peso do cereal varia de caixa para caixa, fazendo com que algumas caixas fiquem subabastecidas (menos de 368 gramas) enquanto outras superabastecidas (mais de 368 gramas). Se o processo não estiver funcionando de maneira apropriada, o peso médio das caixas pode se desviar demasiadamente 3 Estatística 2 Prof. Luciano Barboza da Silva Problema Introdutório do peso especificado no rótulo e se tornar inaceitável. Uma vez que a pesagem de cada caixa individual consome uma quantidade demasiadamente grande de tempo, é dispendiosa e ineficiente, você deve extrair uma amostra de caixas. Para cada amostra selecionada você planeja pesar as caixas individuais e calcular uma 4 Estatística 2 Prof. Luciano Barboza da Silva Problema Introdutório média aritmética para a amostra. Você precisa determinar a probabilidade de que essa média aritmética amostral tenha sido aleatoriamente extraída de uma população cuja média aritmética populacional é 369 gramas. Com sua análise você deverá decidir entre manter, alterar o interromper o processo. 5 Estatística 2 Prof. Luciano Barboza da Silva Introdução à Amostragem • Amostra: Uma parcela da população selecionada para fins de análise; 6 Estatística 2 Prof. Luciano Barboza da Silva Introdução à Amostragem • Razões para amostrar: – Demora menos que selecionar toda a população; – É menos dispendioso do que selecionar toda a população; – Análise menos complexa que a da população. 7 Estatística 2 Prof. Luciano Barboza da Silva Introdução à Amostragem • As amostras são escolhidas de grades de dados; • As grades de dados são listas que compõem a população; • As grades devem incluir todos os indivíduos da população; 8 Estatística 2 Prof. Luciano Barboza da Silva Introdução à Amostragem • Amostragem: Processo de geração de amostras. 9 Estatística 2 Prof. Luciano Barboza da Silva Introdução à Amostragem • Amostras Não Probabilísticas: – Por Conveniência: os itens da amostra são selecionados com base na facilidade de acesso; – Por Julgamento: Coleta-se a opinião de peritos pré- selecionados em relação ao objeto de estudo; 10 Estatística 2 Prof. Luciano Barboza da Silva Introdução à Amostragem • Amostras Probabilísticas: Amostra Aleatória Simples – Todos os indivíduos da grade populacional têm a mesma probabilidade de ser escolhidos; – Em uma população com N indivíduos, cada um deles apresenta uma probabilidade de seleção de 1/N 11 Estatística 2 Prof. Luciano Barboza da Silva Introdução à Amostragem • Amostra Aleatória Simples : com reposição – Cada item selecionado retorna á grade e pode ser selecionado novamente com a mesma probabilidade; – Assim independentemente de já haver sido selecionado, cada indivíduo de uma população de N indivíduos, a cada momento, tem probabilidade 1/N de ser selecionado; 12 Estatística 2 Prof. Luciano Barboza da Silva Introdução à Amostragem • Amostra Aleatória Simples: sem reposição – O item selecionado não retorna à grade populacional, sendo impossível selecioná-lo novamente; – A chance de cada indivíduo ser sorteado na primeira rodada, numa população de N indivíduos, é 1/N. Na segunda rodada 1/(N-1), e assim sucessivamente, até que a amostra esteja completa; 13 Estatística 2 Prof. Luciano Barboza da Silva Introdução à Amostragem • OBS: – O método acima pressupõe um ótimo processo de “embaralhamento” dos dados; – Uma forma de manter o “embaralhamento” necessário é a utilização de uma Tabela de Números Aleatórios 14 Estatística 2 Prof. Luciano Barboza da Silva Introdução à Amostragem • Exemplo: Uma empresa deseja selecionar uma amostra de 32 trabalhadores de horário integral a partir de uma população de 800 empregados de horário integral, no intuito de coletar informações sobre gastos com plano odontológico patrocinado pela empresa. Como você selecionaria uma amostra aleatória simples? 15 Estatística 2 Prof. Luciano Barboza da Silva Introdução à Amostragem • Suponha eu a empresa resolva solicitar a informação por meio eletrônico e imagine que somente 80% dos empregados responderão à solicitação, encaminhando os dados. Neste caso devemos encaminha mais de 32 questionário, digamos n. Temos: 16 Estatística 2 Prof. Luciano Barboza da Silva 40 8,0 32 328,0 nn Introdução à Amostragem Uma vez que sabemos o tamanho da amostra, precisamos selecioná-la dentre a grade de 800 ocorrências; Para tanto: – Numeramos as ocorrências de 001 a 800; 17 Estatística 2 Prof. Luciano Barboza da Silva Introdução à Amostragem – Utilizamos uma tabela de número aleatórios 18 Estatística 2 Prof. Luciano Barboza da Silva Introdução à Amostragem – Procedimento: • Escolha um ponto de partida arbitrário (digamos o indicado em vermelho na tabela anterior); • Segue escolhendo trios (número de três dígitos) válidos (entre 000 e 800) descartando os demais que ocorrerem (por exemplo, na sequência marcada 884); 19 Estatística 2 Prof. Luciano Barboza da Silva Introdução à Amostragem – No nosso exemplo a amostra selecionada iniciaria com os indivíduos da grade número: 20 Estatística 2 Prof. Luciano Barboza da Silva 705470592109363 463433720364003 Introdução à Amostragem • Amostras Probabilísticas: Amostra Sistemática – Numera-se os indivíduos da grade; – Divide-se a grade de N indivíduos em k classes onde: 21 Estatística 2 Prof. Luciano Barboza da Silva n N arredk Introdução à Amostragem • Amostras Probabilísticas: Amostra Sistemática – Escolhe-se aleatoriamente um indivíduo da primeira classe, digamos o j-ésimo termo; – A partir daí seleciona-se o j-ésimo termo de cada uma das classes subsequentes; 22 Estatística 2 Prof. Luciano Barboza da Silva Introdução à Amostragem • Exemplo: Suponha que nossa grade possua N = 1000 indivíduos e desejo uma amostra sistemática de n = 50 indivíduos. Temos: • Fazendo j = 2, temos 23 Estatística 2 Prof. Luciano Barboza da Silva 20 50 1000 arredk Introdução à Amostragem 24 Estatística 2 Prof. Luciano Barboza da Silva Classes Indivíduo 1 2 ... 20 1 1 51 101 2 2 52 102 . . . . . . . . . . . . . . . 50 50 100 150 Introdução à Amostragem • Amostras Probabilísticas: Amostra Estratificada – Subdivide-se os N elemento da grade em j estratos de tamanho Nj, j = 1,2,3,...,k:– OBS: Estratos são, em geral, divisões arbitrárias definidos pelo interesse do pesquisador (Ex. Sexo, Escolaridade, etc.) 25 Estatística 2 Prof. Luciano Barboza da Silva k j jNN 1 Introdução à Amostragem • Amostras Probabilísticas: Amostra Estratificada – Seleciona-se uma Amostra Aleatória Simples de cada extrato j de tamanho: 26 Estatística 2 Prof. Luciano Barboza da Silva n N N arredn j j Introdução à Amostragem • Amostras Probabilísticas: Amostra Estratificada – Ao final teremos uma amostra de tamanho n, tal que 27 Estatística 2 Prof. Luciano Barboza da Silva k j jnn 1 Introdução à Amostragem • Exemplo: Suponha que queiramos extrair uma amostra de 32 empregados, de uma população de 800 empregados, para estimar o gasto com planos odontológicos. Dos empregados de tempo integral, 25% ocupam cargo de gerência e 75% ocupam cargos não gerenciais. Como você estabeleceria uma amostra 28 Estatística 2 Prof. Luciano Barboza da Silva Introdução à Amostragem • Estratificada para esse caso? Considere uma taxa de resposta de 80%. – Estratos: (CG) Cargos Gerenciais (25%) e (CNG) Cargos Não Gerenciais (75%). Assim: 29 Estatística 2 Prof. Luciano Barboza da Silva 60080075,020080025,0 CNGCG NN Introdução à Amostragem • Considerando que a taxa de retorno é de 80%, definimos n: • Aplicando a proporção dos extratos temos: 30 Estatística 2 Prof. Luciano Barboza da Silva 403280,0 nn 304075,0104025,0 CNGCG nn Introdução à Amostragem • Uma vez definida a amostra dos estratos procede-se uma amostragem aleatória simples. 31 Estatística 2 Prof. Luciano Barboza da Silva Introdução à Amostragem • Amostras Probabilísticas: Amostra por Conglomerado – A principal diferença entre Estrato e Conglomerado é que o segundo é uma divisão natural (Exe. Municípios, Distritos Eleitorais, Bairros, etc.), enquanto o segundo, como vimos, depende do interesse do pesquisador; – O procedimento é idêntico ao caso de estratos; 32 Estatística 2 Prof. Luciano Barboza da Silva Introdução à Amostragem • Erros de Pesquisa: – Erro de Cobertura: Exclusão de parte da população de modo que não tenham chance de ser selecionados. Isso implica o Viés de Seleção; – Erro por Falta de Resposta:Devido à negativa por parte dos entrevistados em responder certas questões; 33 Estatística 2 Prof. Luciano Barboza da Silva Introdução à Amostragem • Erros de Pesquisa: – Erro de Amostragem: Reflete a possível variação amostral, que pode trazer problemas de representatividade; – Erro de Medição: Fontes • Formulação ambígua; • Efeito Hawthorne – O entrevistado busca agradar o entrevistador; • Erro do Respondente: Ocorre por falta de zelo por parte do entrevistado. 34 Estatística 2 Prof. Luciano Barboza da Silva Distribuições Amostrais • Grandezas que são calculadas em uma amostra têm valores que oscilam de uma amostra para outra; • Entender como se manifesta essa aleatoriedade é o objetivo dessa seção. 35 Estatística 2 Prof. Luciano Barboza da Silva Distribuições Amostrais: Média Amostral • Ausência de Viés da Média Aritmética – Viés: Erro sistemático ou tendência média a se afastar da média real; – Assim dizer que a média aritmética é uma medida sem viés é dizer que sua média é igual a média da população que a gerou; 36 Estatística 2 Prof. Luciano Barboza da Silva Distribuições Amostrais: Média Amostral • Exemplo: Suponha que a quatro assistentes administrativos foi solicitado que digitassem um mesmo documento. Seja X o número de erros cometidos pelo auxiliar: 37 Estatística 2 Prof. Luciano Barboza da Silva Auxiliar X Auxiliar X Anne 3 Carla 1 Bob 2 Dave 4 Distribuições Amostrais: Média Amostral • Medidas populacionais: – Média – Desvio Padrão 38 Estatística 2 Prof. Luciano Barboza da Silva erros 5,2 4 4 1 j jX erro 12,1 4 4 1 2 j j XX Distribuições Amostrais: Média Amostral • Se retirássemos dessa população uma amostra de dois indivíduos (com reposição) e calculássemos a média da amostra teríamos 16 resultados possíveis, cada um com uma certa probabilidade (vide quadro); 39 Estatística 2 Prof. Luciano Barboza da Silva Distribuições Amostrais: Média Amostral 40 Estatística 2 Prof. Luciano Barboza da Silva Distribuições Amostrais: Média Amostral • Note que a média das médias aritméticas amostrais é 2,5, exatamente igual a média aritmética populacional (ausência de viés); • Note ainda que na prática, em geral, não sabemos a média populacional, portanto nunca saberemos quão próxima nossa média amostral estará da mesma; 41 Estatística 2 Prof. Luciano Barboza da Silva Distribuições Amostrais: Média Amostral • Note adicionalmente que apesar de não sabermos a média populacional, sabemos que em média estamos calculando a média populacional corretamente; 42 Estatística 2 Prof. Luciano Barboza da Silva Distribuições Amostrais: Erro Padrão da Média • Façamos uma tabela de frequência dos valores médios das amostrar retiradas. Temos: 43 Estatística 2 Prof. Luciano Barboza da Silva Distribuições Amostrais: Erro Padrão da Média • Como a média aritmética amostral é uma variável aleatória tem sua própria média e seu desvio padrão. Pode-se mostrar que para uma amostra de tamanho n: 44 Estatística 2 Prof. Luciano Barboza da Silva n X Distribuições Amostrais: Erro Padrão da Média • Exemplo: Retornando ao processo de abastecimento do problema original do nosso capítulo. Se selecionarmos 25 caixas de cereais diante de milhares produzidas por dia e considerando que o desvio padrão populacional é de 15, o desvio padrão da média aritmética será: 45 Estatística 2 Prof. Luciano Barboza da Silva 3 25 15 X Distribuições Amostrais: Erro Padrão da Média • As medias aritmética amostrais são variáveis mais estáveis que as variáveis originais do problema. E serão tão mais estáveis quanto maio a amostra; • Não só sabemos que a média das médias é a média populacional, como também sabemos que para amostras de tamanho razoável a variabilidade é muito baixa; 46 Estatística 2 Prof. Luciano Barboza da Silva Distribuições Amostrais: População Normal • Resultados: para uma população qualquer de média μ e desvio padrão σ: • Caso a população seja Normalmente Distribuída teremos: 47 Estatística 2 Prof. Luciano Barboza da Silva n XX n NX ,~ Distribuições Amostrais: População Normal • Dessa forma temos: 48 Estatística 2 Prof. Luciano Barboza da Silva 1,0~ N X n Distribuições Amostrais: Proporção • Exemplo: A quantidade de tempo que um caixa, em uma agência bancária, gasta com cada cliente apresenta uma média aritmética da população, μ, igual a 3,10 ,minutos e um desvio padrão, σ, de 0,40 minuto (considere a distribuição populacional normal). Se você selecionar uma amostra aleatória de16 clientes: 49 Estatística 2 Prof. Luciano Barboza da Silva Distribuições Amostrais: Proporção – a) Qual a probabilidade de que a média aritmética do tempo gasto por cliente seja de 3 minutos? – b) Existe uma chance de 85% de que a média amostral seja menor do que quantos minutos? 50 Estatística 2 Prof. Luciano Barboza da Silva Distribuições Amostrais: Proporção – a) Temos: 51 Estatística 2 Prof. Luciano Barboza da Silva 40,0 10,33 163 X nPXP 8413,013 ZPXP Distribuições Amostrais: Proporção – b) Temos: 52 Estatística 2 Prof. Luciano Barboza da Silva 85,0 40,0 10,3 1685,0 tX nPtXP 40,0 10,3 1685,0 t zzZP min 20,3 4 04,140,0 10,304,1 tz Distribuições Amostrais: População Não Normal • Teorema Limite Central (TLC): Independentemente da distribuição da população, com média μ e desvio padrão σ, para amostras de tamanho (n) grande, temos: • OBS: Em termos práticos o TLC vale para n ≥ 30. 53 Estatística 2 Prof. Luciano Barboza da Silva 1,0~ N X n Distribuições Amostrais: População Não Normal 54 Estatística 2 Prof. Luciano Barboza da Silva Distribuições Amostrais: Proporção • Consideremos agora que você esteja interessado em saber a proporção de sues clientes que consomem determinado produto. Você seleciona uma amostra. A proporção da amostra é dada por: 55 Estatística 2 Prof. Luciano Barboza da Silva n Y p Y é o número de clientes da amostra que consomem o produto n é o número de clientes da amostra Distribuições Amostrais: Proporção • Note: – p é um número entre 0 e 1; – p é uma VA amostral, depende da amostra • Podemos utilizar p para estimar o verdadeiro valor da proporção populacional (π) 56 Estatística 2 Prof. Luciano Barboza da Silva Distribuições Amostrais: Proporção • Temos que: • Pelo TLC temos: 57 Estatística 2 Prof. Luciano Barboza da Silva n Xp 1 1,0~ 1 N n p Distribuições Amostrais: Proporção • Exemplo: Um instituto de pesquisa sobre intenções de votos está conduzindo uma análise sobre os resultados de amostras com o objetivo de realizar previsões na noite das eleições. Pressupondo uma eleição entre duas candidatas, se uma candidata específica receber pelo menos 55% dos na amostra ela será dada como 58 Estatística 2 Prof. Luciano Barboza da Silva Distribuições Amostrais: Proporção vencedora da eleição. Se você selecionar uma amostra aleatória de 100 eleitores, qual a probabilidade de que uma candidata será dada como vencedora quando: – Quando o verdadeiro percentual de seus votos for 51,5%; – Quando o verdadeiro valor de seus votos for 60%; 59 Estatística 2 Prof. Luciano Barboza da Silva Distribuições Amostrais: Proporção • Resolução: – a) Temos: 60 Estatística 2 Prof. Luciano Barboza da Silva 100501,01501,0 501,055,0 1 55,0 n p PpP 1635,098,0 05,0 049,0 55,0 ZPZPpP Distribuições Amostrais: Proporção • Resolução: – b) Temos: 61 Estatística 2 Prof. Luciano Barboza da Silva 10060,0160,0 60,055,0 1 55,0 n p PpP 8461,00206,1 049,0 05,0 55,0 ZPZPpP
Compartilhar