Baixe o app para aproveitar ainda mais
Prévia do material em texto
UNIVERSIDADE FEDERAL DO TOCANTINS CURSO DE ENGENHARIA ELÉTRICA DOUGLAS SOUSA SANTOS ESTUDO SOBRE TAMANHO DE AMOSTRAS Palmas 2017 1 SUMÁRIO 1 CONCEITOS INICIAIS ................................................................................................. 2 1.1 Estimativa e parâmetro:........................................................................................ 2 1.2 População finita e infinita: .................................................................................... 2 1.3 Margem de erro ou erro amostral tolerável: ....................................................... 3 1.4 Intervalo de Confiança ...................................................................................... 3 2 TAMANHO DA AMOSTRA A PARTIR DA ESTIMAÇÃO DA MÉDIA DE POPULAÇÃO INFINITA ...................................................................................................................................... 4 3 TAMANHO DA AMOSTRA A PARTIR DA ESTIMAÇÃO DA MÉDIA DE UMA POPULAÇÃO FINITA .................................................................................................................... 5 4 TAMANHO DA AMOSTRA A PARTIR DA ESTIMAÇÃO DA PROPORÇÃO POPULACIONAL DE UMA POPULAÇÃO INFINITA........................................................................ 7 5 TAMANHO DA AMOSTRA A PARTIR DA ESTIMAÇÃO DA PROPORÇÃO POPULACIONAL DE UMA POPULAÇÃO FINITA ........................................................................... 8 6 REFERÊNCIAS BIBLIOGRÁFICAS .................................................................................. 10 2 1 CONCEITOS INICIAIS 1.1 Estimativa e parâmetro: Em inferência estatística as vezes precisamos deduzir características de uma determinada população a partir de dados amostrais de uma população. Essa dedução é denominada estimativa que é realizada para inferir certos parâmetros populacionais. Parâmetro é uma medida que descreve certa característica dos elementos da população. Assim estimativa de parâmetro é dada por: 𝜇 ≅ �̅� (1) Entretanto, no nosso estudo pode haver um erro de estimativa, que é dado como seguinte: 𝑒 = �̅� − 𝜇 (2) 𝑜𝑢 𝑒 = 𝑧 × 𝜎 √𝑛 (3) Em que 𝜇 é a média da população, �̅� é a média da amostra, 𝑒 é a margem de erro, 𝑛 é o número de valores que componham uma população (finita), 𝜎 é o desvio padrão e 𝑧 representa a variável aleatória normal padrão, ou seja, z ~N(0, 1), que por não depender de parâmetro desconhecido facilita os cálculos. Suponhamos que precisamos saber o tempo médio em que as pessoas ficam em filas de agência bancaria no Brasil de um certo banco. Se formos analisar o tempo em que todas as pessoas ficam nesta agencia, o estudo fica inviável, deste modo, precisamos retirar uma amostra do total de pessoas que vão a agências bancarias no Brasil. Deste modo verificamos que a média da amostra coletada seja de μ. Assim podemos deduzir que a média aritmética represente a média aritmética de toda população. 1.2 População finita e infinita: Estes dois termos são bem simples, a população finita refere-se ao um número não muito grande de uma certa população, exemplo: O perfil econômico de uma pequena cidade no 3 interior de Palmas. Já a população infinita se refere a um número muito elevado de elementos, como por exemplo a quantidade de minérios na serra do sossego em Canãa dos Carajás no Pará. 1.3 Margem de erro ou erro amostral tolerável: Erro amostral é a diferença entre um resultado amostral e o verdadeiro resultado populacional, tais erros resultam de flutuações amostrais aleatórias. Estes erros geralmente são causados por: dados amostrais são coletados, registrado ou analisado erroneamente; o instrumento defeituoso para a realização de mensurações e questionário ou formulá r io tendencioso. Não podemos evitar a ocorrência deste erro, mas podemos limitar o seu valor escolhendo uma amostra de tamanho adequado definindo assim a margem de erro para uma certa analise. Obviamente quanto maior a amostra menor o erro. Assim a margem de erro é um intervalo de confiança que possui uma faixa que provavelmente nosso parâmetro está contido. Neste caso podemos tomar como base por exemplo uma análise ao tempo de vida médio do brasileiro, se analisarmos somente a amostra de uma região do Brasil haverá um erro amostral maior do que se pegarmos para analisar elementos para compor nossa amostra de todas as regiões do país, diminuído erro amostral desta população de modo que se encaixe na nossa margem de erro. 1.4 Intervalo de Confiança O intervalo de confiança para a média populacional estimada pela média de uma amostra x é um intervalo de valores, acima e abaixo dessa média, dentro do qual se acredita que possa estar a verdadeira média da população µ , com um grau de confiança de tantos pontos percentuais quantos queiramos, 95 % por exemplo, determinado por z. Este grau de confiança significa que, se tomássemos muitas amostras da mesma população e construíssemos interva los de confiança para as suas médias, poderíamos estar seguros de que 95 % destes interva los conteriam a verdadeira média populacional µ . Assim definimos sua formula como sendo: 𝑃[(𝑋 − 𝑒) < 𝜇 < (𝑋 + 𝑒)] 4 2 TAMANHO DA AMOSTRA A PARTIR DA ESTIMAÇÃO DA MÉDIA DE POPULAÇÃO INFINITA De acordo com a nossa equação (3) podemos realizar a seguinte dedução: 𝑛 = (𝑧 × 𝜎 𝑒 )2 (4) Obs. O desvio padrão pode ser desconhecido, então o que se faz é trabalhar com o erro e como múltiplo ou fração do desvio padrão, p.ex., e = 2σ ou e = σ/4. Dessa forma na expressão (*4) o parâmetro σ é eliminado da expressão. Quando queremos calcular quantos elementos precisamos tomar na nossa amostra aplicamos a fórmula (4) acima. Cabe lembrar como explicito na formula, que o tamanho da amostra depende do desvio padrão da população, o tamanho do erro que estamos dispostos a aceitar e grau de confiança que desejamos representado por 𝑧. Exemplo (1): Uma empresa está pesquisando o tempo médio diário que pessoas passam assistindo TV. A pesquisa determina um grau de confiança de 98 % e deseja-se a estimativa com um erro de 0,5 horas, ou meia hora. Um estudo piloto, realizado especificamente para esta pesquisa mostrou um desvio padrão de 1,87 horas. Neste caso o desvio padrão populacional σ foi estimado pelo desvio padrão amostral s = 1,87 horas em um trabalho anterior. Porém, Tamanho da Amostra em Pesquisas se não existisse esse trabalho prévio, o que geralmente é a realidade, poderia se supor o erro como 20% de σ, ou seja, e = 0,20σ. Precisa-se calcular quantas entrevistas serão necessárias para esta pesquisa. 𝑛 = (𝑧 × 𝜎 𝑒 )2 = (2.33 × 1,87 0,5 )2 = 75,93 ≅ 76 Entretanto para aplicar a formula (4) precisamos calcular o desvio padrão da população. Que na maior parte das vezes é desconhecido pelo pesquisador. Neste caso há duas possibilidades estatisticamente válidas para contornar este problema: (1) Podemos estimar o desvio padrão populacional empregando uma regra prática, decorrente de experiências empíricas: 𝜎 = 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒 4 (∗ 5) (2) Ou então, poderemos usar o desvio padrão amostral, s, desde que seja tomada uma amostra igual ou maior do que 31 elementos; desde que n≥31 . O Teorema do Limite Central garante que amostras maiores do que 30 são normais, independentemente 5 do formato da distribuiçãode probabilidade da população da qual está sendo retirada a amostra. 3ª.) Ou então suporíamos, como descrito anteriormente, o erro como um múltiplo ou uma fração do desvio padrão σ. Exemplo 2: A rede de postos de combustível Cia. de Petróleo Brasileira (CPB), pretende saber o gasto médio de cada cliente de uma rede concorrente. Os executivos da CPB informam que a despesa de um cliente possa variar de 10 a 300 R$. Eles desejam um grau de confiança de 96% e admitem uma margem de erro de 2R$. Pede se para calcular o tamanho da amostra para esta pesquisa. 1) Calculo do desvio padrão pela formula (*5): 𝜎 = 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒 4 = 300 − 10 4 = 290 2) Calculo para o tamanho da amostra: 𝑛 = (𝑧 × 𝜎 𝑒 )2 = (2,06 × 290 2 2 ) = 89221,69 ≅ 89222 3 TAMANHO DA AMOSTRA A PARTIR DA ESTIMAÇÃO DA MÉDIA DE UMA POPULAÇÃO FINITA A formula (*1) pressupõe o cálculo para populações infinitas. Portanto se aplicássemos a mesma para populações finitas estaríamos violando a restrição. Neste caso podemos multiplicar o erro padrão da formula (*1) por um fator de correção para populações finitas. Assim temos que a formula para o cálculo do erro fica sendo: 𝑒 = 𝑧 × 𝜎 √𝑛 × √ 𝑁 − 𝑛 𝑁 − 1 (6) Em que N é o tamanho da população e n o tamanho da amostra. Assim como na formula (*1) a formula (*4) precisa ser reajustada para populações finitas. Basta multiplicar o erro padrão da fórmula (*2) pelo mesmo fator de correção para populações finitas. A partir da fórmula (*4), para o cálculo do erro em populações finitas, podemos facilmente deduzir uma fórmula para o cálculo da amostra em populações finitas. Assim teremos que: 6 𝑛 = 𝑧2 × 𝜎 2 × 𝑁 𝑒2 × (𝑁 − 1) + 𝑧2 × 𝜎 2 (7) Exemplo (1):O município de Ouro Branco/MG deseja fazer uma pesquisa do peso de pilhas descartados mensalmente pelas residências da cidade, para efeito do planejamento da coleta de lixo. O peso médio de pilhas descartadas em um mês, por uma amostra de 45 residências, foi de 0,2 kg e o desvio padrão dessa amostra foi de 0,1 kg. Como a cidade possui 1850 residências, deseja-se conhecer o intervalo de confiança para esta média, com grau de confiança de 95 %. Aplicando a formula (6): 𝑒 = 1,96 × 0,1 √45 × √ 1850 − 45 1850 − 1 = 0,0289 𝑘𝑔 Aplicando a fórmula (7): 𝑛 = 1,962 × 0,12 × 1850 0,02892 × (1850 − 1) + 1,962 × 0,12 = 11,9795 Entretanto para as aplicações das formulas anteriores, pressupõe que colhemos uma amostra maior que 30, se for inferior a 30 precisamos empregar a distribuição T de Studant, com n – 1 graus de liberdade, no lugar do escore z. As fórmulas para o cálculo do erro são as mesmas, apenas substituindo-se z por t. Observa-se que, mesmo assim é preciso que a população tenha distribuição normal. As fórmulas para o cálculo do erro passam, então, a ser: Para populações infinitas: 𝑒 = 𝑇 × 𝜎 √𝑛 (8) E, aqui ocorre um problema. Para obtermos o valor de t há necessidade do número de graus de liberdade ν = n – 1, que depende do tamanho da amostra n. Então, o que se faz é tomar uma amostra piloto de tamanho n0, estimar o desvio padrão por s0, obter t com n0 -1 graus de liberdade e dimensionar o tamanho da amostra por n’ (fixado o erro de estimativa). Se o tamanho da amostra obtido n’ foi maior que n0 deve-se tomar mais n’ – n0 outras observações; se não se recalcula o erro e pronto. Para populações finitas: 𝑒 = 𝑇 × 𝜎 √𝑛 × √ 𝑁 − 𝑛 𝑁 − 1 (9) Exemplo (2): Uma pesquisa sobre uso do tempo constatou que 20 técnicos eletricistas, selecionados aleatoriamente, gastam uma média de 0,25 horas (15 minutos) por dia, desvio 7 padrão de 0,03 horas (um minuto e meio), preenchendo os check list necessários de segurança do trabalho. Os dados aparentam uma distribuição normal. Pede-se construir um intervalo de confiança de 95 % para esta média amostral, considerando todos os 897 técnicos de uma metrópole. Considerando T- para 95% e 19=20-1 graus de liberdade = 2,093 (Tabela) 𝑒 = 2,093 × 0,03 √20 × √ 897 − 20 897 − 1 = 0,2778 𝑛 = 2,0932 × 0,032 × 897 0,27782 × (897 − 1) + 2,0932 × 0,032 = 56,82 ≅ 57 4 TAMANHO DA AMOSTRA A PARTIR DA ESTIMAÇÃO DA PROPORÇÃO POPULACIONAL DE UMA POPULAÇÃO INFINITA Muitas das vezes estamos interessados em saber em uma pesquisa estatista a proporção que um grupo tem sobre o total da população. Um exemplo é em pesquisas eleitorais em que desejamos saber quantas pessoas votam em candidato A, B, C ou D. Para este tipo de pesquisa empregam-se procedimentos de cálculo mediante proporções. A formula para este caso é bem simples: �̂� = 𝑋 𝑛 (10) Em que x é sucessos e n é amostra do tamanho n. Trata-se de uma simples proporção, como o número de um grupo de eventos sobre um número total de eventos. Dada sempre na base 1, existem 3 possibilidades: proporção, probabilidade e porcentagem. Para o cálculo do erro de estimativa de uma proporção e intervalo de confiança usaremos a seguinte formula: 𝑒 = 𝑧√ �̂� × �̂� 𝑛 (11) Em que �̂�=1-�̂� A partir da formula (11) podemos deduzir o a formula para o cálculo do tamanho da amostra infinita: 8 𝑛 = 𝑧2 × �̂� × �̂� 𝑒2 (12) Quando pˆ é desconhecido, fazer: �̂� × �̂�= 0,25 ; que corresponde ao pior caso para o erro padrão, ou seja, se p = 0,5 o erro padrão é máximo. Exemplo (1): Uma empresa de radiocomunicações está interessada em saber quantas qual é sua audiência em Belo Horizonte. Para isto deseja-se saber o tamanho de amostra de ouvintes a serem entrevistados. Deseja-se uma margem de erro de 3 pontos percentuais, para mais ou para menos, e um nível de confiança de 90%. Estudos anteriores mostravam que 12% dos ouvintes, sintonizam nesta rádio. Para calcularmos isto, basta somente aplicarmos a formula (12): 𝑛 = 1,6452 × 0,12 × 0,88 0,032 = 317,5 ≅ 318 Exemplo (2): Uma empresa de cartões de créditos deseja saber internacional, deseja saber como está a satisfação de seus clientes com os serviços prestados. Para isto eles procuram determinar o tamanho da amostra para realizarem uma pesquisa e saberem quantas pessoas consideram o serviço excelente. Estes desejam uma margem de erro de 1 ponto percentual, para mais e para menos, e um nível de confiança de 99%. Neste exemplo, não é citado um estudo anterior, ou seja, precisamos considerar �̂� × �̂�= 0,25. Feito esta consideração, podemos aplicar a formula (12): 𝑛 = 2,5752 × 0,25 0,012 = 16576,56 ≅ 16577 5 TAMANHO DA AMOSTRA A PARTIR DA ESTIMAÇÃO DA PROPORÇÃO POPULACIONAL DE UMA POPULAÇÃO FINITA Trata-se do mesmo procedimento empregado para o cálculo do tamanho de amostra em população infinita. Só que, neste caso, o valor encontrado deverá ser multiplicado pelo mesmo fator de correção para populações finitas, já apresentado anteriormente em tamanho da amostra a partir da estimação da média de uma população finita. Assim posto, teremos as nossas seguintes formulas: 𝑒 = 𝑧 × √ �̂� × �̂� 𝑛 × √ 𝑁 − 𝑛 𝑁 − 1 (13) 9 𝑛 = 𝑧2 × �̂� × �̂� × 𝑁 𝑒2 × (𝑁 − 1) + 𝑧2 × �̂� × �̂� (14) Exemplo (1): Um instituto de pesquisa foi contratado para avaliar quantas residências tem acesso à internet em Parauapebas/PA, cujo número de residências somam 75000 casas. Aceita-se uma margem de erros de 3 pontos percentuais, para mais e para menos. Deseja-se um grau de confiança de 95%. Como não foi informado uma pesquisa anterior, faremos �̂� × �̂�= 0,25: 𝑛 = 1,962 × 0,25 × 75000 0,032 × (75000 − 1) + 1,962 × 0,25 = 1052,15 ≅ 1052 Exemplo (2):Um certo instituto pesquisa, em São Tomé das Letras/MG, conclui que para saber quantas pessoas acessavam internet pelo smartphone, eles deveriam adotar 169 pessoas como amostras em um total de 6655 pessoas com um grau de confiança de 95%. Uma pesquisa anterior mostrou que 87% destas pessoas acessavam internet pelo smartphone. Determine a margem de erro percentual desta pesquisa. 𝑒 = 1,96 × √ 0,87 × 0,13 169 × √ 6655 − 169 6655 − 1 = 0,05006 ≅ 0,05 Neste caso, a margem de erro percentual desta pesquisa será de 5 pontos para mais ou para menos. 10 6 REFERÊNCIAS BIBLIOGRÁFICAS CLÁUDIO J. LUCHESA & ANSELMO CHAVES NETO. Cálculo do tamanho da amostra nas pesquisas em Administração. Centro Universitário Curitiba (UNICURITIBA). Disponível em: <http://www.unicuritiba.edu.br/sites/default/files/publicacoes/arquivos/calculo_do_tamanho_ da_amostra_-_texto_final_para_impressapso1.pdf>Acesso em: 06 junho. 2017. MORETTIN, L.G. Estatística Básica – Probabilidade. v. 1. 7a ed. São Paulo: Pearson Makron Books, 1999. MILONE, G. Estatística Geral e Aplicada. 1 a .ed. São Paulo: Thomson Learning, 2006.
Compartilhar