Prévia do material em texto
Métodos introdutórios de amostragem A utilização da Amostragem Aleatória Simples com e sem reposição para estimação das quantidades de interesse, a estimação de médias, totais e proporções, o tamanho amostral necessário para esses cálculos. Prof. Leandro Vitral Andraos 1. Itens iniciais Propósito Conceituar a técnica de Amostragem Aleatória Simples com e sem reposição para estimação das quantidades de interesse em uma pesquisa. Apresentar as expressões utilizadas para realizar essa estimação e para se definir o tamanho de amostra de acordo com o erro amostral pretendido. Apresentar o conceito de proporção e as estimativas a partir desse tipo de desenho amostral. Preparação Antes de iniciar o conteúdo deste tema, certifique-se de ter papel e lápis por perto para acompanhar os exemplos e demonstrações. Além disso, a tabela da distribuição normal é importante quando estudarmos os tamanhos amostrais. Objetivos Identificar os dois tipos de seleção por Amostragem Aleatória Simples, notações utilizadas e probabilidades de seleção. Reconhecer algumas notações utilizadas na teoria da amostragem, a distribuição amostral e as expressões de estimação de totais, médias e variâncias na Amostragem Aleatória Simples. Identificar os aspectos importantes sobre o tamanho da amostra, expressões para seu cálculo e estimação de variáveis de proporções. • • • 1. Tipos de seleção por Amostragem Aleatória Simples Conceitos sobre Amostragem Aleatória Simples (AAS) A forma de seleção amostral mais básica, famosa e utilizada é o método da Amostragem Aleatória Simples. Este módulo analisará os dois tipos de seleção por Amostragem Aleatória Simples existentes: Os métodos têm suas particularidades que serão investigadas no momento da estimação dos dados. Além disso, os cálculos de tamanho de amostra serão apresentados sob diversas situações. Você vai perceber que já realizou muitas vezes a Amostragem Aleatória Simples em sua vida sem nem se dar conta disso. A Amostragem Aleatória Simples (AAS) é uma técnica de amostragem em que a seleção é aleatória e cada elemento tem igual probabilidade de ser sorteado para a amostra. Ademais, é selecionado independente de qualquer outro. Assim, se conhece a probabilidade de todas as combinações amostrais possíveis. Resumindo Utilizando um procedimento aleatório, sorteia-se com igual probabilidade um elemento da população. A AAS é a forma de seleção mais básica, porém é a mais importante da amostragem. Ela é a base de planos amostrais mais complexos. Todo mundo já fez ou viu uma seleção por este método. Quer ver um exemplo? Exemplo Quando você participa de um sorteio e selecionam um cupom dentro de uma urna, o que se faz ali é uma seleção aleatória simples. Alguém organiza uma urna, as pessoas vão adicionando papéis lá dentro, e no dia do sorteio uma pessoa mistura tudo e seleciona um cupom. Perceba, nesse caso, que todos os cupons têm a mesma probabilidade de serem selecionados. Nenhum papel deve sobressair sobre o outro, tampouco pode ter alguma marcação que o permita destacá-lo dos demais (um papel mais grosso, mais duro, mais áspero, de outra cor, mais pesado ou leve etc.). Todos devem ser absurdamente iguais. Além disso, há duas formas de se utilizar o método da AAS, eles podem ser com e sem reposição. Com reposição Quando as unidades amostrais podem ser selecionadas mais de uma vez. Sem reposição Quando as unidades amostrais são selecionadas uma única vez. Diferenças práticas de seleções com e sem reposição A escolha de qual dos dois métodos utilizar depende da natureza do estudo, porém o mais comum na prática é a utilização sem reposição. Permitir que uma mesma pessoa seja selecionada duas vezes acaba tendo um efeito prático negativo. Se numa premiação a mesma pessoa ganhar duas vezes seguidas com o mesmo bilhete, com certeza, acharão que é marmelada. Todavia, isso poderia perfeitamente acontecer, pois estando de novo na urna, sua probabilidade volta a ser maior do que zero (sendo a mesma de qualquer outro cupom na caixa). Veja exemplos de AAS sem reposição abaixo: Mega-Sena Neste método, existem 6 dezenas de opções de números disponíveis (1 a 60). Assim, as bolinhas são selecionadas e o apresentador retorna ao público com os 6 números selecionados. Muitos estudos são realizados para garantir a lisura do sorteio, pois as bolinhas não podem ter diferença de peso ou tamanho, por exemplo. Elas devem ser todas iguais para que a seleção seja completamente aleatória. Além disso, devem ser independentes. Ou seja, ao retirar uma bolinha da urna e anotar seu valor, a seleção da próxima bolinha não deve ter influência nenhuma da anterior. Se a anterior foi par ou ímpar, se foi número grande ou pequeno, nada diz respeito à próxima seleção. E se a Mega-Sena fosse com reposição? Isso significa que um mesmo número poderia aparecer mais de uma vez, o que dificultaria ainda mais (se que é possível) ganhar na Mega-Sena. Bingo Mais um exemplo bastante utilizado de AAS sem reposição é o famoso bingo. No jogo, várias pedras são retiradas de um reservatório, e isso é feito sem reposição, ou seja, dado que aquele número foi selecionado, ele não volta mais para a urna. Não faria sentido retorná-lo ao local de seleção das amostras. Isso apenas atrapalharia. Logo, um método ou outro deve ser sempre pensado a respeito do tipo de estudo realizado. Veremos mais abaixo como o plano com reposição acaba sendo menos utilizado na prática. AAS com reposição Quando as unidades da amostra podem ser selecionadas mais de uma vez para a mesma amostra, diz-se que a seleção é com reposição. Se em um sorteio de dois carros, o ganhador do primeiro carro tiver seu cupom colocado novamente na urna, então dizemos que temos Amostragem Aleatória Simples com reposição. AAS sem reposição Quando as unidades da amostra não podem ser selecionadas mais de uma vez para a mesma amostra, diz-se que a amostra é sem reposição. Se no sorteio dos dois carros, o cupom do primeiro ganhador for descartado para o segundo prêmio, então dizemos que foi feita uma amostra aleatória simples sem reposição. Comentário Temos de nos ambientar com uma primeira notação estatística. É uma notação simples, porém muito utilizada na amostragem. Usamos N para se referir ao tamanho, quantidade da população e n para se referir ao tamanho, quantidade da amostra. Ao ver uma pesquisa com N = 10000 e n = 350, significa que foram selecionados 350 indivíduos de uma população de 10000. E essa notação independe do plano de seleção adotado. Fique atento toda vez que se deparar com essa terminologia para não confundir as duas quantidades. Vamos analisar um exemplo prático para entendermos melhor a Amostragem Aleatória Simples. Suponha que uma empresa possua 12 funcionários cuja distribuição de salário seja a seguinte: PESSOAS RENDA (R$) A ........... 1 300 B ........... 6 300 C ........... 3 100 D ........... 2 000 E ........... 3 600 F ........... 2 200 G ........... 1 800 H ........... 2 700 I ........... 1 500 J ........... 900 L .......... 4 800 M .......... 1 900 S (Soma) ......... 32 100 μ (Média) ......... 2 675 Tabela 1 - Distribuição do salário de 12 pessoas em uma empresa. Leandro Vitral Andraos. Nosso interesse aqui seria de conhecer a renda média dessa população constituída por N = 12 unidades, ou seja, 12 pessoas, e para tal, utilizaremos a seleção por AAS. Claro que para uma população tão pequena assim poderia ser realizado um censo, mas para fins didáticos, vamos supor que uma seleção amostral por Amostragem Aleatória Simples seja feita. Método de seleção das unidades Há inúmeras maneiras de selecionar da população de tamanho N as unidades que deverão participar da amostra. Como temos 12 unidades populacionais, poderíamos selecionar uma amostra de tamanho 1 (valor mínimo) até o tamanho 11 (valor máximo), pois, acima desse valor, teríamos a utilização de todos os elementos, deixando de ser amostra e virando censo. Resumindo Podemos dizerque em toda população temos unidades amostrais que podem ser selecionadas. Nesse exemplo, a amostra pode assumir os seguintes tamanhos: , , até , ou seja . Mas isso em populações pequenas é simples, porque podemos listar todos os casos possíveis. No momento, trabalharemos com amostras pequenas e, posteriormente, após consolidação dos conceitos adquiridos, passaremos a alçar voos maiores. Suponha que a partir da Tabela 1, selecionaremos uma amostra de tamanho n = 2 constituída de 2 pessoas. Teríamos muitas combinações a escolher e algumas das amostras possíveis são AB, AC, ..., LM, AA, DD, .... Em alguns casos, existe amostras constituídas de duas unidades diferentes e em outros, as unidades estão repetidas (AA, DD, ...). Se permitirmos que o estudo seja AAS com reposição, poderemos dispor da mesma pessoa escolhida duas vezes, caso escolhamos sem reposição, ela poderia aparecer uma única vez. É muito importante que a seleção não seja influenciada por fatores subjetivos (preferências do operador), isto quer dizer que a seleção deve ser realmente "ao acaso" ou "aleatória". Para que a AAS seja realmente eficaz, não deve haver nenhum tipo de manipulação ou influência na seleção das unidades. O método da AAS é muito simples, porém requer acesso a algum tipo de cadastro ou lista para se efetuar a seleção das unidades. É necessário possuir tal cadastro ou um repositório com todas as opções para que se possa fazer uma seleção. Comentário Apesar de simples, nem sempre é factível fazer a AAS na prática. As pesquisas eleitorais, por exemplo, não devem ser feitas dessa forma. Imagine uma pesquisa desse porte no Brasil inteiro. Seria preciso ter uma lista com todas as pessoas votantes, e como o Brasil tem cerca de 150 milhões de eleitores, seria necessário enumerar de 1 a 150 milhões os indivíduos e, a partir disso, sortear alguns. Poderiam aparecer indivíduos de qualquer lugar do país, tornando-se um método muito custoso. Para populações pequenas funciona bem, mas quando a população é grande e muito espalhada, pode ser mais difícil. Voltando ao nosso exemplo, vamos atribuir a cada pessoa um número de 1 a 12 fazendo-se a correspondência com 12 fichas numeradas de 1 a 12, colocadas em um saco. Após misturá-las, começamos a seleção. Retiramos a primeira ficha, anotamos o seu número para saber qual a pessoa selecionada e, em seguida, retiramos a segunda ficha. Se o processo de seleção for com reposição, então a ficha selecionada na primeira seleção é recolocada no saco, e no caso do processo de seleção sem reposição, ela é mantida fora do saco após a primeira seleção. Probabilidade de seleção A probabilidade de seleção de cada unidade da população de tamanho N de participar de uma amostra de tamanho é igual a . Exemplo Caso você participe de um sorteio de 1 carro (n ) entre 1000 pessoas ( ), a probabilidade de sair de lá motorizado é de . Multiplicando por 100 para transformar em percentual, você teria 0,1% de chance de vitória. Vamos voltar agora e analisar o exemplo da indústria (Tabela 1), nela temos e os tamanhos de amostra possíveis seriam . Ou seja, podemos selecionar 1 indivíduo, 2, 3, até 11 indivíduos. Neste caso fixado a probabilidade de cada unidade da população (pessoa) ser selecionada para uma amostra é função do tamanho dessa amostra, pois dependerá do valor de para se fazer o cálculo. Quanto mais pessoas você for selecionar, mais aumenta a sua probabilidade de ser selecionado. Concorda que se selecionarmos 10 em 12 pessoas, a probabilidade de ser escolhido é muito maior do que se fosse uma seleção de apenas um indivíduo? Inicialmente, digamos que iremos selecionar uma amostra de tamanho 1. As amostras possíveis de tamanho seriam (A), (B), (C), , (M), ao todo 12 amostras; a probabilidade de seleção de cada pessoa é . Do mesmo modo, as amostras possíveis de tamanho , sem reposição das unidades, seriam (AB), (AC), ..., (BC), (BD), ..., (LM), ao todo 66 amostras distintas (veremos como achar esse número logo abaixo). Agora, a probabilidade de seleção é , ou seja, cada unidade da população possui chance de participar da amostra . Atenção Perceba como a chance de um indivíduo se tornar parte da amostra dobrou ao se dobrar o tamanho da amostra. Espaço amostral Na teoria de probabilidades, o conjunto de todas as amostras possíveis e distintas de um mesmo tamanho que se podem formar com os elementos da população chama-se espaço amostral, convencionalmente representado por . Exemplo Se o experimento é jogar uma moeda e verificar a face que caiu voltada para cima, o espaço amostral é o conjunto . São todas as possibilidades. Para o lançamento de um dado comum, o espaço amostral é S = {1,2,3,4,5,6}. É impossível que um resultado não seja um desses números ou então, seja mais de um número ao mesmo tempo. Para encontrar quantas combinações amostrais possíveis poderemos retirar de uma população, usaremos o conceito de combinação. Combinação Estamos frequentemente interessados em obter o número de amostras diferentes que podemos formar a partir de um total populacional. A expressão, que está em função apenas de e , e nos fornece o total de combinações amostrais possíveis e diferentes, é dada por: Lembrando que N é sempre maior (ou se for censo é igual) que n, . Além disso, representa o número de amostras diferentes com elementos que podem ser selecionados de uma população de N objetos quando a ordem de seleção não é considerada relevante. Atenção É importante notar que essa expressão só vale para a amostragem sem reposição, pois não há amostras iguais. Dependendo do critério de seleção, sem ou com reposição, os respectivos espaços amostrais são: Sem reposição Com reposição No caso de seleção sem reposição Para a AAS sem reposição, usaremos basicamente a expressão acima para encontrar a quantidade de amostras disponíveis, ou seja, . Isto quer dizer que uma amostra difere de outra, de mesmo tamanho, pela natureza de seus elementos, ou quando pelo menos um de seus elementos é diferente ( é diferente de , porém e são as mesmas coisas). ordem não faz diferença nesse caso, pois tanto faz selecionar primeiro o indivíduo A e depois o indivíduo M ou primeiro o M e depois o A . No caso de , as amostras (AB) e (AC) constituem duas amostras distintas. O espaço amostral S para e será igual ao número de combinações possíveis de 12 elementos de classe 2, ou seja: • • Dessa forma, temos 66 combinações distintas de se selecionar uma amostra de tamanho 2 sem reposição. Você poderia selecionar (AB), (AC) mas nunca (AA) por exemplo. No caso de seleção com reposição No caso da AAS com reposição, o cálculo é ainda mais simples, pois as amostras podem se repetir, logo, para esse caso, basta multiplicar o tamanho da população vezes, sendo o tamanho da amostra. Ou seja, fazer . Isto quer dizer que agora uma amostra pode diferir da outra apenas pela ordem de seleção dos elementos. No caso de tem-se (AA), (AB), amostras. 0 respectivo espaço amostral é dado por amostras possíveis que correspondem às possibilidades com repetição de (tamanho populacional) elementos de classe (tamanho amostral). Comparação entre AAS sem e com reposição A AAS sem reposição é muito mais intuitiva, pois cada unidade da população pode aparecer apenas uma vez na amostra. Exemplo Imagine que você esteja pensando em abrir uma loja no centro de uma cidade. Fazer uma pesquisa antes de abrir um comércio ou serviço é fundamental, pois ali você descobre muito sobre as necessidades daquela população. Concorda comigo que pesquisar o mesmo indivíduo mais de uma vez é ruim? Você quer opiniões diferentes e não a mesma resposta. Assim, na prática, na maioria das vezes, é utilizado o esquema sem reposição. Cabe ressaltar que a AAS com reposição apresenta expressões matemáticas mais simples. Se você avaliar as fórmulas acima, usadas para encontrar as quantidades de combinações amostrais possíveis, verá que com reposição foi muito mais simples. No próximo módulo, veremos a estimação dequantidades de interesse e isso ficará ainda mais evidente. Atenção Perceba, no exemplo anterior, quando calculamos as quantidades de amostras possíveis, como o valor de possibilidades aumentou, no caso da AAS sem reposição, de 66 para 144 amostras com reposição. A quantidade de amostras possíveis mais que dobrou, assim, há uma diferença considerável nos dois casos. Quando o tamanho da população é grande se comparado ao tamanho da amostra , muitos dos resultados obtidos através de AAS sem reposição são similares aos obtidos por AAS com reposição. Assim, se a população for infinita (ou muito grande), então as retiradas com e sem reposição serão equivalentes, isto é, o fato de se recolocar o elemento de volta na população não afetará em nada a probabilidade de extração do elemento seguinte. Então, faz pouca diferença adotar um método de seleção ou outro. Veja no vídeo, a seguir, a explicação dos pontos mais importantes do módulo. Conteúdo interativo Acesse a versão digital para assistir ao vídeo. Verificando o aprendizado Questão 1 A Mega-Sena movimenta milhões todos os meses no Brasil. Milhares de pessoas apostam muito dinheiro na perspectiva de ficarem milionárias. Agora que você conheceu a Amostragem Aleatória Simples, já sabe que esse estilo de sorteio da Mega-Sena é feito sem reposição. Mas quantas combinações existem na Mega- Sena? (ou seja, você vai jogar 6 números entre 1 e 60 e vai acertar exatamente os 6 números sorteados com apenas um único jogo). A 49 980 934 combinações B 50 760 943 combinações C 50 063 860 combinações D 51 043 231 combinações A alternativa C está correta. Teremos milhões de combinações possíveis de 6 números entre os 60 da Mega-Sena, porém apenas uma combinação certeira de 6 em 60 números entre as milhões existentes. Como o método utilizado é a AAS sem reposição, usaremos a fórmula da combinação. Logo, Ou seja, temos aproximadamente um espaço amostral S = 50 milhões de jogos diferentes possíveis na Mega-Sena, o que significa que temos cerca de 50 milhões de modos diferentes de se escolher os seis números de 1 a 60. Veja algumas possíveis combinações: Para você ganhar na Mega-Sena com uma única aposta, é preciso que o seu jogo seja o vencedor dentre os 50 milhões. Ou seja, sua chance de acertar apostando apenas uma cartela simples é de 1 em 50 milhões, o que fornece uma probabilidade muito pequena. Fazendo a divisão temos o resultado de cerca de . Boa sorte nos seus próximos jogos, pois vai precisar. Questão 2 Para uma população de tamanho N, foi dado que existem 105 combinações possíveis de amostras de tamanho 2 de uma seleção feita por Amostragem Aleatória Simples sem reposição. Qual é então o tamanho populacional? A N = 20 indivíduos B N = 15 indivíduos C N = 13 indivíduos D N = 17 indivíduos A alternativa B está correta. Que orgulho, essa era uma questão difícil! Para resolver esse problema, precisamos utilizar os conceitos de combinação. Porém, neste caso, faremos a operação inversa, pois foi dado o tamanho amostral n e a quantidade de amostras . Portanto, Utilizando a ideia do fatorial, podemos fazer . Logo: Cortando do numerador e do denominador, ficamos com . Aplicando Bhaskara, encontramos duas raízes, . Como a população não pode ser inferior a 0, descartamos o negativo e ficamos com . Portanto, a partir de uma amostra de tamanho 2 foram feitas 105 combinações por AAS, dada uma população de tamanho 15. 2. Notações utilizadas na teoria da amostragem Notação e linguagem comum No módulo anterior, estudamos as propriedades da AAS com e sem reposição e a quantidade de amostras possíveis em cada caso. A partir de agora, vamos conhecer a distribuição amostral e utilizar essa amostra selecionada para efetuar várias estimativas. Dica Utilizamos o termo estimação, pois estamos trabalhando com uma amostra. Nosso objetivo sempre é encontrar valores que possam refletir nossa população. Porém, ao fazer uma amostra, nunca conseguiremos encontrar o verdadeiro valor populacional, e sim uma estimação dele. Queremos que seja o mais próximo possível, mas ainda assim não será o valor exato. Neste módulo, analisaremos então a distribuição amostral e as técnicas de estimação para uma seleção por amostragem aleatória simples com e sem reposição. A partir de agora, precisamos definir algumas outras notações importantes, pois começaremos a utilizar algumas fórmulas com várias variáveis para encontrarmos as quantidades de interesse (um total ou média, por exemplo). Na amostragem, costuma-se usar a seguinte notação ou simbologia: Universo ou População ou Cadastro de seleção (N) É a lista de unidades de onde a amostra é selecionada. Amostra (n) É o conjunto de unidades que selecionamos para observar. Parâmetro É uma característica fixa e desconhecida da população a qual se tem interesse em estudar. Os parâmetros representam quantidades numéricas que podem ser interpretadas pelo pesquisador, por exemplo: Média, proporção, variação, taxa de crescimento, totais etc. Estimador É expressão matemática do processo de cálculo das estimativas. Estimativa É o valor calculado a partir dos dados obtidos pela amostra para se estimar o valor desconhecido do parâmetro. Além disso, temos também: As letras gregas e as letras latinas maiúsculas representam parâmetros da população. Letras latinas minúsculas para representar as características na amostra. Veja um exemplo de média populacional: Veja um exemplo de média amostral: Perceba as diferenças nas fórmulas acima: Na população, usamos Y e N (maiúsculos) e na amostra temos y e n (minúsculos). Outros exemplos: Distribuição amostral Seja a representação genérica de um elemento de ordem i na amostra em relação a alguma variável . Naturalmente, a amostra de elementos é formada pelo subconjunto . • • Letras gregas ou letras latinas maiúsculas Usaremos quando nos referirmos a um parâmetro da população. Letras latinas minúsculas Usaremos quando estivermos interessados na amostra. População: Média Variância Total Amostra: Média Variância Total Dica Com esses valores de , que correspondem ao valor de cada unidade selecionada para a amostra, pode- se obter uma distribuição de frequências e, a partir dela, calcular as estatísticas. Define-se como distribuição amostral a distribuição de frequências que se pode formular com os n valores correspondentes aos respectivos elementos. Resumindo Tal distribuição nada mais é do que criar uma tabela com todas as opções de respostas referentes àquelas amostras selecionadas. No nosso exemplo da Tabela 1, quando podem-se formar amostras. Vamos exibir somente 3 das 220 combinações na Tabela 2, algumas dessas são: AMOSTRAS VALORES DE xi (Rendas) TOTAL (t) MÉDIA (ABC) (1 300, 6 300, 3 100) 10 700 3 567 (ABD) (1 300, 6 300, 2 000) 9 600 3 200 (JLM) (900, 4 800, 1 900) 7 600 2 533 ..... ............................ .... .... Tabela 2: Exemplo de totais e médias a partir de algumas amostras selecionadas. Observa-se que cada amostra possui uma distribuição de frequência própria formada pelos elementos que a constitui, gerando estatísticas distintas. Assim, cada amostra que você selecionar apresentará um total diferente, uma média diferente, uma variância diferente. Isso, em geral, só é um problema quando a amostra for muito pequena, pois conforme o tamanho for aumentando, os resultados tornam-se mais precisos. Cada amostra de tamanho n possui sua própria distribuição de amostra. Como o espaço amostral contém S amostras, portanto S distribuições de frequências, então a totalidade das S distribuições de frequências geram uma única distribuição, que é definida por distribuição de amostragem. Vamos estudar abaixo a distribuição amostral média. Distribuição amostral da média Cada amostra tem sua média, consequentemente, o conjunto de várias amostras geram uma distribuição de frequências das médias. A essa distribuição de frequências damos o nome de distribuição amostral da média, cuja média amostralé idêntica à média da população. Vimos no exemplo da indústria que se podem formar com as pessoas inúmeras amostras de tamanho n. Na tabela 3, temos as distribuições da renda média correspondentes aos diversos espaços amostrais formados por amostras de tamanho . CLASSES DE RENDA MÉDIA, ESTIMADA ATRAVÉS DA AMOSTRA (R$1,00) DISTRIBUIÇÃO DOS ESPAÇOS AMOSTRAIS DE TAMANHO n n=1 n=2 n=3 n=4 n=5 n=6 n=7 800 |----------- 1200 .... 1 1 - - - - - 1200 |----------- 1400 .... 1 2 3 1 - - - 1400 |----------- 1600 .... 1 5 10 11 7 1 - 1600 |----------- 1800 .... - 6 15 25 25 16 6 1800 |----------- 2000 .... 2 5 20 42 55 50 27 2000 |----------- 2200 .... 1 6 22 50 78 84 61 2200 |----------- 2400 .... 1 6 22 52 90 109 98 2400 |----------- 2600 .... - 6 19 52 101 139 136 2600 |----------- 2800 .... 1 3 17 49 108 151 150 2800 |----------- 3000 .... - 4 16 57 101 133 130 3000 |----------- 3200 .... 1 3 16 46 81 107 108 3200 |----------- 3400 .... - 3 16 38 61 79 62 3400 |----------- 3600 .... - 2 13 26 46 43 14 3600 |----------- 3800 .... 1 2 10 21 27 12 - 3800 |----------- 4000 .... - 3 7 11 10 - - 4000 |----------- 4200 .... - 3 4 10 2 - - 4200 |----------- 4400 .... - 2 6 3 - - - CLASSES DE RENDA MÉDIA, ESTIMADA ATRAVÉS DA AMOSTRA (R$1,00) DISTRIBUIÇÃO DOS ESPAÇOS AMOSTRAIS DE TAMANHO n n=1 n=2 n=3 n=4 n=5 n=6 n=7 4400 |----------- 4600 .... - 1 1 1 - - - 4600 |----------- 4800 .... - 1 2 - - - - 4800 |----------- 6400 .... 2 2 1 - - - - Quantidade de amostras possíveis 12 66 220 495 792 924 792 Média de todas as amostras 2675 2 675 2 675 2 675 2 675 2 675 2 675 Tabela 3: Todas as estimativas possíveis da renda média provenientes de amostras sem reposição da população de 12 pessoas. Cada amostra possibilita uma estimativa da renda média, e para cada tamanho de amostra, a média das rendas médias estão indicadas na última linha da tabela, que necessariamente são todas iguais à renda média da população em estudo. Atenção Se você fizer a renda média da população (somar os 12 valores dos indivíduos e dividir por 12) vai encontrar R$ 2675,00. Perceba que todas as amostras utilizadas apresentam as médias de suas amostras também iguais a R$ 2675,00. Isso mostra como a média amostral pode ser utilizada para estimar a média populacional. Outros resultados importantes da tabela 3 A distribuição de frequências das médias das amostras tem como limite inferior o valor R$ 800,00, enquanto o limite superior é R$ 6.400,00 com a amplitude total de R$ 5.600,00 (6400 - 800). A amostra de tamanho n = 2 formada pelas pessoas D e E tem a estimativa de renda média igual a: Esta renda média está próxima à classe (2600 - 2800) que contém a renda média da população. Do mesmo modo, a amostra formada pelas pessoas B, C, E, L estima a renda média em: Sendo a única das amostras de tamanho dentre as 495 amostras possíveis cuja estimativa de renda média está contida na classe (4400 - 4600). Comparando-se as sete distribuições de amostragem da renda média correspondentes aos tamanhos de amostras destacam-se as observações: À medida que o tamanho da amostra aumenta, maior é a tendência das médias das amostras se concentrarem em torno da classe (2600 - 2800) que contém a média verdadeira da população igual a R$ 2.675,00. Infere-se que a estimativa se aproxima mais do valor verdadeiro com o aumento de tamanho da amostra. Quanto maior for o tamanho da amostra, maior é a tendência da distribuição das médias das amostras se aproximar da distribuição normal. Observa-se que a distribuição de amostragem das médias para é mais próxima da distribuição normal do que no caso de . Mas o que é a distribuição Normal? Na estatística, chamamos de distribuição toda função de probabilidade que define uma curva (gráfico), e a área abaixo desse gráfico nos mostra a probabilidade de acontecer algum evento relacionado a ela. Imagine a situação na qual você receba uma série de dados para analisar, porém, como não investigou tais dados, aquilo ainda é algo completamente desconhecido para você. Não seria interessante se soubesse como aqueles dados se comportam? E não seria melhor ainda se, ao saber como aqueles dados se comportam, você tivesse alguma referência já consolidada com propriedades e fórmulas matemáticas bem definidas? É por isso que usamos distribuições estatísticas. Se conseguirmos ajustar essas distribuições em nossos dados, saímos do Universo desconhecido e passamos a "pisar" em solos mais conhecidos. Existem diversas distribuições estatísticas na literatura, algumas usadas apenas em casos muito específicos e outras usadas todo o tempo. Veremos o caso da mais conhecida, que é praticamente a base de todas as outras. A distribuição Normal, ou também chamada de Gaussiana, é a curva mais utilizada, mais famosa e mais importante entre as distribuições estatísticas. A função 01D453 01D 465( ), abaixo, que determina se uma variável aleatória segue uma distribuição normal é um pouco complicada, porém não precisamos nos preocupar em calcular essas contas, pois os valores já foram calculados e distribuídos em uma tabela. Esses valores tabelados serão usados, por exemplo, quando formos calcular os tamanhos de amostra. Onde: • • é a média populacional. é a variância populacional. pode apresentar qualquer valor. O formato da curva normal lembra um sino (veja abaixo) e os valores em torno da média têm maior probabilidade de ocorrerem, e conforme vai se afastando e se aproximando das caudas, a quantidade de observações diminui. Sabe aquela expressão muito utilizada: "Fulano é um ponto fora da média"? Significa que ele está longe da média geral, pode ser algo bom ou ruim, depende da variável em estudo. Curva da distribuição Normal. Agora fica fácil observar a tabela 2 com as distribuições amostrais e perceber que conforme o tamanho da amostra aumenta, os dados se aproximam de uma distribuição normal (tente ver a tabela de lado, veja como os dados se concentram mais no meio da tabela). Isso é algo realmente útil, porque podemos trabalhar nossos dados a partir de uma distribuição já conhecida, com propriedades e expressões bem definidas. Estimação O principal propósito da inferência é proporcionar, através de uma amostra, estimativas válidas de parâmetros na população. Assim, a partir de dados amostrais, usaremos diversas expressões para encontrar estimações sobre as quantidades de interesse (médias, totais, variâncias e outras estatísticas) e podermos generalizar a informação da amostra para a população da qual foi tirada. Como não temos acesso aos verdadeiros valores das variáveis populacionais, temos de usar a amostra para estimar tais variáveis. Através do estudo da distribuição de amostragem de cada estatística são elaborados os estimadores. • • • Dica Por notação, o acento circunflexo indica que se trata de um estimador, e o asterisco (*) denota um estimador tendencioso. Além da estimação daquela variável de interesse, temos de pensar na estimação de sua variância também. Variância, desvio padrão e coeficiente de variação A variância é uma medida de dispersão que mede a variabilidade, ou seja, mostra como cada valor está distante do valor central dos dados, ou seja, da média. Dica Quanto menor o valor da variância, mais próximos os dados estão da média. A variância é uma medida quadrática, assim não tem uma interpretação tão simples, já que apresenta seu resultado na unidade de medida ao quadrado da variável original. A variância populacional é denotada por σ² e estimada com dados da amostra por s². Já o desvio padrão é calculado pela raiz quadrada da variância e, por isso, é expresso na mesma unidade de medida das variáveis. Quanto mais uniforme forem os valores, mais próximo de zero estará o desvio padrão. Quando todos os valores são iguais, o desvio padrão é zero. Assim, a amostra é perfeitamente uniforme. A variância amostral é estimada por: Para encontrar o desvio padrão basta fazer:Na tabela 1 estimamos a renda (em reais) dos trabalhadores. Vamos supor que a variancla calculada seja igual 900 reais . 0 que significa reais ? Acho que ninguém sabe, porque reais não tem muito sentido, não tem uma interpretação prática. Porém, ao retirar a raiz de 900 reais , encontramos 30 reais (pois também tiramos raiz do reais²). Agora, sim, conseguimos uma interpretação prática do resultado, ou seia, um desvio padrấo de 30 reais significa que os dados estão distantes da média em aproximadamente 30 reais. Quanto menor a variância e, consequentemente, o desvio padrão, mais homogêneos são os dados. Logo em seguida, usaremos para estimar algumas variâncias dos nossos estimadores. Nesse caso, ao calcular a raiz quadrada da variância, não chamaremos mais de desvio padrão, e sim, de erro padrão. O cálculo é o mesmo, porém, ao se trabalhar com estimadores, chamamos a raiz da variância de erro padrão, ao invés de desvio padrão, assim, para a média, teremos: Dessa forma, o erro padrão da estimativa fornece interpretações práticas melhores do que se trabalhar somente com a variância. Outra medida muito utilizada é o coeficiente de variação (CV). Ele representa uma dispersão relativa entre o desvio padrão (ou erro padrão) e a média. Assim, podemos comparar duas estimativas e verificar qual delas é mais variável. O CV populacional da média é dado por: Porém, ao usar a amostra, faremos o CV amostral da média com: Estimação da média populacional A partir de uma amostra, podemos estar interessados em estimar a média populacional de alguma variável . Por isso, usaremos a média amostral como um estimador não tendencioso da média populacional. A média populacional é um parâmetro que queremos estimar e utilizamos letras gregas e maiúsculas para representá-las. Já para a amostra, utilizamos letras minúsculas. Além disso, para ambos os casos, sem e com reposição, as fórmulas são as mesmas. Média populacional: Estimador da média populacional sob AAS com e sem reposição: Exemplo da estimação da média populacional Imagine uma pesquisa que queira avaliar a média de funcionários de 200 empresas comerciais de uma cidade. Nesse caso, você faz uma amostra de 20 empresas por AAS e encontra o seguinte resultado: Número de Empresas 4 3 5 6 2 Número de Funcionários 3 4 2 1 7 Tabela 4: Número de empresas e de funcionários de uma pesquisa de comércio. Chave de resposta 4 empresas disseram ter 3 funcionários, 3 empresas disseram ter 4 funcionários e assim, sucessivamente. Fazendo a média amostral de funcionários com a fórmula: Temos: Deste modo, a estimação da média populacional é de 2,7 funcionários por empresa. O resultado verdadeiro poderia e provavelmente deve ser um pouco diferente desse valor. Essa diferença encontrada entre a estimativa e o verdadeiro valor populacional é o que chamamos de erro amostral ou erro da estimação. O erro amostral é o "preço que se paga" por fazer uma amostra em vez do censo, ou seja, é a diferença entre a estimativa amostral e o parâmetro populacional. Estimação do total populacional Outra medida que podemos estar interessados em estimar refere-se ao total populacional. O total é uma variável muito utilizada na prática e o total populacional T é dado por: Ainda na Tabela 3, podemos estar interessados agora em estimar o total populacional. Se formos utilizar o mesmo critério da média amostral, bastaria fazermos o total amostral. O resultado seria: Um total de 17 funcionários estimados para 200 empresas é muito pouco, não acha? Nesse caso, chamamos t* de um estimador viesado (ou viciado ou tendencioso) do total populacional. Para resolver esse problema, precisamos realizar um ajuste nessa expressão. Assim, o estimador não viesado do total populacional para AAS, tanto no caso sem reposição, quanto com reposição, é dado por: Estimador do total populacional sob AAS com e sem reposição: Chave de resposta Para encontrar o estimador não viesado do total populacional, basta então multiplicar o valor do total populacional pela média amostral. Assim, no exemplo temos: Um valor muito mais factível, não é mesmo? Portanto, usaremos t e não t* para estimar o total populacional. Estimação da variância do estimador da média populacional Uma medida também muito importante é a estimação da variância. Ela representa a precisão com a qual o estimador atinge o parâmetro verdadeiro. Relembrando Não encontramos a variância verdadeira, e sim sua estimação. Logo teremos a estimação da variância para as quantidades de interesse. E depois, poderemos tirar sua raiz quadrada e encontrar o erro padrão. Primeiro, faremos para a média populacional. Porém, diferente dos casos anteriores, teremos expressões diferentes se a AAS for com ou sem reposição. O nome completo é extenso e parece estranho, mas como são estimativas, temos que estimar a variância de algo que já foi estimado antes. Portanto, chamamos de: Estimador da variância do estimador da média populacional para AAS com reposição Estimador da variância do estimador da média populacional para AAS sem reposição Na qual em ambos os casos precisamos encontrar primeiro: Voltando ao nosso exemplo, vamos fazer a estimação da variância do estimador da média populacional para uma amostra AAS sem reposição. Pela expressão, temos: Precisamos encontrar . Logo, fazemos: como segue que: Dica Você pode utilizar um software ou uma calculadora para auxiliá-lo nesses cálculos. Por sorte, vários softwares calculam rapidamente. Agora, podemos obter . Assim: O erro padrão é de Logo, o erro médio da estimativa da média populacional dessa amostra é de cerca de 0,4 funcionários (para mais ou menos). Estimação da variância do estimador do total populacional Da mesma forma que fizemos para estimação da variância na média, podemos fazer para o total. Assim, teremos a estimação da variância para o estimador do total populacional. Nesse caso, teremos novamente expressões diferentes baseados na seleção de AAS com e sem reposição. Portanto: Estimador da variância do estimador de total populacional para AAS com reposição Estimador da variância do estimador de total populacional para AAS sem reposição Na qual em ambos os casos: Novamente, para a tabela 3 faremos: Assim, o erro padrão é de: Logo, o erro de estimação médio do total populacional dessa amostra é de cerca de 77 funcionários nas empresas (para mais ou menos). Assista ao vídeo para entender os pontos mais importantes do módulo. Conteúdo interativo Acesse a versão digital para assistir ao vídeo. Verificando o aprendizado Questão 1 Duas amostras foram selecionadas em diferentes anos para avaliar o peso da população de uma cidade. A primeira amostra (A) apresentou média com a segunda amostra (B) apresentou média de com . Comparando as duas amostras, qual delas é mais homogênea? A A amostra B apresenta CV = 0,75 e a amostra A apresenta CV = 1,01, logo a amostra B é mais homogênea. B A amostra B apresenta CV = 0,09 e a amostra A apresenta CV = 0,11, logo a amostra B é mais homogênea. C A amostra B apresenta CV = 0,98 e a amostra A apresenta CV = 1,32, logo a amostra A é mais homogênea. D A amostra B apresenta CV = 8,88 e a amostra A apresenta CV = 10,62, logo a amostra A é mais homogênea. A alternativa B está correta. Para comparar duas amostras, precisamos de uma medida relativa, no caso, o coeficiente de variação. Assim, Portanto, a amostra B tem menor CV e é mais homogênea. Questão 2 Suponha uma população com N = 50 alunos de uma escola e que uma amostra de n = 7 indivíduos foi retirada e avaliada a idade em anos. Os resultados foram 15, 16, 15, 14, 16, 15, 14. Qual a estimativa da idade média e do erro padrão dessa estimativa supondo uma AAS com reposição? A e B e C e D e A alternativa B está correta. Você entendeu o conceito de estimação do erro padrão da estimativa da média populacional! Na questão, temos que o tamanho amostral é selecionada por AAS com reposição e o tamanho populacional é .A estimação da média populacional é dada por: Já a estimação da variância da estimativa da média é dada por: Precisamos encontrar Logo, fazemos: Portanto, 3. Aspectos importantes sobre o tamanho da amostra Estimação de proporções Vimos, no módulo anterior, como estimar quantidades de interesse em uma pesquisa, como totais e médias por exemplo. Além disso, observamos como estimar a variância para essas estimativas. Neste momento, abordaremos um assunto muito interessante e útil na prática: o dimensionamento do tamanho de amostra para as seleções realizadas por meio da amostragem aleatória simples. E, ainda, como executar as estimações para variáveis do tipo proporção. A variável qualitativa é outra variável de muito interesse em uma pesquisa. Numa variável desse tipo, não podemos fazer os mesmos cálculos utilizados em variáveis quantitativas. Faremos então sua proporção. Comentário Não é difícil observar, em alguns estudos, resultados informando a proporção de indivíduos com determinada característica, como, por exemplo, a proporção de empresas que paralisaram suas atividades no período da pandemia em 2020. A variável proporção é definida como o número de unidades de certa população com determinada característica, dividido pelo total de unidades dessa mesma população. Dica O denominador é sempre o número de unidades da população e o resultado da proporção está sempre entre 0 e 1, podendo ser representado em porcentagem. Nosso interesse aqui é estimar a proporção de unidades da população que pertencem a determinada categoria. Exemplo Proporção de alunos do sexo feminino em uma escola. Proporção de fumantes na população. Percentual de peças defeituosos em um lote. Nas variáveis de proporção, recebe valor 1 se as unidades possuem aquela característica e 0 caso contrário: Com os valores de , podemos estimar a proporção populacional a partir de uma AAS sem reposição, lembrando que, ao trabalhar com amostras, usamos apenas as fórmulas com ^ em cima da variável, as outras se referem aos dados populacionais: Proporção populacional Estimador da proporção populacional (Proporção amostral) Variância do estimador da proporção Estimador da variância do estimador da proporção Erro padrão do estimador da variância do estimador da proporção Pelas expressões acima, você pode perceber que a proporção se comporta como se fosse uma média, no entanto, ao invés de somar os valores das variáveis, soma-se os para cada indivíduo e depois divide- se pelo total. Vamos entender como essas estimações são feitas na prática com o seguinte exemplo: Suponha uma população de pessoas em que se saiba previamente que 100 sejam canhotas. Nossa proporção populacional de pessoas canhotas seria: . Um estudo novo deseja investigar se há diferenças na capacidade de aprendizado entre destros e canhotos. Logo, uma amostra sob AAS sem reposição de pessoas é realizada. Após a coleta dos dados, obtivemos que 8 delas eram canhotas, nossa proporção amostral de pessoas canhotas seria, então: . Essa diferença é completamente natural, já que selecionamos uma amostra para investigar alguma característica da população, assim o valor dificilmente será igual. Essa diferença é o que falamos no módulo anterior e chamamos de erro de estimação. Chave de resposta Para encontrarmos a estimativa da variância do estimador dessa proporção fazemos: Encontrando o erro padrão dessa estimativa, temos um erro pequeno: Tamanho da amostra O tamanho mínimo de uma amostra é um questionamento muito comum toda vez que alguém deseja selecionar uma amostra para se fazer uma estimação. Comentário O conhecimento popular diz que quanto maior é a população, maior deve ser a amostra. Isso não está exatamente errado, porém não é uma verdade absoluta. Quando você vai experimentar o tempero de uma comida, o que você faz? Você pega uma colher, mexe a panela e prova. Faz diferença se a panela é pequena ou se é um caldeirão? Não faz. Está vendo como o tamanho populacional não influencia diretamente o tamanho amostral? Mas o que influencia então? Para começarmos a compreender o porquê de isso acontecer, precisamos ter bem claro o conceito de que o tamanho da amostra não é linear. Assim, uma população maior não quer dizer necessariamente uma amostra maior. Resumindo A homogeneidade ou heterogeneidade da população é o mais importante. Se o objetivo é entrevistar consumidores sobre um tema amplo, é possível que haja muita variabilidade e a amostra seja maior. Todavia, se a população for mais homogênea, então sua variabilidade será menor e o tamanho da amostra poderá ser menor. A Figura 3 mostra exatamente esse conceito, pois não necessariamente uma população maior terá uma amostra maior. O gráfico que relaciona as duas grandezas não é uma função do 1° grau (a), assemelha-se antes a uma função raiz quadrada (b). Comparação tamanho da amostra e população/ a) Função linear b) Função raiz. O mais importante em uma população não é exatamente o seu tamanho, e sim a sua variabilidade. Se a população for muito semelhante entre si, não precisamos coletar uma amostra tão grande, pois todos apresentam características ou opiniões similares. Exemplo Em uma sopa, ao mexer a panela com uma colher, você homogeniza todo o tempero. Logo, provando apenas uma colher, você consegue perceber se está salgada ou não. O mesmo acontece com o exame de sangue, não é necessário retirá-lo por completo para realizar a análise, somente uma pequena amostra é necessária, pois a população (no caso seu sangue) é homogênea. Então, precisamos nos preocupar muito mais se a população de interesse é muito ou pouco heterogênea ao invés de olhar simplesmente para seu tamanho. De acordo com Bolfarine (2005), é importante utilizar pesquisas anteriores, caso existam, ou uma amostra teste para se ter algum conhecimento a priori da variabilidade da população (σ²). Em muitas situações, a amostra teste pode fornecer uma boa informação para um estimador da variância populacional. Em outros casos, pesquisas amostrais anteriores podem também fornecer estimativas iniciais satisfatórias a respeito de σ². Dica Mas qual deve ser o tamanho mínimo de uma amostra?Antes de começar a planejar uma pesquisa e seu tamanho amostral, deve-se verificar qual orçamento disponível. Não adianta executar todos os cálculos amostrais e depois descobrir que não há dinheiro para isso. No cálculo amostral, tudo deve ser levado em consideração no financeiro, pois os custos por questionário coletado podem ser elevados. Assim, em geral, na prática calculamos o tamanho de amostra com diversos valores de erros e deixamos a cargo do mandante da pesquisa decidir. Recomendação No mundo real não é recomendado efetuar o cálculo apenas para um valor de erro, mas, sim, oferecer vários cenários para o contratante analisar e comparar. Para resolver essa questão, precisamos estabelecer um tamanho mínimo amostral de acordo com o nível de precisão que desejamos, além de duas variáveis para fazer essa precisão: E: Distância máxima tolerável entre a estimativa feita e o verdadeiro valor do parâmetro (erro absoluto aceitável). α: Probabilidade de que essa distância seja maior do que o valor de E. O mais comum é um α (alfa) de 5%, assim, nesse caso, temos um nível de confiança da pesquisa de 95% (no caso da distribuição normal Z temos um valor de Z = 1.96). O melhor dos mundos é sempre termos os recursos disponíveis para se calcular o tamanho amostral sem restrições orçamentárias. O cálculo do tamanho da amostra é o mesmo quando se quer estimar a média ou o total de alguma variável, bem como utilizando-se o erro absoluto ou o erro relativo. Veremos a seguir as fórmulas para se calcular o tamanho da amostra quando admite-se o custo livre. Tamanho da amostra para estimar a média e o total populacional sob AAS Se nosso objetivo é estimar algum total ou média populacional, utilizaremos a seguinte fórmula para encontrar o tamanho da amostra: Quando o tamanho da população formuito grande ou não tivermos seu valor, por ser considerada infinita, podemos usar simplesmente: • • Onde: é o tamanho da amostra. é o múltiplo do desvio padrão, encontrado na tabela da distribuição Normal. é o tamanho da população. é a variância do parâmetro a ser pesquisado. é o erro absoluto admitido. Deseja-se estimar o consumo médio mensal de energia elétrica de domicílios de uma grande cidade. Se fixarmos o erro máximo de 5kWh e o nível de confiança em 95%, qual seria o tamanho mínimo de amostra considerado AAS? Chave de resposta Uma estimativa do desvio padrão populacional foi feita anteriormente e o resultado foi de s = 70kWh. Em problemas desse tipo, podemos não ter o total populacional, ou considerar seu tamanho como muito grande. Foi dado, também, um nível de confiança de 95%, e a tabela normal nos mostra um valor de Z95%=1,96. Assim, podemos fazer: Nesse caso, sempre arredondamos o tamanho amostral para cima. Logo, o tamanho de amostra necessário seria de 753 domicílios. Tamanho da amostra para estimar uma proporção sob AAS O tamanho amostral de uma seleção por AAS para uma variável do tipo de proporção é dado por: • • • • • Se a população for muito grande ou considerada infinita faremos: Onde: é o tamanho da amostra. é o múltiplo do desvio padrão. é a proporção da variável. é o erro absoluto desejado. Tamanho de amostra para estimar proporções com a proporção desconhecida Quando a proporção P for totalmente desconhecida e não for possível efetivar nenhuma hipótese sobre seu valor, usaremos sempre P = 0,5, pois esse é um valor que maximiza a sua variância. Olhe com atenção para a parte da expressão que envolve a proporção, temos P(1-P). Atenção Note que isso é uma função quadrática, ou seja, uma parábola com concavidade negativa. Assim, tem um ponto de máximo. Se resolvermos essa equação, teremos P = 0,5. Por isso, em situações em que não sabemos P, faremos ele igual a meio. • • • • Valores dos valores possíveis de P. Assim, o tamanho máximo de amostra AAS para estimar qualquer proporção P com certo erro d e P = 0,5 é dado por: Essa forma de calcular o tamanho de amostra é chamada de conservadora dentro da amostragem, pois com qualquer outro valor de P o valor da amostra seria menor. Assim, estamos utilizando o maior tamanho de amostra possível, já que não conhecemos a proporção populacional. Veja no vídeo a explicação dos pontos mais importantes do módulo. Conteúdo interativo Acesse a versão digital para assistir ao vídeo. Verificando o aprendizado Questão 1 Uma pesquisa, ainda na fase de planejamento, avaliará algumas variáveis sobre a proporção de empresas que aderiram a um novo programa de incentivo do governo. Qual o tamanho de amostra necessário, assumindo uma precisão de 3% e uma confiança de 95%? A n = 230 B n = 1745 C n = 978 D n = 1067 A alternativa D está correta. Como estamos interessados em estimar o tamanho de amostra de uma proporção e não temos informação nenhuma sobre o parâmetro da proporção populacional, iremos utilizar . Assim, fazemos: Dessa forma, arredondando para cima, 1068 empresas precisam ser coletadas para satisfazer as condições da pesquisa. Questão 2 O município do Rio de Janeiro deseja estimar qual o número de famílias que residem em "casas alugadas", o valor médio do aluguel e outros dados relacionados ao problema de residir em "casa alugada". Qual o tamanho da amostra necessário para dar essas informações, sabendo-se que esse bairro possuía 60.000 famílias, e que a proporção de "casas alugadas" em 1980 era de 20%? Admite-se resolver o problema com erro relativo E = 0,05 e coeficiente de confiança de 95%. A n = 676 famílias. B n= 345 famílias. C n = 503 famílias. D n= 406 famílias. A alternativa A está correta. Como estamos interessados em estimar o tamanho de amostra de uma proporção com N = 60000 e estimativa p = 20% = 0,2 , fazemos Arredondando para cima, encontramos o tamanho amostral de 676 famílias para essa pesquisa. 4. Conclusão Considerações finais Ao longo dos módulos, foi possível compreender mais sobre os métodos iniciais de seleção de amostras, suas estimações e cálculos de seu tamanho. Inicialmente, discutimos os conceitos fundamentais da amostragem aleatória simples com e sem reposição, desde a discussão das probabilidades de seleção até o cálculo das quantidades de amostras possíveis de serem obtidos por cada um dos métodos. No segundo módulo, apresentamos as ferramentas estatísticas de estimação das quantidades de interesse. Aprendemos como estimar um total e uma média a partir de uma amostra e como esses resultados podem não ser exatamente iguais aos da população devido ao erro de estimação. Além disso, aprendemos a calcular tais erros, utilizando estimativas de variância das estimativas que já haviam sido calculadas. Por fim, investigamos a estimação de proporções, já que em determinadas pesquisas o foco em variáveis qualitativas é muito maior do que em variáveis quantitativas. Vimos, ainda, o cálculo do tamanho da amostra necessário para se fazer as estimações, tópico importante e de muita utilidade prática. Dito isso, temos certeza de que, ao chegar ao fim deste tema, você conseguiu utilizar a amostra aleatória simples para fazer a seleção amostral e estimação das variáveis de interesse. Podcast Ouça o podcast sobre os métodos de amostragem. Conteúdo interativo Acesse a versão digital para ouvir o áudio. Explore+ Para saber mais sobre os assuntos tratados neste tema, pesquise: Determinação do tamanho de uma amostra, material publicado na revista eletrônica, no Portal da Organização Ciências e Cognição. Referências BOLFARINE, H.; BUSSAB, W. O. Elementos de Amostragem. São Paulo: Blucher, 2005. BONAFINI, C. F. Probabilidade e Estatística. São Paulo: Pearson Education do Brasil, 2015. COCHRAN, W. G. Sampling Techniques, third edition. New York: John Wiley & Sons, 1977. FERREIRA, V. A. M. Análise Estatística. Rio de Janeiro: Estácio, 2015. • JESSEN, R. J. Statistical Survey Techniques. New York: Wiley, 1978. LARSON, R.; FABER, B. Estatística Aplicada. 4. ed. São Paulo: Pearson, 2009. LOHR, Sharon. Sampling: Design and Analysis. 2nd edition. Duxbury Press, 2010. MORETTIN, P. A.; BUSSAB, W. de O. Estatística Básica: Probabilidade e Inferência, volume único. São Paulo: Pearson Prentice Hall, 2010. PFEFFERMANN, D.; RAO, C. R. Handbook of Statistics 29A: Sample Surveys: Design, Methods and Applications. D. Pfeffermann; C. R. Rao, (eds.). Amsterdam: NorthHolland, p. 698. R CORE TEAM. R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria, 2020. SARNDAL, C. E.; SWENSSON, B.; WRETMAN, J. Model assisted survey sampling. Nova York: Springer-Verlag, 1992. Métodos introdutórios de amostragem 1. Itens iniciais Propósito Preparação Objetivos 1. Tipos de seleção por Amostragem Aleatória Simples Conceitos sobre Amostragem Aleatória Simples (AAS) Resumindo Exemplo Diferenças práticas de seleções com e sem reposição Mega-Sena Bingo Comentário Método de seleção das unidades Resumindo Comentário Probabilidade de seleção Exemplo Atenção Espaço amostral Exemplo Combinação Atenção No caso de seleção sem reposição No caso de seleção com reposição Comparação entre AAS sem e com reposição Exemplo Atenção Conteúdo interativo Verificando o aprendizado 2. Notações utilizadas na teoria da amostragem Notação e linguagem comum Dica Universo ou População ou Cadastro de seleção (N) Amostra (n) Parâmetro Estimador Estimativa Distribuição amostral Dica Resumindo Distribuição amostral da média Atenção Outros resultados importantes da tabela 3 Mas o que é a distribuição Normal? Estimação Dica Variância, desvio padrão e coeficiente de variação Dica Estimação da média populacional Exemplo da estimação da média populacional Estimação do total populacionalEstimação da variância do estimador da média populacional Relembrando Estimador da variância do estimador da média populacional para AAS com reposição Estimador da variância do estimador da média populacional para AAS sem reposição Dica Estimação da variância do estimador do total populacional Estimador da variância do estimador de total populacional para AAS com reposição Estimador da variância do estimador de total populacional para AAS sem reposição Conteúdo interativo Verificando o aprendizado 3. Aspectos importantes sobre o tamanho da amostra Estimação de proporções Comentário Dica Exemplo Proporção populacional Estimador da proporção populacional (Proporção amostral) Variância do estimador da proporção Estimador da variância do estimador da proporção Erro padrão do estimador da variância do estimador da proporção Tamanho da amostra Comentário Resumindo Exemplo Dica Recomendação Tamanho da amostra para estimar a média e o total populacional sob AAS Tamanho da amostra para estimar uma proporção sob AAS Tamanho de amostra para estimar proporções com a proporção desconhecida Atenção Conteúdo interativo Verificando o aprendizado 4. Conclusão Considerações finais Podcast Conteúdo interativo Explore+ Referências