Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Prévia do material em texto

Métodos introdutórios de amostragem
A utilização da Amostragem Aleatória Simples com e sem reposição para estimação das quantidades de
interesse, a estimação de médias, totais e proporções, o tamanho amostral necessário para esses
cálculos.
Prof. Leandro Vitral Andraos
1. Itens iniciais
Propósito
Conceituar a técnica de Amostragem Aleatória Simples com e sem reposição para estimação das quantidades
de interesse em uma pesquisa. Apresentar as expressões utilizadas para realizar essa estimação e para se
definir o tamanho de amostra de acordo com o erro amostral pretendido. Apresentar o conceito de proporção
e as estimativas a partir desse tipo de desenho amostral.
Preparação
Antes de iniciar o conteúdo deste tema, certifique-se de ter papel e lápis por perto para acompanhar os
exemplos e demonstrações. Além disso, a tabela da distribuição normal é importante quando estudarmos os
tamanhos amostrais.
Objetivos
Identificar os dois tipos de seleção por Amostragem Aleatória Simples, notações utilizadas e
probabilidades de seleção.
 
Reconhecer algumas notações utilizadas na teoria da amostragem, a distribuição amostral e as
expressões de estimação de totais, médias e variâncias na Amostragem Aleatória Simples.
 
Identificar os aspectos importantes sobre o tamanho da amostra, expressões para seu cálculo e
estimação de variáveis de proporções.
• 
• 
• 
1. Tipos de seleção por Amostragem Aleatória Simples
Conceitos sobre Amostragem Aleatória Simples (AAS)
A forma de seleção amostral mais básica, famosa e utilizada é o método da Amostragem Aleatória Simples.
Este módulo analisará os dois tipos de seleção por Amostragem Aleatória Simples existentes:
Os métodos têm suas particularidades que serão investigadas no momento da estimação dos dados. Além
disso, os cálculos de tamanho de amostra serão apresentados sob diversas situações. Você vai perceber que
já realizou muitas vezes a Amostragem Aleatória Simples em sua vida sem nem se dar conta disso.
 
A Amostragem Aleatória Simples (AAS) é uma técnica de amostragem em que a seleção é aleatória e cada
elemento tem igual probabilidade de ser sorteado para a amostra. Ademais, é selecionado independente de
qualquer outro. Assim, se conhece a probabilidade de todas as combinações amostrais possíveis.
Resumindo
Utilizando um procedimento aleatório, sorteia-se com igual probabilidade um elemento da população. 
A AAS é a forma de seleção mais básica, porém é a mais importante da amostragem. Ela é a base de planos
amostrais mais complexos. Todo mundo já fez ou viu uma seleção por este método. Quer ver um exemplo?
Exemplo
Quando você participa de um sorteio e selecionam um cupom dentro de uma urna, o que se faz ali é uma
seleção aleatória simples. Alguém organiza uma urna, as pessoas vão adicionando papéis lá dentro, e no
dia do sorteio uma pessoa mistura tudo e seleciona um cupom. 
Perceba, nesse caso, que todos os cupons têm a mesma probabilidade de serem selecionados. Nenhum papel
deve sobressair sobre o outro, tampouco pode ter alguma marcação que o permita destacá-lo dos demais (um
papel mais grosso, mais duro, mais áspero, de outra cor, mais pesado ou leve etc.). Todos devem ser
absurdamente iguais.
 
Além disso, há duas formas de se utilizar o método da AAS, eles podem ser com e sem reposição.
Com reposição 
Quando as unidades amostrais podem ser
selecionadas mais de uma vez.
Sem reposição 
Quando as unidades amostrais são
selecionadas uma única vez.
Diferenças práticas de seleções com e sem reposição
A escolha de qual dos dois métodos utilizar depende da natureza do estudo, porém o mais comum na prática
é a utilização sem reposição. Permitir que uma mesma pessoa seja selecionada duas vezes acaba tendo um
efeito prático negativo. Se numa premiação a mesma pessoa ganhar duas vezes seguidas com o mesmo
bilhete, com certeza, acharão que é marmelada. Todavia, isso poderia perfeitamente acontecer, pois estando
de novo na urna, sua probabilidade volta a ser maior do que zero (sendo a mesma de qualquer outro cupom na
caixa).
 
Veja exemplos de AAS sem reposição abaixo:
Mega-Sena
Neste método, existem 6 dezenas de opções de números disponíveis (1 a
60). Assim, as bolinhas são selecionadas e o apresentador retorna ao
público com os 6 números selecionados. Muitos estudos são realizados
para garantir a lisura do sorteio, pois as bolinhas não podem ter diferença
de peso ou tamanho, por exemplo. Elas devem ser todas iguais para que
a seleção seja completamente aleatória. Além disso, devem ser
independentes. Ou seja, ao retirar uma bolinha da urna e anotar seu valor,
a seleção da próxima bolinha não deve ter influência nenhuma da
anterior. Se a anterior foi par ou ímpar, se foi número grande ou pequeno,
nada diz respeito à próxima seleção. E se a Mega-Sena fosse com
reposição? Isso significa que um mesmo número poderia aparecer mais
de uma vez, o que dificultaria ainda mais (se que é possível) ganhar na
Mega-Sena.
Bingo
Mais um exemplo bastante utilizado de AAS sem reposição é o famoso
bingo. No jogo, várias pedras são retiradas de um reservatório, e isso é
feito sem reposição, ou seja, dado que aquele número foi selecionado,
ele não volta mais para a urna. Não faria sentido retorná-lo ao local de
seleção das amostras. Isso apenas atrapalharia. Logo, um método ou
outro deve ser sempre pensado a respeito do tipo de estudo realizado.
Veremos mais abaixo como o plano com reposição acaba sendo menos utilizado na prática.
AAS com reposição 
Quando as unidades da amostra podem ser
selecionadas mais de uma vez para a mesma
amostra, diz-se que a seleção é com
reposição. Se em um sorteio de dois carros, o
ganhador do primeiro carro tiver seu cupom
colocado novamente na urna, então dizemos
que temos Amostragem Aleatória Simples
com reposição.
AAS sem reposição 
Quando as unidades da amostra não
podem ser selecionadas mais de uma
vez para a mesma amostra, diz-se que a
amostra é sem reposição. Se no sorteio
dos dois carros, o cupom do primeiro
ganhador for descartado para o
segundo prêmio, então dizemos que foi
feita uma amostra aleatória simples sem
reposição.
Comentário
Temos de nos ambientar com uma primeira notação estatística. É uma notação simples, porém muito
utilizada na amostragem. Usamos N para se referir ao tamanho, quantidade da população e n para se
referir ao tamanho, quantidade da amostra. Ao ver uma pesquisa com N = 10000 e n = 350, significa que
foram selecionados 350 indivíduos de uma população de 10000. E essa notação independe do plano de
seleção adotado. Fique atento toda vez que se deparar com essa terminologia para não confundir as
duas quantidades. 
Vamos analisar um exemplo prático para entendermos melhor a Amostragem Aleatória Simples. Suponha que
uma empresa possua 12 funcionários cuja distribuição de salário seja a seguinte:
PESSOAS   RENDA (R$)
A ........... 1 300
B ........... 6 300
C ........... 3 100
D ........... 2 000
E ........... 3 600
F ........... 2 200
G ........... 1 800
H ........... 2 700
I ........... 1 500
J ........... 900
L .......... 4 800
M .......... 1 900
S (Soma)  .........   32 100
μ (Média)  .........   2 675
Tabela 1 - Distribuição do salário de 12 pessoas em uma empresa. 
Leandro Vitral Andraos.
Nosso interesse aqui seria de conhecer a renda média dessa população constituída por N = 12 unidades, ou
seja, 12 pessoas, e para tal, utilizaremos a seleção por AAS. Claro que para uma população tão pequena assim
poderia ser realizado um censo, mas para fins didáticos, vamos supor que uma seleção amostral por
Amostragem Aleatória Simples seja feita.
Método de seleção das unidades
Há inúmeras maneiras de selecionar da população de tamanho N as unidades que deverão participar da
amostra. Como temos 12 unidades populacionais, poderíamos selecionar uma amostra de tamanho 1 (valor
mínimo) até o tamanho 11 (valor máximo), pois, acima desse valor, teríamos a utilização de todos os
elementos, deixando de ser amostra e virando censo.
Resumindo
Podemos dizerque em toda população temos unidades amostrais que podem ser selecionadas. 
Nesse exemplo, a amostra pode assumir os seguintes tamanhos: , , até , ou seja .
Mas isso em populações pequenas é simples, porque podemos listar todos os casos possíveis.
 
No momento, trabalharemos com amostras pequenas e, posteriormente, após consolidação dos conceitos
adquiridos, passaremos a alçar voos maiores. Suponha que a partir da Tabela 1, selecionaremos uma amostra
de tamanho n = 2 constituída de 2 pessoas. Teríamos muitas combinações a escolher e algumas das amostras
possíveis são AB, AC, ..., LM, AA, DD, .... Em alguns casos, existe amostras constituídas de duas unidades
diferentes e em outros, as unidades estão repetidas (AA, DD, ...). Se permitirmos que o estudo seja AAS com
reposição, poderemos dispor da mesma pessoa escolhida duas vezes, caso escolhamos sem reposição, ela
poderia aparecer uma única vez.
É muito importante que a seleção não seja influenciada por fatores subjetivos (preferências do
operador), isto quer dizer que a seleção deve ser realmente "ao acaso" ou "aleatória". Para que a
AAS seja realmente eficaz, não deve haver nenhum tipo de manipulação ou influência na seleção das
unidades.
O método da AAS é muito simples, porém requer acesso a algum tipo de cadastro ou lista para se efetuar a
seleção das unidades. É necessário possuir tal cadastro ou um repositório com todas as opções para que se
possa fazer uma seleção.
Comentário
Apesar de simples, nem sempre é factível fazer a AAS na prática. As pesquisas eleitorais, por exemplo,
não devem ser feitas dessa forma. Imagine uma pesquisa desse porte no Brasil inteiro. Seria preciso ter
uma lista com todas as pessoas votantes, e como o Brasil tem cerca de 150 milhões de eleitores, seria
necessário enumerar de 1 a 150 milhões os indivíduos e, a partir disso, sortear alguns. Poderiam
aparecer indivíduos de qualquer lugar do país, tornando-se um método muito custoso. Para populações
pequenas funciona bem, mas quando a população é grande e muito espalhada, pode ser mais difícil. 
Voltando ao nosso exemplo, vamos atribuir a cada pessoa um número de 1 a 12 fazendo-se a correspondência
com 12 fichas numeradas de 1 a 12, colocadas em um saco. Após misturá-las, começamos a seleção.
Retiramos a primeira ficha, anotamos o seu número para saber qual a pessoa selecionada e, em seguida,
retiramos a segunda ficha. Se o processo de seleção for com reposição, então a ficha selecionada na primeira
seleção é recolocada no saco, e no caso do processo de seleção sem reposição, ela é mantida fora do saco
após a primeira seleção.
Probabilidade de seleção
A probabilidade de seleção de cada unidade da população de tamanho N de participar de uma amostra de
tamanho é igual a .
Exemplo
Caso você participe de um sorteio de 1 carro (n ) entre 1000 pessoas ( ), a probabilidade de sair de lá
motorizado é de . Multiplicando por 100 para transformar em percentual, você teria 0,1% de chance de
vitória. 
Vamos voltar agora e analisar o exemplo da indústria (Tabela 1), nela temos e os tamanhos de
amostra possíveis seriam . Ou seja, podemos selecionar 1 indivíduo, 2, 3, até 11
indivíduos. Neste caso fixado a probabilidade de cada unidade da população (pessoa) ser selecionada
para uma amostra é função do tamanho dessa amostra, pois dependerá do valor de para se fazer o cálculo.
Quanto mais pessoas você for selecionar, mais aumenta a sua probabilidade de ser selecionado.
Concorda que se selecionarmos 10 em 12 pessoas, a probabilidade de ser escolhido é muito maior
do que se fosse uma seleção de apenas um indivíduo?
Inicialmente, digamos que iremos selecionar uma amostra de tamanho 1. As amostras possíveis de tamanho 
 seriam (A), (B), (C), , (M), ao todo 12 amostras; a probabilidade de seleção de cada pessoa é 
. Do mesmo modo, as amostras possíveis de tamanho , sem reposição das unidades, seriam
(AB), (AC), ..., (BC), (BD), ..., (LM), ao todo 66 amostras distintas (veremos como achar esse número logo
abaixo). Agora, a probabilidade de seleção é , ou seja, cada unidade da população possui chance de
participar da amostra .
Atenção
Perceba como a chance de um indivíduo se tornar parte da amostra dobrou ao se dobrar o tamanho da
amostra. 
Espaço amostral
Na teoria de probabilidades, o conjunto de todas as amostras possíveis e distintas de um mesmo tamanho 
que se podem formar com os elementos da população chama-se espaço amostral, convencionalmente
representado por .
Exemplo
Se o experimento é jogar uma moeda e verificar a face que caiu voltada para cima, o espaço amostral é o
conjunto . São todas as possibilidades. 
Para o lançamento de um dado comum, o espaço amostral é S = {1,2,3,4,5,6}. É impossível que um resultado
não seja um desses números ou então, seja mais de um número ao mesmo tempo. Para encontrar quantas
combinações amostrais possíveis poderemos retirar de uma população, usaremos o conceito de combinação.
Combinação
Estamos frequentemente interessados em obter o número de amostras diferentes que podemos formar a
partir de um total populacional. A expressão, que está em função apenas de e , e nos fornece o total de
combinações amostrais possíveis e diferentes, é dada por:
Lembrando que N é sempre maior (ou se for censo é igual) que n, . Além disso, representa
o número de amostras diferentes com elementos que podem ser selecionados de uma população de N
objetos quando a ordem de seleção não é considerada relevante.
Atenção
É importante notar que essa expressão só vale para a amostragem sem reposição, pois não há amostras
iguais. 
Dependendo do critério de seleção, sem ou com reposição, os respectivos espaços amostrais são:
 
Sem reposição
 
Com reposição
No caso de seleção sem reposição
Para a AAS sem reposição, usaremos basicamente a expressão acima para encontrar a quantidade de
amostras disponíveis, ou seja, . Isto quer dizer que uma amostra difere de outra, de mesmo
tamanho, pela natureza de seus elementos, ou quando pelo menos um de seus elementos é diferente ( é
diferente de , porém e são as mesmas coisas). ordem não faz diferença nesse caso, pois
tanto faz selecionar primeiro o indivíduo A e depois o indivíduo M ou primeiro o M e depois o A . No caso de 
, as amostras (AB) e (AC) constituem duas amostras distintas. O espaço amostral S para e 
 será igual ao número de combinações possíveis de 12 elementos de classe 2, ou seja:
• 
• 
Dessa forma, temos 66 combinações distintas de se selecionar uma amostra de tamanho 2 sem reposição.
Você poderia selecionar (AB), (AC) mas nunca (AA) por exemplo.
No caso de seleção com reposição
No caso da AAS com reposição, o cálculo é ainda mais simples, pois as amostras podem se repetir, logo, para
esse caso, basta multiplicar o tamanho da população vezes, sendo o tamanho da amostra. Ou seja,
fazer . Isto quer dizer que agora uma amostra pode diferir da outra apenas pela ordem de seleção
dos elementos. No caso de tem-se (AA), (AB), amostras. 0 respectivo espaço
amostral é dado por amostras possíveis que correspondem às possibilidades com
repetição de (tamanho populacional) elementos de classe (tamanho amostral).
Comparação entre AAS sem e com reposição
A AAS sem reposição é muito mais intuitiva, pois cada unidade da população pode aparecer apenas uma vez
na amostra.
Exemplo
Imagine que você esteja pensando em abrir uma loja no centro de uma cidade. Fazer uma pesquisa
antes de abrir um comércio ou serviço é fundamental, pois ali você descobre muito sobre as
necessidades daquela população. Concorda comigo que pesquisar o mesmo indivíduo mais de uma vez
é ruim? Você quer opiniões diferentes e não a mesma resposta. Assim, na prática, na maioria das vezes,
é utilizado o esquema sem reposição. 
Cabe ressaltar que a AAS com reposição apresenta expressões matemáticas mais simples. Se você avaliar as
fórmulas acima, usadas para encontrar as quantidades de combinações amostrais possíveis, verá que com
reposição foi muito mais simples. No próximo módulo, veremos a estimação dequantidades de interesse e
isso ficará ainda mais evidente.
Atenção
Perceba, no exemplo anterior, quando calculamos as quantidades de amostras possíveis, como o valor
de possibilidades aumentou, no caso da AAS sem reposição, de 66 para 144 amostras com reposição. A
quantidade de amostras possíveis mais que dobrou, assim, há uma diferença considerável nos dois
casos. 
Quando o tamanho da população é grande se comparado ao tamanho da amostra , muitos dos
resultados obtidos através de AAS sem reposição são similares aos obtidos por AAS com reposição. Assim, se
a população for infinita (ou muito grande), então as retiradas com e sem reposição serão equivalentes, isto é,
o fato de se recolocar o elemento de volta na população não afetará em nada a probabilidade de extração do
elemento seguinte. Então, faz pouca diferença adotar um método de seleção ou outro.
Veja no vídeo, a seguir, a explicação dos pontos mais importantes do módulo.
Conteúdo interativo
Acesse a versão digital para assistir ao vídeo.
Verificando o aprendizado
Questão 1
A Mega-Sena movimenta milhões todos os meses no Brasil. Milhares de pessoas apostam muito dinheiro na
perspectiva de ficarem milionárias. Agora que você conheceu a Amostragem Aleatória Simples, já sabe que
esse estilo de sorteio da Mega-Sena é feito sem reposição. Mas quantas combinações existem na Mega-
Sena? (ou seja, você vai jogar 6 números entre 1 e 60 e vai acertar exatamente os 6 números sorteados com
apenas um único jogo).
A
49 980 934 combinações
B
50 760 943 combinações
C
50 063 860 combinações
D
51 043 231 combinações
A alternativa C está correta.
Teremos milhões de combinações possíveis de 6 números entre os 60 da Mega-Sena, porém apenas uma
combinação certeira de 6 em 60 números entre as milhões existentes. Como o método utilizado é a AAS
sem reposição, usaremos a fórmula da combinação.
Logo,
Ou seja, temos aproximadamente um espaço amostral S = 50 milhões de jogos diferentes possíveis na
Mega-Sena, o que significa que temos cerca de 50 milhões de modos diferentes de se escolher os seis
números de 1 a 60. Veja algumas possíveis combinações:
Para você ganhar na Mega-Sena com uma única aposta, é preciso que o seu jogo seja o vencedor dentre
os 50 milhões. Ou seja, sua chance de acertar apostando apenas uma cartela simples é de 1 em 50
milhões, o que fornece uma probabilidade muito pequena. Fazendo a divisão temos o resultado
de cerca de . Boa sorte nos seus próximos jogos, pois vai precisar.
Questão 2
Para uma população de tamanho N, foi dado que existem 105 combinações possíveis de amostras de tamanho
2 de uma seleção feita por Amostragem Aleatória Simples sem reposição. Qual é então o tamanho
populacional?
A
N = 20 indivíduos
B
N = 15 indivíduos
C
N = 13 indivíduos
D
N = 17 indivíduos
A alternativa B está correta.
Que orgulho, essa era uma questão difícil! Para resolver esse problema, precisamos utilizar os conceitos de
combinação. Porém, neste caso, faremos a operação inversa, pois foi dado o tamanho amostral n e a
quantidade de amostras .
Portanto,
Utilizando a ideia do fatorial, podemos fazer . Logo:
Cortando do numerador e do denominador, ficamos com 
.
Aplicando Bhaskara, encontramos duas raízes, . Como a população não pode ser
inferior a 0, descartamos o negativo e ficamos com . Portanto, a partir de uma amostra de
tamanho 2 foram feitas 105 combinações por AAS, dada uma população de tamanho 15.
2. Notações utilizadas na teoria da amostragem
Notação e linguagem comum
No módulo anterior, estudamos as propriedades da AAS com e sem reposição e a quantidade de amostras
possíveis em cada caso. A partir de agora, vamos conhecer a distribuição amostral e utilizar essa amostra
selecionada para efetuar várias estimativas.
Dica
Utilizamos o termo estimação, pois estamos trabalhando com uma amostra. 
Nosso objetivo sempre é encontrar valores que possam refletir nossa população. Porém, ao fazer uma
amostra, nunca conseguiremos encontrar o verdadeiro valor populacional, e sim uma estimação dele.
Queremos que seja o mais próximo possível, mas ainda assim não será o valor exato.
 
Neste módulo, analisaremos então a distribuição amostral e as técnicas de estimação para uma seleção por
amostragem aleatória simples com e sem reposição.
 
A partir de agora, precisamos definir algumas outras notações importantes, pois começaremos a utilizar
algumas fórmulas com várias variáveis para encontrarmos as quantidades de interesse (um total ou média, por
exemplo). Na amostragem, costuma-se usar a seguinte notação ou simbologia:
Universo ou População ou Cadastro de seleção (N)
É a lista de unidades de onde a amostra é selecionada.
Amostra (n)
É o conjunto de unidades que selecionamos para observar.
Parâmetro
É uma característica fixa e desconhecida da população a qual se tem interesse em estudar. Os
parâmetros representam quantidades numéricas que podem ser interpretadas pelo pesquisador, por
exemplo: Média, proporção, variação, taxa de crescimento, totais etc.
Estimador
É expressão matemática do processo de cálculo das estimativas.
Estimativa
É o valor calculado a partir dos dados obtidos pela amostra para se estimar o valor desconhecido do
parâmetro.
Além disso, temos também:
 
As letras gregas e as letras latinas maiúsculas representam parâmetros da população.
 
Letras latinas minúsculas para representar as características na amostra.
 
Veja um exemplo de média populacional:
Veja um exemplo de média amostral:
Perceba as diferenças nas fórmulas acima:
Na população, usamos Y e N (maiúsculos) e na amostra temos y e n (minúsculos). Outros exemplos:
Distribuição amostral
Seja a representação genérica de um elemento de ordem i na amostra em relação a alguma variável .
Naturalmente, a amostra de elementos é formada pelo subconjunto .
• 
• 
Letras gregas ou letras latinas maiúsculas 
Usaremos quando nos referirmos a um
parâmetro da população.
Letras latinas minúsculas 
Usaremos quando estivermos
interessados na amostra.
População: Média Variância Total Amostra: Média Variância 
Total 
Dica
Com esses valores de , que correspondem ao valor de cada unidade selecionada para a amostra, pode-
se obter uma distribuição de frequências e, a partir dela, calcular as estatísticas. 
Define-se como distribuição amostral a distribuição de frequências que se pode formular com os n valores 
correspondentes aos respectivos elementos.
Resumindo
Tal distribuição nada mais é do que criar uma tabela com todas as opções de respostas referentes
àquelas amostras selecionadas. 
No nosso exemplo da Tabela 1, quando podem-se formar amostras. Vamos exibir somente 3
das 220 combinações na Tabela 2, algumas dessas são:
AMOSTRAS VALORES DE xi (Rendas) TOTAL (t) MÉDIA
(ABC) (1 300, 6 300, 3 100) 10 700 3 567
(ABD) (1 300, 6 300, 2 000) 9 600 3 200
(JLM) (900, 4 800, 1 900) 7 600 2 533
..... ............................ .... ....
Tabela 2: Exemplo de totais e médias a partir de algumas amostras selecionadas.
Observa-se que cada amostra possui uma distribuição de frequência própria formada pelos elementos que a
constitui, gerando estatísticas distintas. Assim, cada amostra que você selecionar apresentará um total
diferente, uma média diferente, uma variância diferente. Isso, em geral, só é um problema quando a amostra
for muito pequena, pois conforme o tamanho for aumentando, os resultados tornam-se mais precisos.
 
Cada amostra de tamanho n possui sua própria distribuição de amostra. Como o espaço amostral contém S
amostras, portanto S distribuições de frequências, então a totalidade das S distribuições de frequências
geram uma única distribuição, que é definida por distribuição de amostragem. Vamos estudar abaixo a
distribuição amostral média.
Distribuição amostral da média
Cada amostra tem sua média, consequentemente, o conjunto de várias amostras geram uma distribuição de
frequências das médias. A essa distribuição de frequências damos o nome de distribuição amostral da
média, cuja média amostralé idêntica à média da população.
 
Vimos no exemplo da indústria que se podem formar com as pessoas inúmeras amostras de
tamanho n. Na tabela 3, temos as distribuições da renda média correspondentes aos diversos espaços
amostrais formados por amostras de tamanho .
CLASSES DE RENDA MÉDIA,
ESTIMADA ATRAVÉS DA AMOSTRA
(R$1,00)
DISTRIBUIÇÃO DOS ESPAÇOS AMOSTRAIS DE
TAMANHO n
n=1
 
n=2
 
n=3
 
n=4
 
n=5
 
n=6
 
n=7
 
800 |----------- 1200 ....
1 1 - - - - -
1200 |----------- 1400 ....
1 2 3 1 - - -
1400 |----------- 1600 ....
1 5 10 11 7 1 -
1600 |----------- 1800 ....
- 6 15 25 25 16 6
1800 |----------- 2000 ....
2 5 20 42 55 50 27
2000 |----------- 2200 ....
1 6 22 50 78 84 61
2200 |----------- 2400 ....
1 6 22 52 90 109 98
2400 |----------- 2600 ....
- 6 19 52 101 139 136
2600 |----------- 2800 ....
1 3 17 49 108 151 150
2800 |----------- 3000 ....
- 4 16 57 101 133 130
3000 |----------- 3200 ....
1 3 16 46 81 107 108
3200 |----------- 3400 ....
- 3 16 38 61 79 62
3400 |----------- 3600 ....
- 2 13 26 46 43 14
3600 |----------- 3800 ....
1 2 10 21 27 12 -
3800 |----------- 4000 ....
- 3 7 11 10 - -
4000 |----------- 4200 ....
- 3 4 10 2 - -
4200 |----------- 4400 ....
- 2 6 3 - - -
CLASSES DE RENDA MÉDIA,
ESTIMADA ATRAVÉS DA AMOSTRA
(R$1,00)
DISTRIBUIÇÃO DOS ESPAÇOS AMOSTRAIS DE
TAMANHO n
n=1
 
n=2
 
n=3
 
n=4
 
n=5
 
n=6
 
n=7
 
4400 |----------- 4600 ....
- 1 1 1 - - -
4600 |----------- 4800 ....
- 1 2 - - - -
4800 |----------- 6400 ....
2 2 1 - - - -
Quantidade de amostras possíveis 12 66 220 495 792 924 792
Média de todas as amostras 2675 2
675
2
675
2
675
2
675
2
675
2
675
Tabela 3: Todas as estimativas possíveis da renda média provenientes de amostras sem reposição da
população de 12 pessoas.
Cada amostra possibilita uma estimativa da renda média, e para cada tamanho de amostra, a média das
rendas médias estão indicadas na última linha da tabela, que necessariamente são todas iguais à renda média
da população em estudo.
Atenção
Se você fizer a renda média da população (somar os 12 valores dos indivíduos e dividir por 12) vai
encontrar R$ 2675,00. Perceba que todas as amostras utilizadas apresentam as médias de suas
amostras também iguais a R$ 2675,00. Isso mostra como a média amostral pode ser utilizada para
estimar a média populacional. 
Outros resultados importantes da tabela 3
A distribuição de frequências das médias das amostras tem como limite inferior o valor R$ 800,00, enquanto o
limite superior é R$ 6.400,00 com a amplitude total de R$ 5.600,00 (6400 - 800).
 
A amostra de tamanho n = 2 formada pelas pessoas D e E tem a estimativa de renda média igual a:
Esta renda média está próxima à classe (2600 - 2800) que contém a renda média da população.
Do mesmo modo, a amostra formada pelas pessoas B, C, E, L estima a renda média em:
Sendo a única das amostras de tamanho dentre as 495 amostras possíveis cuja estimativa de renda
média está contida na classe (4400 - 4600).
 
Comparando-se as sete distribuições de amostragem da renda média correspondentes aos tamanhos de
amostras destacam-se as observações:
 
À medida que o tamanho da amostra aumenta, maior é a tendência das médias das amostras se
concentrarem em torno da classe (2600 - 2800) que contém a média verdadeira da população igual a
R$ 2.675,00. Infere-se que a estimativa se aproxima mais do valor verdadeiro com o aumento de
tamanho da amostra.
 
Quanto maior for o tamanho da amostra, maior é a tendência da distribuição das médias das amostras
se aproximar da distribuição normal. Observa-se que a distribuição de amostragem das médias para 
 é mais próxima da distribuição normal do que no caso de .
Mas o que é a distribuição Normal?
Na estatística, chamamos de distribuição toda função de probabilidade que define uma curva (gráfico), e a
área abaixo desse gráfico nos mostra a probabilidade de acontecer algum evento relacionado a ela. Imagine a
situação na qual você receba uma série de dados para analisar, porém, como não investigou tais dados, aquilo
ainda é algo completamente desconhecido para você.
Não seria interessante se soubesse como aqueles dados se comportam? E não seria melhor ainda
se, ao saber como aqueles dados se comportam, você tivesse alguma referência já consolidada com
propriedades e fórmulas matemáticas bem definidas? É por isso que usamos distribuições
estatísticas.
Se conseguirmos ajustar essas distribuições em nossos dados, saímos do Universo desconhecido e passamos
a "pisar" em solos mais conhecidos. Existem diversas distribuições estatísticas na literatura, algumas usadas
apenas em casos muito específicos e outras usadas todo o tempo. Veremos o caso da mais conhecida, que é
praticamente a base de todas as outras.
 
A distribuição Normal, ou também chamada de Gaussiana, é a curva mais utilizada, mais famosa e mais
importante entre as distribuições estatísticas. A função 01D453
01D
465( ), abaixo, que determina se uma variável
aleatória segue uma distribuição normal é um pouco complicada, porém não precisamos nos preocupar em
calcular essas contas, pois os valores já foram calculados e distribuídos em uma tabela. Esses valores
tabelados serão usados, por exemplo, quando formos calcular os tamanhos de amostra.
Onde: 
• 
• 
 
 é a média populacional.
 
 é a variância populacional.
 
 pode apresentar qualquer valor.
 
O formato da curva normal lembra um sino (veja abaixo) e os valores em torno da média têm maior
probabilidade de ocorrerem, e conforme vai se afastando e se aproximando das caudas, a quantidade de
observações diminui. Sabe aquela expressão muito utilizada: "Fulano é um ponto fora da média"? Significa que
ele está longe da média geral, pode ser algo bom ou ruim, depende da variável em estudo.
Curva da distribuição Normal. 
Agora fica fácil observar a tabela 2 com as distribuições amostrais e perceber que conforme o tamanho da
amostra aumenta, os dados se aproximam de uma distribuição normal (tente ver a tabela de lado, veja como
os dados se concentram mais no meio da tabela). Isso é algo realmente útil, porque podemos trabalhar nossos
dados a partir de uma distribuição já conhecida, com propriedades e expressões bem definidas.
Estimação
O principal propósito da inferência é proporcionar, através de uma amostra, estimativas válidas de parâmetros
na população. Assim, a partir de dados amostrais, usaremos diversas expressões para encontrar estimações
sobre as quantidades de interesse (médias, totais, variâncias e outras estatísticas) e podermos generalizar a
informação da amostra para a população da qual foi tirada.
 
Como não temos acesso aos verdadeiros valores das variáveis populacionais, temos de usar a amostra para
estimar tais variáveis. Através do estudo da distribuição de amostragem de cada estatística são elaborados os
estimadores.
• 
• 
• 
Dica
Por notação, o acento circunflexo indica que se trata de um estimador, e o asterisco (*) denota um
estimador tendencioso. Além da estimação daquela variável de interesse, temos de pensar na estimação
de sua variância também. 
Variância, desvio padrão e coeficiente de variação
A variância é uma medida de dispersão que mede a variabilidade, ou seja, mostra como cada valor está
distante do valor central dos dados, ou seja, da média.
Dica
Quanto menor o valor da variância, mais próximos os dados estão da média. 
A variância é uma medida quadrática, assim não tem uma interpretação tão simples, já que apresenta seu
resultado na unidade de medida ao quadrado da variável original. A variância populacional é denotada por σ² e
estimada com dados da amostra por s². Já o desvio padrão é calculado pela raiz quadrada da variância e, por
isso, é expresso na mesma unidade de medida das variáveis.
Quanto mais uniforme forem os valores, mais próximo de zero estará o desvio padrão. Quando todos
os valores são iguais, o desvio padrão é zero. Assim, a amostra é perfeitamente uniforme.
A variância amostral é estimada por:
Para encontrar o desvio padrão basta fazer:Na tabela 1 estimamos a renda (em reais) dos trabalhadores. Vamos supor que a variancla calculada seja
igual 900 reais . 0 que significa reais ? Acho que ninguém sabe, porque reais não tem muito sentido,
não tem uma interpretação prática. Porém, ao retirar a raiz de 900 reais , encontramos 30 reais
(pois também tiramos raiz do reais²). Agora, sim, conseguimos uma interpretação prática do resultado, ou
seia, um desvio padrấo de 30 reais significa que os dados estão distantes da média em aproximadamente 30
reais.
 
Quanto menor a variância e, consequentemente, o desvio padrão, mais homogêneos são os dados.
 
Logo em seguida, usaremos para estimar algumas variâncias dos nossos estimadores. Nesse caso, ao
calcular a raiz quadrada da variância, não chamaremos mais de desvio padrão, e sim, de erro padrão.
 
O cálculo é o mesmo, porém, ao se trabalhar com estimadores, chamamos a raiz da variância de erro padrão,
ao invés de desvio padrão, assim, para a média, teremos:
Dessa forma, o erro padrão da estimativa fornece interpretações práticas melhores do que se trabalhar
somente com a variância.
 
Outra medida muito utilizada é o coeficiente de variação (CV). Ele representa uma dispersão relativa entre o
desvio padrão (ou erro padrão) e a média. Assim, podemos comparar duas estimativas e verificar qual delas é
mais variável. O CV populacional da média é dado por: 
Porém, ao usar a amostra, faremos o CV amostral da média com:
Estimação da média populacional
A partir de uma amostra, podemos estar interessados em estimar a média populacional de alguma variável .
Por isso, usaremos a média amostral como um estimador não tendencioso da média populacional.
 
A média populacional é um parâmetro que queremos estimar e utilizamos letras gregas e maiúsculas para
representá-las. Já para a amostra, utilizamos letras minúsculas.
 
Além disso, para ambos os casos, sem e com reposição, as fórmulas são as mesmas.
 
Média populacional:
Estimador da média populacional sob AAS com e sem reposição:
Exemplo da estimação da média populacional
Imagine uma pesquisa que queira avaliar a média de funcionários de 200 empresas comerciais de uma cidade.
Nesse caso, você faz uma amostra de 20 empresas por AAS e encontra o seguinte resultado:
Número de Empresas
4 3 5 6 2
Número de Funcionários
3 4 2 1 7
Tabela 4: Número de empresas e de funcionários de uma pesquisa de comércio.
Chave de resposta
4 empresas disseram ter 3 funcionários, 3 empresas disseram ter 4 funcionários e assim, sucessivamente.
Fazendo a média amostral de funcionários com a fórmula:
Temos:
Deste modo, a estimação da média populacional é de 2,7 funcionários por empresa. O resultado verdadeiro
poderia e provavelmente deve ser um pouco diferente desse valor. Essa diferença encontrada entre a
estimativa e o verdadeiro valor populacional é o que chamamos de erro amostral ou erro da estimação. O
erro amostral é o "preço que se paga" por fazer uma amostra em vez do censo, ou seja, é a diferença entre
a estimativa amostral e o parâmetro populacional.
Estimação do total populacional
Outra medida que podemos estar interessados em estimar refere-se ao total populacional. O total é uma
variável muito utilizada na prática e o total populacional T é dado por:
Ainda na Tabela 3, podemos estar interessados agora em estimar o total populacional. Se formos utilizar o
mesmo critério da média amostral, bastaria fazermos o total amostral. O resultado seria:
Um total de 17 funcionários estimados para 200 empresas é muito pouco, não acha? Nesse caso, chamamos
t* de um estimador viesado (ou viciado ou tendencioso) do total populacional. Para resolver esse problema,
precisamos realizar um ajuste nessa expressão. Assim, o estimador não viesado do total populacional para
AAS, tanto no caso sem reposição, quanto com reposição, é dado por:
 
Estimador do total populacional sob AAS com e sem reposição:
Chave de resposta
Para encontrar o estimador não viesado do total populacional, basta então multiplicar o valor do total
populacional pela média amostral. Assim, no exemplo temos:
Um valor muito mais factível, não é mesmo? Portanto, usaremos t e não t* para estimar o total
populacional.
Estimação da variância do estimador da média
populacional
Uma medida também muito importante é a estimação da variância. Ela representa a precisão com a qual o
estimador atinge o parâmetro verdadeiro.
Relembrando
Não encontramos a variância verdadeira, e sim sua estimação. 
Logo teremos a estimação da variância para as quantidades de interesse. E depois, poderemos tirar sua raiz
quadrada e encontrar o erro padrão. Primeiro, faremos para a média populacional. Porém, diferente dos casos
anteriores, teremos expressões diferentes se a AAS for com ou sem reposição. O nome completo é extenso e
parece estranho, mas como são estimativas, temos que estimar a variância de algo que já foi estimado antes.
Portanto, chamamos de:
Estimador da variância do estimador da
média populacional para AAS com
reposição
Estimador da variância do estimador da
média populacional para AAS sem
reposição
Na qual em ambos os casos precisamos encontrar primeiro:
Voltando ao nosso exemplo, vamos fazer a estimação da variância do estimador da média populacional para
uma amostra AAS sem reposição. Pela expressão, temos:
Precisamos encontrar . Logo, fazemos: 
como segue que:
 
Dica
Você pode utilizar um software ou uma calculadora para auxiliá-lo nesses cálculos. Por sorte, vários
softwares calculam rapidamente. 
Agora, podemos obter . Assim:
O erro padrão é de
Logo, o erro médio da estimativa da média populacional dessa amostra é de cerca de 0,4 funcionários (para
mais ou menos).
Estimação da variância do estimador do total populacional
Da mesma forma que fizemos para estimação da variância na média, podemos fazer para o total. Assim,
teremos a estimação da variância para o estimador do total populacional. Nesse caso, teremos novamente
expressões diferentes baseados na seleção de AAS com e sem reposição. Portanto:
Estimador da variância do estimador de
total populacional para AAS com
reposição
Estimador da variância do estimador de
total populacional para AAS sem
reposição
Na qual em ambos os casos:
Novamente, para a tabela 3 faremos:
Assim, o erro padrão é de:
Logo, o erro de estimação médio do total populacional dessa amostra é de cerca de 77 funcionários nas
empresas (para mais ou menos).
 
Assista ao vídeo para entender os pontos mais importantes do módulo.
Conteúdo interativo
Acesse a versão digital para assistir ao vídeo.
Verificando o aprendizado
Questão 1
Duas amostras foram selecionadas em diferentes anos para avaliar o peso da população de uma cidade. A
primeira amostra (A) apresentou média com a segunda amostra (B) apresentou média
de com . Comparando as duas amostras, qual delas é mais homogênea?
A
A amostra B apresenta CV = 0,75 e a amostra A apresenta CV = 1,01, logo a amostra B é mais homogênea.
B
A amostra B apresenta CV = 0,09 e a amostra A apresenta CV = 0,11, logo a amostra B é mais homogênea.
C
A amostra B apresenta CV = 0,98 e a amostra A apresenta CV = 1,32, logo a amostra A é mais homogênea.
D
A amostra B apresenta CV = 8,88 e a amostra A apresenta CV = 10,62, logo a amostra A é mais homogênea.
A alternativa B está correta.
Para comparar duas amostras, precisamos de uma medida relativa, no caso, o coeficiente de variação.
Assim,
Portanto, a amostra B tem menor CV e é mais homogênea.
Questão 2
Suponha uma população com N = 50 alunos de uma escola e que uma amostra de n = 7 indivíduos foi retirada
e avaliada a idade em anos. Os resultados foram 15, 16, 15, 14, 16, 15, 14. Qual a estimativa da idade média e
do erro padrão dessa estimativa supondo uma AAS com reposição?
A
 e 
B
 e 
C
 e 
D
 e 
A alternativa B está correta.
Você entendeu o conceito de estimação do erro padrão da estimativa da média populacional!
Na questão, temos que o tamanho amostral é selecionada por AAS com reposição e o tamanho
populacional é .A estimação da média populacional é dada por:
Já a estimação da variância da estimativa da média é dada por:
Precisamos encontrar Logo, fazemos:
Portanto,
3. Aspectos importantes sobre o tamanho da amostra
Estimação de proporções
Vimos, no módulo anterior, como estimar quantidades de interesse em uma pesquisa, como totais e médias
por exemplo. Além disso, observamos como estimar a variância para essas estimativas.
 
Neste momento, abordaremos um assunto muito interessante e útil na prática: o dimensionamento do
tamanho de amostra para as seleções realizadas por meio da amostragem aleatória simples. E, ainda, como
executar as estimações para variáveis do tipo proporção.
 
A variável qualitativa é outra variável de muito interesse em uma pesquisa. Numa variável desse tipo, não
podemos fazer os mesmos cálculos utilizados em variáveis quantitativas. Faremos então sua proporção.
Comentário
Não é difícil observar, em alguns estudos, resultados informando a proporção de indivíduos com
determinada característica, como, por exemplo, a proporção de empresas que paralisaram suas
atividades no período da pandemia em 2020. 
A variável proporção é definida como o número de unidades de certa população com determinada
característica, dividido pelo total de unidades dessa mesma população.
Dica
O denominador é sempre o número de unidades da população e o resultado da proporção está sempre
entre 0 e 1, podendo ser representado em porcentagem. 
Nosso interesse aqui é estimar a proporção de unidades da população que pertencem a determinada
categoria.
Exemplo
Proporção de alunos do sexo feminino em uma escola. Proporção de fumantes na população. Percentual
de peças defeituosos em um lote. 
Nas variáveis de proporção, recebe valor 1 se as unidades possuem aquela característica e 0 caso
contrário:
Com os valores de , podemos estimar a proporção populacional a partir de uma AAS sem reposição,
lembrando que, ao trabalhar com amostras, usamos apenas as fórmulas com ^ em cima da variável, as outras
se referem aos dados populacionais:
Proporção populacional Estimador da proporção populacional
(Proporção amostral)
Variância do estimador da proporção Estimador da variância do estimador da
proporção
Erro padrão do estimador da variância do
estimador da proporção
Pelas expressões acima, você pode perceber que a proporção se comporta como se fosse uma média, no
entanto, ao invés de somar os valores das variáveis, soma-se os para cada indivíduo e depois divide-
se pelo total.
 
Vamos entender como essas estimações são feitas na prática com o seguinte exemplo:
 
Suponha uma população de pessoas em que se saiba previamente que 100 sejam canhotas.
Nossa proporção populacional de pessoas canhotas seria: . Um estudo novo
deseja investigar se há diferenças na capacidade de aprendizado entre destros e canhotos.
 
Logo, uma amostra sob AAS sem reposição de pessoas é realizada. Após a coleta dos dados,
obtivemos que 8 delas eram canhotas, nossa proporção amostral de pessoas canhotas seria, então: 
. Essa diferença é completamente natural, já que selecionamos uma amostra para
investigar alguma característica da população, assim o valor dificilmente será igual. Essa diferença é o que
falamos no módulo anterior e chamamos de erro de estimação.
Chave de resposta
Para encontrarmos a estimativa da variância do estimador dessa proporção fazemos:
Encontrando o erro padrão dessa estimativa, temos um erro pequeno:
Tamanho da amostra
O tamanho mínimo de uma amostra é um questionamento muito comum toda vez que alguém deseja
selecionar uma amostra para se fazer uma estimação.
Comentário
O conhecimento popular diz que quanto maior é a população, maior deve ser a amostra. Isso não está
exatamente errado, porém não é uma verdade absoluta. 
Quando você vai experimentar o tempero de uma comida, o que você faz? Você pega uma colher, mexe a
panela e prova. Faz diferença se a panela é pequena ou se é um caldeirão? Não faz. Está vendo como o
tamanho populacional não influencia diretamente o tamanho amostral? Mas o que influencia então?
 
Para começarmos a compreender o porquê de isso acontecer, precisamos ter bem claro o conceito de que o
tamanho da amostra não é linear. Assim, uma população maior não quer dizer necessariamente uma amostra
maior.
Resumindo
A homogeneidade ou heterogeneidade da população é o mais importante. Se o objetivo é entrevistar
consumidores sobre um tema amplo, é possível que haja muita variabilidade e a amostra seja maior.
Todavia, se a população for mais homogênea, então sua variabilidade será menor e o tamanho da
amostra poderá ser menor. 
A Figura 3 mostra exatamente esse conceito, pois não necessariamente uma população maior terá uma
amostra maior. O gráfico que relaciona as duas grandezas não é uma função do 1° grau (a), assemelha-se
antes a uma função raiz quadrada (b).
Comparação tamanho da amostra e população/ a) Função linear b) Função raiz. 
O mais importante em uma população não é exatamente o seu tamanho, e sim a sua variabilidade. Se a
população for muito semelhante entre si, não precisamos coletar uma amostra tão grande, pois todos
apresentam características ou opiniões similares.
Exemplo
Em uma sopa, ao mexer a panela com uma colher, você homogeniza todo o tempero. Logo, provando
apenas uma colher, você consegue perceber se está salgada ou não. O mesmo acontece com o exame
de sangue, não é necessário retirá-lo por completo para realizar a análise, somente uma pequena
amostra é necessária, pois a população (no caso seu sangue) é homogênea. Então, precisamos nos
preocupar muito mais se a população de interesse é muito ou pouco heterogênea ao invés de olhar
simplesmente para seu tamanho. 
De acordo com Bolfarine (2005), é importante utilizar pesquisas anteriores, caso existam, ou uma amostra
teste para se ter algum conhecimento a priori da variabilidade da população (σ²). Em muitas situações, a
amostra teste pode fornecer uma boa informação para um estimador da variância populacional. Em outros
casos, pesquisas amostrais anteriores podem também fornecer estimativas iniciais satisfatórias a respeito de
σ².
Dica
Mas qual deve ser o tamanho mínimo de uma amostra?Antes de começar a planejar uma pesquisa e seu
tamanho amostral, deve-se verificar qual orçamento disponível. Não adianta executar todos os cálculos
amostrais e depois descobrir que não há dinheiro para isso. 
No cálculo amostral, tudo deve ser levado em consideração no financeiro, pois os custos por questionário
coletado podem ser elevados. Assim, em geral, na prática calculamos o tamanho de amostra com diversos
valores de erros e deixamos a cargo do mandante da pesquisa decidir.
Recomendação
No mundo real não é recomendado efetuar o cálculo apenas para um valor de erro, mas, sim, oferecer
vários cenários para o contratante analisar e comparar. 
Para resolver essa questão, precisamos estabelecer um tamanho mínimo amostral de acordo com o nível de
precisão que desejamos, além de duas variáveis para fazer essa precisão:
 
E: Distância máxima tolerável entre a estimativa feita e o verdadeiro valor do parâmetro (erro absoluto
aceitável).
 
α: Probabilidade de que essa distância seja maior do que o valor de E. O mais comum é um α (alfa) de
5%, assim, nesse caso, temos um nível de confiança da pesquisa de 95% (no caso da distribuição
normal Z temos um valor de Z = 1.96).
 
O melhor dos mundos é sempre termos os recursos disponíveis para se calcular o tamanho amostral sem
restrições orçamentárias. O cálculo do tamanho da amostra é o mesmo quando se quer estimar a média ou o
total de alguma variável, bem como utilizando-se o erro absoluto ou o erro relativo. Veremos a seguir as
fórmulas para se calcular o tamanho da amostra quando admite-se o custo livre.
Tamanho da amostra para estimar a média e o total populacional sob AAS
Se nosso objetivo é estimar algum total ou média populacional, utilizaremos a seguinte fórmula para encontrar
o tamanho da amostra:
Quando o tamanho da população formuito grande ou não tivermos seu valor, por ser considerada infinita,
podemos usar simplesmente:
• 
• 
Onde:
 
 é o tamanho da amostra.
 
 é o múltiplo do desvio padrão, encontrado na tabela da distribuição Normal.
 
 é o tamanho da população.
 
 é a variância do parâmetro a ser pesquisado.
 
 é o erro absoluto admitido.
Deseja-se estimar o consumo médio mensal de energia elétrica de domicílios de uma grande cidade. Se
fixarmos o erro máximo de 5kWh e o nível de confiança em 95%, qual seria o tamanho mínimo de amostra
considerado AAS?
Chave de resposta
Uma estimativa do desvio padrão populacional foi feita anteriormente e o resultado foi de s = 70kWh.
Em problemas desse tipo, podemos não ter o total populacional, ou considerar seu tamanho como muito
grande. Foi dado, também, um nível de confiança de 95%, e a tabela normal nos mostra um valor de
Z95%=1,96. Assim, podemos fazer:
Nesse caso, sempre arredondamos o tamanho amostral para cima. Logo, o tamanho de amostra
necessário seria de 753 domicílios.
Tamanho da amostra para estimar uma proporção sob AAS
O tamanho amostral de uma seleção por AAS para uma variável do tipo de proporção é dado por:
• 
• 
• 
• 
• 
Se a população for muito grande ou considerada infinita faremos:
Onde:
 
 é o tamanho da amostra.
 
 é o múltiplo do desvio padrão.
 
 é a proporção da variável.
 
 é o erro absoluto desejado.
Tamanho de amostra para estimar proporções com a proporção
desconhecida
Quando a proporção P for totalmente desconhecida e não for possível efetivar nenhuma hipótese sobre seu
valor, usaremos sempre P = 0,5, pois esse é um valor que maximiza a sua variância. Olhe com atenção para a
parte da expressão que envolve a proporção, temos P(1-P).
Atenção
Note que isso é uma função quadrática, ou seja, uma parábola com concavidade negativa. Assim, tem
um ponto de máximo. 
Se resolvermos essa equação, teremos P = 0,5. Por isso, em situações em que não sabemos P, faremos ele
igual a meio.
• 
• 
• 
• 
Valores dos valores possíveis de P.
Assim, o tamanho máximo de amostra AAS para estimar qualquer proporção P com certo erro d e P = 0,5 é
dado por:
Essa forma de calcular o tamanho de amostra é chamada de conservadora dentro da amostragem, pois com
qualquer outro valor de P o valor da amostra seria menor. Assim, estamos utilizando o maior tamanho de
amostra possível, já que não conhecemos a proporção populacional.
 
Veja no vídeo a explicação dos pontos mais importantes do módulo.
Conteúdo interativo
Acesse a versão digital para assistir ao vídeo.
Verificando o aprendizado
Questão 1
Uma pesquisa, ainda na fase de planejamento, avaliará algumas variáveis sobre a proporção de empresas que
aderiram a um novo programa de incentivo do governo. Qual o tamanho de amostra necessário, assumindo
uma precisão de 3% e uma confiança de 95%?
A
n = 230
B
n = 1745
C
n = 978
D
n = 1067
A alternativa D está correta.
Como estamos interessados em estimar o tamanho de amostra de uma proporção e não temos informação
nenhuma sobre o parâmetro da proporção populacional, iremos utilizar . Assim, fazemos:
Dessa forma, arredondando para cima, 1068 empresas precisam ser coletadas para satisfazer as condições
da pesquisa.
Questão 2
O município do Rio de Janeiro deseja estimar qual o número de famílias que residem em "casas alugadas", o
valor médio do aluguel e outros dados relacionados ao problema de residir em "casa alugada". Qual o tamanho
da amostra necessário para dar essas informações, sabendo-se que esse bairro possuía 60.000 famílias, e
que a proporção de "casas alugadas" em 1980 era de 20%? Admite-se resolver o problema com erro relativo E
= 0,05 e coeficiente de confiança de 95%.
A
n = 676 famílias.
B
n= 345 famílias.
C
n = 503 famílias.
D
n= 406 famílias.
A alternativa A está correta.
Como estamos interessados em estimar o tamanho de amostra de uma proporção com N = 60000 e
estimativa p = 20% = 0,2 , fazemos
Arredondando para cima, encontramos o tamanho amostral de 676 famílias para essa pesquisa.
4. Conclusão
Considerações finais
Ao longo dos módulos, foi possível compreender mais sobre os métodos iniciais de seleção de amostras, suas
estimações e cálculos de seu tamanho. Inicialmente, discutimos os conceitos fundamentais da amostragem
aleatória simples com e sem reposição, desde a discussão das probabilidades de seleção até o cálculo das
quantidades de amostras possíveis de serem obtidos por cada um dos métodos.
 
No segundo módulo, apresentamos as ferramentas estatísticas de estimação das quantidades de interesse.
Aprendemos como estimar um total e uma média a partir de uma amostra e como esses resultados podem
não ser exatamente iguais aos da população devido ao erro de estimação. Além disso, aprendemos a calcular
tais erros, utilizando estimativas de variância das estimativas que já haviam sido calculadas.
 
Por fim, investigamos a estimação de proporções, já que em determinadas pesquisas o foco em variáveis
qualitativas é muito maior do que em variáveis quantitativas. Vimos, ainda, o cálculo do tamanho da amostra
necessário para se fazer as estimações, tópico importante e de muita utilidade prática.
 
Dito isso, temos certeza de que, ao chegar ao fim deste tema, você conseguiu utilizar a amostra aleatória
simples para fazer a seleção amostral e estimação das variáveis de interesse.
Podcast
Ouça o podcast sobre os métodos de amostragem.
Conteúdo interativo
Acesse a versão digital para ouvir o áudio.
Explore+
Para saber mais sobre os assuntos tratados neste tema, pesquise:
 
Determinação do tamanho de uma amostra, material publicado na revista eletrônica, no Portal da
Organização Ciências e Cognição.
Referências
BOLFARINE, H.; BUSSAB, W. O. Elementos de Amostragem. São Paulo: Blucher, 2005.
BONAFINI, C. F. Probabilidade e Estatística. São Paulo: Pearson Education do Brasil, 2015.
 
COCHRAN, W. G. Sampling Techniques, third edition. New York: John Wiley & Sons, 1977.
 
FERREIRA, V. A. M. Análise Estatística. Rio de Janeiro: Estácio, 2015.
• 
 
JESSEN, R. J. Statistical Survey Techniques. New York: Wiley, 1978.
 
LARSON, R.; FABER, B. Estatística Aplicada. 4. ed. São Paulo: Pearson, 2009.
 
LOHR, Sharon. Sampling: Design and Analysis. 2nd edition. Duxbury Press, 2010.
 
MORETTIN, P. A.; BUSSAB, W. de O. Estatística Básica: Probabilidade e Inferência, volume único. São Paulo:
Pearson Prentice Hall, 2010.
 
PFEFFERMANN, D.; RAO, C. R. Handbook of Statistics 29A: Sample Surveys: Design, Methods and
Applications. D. Pfeffermann; C. R. Rao, (eds.). Amsterdam: NorthHolland, p. 698.
 
R CORE TEAM. R: A language and environment for statistical computing. R Foundation for Statistical
Computing, Vienna, Austria, 2020.
 
SARNDAL, C. E.; SWENSSON, B.; WRETMAN, J. Model assisted survey sampling. Nova York: Springer-Verlag,
1992.
	Métodos introdutórios de amostragem
	1. Itens iniciais
	Propósito
	Preparação
	Objetivos
	1. Tipos de seleção por Amostragem Aleatória Simples
	Conceitos sobre Amostragem Aleatória Simples (AAS)
	Resumindo
	Exemplo
	Diferenças práticas de seleções com e sem reposição
	Mega-Sena
	Bingo
	Comentário
	Método de seleção das unidades
	Resumindo
	Comentário
	Probabilidade de seleção
	Exemplo
	Atenção
	Espaço amostral
	Exemplo
	Combinação
	Atenção
	No caso de seleção sem reposição
	No caso de seleção com reposição
	Comparação entre AAS sem e com reposição
	Exemplo
	Atenção
	Conteúdo interativo
	Verificando o aprendizado
	2. Notações utilizadas na teoria da amostragem
	Notação e linguagem comum
	Dica
	Universo ou População ou Cadastro de seleção (N)
	Amostra (n)
	Parâmetro
	Estimador
	Estimativa
	Distribuição amostral
	Dica
	Resumindo
	Distribuição amostral da média
	Atenção
	Outros resultados importantes da tabela 3
	Mas o que é a distribuição Normal?
	Estimação
	Dica
	Variância, desvio padrão e coeficiente de variação
	Dica
	Estimação da média populacional
	Exemplo da estimação da média populacional
	Estimação do total populacionalEstimação da variância do estimador da média populacional
	Relembrando
	Estimador da variância do estimador da média populacional para AAS com reposição
	Estimador da variância do estimador da média populacional para AAS sem reposição
	Dica
	Estimação da variância do estimador do total populacional
	Estimador da variância do estimador de total populacional para AAS com reposição
	Estimador da variância do estimador de total populacional para AAS sem reposição
	Conteúdo interativo
	Verificando o aprendizado
	3. Aspectos importantes sobre o tamanho da amostra
	Estimação de proporções
	Comentário
	Dica
	Exemplo
	Proporção populacional
	Estimador da proporção populacional (Proporção amostral)
	Variância do estimador da proporção
	Estimador da variância do estimador da proporção
	Erro padrão do estimador da variância do estimador da proporção
	Tamanho da amostra
	Comentário
	Resumindo
	Exemplo
	Dica
	Recomendação
	Tamanho da amostra para estimar a média e o total populacional sob AAS
	Tamanho da amostra para estimar uma proporção sob AAS
	Tamanho de amostra para estimar proporções com a proporção desconhecida
	Atenção
	Conteúdo interativo
	Verificando o aprendizado
	4. Conclusão
	Considerações finais
	Podcast
	Conteúdo interativo
	Explore+
	Referências

Mais conteúdos dessa disciplina