EstApli-U3

•

CEUCLAR

Alexandre Bento

15/06/2020

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Estatística I

56.983 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

EA
D
Teoria da Amostragem
3
1. OBJETIVO
•	 Conhecer	a	teoria	da	amostragem,	identificando	o	erro	amostral,	a	fim	de	compreen-
der	seus	métodos	e	aplicá-los.
2. CONTEÚDOS
•	 Teoria	da	amostragem.
•	 Métodos	de	amostragem.
•	 Erro	amostral.
3. ORIENTAÇÕES PARA O ESTUDO DA UNIDADE
Antes	de	iniciar	o	estudo	desta	unidade,	é	importante	que	você	leia	as	orientações	a	se-
guir:
1)	 Reflita	 sobre	 alguns	 conceitos	 introdutórios	 importantes,	 dando	 atenção	 especial	
àqueles	referentes	à	notação	e	aos	vistos	em	Estatística.
2)	 Utilize	a	padronização	(cálculo	da	variável	Z)	e	a	tabela	da	distribuição	normal	padro-
nizada	(vista	na	Unidade	2),	a	fim	de	aplicar	os	conceitos	de	probabilidade	em	uma	
variável	aleatória.
4. INTRODUÇÃO À UNIDADE
Em	razão	da	dificuldade	em	pesquisar	a	totalidade	dos	dados,	na	prática	utilizamos	amos-
tras	para	representar	os	dados	de	interesse.	A	amostra	deve	ser	representativa	da	população	de	
64 © Estatística Aplicada
origem	e	permitir	que	façamos	uma	generalização	dos	dados	amostrais	para	os	dados	popula-
cionais.
No	estudo	das	variáveis	quantitativas,	os	dados	são	representados	pela	média	e	pelo	des-
vio	padrão.	Já	no	estudo	das	variáveis	qualitativas	(não	numéricas),	os	dados	são	expressos	por	
meio	de	proporções	e/ou	porcentagens.
Mais	uma	vez,	adotaremos	letras	do	alfabeto	grego	para	fazer	referência	a	dados	popula-
cionais	ou	probabilísticos.	Nesta	unidade,	utilizaremos	a	letra	mu	(µ )	para	representar	a	média	
da	distribuição,	a	letra	sigma	(σ )	para	o	desvio	padrão	e	a	letra	teta	(θ )	para	uma	proporção	
populacional.
Um	exemplo	de	estudo	por	amostragem	pode	ser	visto	nas	pesquisas	de	opinião	pública,	
efetuadas	por	profissionais	da	área	que	fazem	previsões	razoavelmente	precisas	de	resultados,	
como	os	das	eleições,	na	qual	são	pesquisadas	poucas	centenas	de	eleitores.
Dessa	forma,	a	simplicidade	que	oferece	a	técnica	de	amostra	também	nos	leva	a	atentar	
sobre	o	cuidado	que	devemos	ter	com	as	formas	de	coleta	de	dados,	pois	uma	coleta	indevida	
pode	resultar	no	insucesso	de	toda	uma	pesquisa.
5. MÉTODOS DE AMOSTRAGEM
O	pesquisador	utiliza	os	métodos	científicos	mais	adequados,	verificando	se	os	elementos	
da	amostra	são	suficientemente	representativos	de	toda	a	população,	de	forma	a	generalizá-la.
Cada	elemento	da	população	tem	a	mesma	chance	de	qualquer	outro	de	fazer	parte	da	
amostra,	denominando-se	método de amostragem aleatório	ou	amostragem	probabilística.
O	uso	de	amostragem	probabilística	permite	a	generalização	dos	resultados	amostrais	para	
a	população,	adotando-se	medidas	probabilísticas	para	o	dimensionamento	do	erro	amostral.
No	entanto,	por	questões	de	conveniência	e	falta	de	interesse	em	estabelecer	resultados	
populacionais,	em	alguns	casos	são	utilizadas	amostragens	não	aleatórias	ou	não	probabilísticas.
Amostras	não	aleatórias
Amostras	não	aleatórias	representam	o	método	mais	comum,	com	base,	exclusivamente,	
no	que	é	conveniente	para	o	pesquisador,	isto	é,	o	pesquisador	escolhe	os	casos	para	aplicá-los	
em	sua	amostra.	Conclui-se	que,	na	aplicação	desse	método,	devemos	ter	cuidado	com	a	carac-
terização	não	científica,	uma	vez	que	os	resultados	podem	ser	direcionados	a	fim	de	que	estes	
sejam	mais	convenientes.
Um	exemplo	de	amostra	não	aleatória	é	a	amostragem	por cotas e por conveniência,	na	
qual	pesquisamos	algumas	características	de	populações,	tais	como	sexo,	classe	social,	idade,	
etnia	etc.,	para	serem	submetidas	ao	processo	de	amostragem,	na	mesma	proporção	em	que	se	
dão	na	população.
Para	compor	a	amostra,	solicitaremos	aos	entrevistadores	que	pesquisem	uma	população	
em	que	38%	são	mulheres	e	62%	são	homens.	Dessa	forma,	se	a	população	é	composta	de	450	
indivíduos,	selecionaremos	171	mulheres	e	279	homens	para	a	amostra.	Neste	caso,	a	escolha	
é	feita	sem	nenhum	critério	científico,	o	que	pode	tendenciar	a	amostragem	e	invalidar	os	re-
sultados.
Outro	tipo	de	amostra	não	aleatória	é	a	amostragem por	julgamento.	Nesse	tipo	de	amos-
tragem,	utilizamos	o	bom	senso,	a	lógica	ou	um	julgamento	bem	fundamentado	para	selecionar	
Claretiano - Centro Universitário
65© U3 - Teoria da Amostragem
uma	amostra	que	seja	representativa	da	população	a	ser	estudada.	Um	exemplo	seria	utilizar	os	
leitores	de	uma	determinada	revista	direcionada	para	a	classe	média	alta	a	fim	de	representar	
essa	classe	social	especificamente.
Amostras aleatórias
Nas	amostras	aleatórias,	 identificamos	todos	os	 indivíduos	da	população,	de	modo	que	
tenham	a	mesma	chance	de	serem	escolhidos	para	compor	a	amostra	ou	que	haja	uma	proba-
bilidade	conhecida	de	serem	selecionados.	Dessa	forma,	fica	patente	que	a	amostra	representa	
a	população,	não	caracterizando	manipulação	dos	resultados.
Entretanto,	com	esse	tipo	de	coleta	podemos	identificar	problemas.	Por	exemplo,	imagine	
uma	lista	completa	de	todos	os	alunos	matriculados	em	uma	grande	universidade,	ou	a	relação	
de	todos	os	moradores	de	uma	grande	cidade.	Como	teremos	certeza	de	que	todos	os	indivídu-
os	da	população	estão	na	lista?
Em	razão	de	dificuldades	dessa	natureza,	existem	diversas	formas	de	se	obter	uma	amos-
tra	aleatória,	de	acordo	com	os	objetivos	da	coleta	de	dados	e	das	características	da	população.
Um	tipo	básico	de	amostra	aleatória	muito	utilizado	é	a	técnica	de	amostragem aleatória 
simples,	que	pode	ser	facilmente	obtida.	Por	exemplo,	quando	se	anotam	os	nomes	de	pesso-
as	em	pequenos	pedaços	de	papel,	colocando-os	em	uma	caixa,	um	chapéu	(grande)	ou	outro	
recipiente.
O	uso	de	uma	tabela	de	números	aleatórios	é	bastante	útil	para	os	pesquisadores	que	
necessitam	de	uma	amostra	aleatória,	conforme	demonstrado	no	Quadro	1.
Quadro 1	Números	aleatórios.
1 2 3 4 5 6 7 8 9 10 11 12
1 2 4 5 8 7 0 2 4 9 0 6 7
2 5 4 3 0 9 4 8 3 4 9 2 7
3 5 2 4 9 3 5 7 1 5 6 8 1
4 2 5 4 3 0 1 9 5 6 7 2 4
5 3 3 5 4 1 4 2 1 4 5 6 3
6 9 6 4 5 8 3 5 5 4 6 8 7
NÚMERO DA COLUNA
N
ú
m
er
o
 d
a 
li
n
h
a
A	tabela	de	números	aleatórios	possibilita	selecionar	uma	amostra	representativa	equi-
valente	à	obtida	pelo	processo	de	tiras	de	papel	colocadas	em	um	recipiente.	Veja,	a	seguir,	um	
exemplo	de	aplicação	desse	método.
Exemplo
Utilizando	o	Quadro	1,	vamos	selecionar	uma	amostra	de	60	indivíduos	em	uma	popula-
ção	de	600	alunos	(matriculados	no	Curso	de	Estatística	do	Ceuclar).
Inicialmente,	vamos	atribuir	números	de	001	a	600	para	todos	os	alunos	do	Curso	de	Es-
tatística.	Aleatoriamente,	o	pesquisador	irá	escolher	na	tabela	um	início	para	a	coleta	de	dados,	
por	exemplo	a	intersecção	da	linha	5	com	a	coluna	1,	caminhando	da	esquerda	para	a	direita,	a	
fim	de	selecionar	os	números	entre	001	e	600.
Os	primeiros	números	que	aparecem	na	coluna	1	e	linha	5	são	3,	3	e	5.	Portanto,	o	primei-
ro	aluno	a	ser	escolhido	é	o	de	número	335.	Em	seguida,	visualizamos	os	números	4,	1	e	4.	Logo,	
66 © Estatística Aplicada
o	segundo	aluno	selecionado	é	o	de	número	414,	e	assim	devemos	repetir	o	processo	até	que	
tenhamos	60	indivíduos	dessa	população	de	600	(alunos).
O	procedimento	de	amostras	aleatórias	simples	é	a	base	para	a	definição	de	diversos	tipos	
de	amostragens	probabilísticas.	Uma	das	mais	comuns	é	a	amostragem aleatória estratificada,	
que	deve	ser	utilizada	quando	a	informação	de	interesse	na	população	se	relaciona	com	suas	
características.
Por	exemplo,	ao	realizar	uma	pesquisa	de	mercado	com	consumidores	de	uma	população,	
para	verificar	a	aceitação	de	uma	novo	modelo	de	aparelho	celular,	devemos	considerar	que	a	
aceitação	pode	ser	influenciada	pelo	gênero	do	consumidor,	pela	sua	renda,	pela	sua	profissão	
etc.
Assim,	ao	selecionarmos,	aleatoriamente,	os	consumidores,	devemos	manter	uma	pro-
porcionalidade	dentro	de	cada	característica	(estrato),	a	fim	de	garantir	a	representatividade.	O	
processo	de	seleção	ou	sorteio	é	facilitado	pelo	trabalho	com	esses	estratos.
Note	que	a	diferença	entre	uma	amostra	estratificada	(probabilística)	e	uma	amostra	por	
cotas	(não	probabilística)	está	na	forma	de	seleção	dos	indivíduos.
Uma	outra	maneira	de	selecionar	aleatoriamenteos	indivíduos	da	população	é	adotar	a	
amostra	aleatória	sistemática.	Esta	é	útil	quando	os	indivíduos	da	população	são	definidos	com	
base	em	listas	(por	exemplo:	lista	telefônica,	cadastro	de	clientes	ou	fornecedores,	lista	de	en-
dereços	de	e-mail	etc.).
Com	base	em	uma	lista,	podemos,	em	vez	de	proceder	a	um	sorteio	completo,	subdividir	a	
lista	em	listas	menores,	e	sortear	apenas	um	indivíduo	de	cada	lista,	sistematizando	o	resultado	
para	as	demais.
Por	exemplo:	suponhamos	que	a	lista	da	população	contenha	10.000	indivíduos	e	necessi-
temos	sortear	500.	Dividindo	10.000	por	500,	obtemos	20.	Então,	é	possível	imaginar	500	listas	
com	20	indivíduos	cada	uma.	Assim,	sorteamos	um	número	de	1	a	20,	por	exemplo,	o	número	
12.	Dessa	forma,	escolhemos	o	12º	elemento	de	cada	uma	das	500	listas.	Com	certeza,	é	bem	
mais	simples	do	que	sortear	diretamente	dos	10.000.
Independentemente	do	método,	nos	três	casos	citados,	devemos	proceder	à	escolha	ale-
atória	(sorteio)	dos	indivíduos,	o	que	pode,	em	alguns	casos,	ser	trabalhoso.	Para	minimizar	o	
trabalho,	podemos	utilizar	uma	amostragem	por	conglomerados.
Tal	amostragem	é	útil	quando	estudamos	uma	população	que	pode	ser	subdividida	geo-
graficamente	ou	segundo	algum	critério	de	localidade.	Assim,	em	vez	de	sortearmos	indivíduos,	
faremos	o	sorteio	das	localidades.	Esse	tipo	de	amostragem	é	muito	comum	em	pesquisas	elei-
torais	e	pesquisas	de	mercado.
6. ERRO AMOSTRAL
Definiremos	algumas	notações	para	a	continuidade	de	nossos	estudos,	uma	vez	que	apa-
recem	a	média	de	uma	amostra,	a	média	de	uma	população	ou	mesmo	a	média	do	desvio	pa-
drão,	bem	como	proporções,	quando	trabalhamos	com	dados	qualitativos.
Observe,	no	Quadro	2	a	seguir,	alguns	símbolos.
Claretiano - Centro Universitário
67© U3 - Teoria da Amostragem
Quadro 2 Símbolos.
Média
Amostra X
População µ
Desvio Padrão
Amostra S
População σ
Proporção
Amostra p
População θ
Assim,	vamos	utilizar	os	símbolos	 µ ,	σ 	e	θ 	para	populações	e	distribuições	de	probabi-
lidades	amostrais.
Um	pesquisador	necessita	obter	uma	amostra	que	seja	representativa	da	população	estu-
dada	e,	por	mais	que	os	métodos	de	coleta	sejam	padronizados,	uma	média	amostral	X 	quase	
nunca	será	igual	à	média	populacional	µ ,	e	um	desvio	padrão	S	dificilmente	será	igual	ao	desvio	
padrão	populacional	σ .	Essa	diferença	entre	os	valores	é	conhecida	como	erro amostral.
Para	 demonstrar	 a	 aplicação	 prática	 do	 erro	 amostral,	 citamos	 as	 pesquisas	 eleitorais.	
Uma	vez	que	os	pesquisadores	fazem	generalizações	de	uma	amostra	relativamente	pequena	
para	uma	população	numerosa	de	eleitores,	eles	costumam	estipular	uma	margem	de	erro	aci-
ma	e	abaixo	do	índice	divulgado.
Por	exemplo,	o	candidato	A	tem	72%	de	intenção	de	votos,	com	uma	margem	de	erro	de	
4%.	Essa	situação	indica	que	o	candidato	pode	receber	entre	68%	e	76%	dos	votos,	ou	seja,	72%	
-	4%,	e	72%	+	4%.
A	seguir,	acompanhe	um	exemplo	prático	de	erro	amostral.
Exemplo
Considere	uma	pesquisa	realizada	com	uma	população	de	20	notas	de	um	exame	final	e	3	
amostras:	A,	B	e	C.
Quadro 3	Uma	população	e	3	amostras	aleatórias	de	notas	de	um	exame	final.
POPULAÇÃO AMOSTRA	A AMOSTRA	B AMOSTRA	C
70 80 93 96 40 72
86 85 90 99 86 96
56 52 67 56 56 49
40 78 57 52 67 56
89 49 48
99 72 30
96 94
µ =	71,55 X = 75,75 X = 62,25 X = 68,25
Fonte:	Levin	e	Fox	(2004,	p.	184).
68 © Estatística Aplicada
No	Quadro	3,	você	pode	observar	a	operação	de	um	erro	amostral.	Ela	mostra	a	população	
de	20	notas	de	um	exame	final	e	3	amostras:	A,	B	e	C,	extraídas	aleatoriamente	dessa	população	
(cada	uma	extraída	com	o	auxílio	de	uma	tabela	de	números	aleatórios).
Nessa	tabela,	são	nítidas	as	diferenças	entre	as	médias	amostrais.	Além	disso,	nenhuma	
delas	é	igual	à	média	da	população	( 71,55µ = ).
O	mesmo	raciocínio	vale	para	quando	estivermos	trabalhando	com	variáveis	qualitativas	
e	calculando	proporções	ou	porcentagens.	Uma	porcentagem	amostral	sempre	estará	sujeita	a	
erro	em	relação	à	real	porcentagem	populacional,	como,	por	exemplo,	nas	pesquisas	eleitorais,	
a	porcentagem	de	votos	de	um	candidato	obtida	pela	pesquisa	não	será	necessariamente	igual	
à	porcentagem	de	votos	que	ele	realmente	apresenta	em	todo	o	eleitorado.
7. DISTRIBUIÇÕES DE PROBABILIDADE AMOSTRAL DA MÉDIA
Verificamos	que	 é	 natural	 o	 resultado	obtido	 em	uma	particular	 amostra	 aleatória	 ser	
diferente	do	verdadeiro	valor	populacional,	ou	 seja,	é	natural	que	a	média	amostral	 X 	 seja	
diferente	da	média	amostral	 µ ,	por	exemplo.	Assim,	é	importante	estabelecer	probabilidades	
sobre	os	resultados	amostrais,	daí	a	formação	das	distribuições	de	probabilidades	amostrais.
Utilizando	a	mesma	lógica	do	exemplo	anterior,	suponhamos	uma	população	com	6	indi-
víduos	(N 6= ),	da	forma	{2,	4,	6,	8,	10,	12},	cuja	média	 7µ = .	Consideremos	agora	todas	as	
possíveis	amostras	com	 2n = 	indivíduos	dessa	população	e	suas	respectivas	médias	amostrais:
Amostra	1:	{2,	4},	com	X 	=	3 Amostra	9:	{4,	12},	com	X =	8
Amostra	2:	{2,	6},	com	X 	=	4 Amostra	10:	{6,	8},	com	X =	7
Amostra	3:	{2,	8},	com	X =	5 Amostra	11:	{6,	10},	com	X =	8
Amostra	4:	{2,	10},	com	X =	6 Amostra	12:	{6,	12},	com	X =	9
Amostra	5:	{2,	12},	com	X =	7 Amostra	13:	{8,	10},	com	X =	9
Amostra	6:	{4,	6},	com	X =	5 Amostra	14:	{8,	12},	com	X =	10
Amostra	7:	{4,	8},	com	X =	6 Amostra	15:	{10,	12},	com	X =	11
Amostra	8:	{4,	10},	com	X =	7
Então,	considerando	todas	as	possíveis	médias	amostrais,	chegamos	a	uma	distribuição	
com	a	seguinte	configuração:
VALOR DA MÉDIA AMOSTRAL X FREQUÊNCIA
3 1
4 1
5 2
6 2
7 3
8 2
9 2
Claretiano - Centro Universitário
69© U3 - Teoria da Amostragem
VALOR DA MÉDIA AMOSTRAL X FREQUÊNCIA
10 1
11 1
Note	que	a	distribuição	das	médias	amostrais	é	simétrica	(média	=	mediana	=	moda	=	7)	e,	
então,	podemos	admitir	que	essa	distribuição	segue	uma	normal.
Ainda,	perceba	que	a	média	das	médias	amostrais	é	exatamente	igual	à	média	populacio-
nal.	Esse	resultado	é	descrito	no	Teorema	do	Limite	Central	e	garante	a	distribuição	normal	para	
a	média	amostral.
Dada	uma	variável	aleatória	X,	com	média	populacional	 µ 	e	desvio	padrão	populacional	
σ ,	retirando-se	uma	amostra	aleatória	de	tamanho	n	( 30n ≥ )	desta	população,	a	média	amos-
tral	 x 	será	uma	variável	aleatória	normalmente	distribuída,	com	média	igual	à	média	popula-
cional	(µ )	e	desvio	padrão	proporcional	ao	desvio	padrão	da	população	
n
σ .
Assim,	de	maneira	 similar	 ao	ocorrido	 com	uma	variável	X,	 podemos	determinar	uma	
fórmula	de	padronização	para	 x ,	e	assim	calcular	probabilidades	com	a	tabela	da	normal	pa-
dronizada	(ver	Unidade	2),	como	a	seguir	:
Z = x
n
−µ
σ
Vamos	exercitar	a	aplicação	dessa	fórmula,	muito	similar	à	dos	exemplos	que	apresenta-
mos	na	Unidade	2.
Exemplo 1
Recentemente	uma	pesquisa	foi	divulgada,	com	base	nos	dados	do	censo	do	IBGE,	tratan-
do	da	distribuição	de	renda	no	país.	Uma	empresa	que	está	se	instalando	na	região,	preocupada	
com	o	cenário	descrito	pela	pesquisa,	resolveu	elaborar	uma	pesquisa	de	mercado	para	avaliar	
a	 renda	média	da	 região,	 dimensionando,	 assim,	 a	possibilidade	de	 comercialização	de	 seus	
produtos.
Para	a	pesquisa,	a	referida	empresa	avaliou	um	total	de	300	chefes	de	famílias.	Conside-
rando	que	os	dados	censitários	do	IBGE	para	a	região	apontam	para	uma	média	populacional	µ 	
igual	a	R$	688,89	e	um	desvio	padrão	populacional	σ 	igual	a	R$	514,88,	determine:
1)	 Qual	a	probabilidade	de	a	média	da	amostra	x 	com	300	chefes,	utilizada	na	pesquisa	
de	mercado,	resultar	em	um	valor	maior	do	que	R$	780,00?
Dados	do	problema:	a	variável	em	questão	é	a	renda,	que	denotaremos	por	X,	cuja	média	
688,89µ = 	e	desvio	padrão	 514,88σ = .	A	amostra	a	ser	utilizada	possui	n	=	300	elementos.
Inicialmente,	queremos	calcular	P(X 780)> .	Padronizando	o	valor,	temos:
X 780 688,89 91,11 91,11 3,06514,88 514,88 29,73
17,32300
Z
n
µ
σ
− −
= = = = =
70 © Estatística Aplicada
Como	 para	 x 	 também	 utilizamos	 a	 normal,	 graficamente,	 conforme	 representado	 na	
Figura	1,temos:
																																Figura	1	Curva	1.
Pela	tabela	da	normal	padronizada,	a	probabilidade	entre	0	e	3,06	é	0,498893	ou	49,8893%.
Assim,	 a	 P(X 780) 50% 49,8893% 0,1107%> = − = ,	 ou	 seja,	 a	 probabilidade	 de	 que	 a	
renda	média	da	amostra	pesquisada	seja	maior	do	que	R$	780,00	é	de	0,11%.
1)	 Qual	a	probabilidade	de	a	média	da	amostra	com	300	chefes	resultar	em	oscilação	
entre	R$	650,00	e	R$	700,00?
Inicialmente,	queremos	calcular	P(650 700)x< < .	Padronizando	os	valores,	temos:
X 650 688,89 38,89 38,89Z 1,31514,88 514,88 29,73
17,32300n
µ
σ
− −
= = = − = − = −
X 700 688,89 11,11 11,11Z 0,37514,88 514,88 29,73
17,32300n
µ
σ
− −
= = = = =
Graficamente,	segundo	podemos	ver	na	Figura	2,	temos:
																																Figura	2	Curva 2.
Claretiano - Centro Universitário
71© U3 - Teoria da Amostragem
Pela	tabela	da	normal	padronizada,	a	probabilidade	entre	0	e	1,31	é	0,404902	ou	40,4902%,	
e	a	probabilidade	entre	0	e	0,37	é	0,144309	ou	14,4309%.
Assim:
P(650 700) 40,4902% 14,4309% 54,9211%x< < = + =
Ou	seja,	a	probabilidade	de	que	a	renda	média	da	amostra	pesquisada	esteja	entre	R$	
650,00	e	R$	700,00	é	de	55%.
2)	 Suponha	que,	após	a	pesquisa	com	os	300	chefes,	tenha	sido	encontrada	uma	média	
amostral	igual	a	R$	796,77.	Considerando	o	resultado	obtido	no	item	1,	qual	a	análise	
que	podemos	fazer	sobre	a	amostra	utilizada?
No	item	1,	verificamos	que	a	probabilidade	de	uma	amostra	com	300	chefes	fornecer	uma	
média	amostral	superior	a	R$	780,00	é	igual	a	0,11%,	ou	seja,	uma	probabilidade	muito	peque-
na,	significando	que	esse	resultado	não	é	esperado.	Então,	se	a	pesquisa	indicar	uma	média	de	
R$	796,77	(maior	do	que	R$	780,00),	significa	que	a	amostra	coletada	está	gerando	uma	média	
pouco	provável	de	ocorrer	na	prática,	sendo	pouco	representativa	e	resultante	de	valores	extre-
mos	na	amostra.
Note	que,	com	base	na	probabilidade,	podemos	averiguar	a	pertinência	ou	não	das	amos-
tras,	o	que	é	importante	para	a	Estatística.
3)	 Refaça	os	cálculos	do	item	1,	supondo	que	a	amostra	seja	composta	por	600	chefes	de	
famílias.	Compare	e	analise	os	resultados.
Dados	do	problema:	a	variável	em	questão	é	a	renda,	que	denotaremos	por	X,	cuja	média	
688,89µ = 	e	desvio	padrão	 514,88σ = .	A	amostra	a	ser	utilizada	possui	 600n = 	elementos.
Vamos	calcular	novamente	P(X 780)> .	Padronizando	o	valor,	temos:
X 780 688,89 91,11 91,11Z 4,33514,88 514,88 21,02
24,49600n
µ
σ
− −
= = = = =
Graficamente,	conforme	representado	na	Figura	3,	temos:
																																Figura	3	Curva 3.
Pela	tabela	da	normal	padronizada,	a	probabilidade	entre	0	e	4,33	é	0,499999	ou	49,9999%.
Assim,	 a	 ( )P X 780 50% 49,9999% 0,0001%> = − = ,	 ou	 seja,	 a	 probabilidade	 de	 que	 a	
renda	média	da	amostra	pesquisada	seja	maior	do	que	R$	780,00	é	de	0,0001%.
72 © Estatística Aplicada
Observe	que,	ao	aumentarmos	o	tamanho	da	amostra	(de	300	para	600),	a	probabilidade	
de	ocorrer	uma	média	extrema	diminui,	ou	seja,	a	chance	de	a	amostra	ser	não	representativa	
reduz-se,	já	que,	quanto	maior	a	amostra,	mais	próximos	ficamos	da	população	e,	assim,	a	chan-
ce	de	errarmos	diminui.
4)	 Refaça	os	cálculos	do	item	2,	supondo	que	a	amostra	seja	composta	por	600	chefes	de	
famílias.	Compare	e	analise	os	resultados.
Vamos	calcular	novamente	 ( )P 650 X 700< < ,	com	 600n = 	elementos.	Padronizando	os	
valores,	temos:
X 650 688,89 38,89 38,89Z 1,85514,88 514,88 21,02
24,49600n
µ
σ
− −
= = = − = − = −
X 700 688,89 11,11 11,11Z 0,53514,88 514,88 21,02
24,49600n
µ
σ
− −
= = = = =
Graficamente,	como	se	pode	ver	na	Figura	4,	temos:
																																		Figura	4	Curva 4.
Pela	tabela	da	normal	padronizada,	a	probabilidade	entre	0	e	1,85	é	0,467843	ou	46,7843%,	
e	a	probabilidade	entre	0	e	0,53	é	0,201944	ou	20,1944%.
Assim:
P(650 X 700) 46,78343% 20,1944% 66,9787%< < = + =
Ou	seja,	a	probabilidade	de	que	a	renda	média	da	amostra	pesquisada	esteja	entre	R$	
650,00	e	R$	700,00	é	de	67%.
Observe	que,	ao	aumentarmos	o	tamanho	da	amostra	(de	300	para	600),	a	probabilidade	
de	ocorrer	uma	média	amostral	em	torno	da	média	da	população	aumenta,	ou	seja,	a	chance	de	
a	amostra	ser	representativa	eleva-se,	já	que,	quanto	maior	a	amostra,	mais	próximos	ficamos	
da	população,	e	assim	a	chance	de	acerto	aumenta.
5)	 Refaça	os	cálculos	do	item	1,	supondo	que	o	desvio	padrão	populacional	seja	igual	a	
R$	133,54.	Compare	e	analise	os	resultados.
Claretiano - Centro Universitário
73© U3 - Teoria da Amostragem
Dados	do	problema:	a	variável	em	questão	é	a	renda,	que	denotaremos	por	X,	cuja	média	
688,89µ = 	e	desvio	padrão	 133,54σ = .	A	amostra	a	ser	utilizada	possui	 300n = 	elementos.
Vamos	calcular	novamente	 ( )X 780Ρ > .	Padronizando	o	valor,	temos:
X 780 688,89 91,11 91,11Z 11,82133,54 133,54 7,71
17,32300n
µ
σ
− −
= = = = =
Graficamente,	conforme	representado	na	Figura	5,	temos:
																												Figura	5	Curva 5.
Pela	 tabela	 da	 normal	 padronizada,	 a	 probabilidade	 entre	 0	 e	 11,82	 é	 0,499999	 ou	
49,9999%.
Assim,	 a	 ( )P X 780 50% 49,9999% 0,0001%> = − = ,	 ou	 seja,	 a	 probabilidade	 de	 que	 a	
renda	média	da	amostra	pesquisada	seja	maior	do	que	R$	780,00	é	de	0,0001%.
Observe	que,	 ao	diminuirmos	o	desvio	padrão,	 a	probabilidade	de	ocorrer	uma	média	
extrema	diminui,	ou	seja,	a	chance	de	a	amostra	ser	não	representativa	reduz-se,	já	que,	quanto	
menor	o	desvio	padrão,	mais	homogêneos	e	mais	próximos	os	dados	são	da	média.
6)	 Refaça	os	cálculos	do	item	2,	supondo	que	o	desvio	padrão	populacional	seja	igual	a	
R$	133,54.	Compare	e	analise	os	resultados.
Vamos	calcular	novamente	 ( )650 X 700Ρ < < ,	com	desvio	padrão	igual	a	133,54	e	 300n = 	
elementos.	Padronizando	os	valores,	temos:
X 650 688,89 38,89 38,89Z 5,04133,54 133,54 7,71
17,32300n
µ
σ
− −
= = = − = − = −
X 700 688,89 11,11 11,11Z 1,44133,54 133,54 7,71
17,32300n
µ
σ
− −
= = = = =
Graficamente,	como	é	possível	ver	na	Figura	6,	temos:
74 © Estatística Aplicada
									Figura	6	Curva 6.
Pela	tabela	da	normal	padronizada,	a	probabilidade	entre	0	e	5,04	é	0,499999	ou	49,9999%,	
e	a	probabilidade	entre	0	e	1,44	é	0,425066	ou	42,5066%.
Assim:
P (650 X 700) 49,9999% 42,5066% 92,5065%< < = + =
Ou	seja,	a	probabilidade	de	que	a	renda	média	da	amostra	pesquisada	esteja	entre	R$	
650,00	e	R$	700,00	é	de	92%.
Observe	que,	 ao	diminuirmos	o	desvio	padrão,	 a	probabilidade	de	ocorrer	uma	média	
amostral	em	torno	da	média	da	população	aumenta,	ou	seja,	a	chance	de	a	amostra	ser	repre-
sentativa	eleva-se,	 já	que,	quanto	menor	o	desvio	padrão,	mais	homogêneos	são	os	dados	e	
mais	próximos	da	média	eles	ficam.
Exemplo 2
Pelos	balanços	realizados	nos	últimos	anos,	sabe-se	que,	em	uma	grande	rede	de	super-
mercados,	a	média	de	consumo	(em	unidades	monetárias)	é	igual	a	R$	80,00,	com	um	desvio	
padrão	igual	a	R$	50,00.	Considerando	que	uma	filial	dessa	rede	se	localiza	em	Ribeirão	Preto	e	
que	esta	pode	ser	uma	amostra	da	rede,	se	em	um	determinado	dia	existirem	100	clientes	na	
filial,	qual	a	probabilidade	de	que	esses	clientes	consumam	uma	média	maior	do	que	R$	75,00?
Dados	do	problema:	a	variável	em	questão	é	o	consumo	em	R$,	que	denotaremos	por	X,	
cuja	média	 80µ = 	e	desvio	padrão	 50σ = .	A	amostra	a	ser	utilizada	possui	 100n = 	clientes.
Vamos	calcular	a	probabilidade	de	a	média	da	amostra	de	100	clientes	fornecer	um	valor	
maior	do	que	R$	75,00,	ou	seja,	 (X 75)Ρ > .	Padronizando	o	valor,	temos:
X 75 80 5 5 1,0050 50 5
10100
Z
n
µ
σ
− −
= = = − = − = −
Graficamente,	conforme	representado	na	Figura	7,	temos:
Claretiano - Centro Universitário
75© U3 - Teoria da Amostragem
																												Figura	7	Curva 7.
Pela	tabela	da	normal	padronizada,	a	probabilidade	entre	0	e	1,00	é	0,341345	ou	34,1345%.
Assim,	a	 (X 75) 50% 34,1345% 84,1345%Ρ > = + = ,	ou	seja,	a	probabilidade	de	que	o	con-
sumo	médio	da	amostra	pesquisada	seja	maior	do	que	R$	75,00	é	de	84%.
8. DISTRIBUIÇÕES DE PROBABILIDADE AMOSTRAL DA PROPORÇÃO
De	maneira	similar	aodesenvolvido	para	a	média	amostral	x ,	também	podemos	efetuar	
cálculos	probabilísticos	quando	tratamos	com	variáveis	qualitativas,	substituindo	a	análise	da	
média	pela	análise	de	uma	proporção.	Chamando	de	θ 	a	proporção	real	de	uma	certa	caracte-
rística	na	população	e	de	p	a	proporção	observada	dessa	característica	em	uma	amostra	com	n	
elementos.	A	fórmula	da	padronização	para	a	proporção	amostral	p	é	dada	por:
(1 )
Z=
n
p
θ θ
θ
⋅ −
−
Vamos	dar	um	exemplo	de	uma	variável	qualitativa	para	ilustrar	a	aplicação	da	fórmula.
Exemplo 3
Um	levantamento	efetuado	em	um	pregão	da	bolsa	de	valores	mostrou	que,	naquele	dia,	
do	total	de	ações,	40%	teve	alguma	valorização.	Se	um	fundo	selecionou	um	lote	de	80	ações	
para	negociar,	qual	a	probabilidade	de	que	nesse	lote	haja:
1)	 mais	de	50%	de	ações	que	se	valorizaram?
2)	 menos	de	25%	de	ações	que	se	valorizaram?
Dados	do	problema:	a	variável	em	questão	é	o	fato	de	a	ação	ter-se	valorizado	ou	não,	
ou	seja,	uma	variável	qualitativa.	Assim,	a	análise	levará	em	conta	a	proporção	populacional	e	
amostral.	A	proporção	populacional	é	 4040% 0,40
100
θ = = = ,	e	o	tamanho	da	amostra	é	 80n = .
O	interesse	da	primeira	questão	é	calcular	a	probabilidade	de	haver	mais	de	50%	de	ações	
valorizadas	na	amostra,	ou	seja,	a	proporção	amostral	p	ser	maior	do	que	 50 0,50
100
= ,	ou	seja,	
P( 0,50)p > .	Padronizando	o	valor,	temos:
76 © Estatística Aplicada
(1 )
0,50 0,40 0,10 0,10 0,10 0,10Z= 1,82
0,0550,40 (1 0,40) 0,40 0,60 0,24 0,003
80 80 80n
p
θ θ
θ
⋅ −
−− = = = = = =
⋅ − ⋅
Graficamente,	como	é	possível	notar	na	Figura	8,	temos:
	 	 									Figura	8	Curva 8.
Pela	tabela	da	normal	padronizada,	a	probabilidade	entre	0	e	1,82	é	0,465620	ou	46,5620%.
Assim,	a	 ( )0,50 50% 46,5620% 3,438%pΡ > = − = ,	ou	seja,	existe	uma	probabilidade	de	
3,438%	de	que	o	percentual	de	ações	valorizadas	na	amostra	seja	superior	a	50%.
Quanto	à	segunda	questão,	o	interesse	é	calcular	a	probabilidade	de	haver	menos	de	25%	
de	ações	valorizadas	na	amostra,	ou	seja,	a	proporção	amostral	p	ser	menor	do	que	 25 0,25
100
= ,	
equivalendo	a	P( 0,25)p < .	Padronizando	o	valor,	temos:
(1 )
0,25 0,40 0,15 0,15 0,15 0,15Z= 2,73
0,0550,40 (1 0,40) 0,40 0,60 0,24 0,003
80 80 80n
p
θ θ
θ
⋅ −
−− = =− =− =− =− =−
⋅ − ⋅
Graficamente,	conforme	representado	na	Figura	9,	temos:
																												Figura	9	Curva 9.
Pela	tabela	da	normal	padronizada,	a	probabilidade	entre	0	e	2,73	é	0,496833	ou	49,6833%.
Assim,	a	 ( )0,25 50% 49,6833% 0,3167%pΡ < = − = ,	ou	seja,	existe	uma	probabilidade	de	
0,32%	de	que	o	percentual	de	ações	valorizadas	na	amostra	seja	menor	do	que	25%.
Claretiano - Centro Universitário
77© U3 - Teoria da Amostragem
9. QUESTÕES AUTOAVALIATIVAS
Confira,	a	seguir,	as	questões	propostas	para	verificar	o	seu	desempenho	no	estudo	desta	
unidade:
1)	 Em	uma	determinada	cidade,	sabe-se	que	a	média	salarial	de	seus	empregados	é	de	R$	1.000,00	( 1000µ = ),	
com	um	desvio	padrão	igual	a	R$	250,00	( 250σ = ).	Se	uma	amostra	de	 144n = 	empregados	foi	retirada	desta	
população,	determine	a	probabilidade	de	que	a	média	salarial	nesta	amostra	(x )	seja	inferior	a	R$	1.050,00.	
Determine	também	a	probabilidade	de	que	a	média	salarial	desta	amostra	(x )	seja	superior	a	R$	900,00.
2)	 Em	uma	empresa,	sabe-se	que	o	número	médio	de	acidentes	de	trabalho	por	funcionários	em	um	ano	é	igual	a	
10	acidentes	( 10µ = ),	com	um	desvio	padrão	de	8	acidentes	( 8σ = ).	Uma	inspeção	da	Delegacia	do	Trabalho	
será	 executada	nesta	 empresa,	 averiguando	por	 amostragem	as	pastas	 funcionais	 de	34	 funcionários.	 Caso	
o	número	médio	amostral	 (x )	de	acidentes	por	 funcionários	 for	maior	do	que	12,	a	empresa	sofrerá	uma	
autuação.	Então,	determine	qual	a	probabilidade	de	a	empresa	receber	a	autuação.
3)	 Em	uma	empresa	especializada	em	produzir	café	em	pó	embalado	em	pacotes	a	vácuo,	a	máquina	responsável	
pelo	empacotamento	tem	uma	configuração	e	calibragem	programadas	para	encher	a	embalagem	com	uma	
quantidade	específica,	contudo,	como	é	uma	máquina	sujeita	a	fatores	externos,	existe	uma	tolerância,	ou	seja,	
em	média	a	máquina	está	programada	para	colocar	980	gramas	de	café	( 980µ = ),	com	um	desvio	padrão	igual	
a	15	gramas	( 15σ = ).	De	tempos	em	tempos,	os	órgãos	de	defesa	do	consumidor	costumam	recolher	lotes	do	
produto	para	aferir	o	peso.
Sendo	assim,	considere	que	o	órgão	de	defesa	do	consumidor	não	aceite	embalagens	com	menos	do	que	977	
gramas	em	média	(x )	de	café	e	que	foram	recolhidas	para	análise	 100n = 	embalagens.	Qual	a	probabilidade	de	
a	empresa	obter	um	resultado	negativo	na	análise?
4)	 Um	procedimento	de	 controle	de	qualidade	 foi	planejado	para	garantir	um	máximo	de	10%	de	defeitos	na	
produção	 ( 0,10θ = ).	 A	 cada	 15	minutos,	 sorteia-se	 uma	 amostra	 de	 40n = 	 peças	 produzidas	 e,	 havendo	
mais	de	15%	de	defeitos	( 0,15p = ),	a	produção	é	interrompida	para	verificações.	Qual	a	probabilidade	de	a	
produção	ser	interrompida	a	cada	15	minutos?
Gabarito
Confira,	a	seguir,	as	respostas	corretas	para	as	questões	autoavaliativas	propostas.
1)	 A	probabilidade	de	a	média	salarial	amostral	ser	 inferior	a	R$	1.050,00	é	de	0,8198%	e	de	ser	superior	a	R$	
900,00	é	de	99,9999%.
2)	 A	probabilidade	de	o	número	médio	de	acidentes	ser	maior	do	que	12	é	de	7,2145%.
3)	 A	probabilidade	de	obter-se	uma	média	menor	do	que	977	gramas	é	de	2,2750%.
4)	 A	probabilidade	de	a	produção	ser	interrompida	a	cada	15	minutos	é	de	14,4572%.
10. CONSIDERAÇÕES
Nesta	unidade,	caracterizamos	as	populações	e	destacamos	a	 importância	da	teoria	de	
amostragem,	a	fim	de	obterem-se	dados	para	estudos	e	análises	de	populações	numerosas.	Em	
razão	da	impossibilidade	de	se	pesquisarem	todos	os	elementos,	são	necessárias	distribuições	
amostrais	para	determinar	probabilidades	sobre	as	amostras.
Dando	continuidade	aos	nossos	estudos,	vamos	transformar	as	distribuições	amostrais	em	
ferramentas	de	inferência,	o	que	levará,	na	Unidade	4,	ao	conceito	de	estimação,	com	base	no	
qual	os	valores	serão	analisados	pelos	critérios	dos	intervalos	de	confiança.
11. REFERÊNCIAS BIBLIOGRÁFICAS
COSTA	NETO,	P.	L.	O.	Estatística.	2.	ed.	São	Paulo:	Edgard	Blϋcher,	2002.
FONSECA,	J.	S.	Curso de estatística.	6.	ed.	São	Paulo:	Atlas,	1996.
78 © Estatística Aplicada
KAZMIER,	L.;	CRUSIUS,	C.	A.	Estatística aplicada à economia e administração.	São	Paulo:	Makron	Books,	1982.
LEVINE,	D.	M.;	BERENSON,	M.	L.;	STEPHAN,	D.	Estatística:	teoria	e	aplicações.	Rio	de	Janeiro:	LTC,	2000.
MARTINS,	G.	A.	Princípios de estatística.	4.	ed.	São	Paulo:	Atlas,	1990.
______.	Estatística geral e aplicada.	2.	ed.	São	Paulo:	Atlas,	2002.
MEYER,	P.	L.;	LOURENÇO	FILHO,	R.	C.	B.	Probabilidade:	aplicação	a	Estatística.	Rio	de	Janeiro:	LTC,	1975.
MORETTIN,	L.	G.	Estatística básica:	probabilidade	e	inferência.	São	Paulo:	Pearson,	2010.
OLIVEIRA,	F.	E.	M.	Estatística e probabilidade.	2.	ed.	São	Paulo:	Atlas,	1999.
STEVENSON,	W.	J.;	FARIAS,	A.	A.	Estatística aplicada à administração.	São	Paulo:	Harper	&	How	do	Brasil,	1986.
TRIOLA,	M.	F.	Introdução à estatística.	7.	ed.	Rio	de	Janeiro:	LTC,	1999.