Introdução à Inferência Estatística

•
UFF

Thiago Queiroz
01/11/2018
E aí, curtiu este material?
Ajude a incentivar outros estudantes a melhorar o conteúdo
Gostou desse material? Compartilhe! 🧡
Estatística I

57.327 Materiais compartilhados
Baixe o app para aproveitar ainda mais
Leia os materiais offline, sem usar a internet. Além de vários outros recursos!
Prévia do material em texto
Inferência Estatística
INTRODUÇÃO
• A Inferência Estatística é um conjunto de 
técnicas que objetiva estudar a população 
através de evidências fornecidas por uma 
amostra.
• É a amostra que contém os elementos que 
podem ser observados e, a partir daí, 
quantidades de interesse podem ser medidas.
Estimação de Parâmetros
População Amostra
Distribuição de Probabilidade (ou FDP)
Parâmetros
Distribuição Amostral (Frequências)
Estatísticas(valor fixo)
estimar
(variável aleatória)
pontual (estatísticas)
por intervalo (intervalos de confiança)
Estimação
OBS:estatística: é a v.a. que estima (pontualmente) um parâmetro (populacional)
as vezes é chamada simplesmente de estimador
estimativa: é o valor do estimador obtido para uma amostra específica
Estimação
Distribuição Amostral
• Retrata o comportamento de uma estatística (média, 
proporção, entre outras), caso retirássemos todas as 
possíveis amostras de tamanho “n” de uma população.
• Uma estatística é uma função da amostra. Uma amostra 
consiste de observações de uma variável aleatória.
• Assim,estatísticas também são variáveis aleatórias e, 
por isso, possuem uma distribuição de probabilidade.
DISTRIBUIÇÃO AMOSTRAL DA 
MÉDIA
• Considere uma população de 5 elementos 
(N = 5): 1, 2, 3, 4, 5. Determine todas as 
amostras possíveis de n=2 com reposição 
e calcule a média e a variância.
• Solução: Na população, temos que µ=3 e 
σ2=2.
DISTRIBUIÇÃO AMOSTRAL DA 
MÉDIA
DISTRIBUIÇÃO AMOSTRAL DA 
MÉDIA
DISTRIBUIÇÃO AMOSTRAL DA 
MÉDIA
• Aqui µ e σ são a média e o desvio padrão populacionais das 
medidas individuais X , e n é o tamanho amostral. Denota-se 
• A aproximação para a normal melhora à medida que o tamanho 
amostral cresce. Este resultado é conhecido como o Teorema 
Central do Limite e é notável porque permite-nos conduzir alguns 
procedimentos de inferência sem qualquer conhecimento da 
distribuição da população. 
Qualidade do Estimador
Qualidade do Estimador
Qualidade do Estimador
• Exemplo: Um pesquisador deseja estimar 
a produção média de um processo 
químico com base na observação da 
produção de três realizações X1, X2, X3 
de um experimento. Considere dois 
estimadores da média
ESTIMAÇÃO PONTUAL 
• No processo de estimação por ponto 
admite-se como valor numérico do 
parâmetro exatamente a estimativa 
calculada a partir de uma amostra 
aleatória extraída da população em 
estudo. 
Estimação Pontual
Seja X uma v.a. normalmente distribuída com a média (µ) e a variância 
(σ2) desconhecidas. Retira-se uma amostra de tamanho n com a 
finalidade de se estimar µ e σ2. 
• média populacional µ
De que maneira os valores da amostra podem ser combinados a fim de 
se produzir uma “boa” estimativa de µ?
ˆkµ é o k-ésimo estimador de µ
1ˆ( ) ( )E E Xµ =
• testando a tendenciosidade dos estimadores
1 2 nX X XE
n
+ + + 
=  
 
L
( )1 21 nE X X X
n
= + + +L
n
n
µ
= µ=
1
n
i
i
x
n
=
=
∑
1ˆ Xµ =
2ˆ ixµ =
Estimação Pontual
Seja X uma v.a. normalmente distribuída com a média (µ) e a variância 
(σ2) desconhecidas. Retira-se uma amostra de tamanho n com a 
finalidade de se estimar µ e σ2. 
• média populacional µ
De que maneira os valores da amostra podem ser combinados a fim de 
se produzir uma “boa” estimativa de µ?
2ˆ( )E µ =
• testando a tendenciosidade dos estimadores
( )iE X µ=1ˆ( )E µ µ=1
n
i
i
x
n
=
=
∑
1ˆ Xµ =
2ˆ ixµ =
ˆkµ é o k-ésimo estimador de µ
Estimação Pontual
Seja X uma v.a. normalmente distribuída com a média (µ) e a variância 
(σ2) desconhecidas. Retira-se uma amostra de tamanho n com a 
finalidade de se estimar µ e σ2. 
• média populacional µ
De que maneira os valores da amostra podem ser combinados a fim de 
se produzir uma “boa” estimativa de µ?
• procurando a menor variância
1ˆ( )E µ µ=
2ˆ( )E µ µ=
1ˆ( ) ( )Var Var Xµ = 1 2 n
X X XVar
n
+ + + 
=  
 
L
( )1 221 nVar X X Xn= + + +L
2
2
n
n
σ
=
2
n
σ
=
1
n
i
i
x
n
=
=
∑
1ˆ Xµ =
2ˆ ixµ =
ˆkµ é o k-ésimo estimador de µ
Estimação Pontual
Seja X uma v.a. normalmente distribuída com a média (µ) e a variância 
(σ2) desconhecidas. Retira-se uma amostra de tamanho n com a 
finalidade de se estimar µ e σ2. 
• média populacional µ
De que maneira os valores da amostra podem ser combinados a fim de 
se produzir uma “boa” estimativa de µ?
• procurando a menor variância
1ˆ( )E µ µ=
2ˆ( )E µ µ=
2
1ˆ( )Var
n
σµ =
2ˆ( )Var µ = ( )iVar X 2σ=1
n
i
i
x
n
=
=
∑
1ˆ Xµ =
2ˆ ixµ =
ˆkµ é o k-ésimo estimador de µ
Estimação Pontual
Seja X uma v.a. normalmente distribuída com a média (µ) e a variância 
(σ2) desconhecidas. Retira-se uma amostra de tamanho n com a 
finalidade de se estimar µ e σ2. 
• média populacional µ
De que maneira os valores da amostra podem ser combinados a fim de 
se produzir uma “boa” estimativa de µ?
1ˆ( )E µ µ=
2ˆ( )E µ µ=
2
1ˆ( )Var
n
σµ =
2
2ˆ( )Var µ σ=
1
n
i
i
x
n
=
=
∑
1ˆ Xµ =
2ˆ ixµ =
ˆkµ é o k-ésimo estimador de µ
Estimação Pontual
Seja X uma v.a. normalmente distribuída com a média (µ) e a variância 
(σ2) desconhecidas. Retira-se uma amostra de tamanho n com a 
finalidade de se estimar µ e σ2. 
• variância populacional σ2
De que maneira os valores da amostra podem ser combinados a fim de 
se produzir uma “boa” estimativa de σ2?
( )2
2 1
ˆ
n
i
i
x X
n
σ =
−
=
∑
Mas será tendenciosa?
( ) ( )2 2 2
1 1
2
n n
i i i
i i
X X X XX X
= =
− = − +∑ ∑
Estimação Pontual
Seja X uma v.a. normalmente distribuída com a média (µ) e a variância 
(σ2) desconhecidas. Retira-se uma amostra de tamanho n com a 
finalidade de se estimar µ e σ2. 
• variância populacional σ2
De que maneira os valores da amostra podem ser combinados a fim de 
se produzir uma “boa” estimativa de σ2?
( )2
2 1
ˆ
n
i
i
x X
n
σ =
−
=
∑
2 2
1 1
2
n n
i i
i i
X X X nX
= =
= − +∑ ∑
1
1
n
i n
i
i
i
X
X X nX
n
=
=
= ⇒ =
∑
∑
2 2
1
n
i
i
X nX
=
= −∑
2 2 2
1
2
n
i
i
X nX nX
=
= − +∑
Estimação Pontual
Seja X uma v.a. normalmente distribuída com a média (µ) e a variância 
(σ2) desconhecidas. Retira-se uma amostra de tamanho n com a 
finalidade de se estimar µ e σ2. 
• variância populacional σ2
De que maneira os valores da amostra podem ser combinados a fim de 
se produzir uma “boa” estimativa de σ2?
( )2
2 1
ˆ
n
i
i
x X
n
σ =
−
=
∑ ( )
2 2
2 1
ˆ
n
i
i
X nX
E E
n
σ =
 
− 
 =
 
 
 
∑ ( )2 2
1
1 n
i
i
E X E X
n
=
 
= − 
 
∑
( ) ( )2 2
1
1 n
i
i
E X E X
n
=
= −∑
2( )iVar X σ= ( ) ( )( )22i iE X E X= − ( )2 2iE X µ= − ( )2 2 2iE X σ µ⇒ = +
Estimação Pontual
Seja X uma v.a. normalmente distribuída com a média (µ) e a variância 
(σ2) desconhecidas. Retira-se uma amostra de tamanho n com a 
finalidade de se estimar µ e σ2. 
• variância populacional σ2
De que maneira os valores da amostra podem ser combinados a fim de 
se produzir uma “boa” estimativa de σ2?
( )2
2 1
ˆ
n
i
i
x X
n
σ =
−
=
∑ ( )
2 2
2 1
ˆ
n
i
i
X nX
E E
n
σ =
 
− 
 =
 
 
 
∑ ( )2 2
1
1 n
i
i
E X E X
n
=
 
= − 
 
∑
( ) ( )2 2
1
1 n
i
i
E X E X
n
=
= −∑
2
( )Var X
n
σ
= ( ) ( )( )22E X E X= − ( )2 2E X µ= − ( ) 22 2E X
n
σ µ⇒ = +
Estimação Pontual
Seja X uma v.a. normalmente distribuída com a média (µ) e a variância 
(σ2) desconhecidas. Retira-se uma amostra detamanho n com a 
finalidade de se estimar µ e σ2. 
• variância populacional σ2
De que maneira os valores da amostra podem ser combinados a fim de 
se produzir uma “boa” estimativa de σ2?
( )2
2 1
ˆ
n
i
i
x X
n
σ =
−
=
∑ ( )
2 2
2 1
ˆ
n
i
i
X nX
E E
n
σ =
 
− 
 =
 
 
 
∑ ( )2 2
1
1 n
i
i
E X E X
n
=
 
= − 
 
∑
( ) ( )2 2
1
1 n
i
i
E X E X
n
=
= −∑
2
2 2 2
n
σ
σ µ µ= + − −
2 2n
n
σ σ−
=
21n
n
σ
−
=
estimador
tendencioso!
( )2
2 1
ˆ
1
n
i
i
x X
n
n n
σ =
−
=
−
∑
Estimação Pontual
Seja X uma v.a. normalmente distribuída com a média (µ) e a variância 
(σ2) desconhecidas. Retira-se uma amostra de tamanho n com a 
finalidade de se estimar µ e σ2. 
• variância populacional σ2
De que maneira os valores da amostra podem ser combinados a fim de 
se produzir uma “boa” estimativa de σ2?
( )2
2 1
1
n
i
i
x X
s
n
=
−
=
−
∑ ( )2 2E s σ= estimador
não tendencioso
ESTIMAÇÃO PONTUAL 
ESTIMAÇÃO PONTUAL 
• Exemplo. Deseja-se conhecer o preço 
médio de determinado artigo em certa 
localidade. Para este fim, observou-se o 
preço do mesmo em 5 pontos de venda 
escolhidos aleatoriamente na localidade, 
encontrando-se os seguintes valores: 85, 
80, 86, 88 e 83. Estime por ponto o preço 
médio do artigo em todos os pontos de 
venda da localidade.
ESTIMAÇÃO PONTUAL 
Estimação Intervalar
Introdução
• No processo de estimação por intervalo, usa-se a distribuição 
amostral do estimador para a construção de um intervalo a partir de 
uma estimativa
• Este intervalo tem uma probabilidade, especificada a priori, de 
conter o valor numérico do parâmetro estimado. 
• O intervalo é denominado intervalo de confiança e a probabilidade 
deste intervalo conter o valor numérico do parâmetro é denominada 
nível de confiança.
• Genericamente, se θ é um parâmetro de uma população, o intervalo 
de confiança de 100(1−α)% para θ é
• sendo 1−α a probabilidade de que o referido intervalo contenha o 
valor do parâmetro. 
• Esta probabilidade é denominada nível de confiança. 
supinf θθθ <<
Intervalo de confiança para a 
média populacional 
• Variância populacional seja conhecida 
– Suponha que uma variável X de uma 
população seja N(µ; σ2 ) 
– Se for extraída com reposição, uma amostra 
de tamanho n, 
– Pelo TEREMA CENTRAL DO LIMITE:
n
XZ X /σ
µ−
=
Intervalo de confiança para a 
média populacional (cont.)
• Considere a proporção 1−α de amostras 
da população em estudo tais que 
α
αα
−=<<− 1)(
2/2/
zZzP X
Intervalo de confiança para a 
média populacional (cont.)
α
σ
µ
αα
−=<
−
<− 1)
/
(
2/2/
z
n
X
zP
• é denominado intervalo de confiança de 100(1−α)% 
para a média populacional. 
• Diz-se então que a probabilidade de que este intervalo 
contenha a média populacional é 1−α.
α
σµσ
αα
−=+<<− 1)(
2/2/ n
zX
n
zXP
Intervalo de confiança para a 
média populacional (cont.)
• Se a amostragem é sem reposição, usando o 
mesmo raciocínio, tem-se que o intervalo de 
confiança de 100(1−α)%para a média 
populacional é
– Observação: Se N >> n (para fins práticos, N ≥≥≥≥ 10n) o termo
– e a amostragem sem reposição é equivalente à amostragem 
com reposição
11 2/2/ −
−+<<
−
−
− N
nN
n
zxN
nN
n
zx σµσ
αα
11 ≅−
−
N
nN
Exemplo
• Para estimar o salário médio de operários em 
certa localidade na qual o salário em R$ é uma 
VAC N(µ, 100), um pesquisador analisou os 
salários de 80 operários, escolhidos 
aleatoriamente na localidade, constatando que o 
salário médio dos mesmos é R$310,00. 
Construa e interprete um intervalo de confiança 
de 95% para o salário médio de todos dos 
operários da localidade considerada, admitindo-
se que o número de operários na localidade 
seja muito maior que 100.
Solução
• Não tendo sido dado o tamanho da 
população (número de operários na 
localidade) admite-se amostragem com 
reposição 
• Então, sendo X o salário de um operário 
na localidade, o intervalo de confiança 
para o salário médio nesta localidade é
n
zx
n
zx σµσ
αα 2/2/
+<<−
Solução (cont.)
• Pelo enunciado do problema tem-se que a 
estimativa do salário médio na localidade 
obtida a partir da amostra de tamanho n = 
80 é = 310, sendo que o desvio padrão 
dos salários na localidade é σ = = 10. 
• Sendo = 0,95, α = 0,05 e o 
coeficiente de confiança, , é tal que como 
ilustra o gráfico a seguir.
x
100
α−1
Solução (cont.)
• Pela tabela do apêndice 1 tem-se que = 1,96. 
Assim sendo, o intervalo de 95% para o salário 
médio dos operários na localidade é
475,02/95,02/)()0( 2/2/2/ ==<<−=<< ααα zZzPzZP XX
Solução (cont.)
80
1096,1310
80
1096,1310 +<<− µ
• Este resultado significa que a probabilidade de 
que o intervalo acima contenha o salário médio 
dos operários na localidade é 0,95.
19,312$R81,307$R << µ
Intervalo de confiança para a 
média populacional
• Variância populacional é desconhecida.
• Considerando-se amostragem com 
reposição, o erro padrão da média, é
substituído por seu estimador
n
SS X = 1
)(1
2
−
−
=
∑
=
n
XX
S
n
i i
Intervalo de confiança para a 
média populacional (cont.)
• Define-se a variável 
padronizada
• Esta variável tem uma 
distribuição de probabilidade 
denominada distribuição t de 
Student com ν = n − 1 graus de 
liberdade. 
n
S
XTX
µ−
=
Intervalo de confiança para a 
média populacional (cont.)
• A forma da distribuição t depende do 
número de graus de liberdade da mesma. 
• Se ν é suficientemente grande (na prática, 
ν ≥ 30) a distribuição t se aproxima da 
distribuição normal padronizada, isto é, 
sendo Z a variável N(0, 1).
ZT =
∞→ν
lim
Intervalo de confiança para a 
média populacional (cont.)
• Considere a proporção 1−α de amostras 
da população em estudo, tais que
– sendo o coeficiente de confiança neste 
caso. O gráfico a seguir ilustra esta situação.
ααα −=<<− 1)( 2/2/ tTtP X
2/αt
Intervalo de confiança para a 
média populacional (cont.)
• é denominado intervalo de confiança de 100(1−α)% 
para a média populacional. 
• Diz-se então que a probabilidade de que este intervalo 
contenha a média populacional é 1−α.
α
µ
αα −=<
−
<− 1)( 2/2/ t
n
S
X
tP
αµ αα −=+<<− 1)( 2/2/
n
StX
n
StXP
Intervalo de confiança para a 
média populacional (cont.)
• Se a amostragem é sem reposição, usando o 
mesmo raciocínio, tem-se que o intervalo de 
confiança de 100(1−α)%para a média 
populacional é
– Observação: Se N >> n (para fins práticos, N ≥≥≥≥ 10n) o termo
– e a amostragem sem reposição é equivalente à amostragem 
com reposição
11 ≅−
−
N
nN
11 2/2/ −
−
+<<
−
−
−
N
nN
n
stx
N
nN
n
stx αα µ
Exemplo
• Um pesquisador analisou o custo de 
produção, em R$, numa amostra de 10 
unidades de um artigo produzido por certo 
fabricante escolhidas aleatoriamente da 
produção, encontrando os seguintes 
valores: 10, 11, 7, 9, 6, 7, 10, 7, 6 e 8. 
Construa e interprete um intervalo de 95% 
para o custo médio de produção do artigo 
considerado.
Solução
Não tendo sido informado o tamanho da população (número de unidades produzidas) admite-se 
amostragem com reposição. Então, sendo X o custo de produção de uma unidade, o intervalo de 
confiança para o custo médio de produção de uma unidade deste artigo é 
n
stx
n
stx 2/2/ αα µ +<<− 
Tem-se a partir desta amostra de tamanho n = 10 que a estimativa da média amostral é 
10
10
1∑ =
=
i ixx 
e a estimativa do desvio padrão amostral é 
( ) ( )
909)110(10110
210
1
10
1
2210
1
10
1
2 ∑∑∑∑
====
−=
−
−
−
=
i ii ii ii i
xxxx
s 
818671076971110101 =+++++++++=∑ =i ix 
6858671076971110 2222222222101
2
=+++++++++=∑
=i ix 
 
1,810
81
==x 
79,1
90
81
9
685 2
=−=s 
Sendo α−1 = 0,95, α = 0,05 e o coeficiente de confiança, ,025,0t é tal que 
95,0)( 025,0025,0 =<<− tTtP X como ilustra o gráfico a seguir. 
 
Figura 5 
A variável XT tem distribuição t de Student com ν = n − 1 = 10 − 1 = 9 graus de 
liberdade. Pela tabela do apêndice 2 tem-se para ν = 9 e α = 0,05 que 025,0t = 2,26. 
Como não foi informado o tamanho da população (número de unidades produzidas) 
considera-se amostragem com reposição ou amostragem sem reposição de uma população muito 
maior que a amostra. Assim sendo, o intervalo de confiança de 95% para o custo médio deste artigo 
é 
10
79,126,21,8
10
79,126,21,8 +<<− µ ∴ 38,9$R82,6$R << µ 
 Este resultado significa que a probabilidade de que o intervalo acima contenha o custo 
médio das unidades deste artigo é 0,95. 
Intervalo de Confiança para a 
Proporção Populacional
• Suponha que certa população tenha uma proporção pi
de objetos com uma característica de interesse para o 
pesquisador (por exemplo, pi pode ser a proporção de 
unidades defeituosos de certo artigo numa linha de 
produção). 
• Neste caso, o estimador não tendencioso de pi é a 
proporção amostral P. Considerando-se amostragem 
com reposição, sabe-se da distribuição amostral da 
proporção que a proporção amostral P tem média igual 
a pi e desvio padrão
n
P
)1( pipi
σ
−
=
Intervalo de Confiança para a 
Proporção Populacional (cont.)
• Para grandes amostras (n ≥ 30), a proporção 
amostral P tem distribuição aproximadamente 
normal. Assim sendo, a variável normal 
padronizada associada a P é
• tem distribuição aproximadamente normal 
padronizada.
n
pp
PZP )1( −
−
=
pi
Intervalo de Confiança para a 
Proporção Populacional (cont.)
Considere a proporção 1−α de amostras da população em estudo tais que
ααα −=<<− 1)( 2/2/ zZzP P
Intervalo de Confiança para a 
Proporção Populacional (cont.)
α
pi
αα −=<
−
−
<− 1))1(( 2/2/ z
n
pp
p
zP
n
pp
zp
n
pp
zp )1()1( 2/2/ −+<<−− αα pi
Intervalo de confiança para a 
Proporção Populacional (cont.)
• Se a amostragem é sem reposição, usando o 
mesmo raciocínio, tem-se que o intervalo de 
confiança de 100(1−α)% para a proporção 
populacional é
– Observação: Se N >> n (para fins práticos, N ≥≥≥≥ 10n) o termo
– e a amostragem sem reposição é equivalente à amostragem 
com reposição
11 ≅−
−
N
nN
1
)1(
1
)1(
2/2/
−
−
−
+<<
−
−
−
− N
nN
n
pp
zpN
nN
n
pp
zp αα pi
Exemplo
• Um produtor deseja estimar a proporção de 
itens de certo artigo na linha de produção de 
sua empresa que apresentam defeito de 
fabricação. Para esta finalidade, retirou uma 
amostra de 200 itens retirados aleatoriamente 
da linha de produção, constatando que 16 
destes apresentam defeito de fabricação. 
Construa e interprete um intervalo de confiança 
de 95% para a proporção de itens na linha de 
produção que apresentam defeito de fabricação.
Solução
Não tendo sido informado o tamanho da população (número de itens produzidos) admite-se 
amostragem com reposição ou amostragem sem reposição de uma população infinita ou população 
finita muito maior que a amostra e o intervalo de confiança para a proporção de itens defeituosos na 
linha de produção é 
n
pp
zp
n
pp
zp )1()1( 2/2/ −+<<−− αα pi 
onde p = x/n. Na amostra de tamanho n = 200 foram observados x = 16 itens defeituosos. Então a 
estimativa da proporção pi de itens defeituosos na linha de produção é 
08,0
200
16
==p 
 Sendo 1 − α = 0,95, α = 0,05 e o coeficiente de confiança 2/αz é tal que 
95,0)( 2/2/ =<<− αα zZzP P como ilustra o gráfico a seguir. 
 
Solução (cont.)
475,02/95,02/)()0( 2/2/2/ ==<<−=<< ααα zPZzPzPZP 
Pela tabela do apêndice 1 tem-se que 2/αz = 1,96. Assim sendo, o intervalo de 95% para a 
proporção de itens defeituosos na linha de produção é 
200
)08,01(08,096,108,0200
)08,01(08,096,108,0 −+<<−− pi ∴ 118,0042,0 << pi 
 Com este resultado, a probabilidade de que o intervalo acima contenha a proporção de itens 
defeituosos na linha de produção é 0,95. 
DETERMINAÇÃO DO TAMANHO DA 
AMOSTRA PARA ESTIMAÇÃO DA MÉDIA
• Considere uma variável X N (µ, σ 2). Para um 
intervalo de confiança de 100(1−α)% para µ
construído a partir de uma determinada amostra 
com média extraída com reposição tem-se que
• onde é o erro de estimativa. Explicitando-
se n tem-se que
n
x
z
σ
µ
α
−
=
2/
2
0
22
2/
 
e
z
n
σα
=
0ex =− µ
DETERMINAÇÃO DO TAMANHO DA AMOSTRA 
PARA ESTIMAÇÃO DA MÉDIA (cont.)
• No caso da amostragem sem reposição de uma 
população finita de tamanho N tem-se que 
1
2/
−
−
−
=
N
nN
n
x
z
σ
µ
α
22
2/
2
0
22
2/
 )1( σ
σ
α
α
ze
Nz
n
N +−
=
DETERMINAÇÃO DO TAMANHO DA AMOSTRA 
PARA ESTIMAÇÃO DA MÉDIA (cont.)
• Se o desvio padrão populacional σ é desconhecido, 
substitui-se o mesmo por sua estimativa s obtida a partir 
de uma amostra inicial, denominada amostra piloto com 
n’ elementos (sendo n’ arbitrário) e procede-se do 
seguinte modo:
– se n for maior que n’, o tamanho da amostra definitiva 
será n e deve-se acrescentar aos n’ elementos da 
amostra piloto até completar a amostra de tamanho 
n; 
– se n for menor ou igual a n’, a amostra piloto já é
suficiente e o tamanho da amostra definitiva será n = 
n’
Exemplo
• Um pesquisador deseja estimar o preço 
médio de um produto nos pontos de 
venda de certa região, de modo que o erro 
de estimação seja no máximo igual a 
R$2,00, admitindo-se um nível de 
confiança de 95%. O pesquisador dispõe 
de uma amostra piloto de 40 pontos de 
venda nos quais o desvio padrão do preço 
do produto é igual a R$12,00. Qual deve 
ser o tamanho da amostra?
Solução
Não tendo sido informado o tamanho da população (número de pontos de venda da região), o 
tamanho da amostra é 
2
0
22
2/
 
e
z
n
σα
= 
Pelos dados do problema, tem-se que 0e = 2 e σ = 12. Sendo ,95,01 =−α 05,0=α e 
025,0z é tal que 95,0)( 2/2/ =<<− αα zZzP X como ilustra o gráfico a seguir. 
 
Figura 5.8 
Observando-se o gráfico acima tem-se que 
475,02/95,02/)()0( 2/2/2/ ==<<−=<< ααα zZzPzZP XX 
Pela tabela do apêndice 1 tem-se que 2/αz = 1,96. Assim sendo, o tamanho da amostra para estimar 
o preço médio do produto nos pontos de venda da região é 
2
22
2
1296,1
 
×
=n ∴ 139 =n 
DETERMINAÇÃO DO TAMANHO DA AMOSTRA 
PARA A ESTIMAÇÃO DA PROPORÇÃO
• Considere uma população com uma 
proporção pi de objetos e uma amostra 
extraída com reposição com uma 
proporção p de objetos 
• onde é o erro de estimativa 
n
p
z
)1(2/ pipi
pi
α
−
−
=
0ep =− pi
2
0
2
2/ )1( 
 
e
z
n
pipiα −
=
DETERMINAÇÃO DO TAMANHO DA AMOSTRA 
PARA A ESTIMAÇÃO DA PROPORÇÃO (cont.)
• No caso da amostragem sem reposição 
de uma população finita de tamanho N 
tem-se que
• Como a proporção pi é desconhecida, emprega-se uma 
estimativa da mesma a partir de uma amostra piloto 
como no caso da média 
1
)1(2/
−
−−
−
=
N
nN
n
p
z
pipi
pi
α
)(1 )1(
)(1 
 2
2/
2
0
2
2/
pipi
pipi
α
α
−+−
−
=
zeN
Nz
n
Exemplo
• Com o objetivo de estimar a proporção de itens 
defeituosos numa produção, um administrador 
de produção deseja extrair uma amostra 
aleatória de itens da referida produção para tal 
fim. Uma amostra piloto de 40 itens apresentou 
4 defeituosos. Qual deve ser o tamanho da 
amostradefinitiva para que o erro de estimação 
da proporção de defeituosos na população seja 
de no máximo 3% a um nível de confiança de 
95%? 
Solução
 Não tendo sido informado o tamanho da população (número de itens produzidos) o tamanho 
da amostra é 
2
0
2
2/ )1( 
 
e
z
n
pipiα −
= 
Sendo pi desconhecido, considera-se a partir da amostra piloto 
1,0
40
4
==pi 
Pelos dados do problema, tem-se que 0e = 0,03. Sendo ,95,01 =−α 05,0=α e 025,0z
é tal que 95,0)( 2/2/ =<<− αα zZzP X como ilustra o gráfico a seguir. 
 
Solução (cont.)
Observando-se o gráfico acima tem-se que 
475,02/95,02/)()0( 2/2/2/ ==<<−=<< ααα zZzPzZP XX 
Pela tabela do apêndice 1 tem-se que 2/αz = 1,96. Assim sendo, o tamanho da amostra para estimar 
a proporção de itens defeituosos na produção é 
203,0
)1,01(1,096,1
 
−×
=n ∴ 385 =n 
Neste caso deve-se acrescentar 345 itens à amostra piloto. 
Intervalo de confiança para a variância de
uma população
• Seja uma amostra 
aleatória extraída 
uma população 
X~ N (µ, σ 2). A variável 
aleatória:
• tem distribuição do 
chi-quadrado com 
n −1 graus de 
liberdade
2
2
12
( 1)
~ n
n s χ
σ −
−
⇒
DistribuiDistribuiçção ão χχ22
2 1 2
2
1( ) 0
2 ( 2)
g x
gf x x e xg
− −
= ≥
Γ
( )E X g=
( ) 2Var X g=
2
~ gX χ (lê-se: X tem distribuição qui-quadrado com g graus 
de liberdade)
0 +∞
g ≤ 2
0 +∞
g > 2
Propriedades:
a) se , então 2 21~Z χ~ (0,1)Z N
b) se , então 2
1
~
n
i n
i
X χ
=
∑21~iX χ
Intervalo de ConfianIntervalo de Confiançça para a para σσ22
2
α
2
α
IC para σ2
2
2
12
( 1)
~ n
n s χ
σ −
−
2
1nχ −
0 +∞ax bx
1 α−
2
1( ) 1a n bP x xχ α−< < = −
2
2
( 1)( ) 1
a b
n sP x x α
σ
−
< < = −
2
2
1 1 1( 1)b a
P
x n s x
σ
α
 
< < = − 
− 
2 2
2( 1) ( 1) 1
b a
n s n sP
x x
σ α
 
− −
< < = − 
 
χ2
Exemplo
• Uma máquina produz uma grande quantidade 
de peças e o número de peças defeituosas da 
produção se distribui normalmente com 
variância σ²(x) = 16. Com o objetivo de diminuir 
a variabilidade do processo, foi providenciada 
uma reforma na máquina. Uma amostra 
aleatória de 51 peças produzidas após a 
reforma forneceu variância 14. Construa um 
intervalo de confiança de 98% para a nova 
variância populacional.
Solução
n = 51 , logo gl (grau de liberdade) = n – 1 = 50 
s² = 14 χ²(1 – α/2) = χ²(0,99) = 76,2 
 χ²
 (α/2) = χ²(0,01) = 29,7 
1 – α = 98% ; α = 0,02 ; α/2 = 0,01 
Teremos então o seguinte intervalo de confiança para a variância: 
P ( ≤ σ² ≤ ) = 1 – α 
P ( ≤ σ² ≤ ) = 0,98 
P ( 9,186 ≤ σ² ≤ 23,569) = 0,98 
Intervalo de confiança para a diferença
entre as médias de duas populações normais,
variâncias desconhecidas
Intervalo de ConfianIntervalo de Confiançça para a para µµ11 -- µµ22
1 ~ ?X
1 2 1 2
2 2
1 2
1 2
( ) ( )
~ ?X X
n n
µ µ
σ σ
− − −
+
(0,1)N
-∞ +∞0
(0,1)N
z-z
2
α
2
α 1 α−
( ) 1P z Z z α− < < = −
1 2 1 2
2 2
1 2
1 2
( ) ( )( ) 1X XP z z
n n
µ µ
α
σ σ
− − −
− < < = −
+
2 2 2 2
1 2 1 2
1 2 1 2 1 2
1 2 1 2
( ) 1P X X z X X z
n n n n
σ σ σ σµ µ α− − + < − < − + + = −
IC para µ1 - µ2
2
1 1 1~ ( , )X N µ σ
2
1
1 1
1
~ ( , )X N
n
σµ
Z
2
2 2 2~ ( , )X N µ σ desconhecidas, mas conhecidasiµ 2iσ
2
2
2 2
2
~ ( , )X N
n
σµ 1 2 ~ ?X X−
2 2
1 2
1 2 1 2
1 2
~ ( , )X X N
n n
σ σµ µ− − +
Exemplo
• Duas populações normais independentes, 
com distribuições x1 e x2, apresentam 
σ(x1) = 5 e σ(x2) = 2. Uma amostra 
aleatória de 12 elementos da primeira 
população apresentou x1 = 34. Uma 
amostra aleatória de 8 elementos da 
segunda população apresentou x2 = 9,4. 
Calcule o intervalo de confiança de 98% 
para a diferença µ₁ - µ₂.
Solução
P [ (34 – 9,4) – Zα/2 < (µ ₁ - µ₂) < (34 – 9,4) + Zα/2 ] = 0,98 
1 – α = 98% ; α = 2% ; α/2 = 0,01 ; logo, Zα/2= 2,325 
P [ 24,6 – 2,325(1,607) < (µ ₁ - µ₂) < 24,6 + 2,325(1,607) ] = 0,98 
P [ 20,864 < (µ ₁ - µ₂) < 28,336 ] = 0,98 
-∞ +∞0
gt
t-t
2
α
2
α 1 α−
( ) 1P t T t α− < < = −
Intervalo de ConfianIntervalo de Confiançça para a para µµ11 -- µµ22
1 2 1 2
2 2
1 2
1 2
( ) ( )
~ g
X X
t
s s
n n
µ µ− − −
+
2
1 1 1~ ( , )X N µ σ 22 2 2~ ( , )X N µ σ e desconhecidasiµ 2iσ
1 2 1 2
2 2
1 2
1 2
( ) ( )
~ ?X X
n n
µ µ
σ σ
− − −
+
(0,1)N
1 2 1 2
2 2
1 2
1 2
( ) ( )( ) 1X XP t t
s s
n n
µ µ
α
− − −
− < < = −
+
2 2 2 2
1 2 1 2
1 2 1 2 1 2
1 2 1 2
( ) 1s s s sP X X t X X t
n n n n
µ µ α− − + < − < − + + = −
IC para µ1 - µ2 (atenção: t heterocedástico)2 21 2σ σ≠
22 2
1 2
1 2
2 22 2
1 2
1 2
1 21 1
s s
n n
g
s s
n n
n n
 
+ 
 
≈
   
   
   +
− −
(considerando 2 21 2σ σ≠ )
Exemplo
• Com os dados de resistências à
compressão em concretos com cimentos 
das marcas A e B, considerando 
variâncias desconhecidas. E nível de 
confiança de 95%.
Exemplo
Exemplo
Intervalo de ConfianIntervalo de Confiançça para a para pipi11 –– pipi22
Exemplo
• Duas máquinas produzem o mesmo tipo de 
peça, que são misturadas para embalagem 
posterior. Uma amostra de 40 peças da primeira 
máquina apresentou 1 peça defeituosa, 
enquanto uma amostra de 36 peças da segunda 
máquina apresentou 2 peças defeituosas. 
Calcule, ao nível de 98%, um intervalo de 
confiança para a diferença das proporções de 
peças defeituosas na produção dessas 
máquinas.
Solução