Apostila Inferência Estatistica

•

UEM

Diego Alberti

25.10.2015

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 31 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 31 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 31 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Estatística Econômica I

625 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

INFERÊNCIA ESTATÍSTICA 
 
 
 
 
 
 
 
 
 
 
 
 
1 
 
 
 
CAPÍTULO I 
 
1 - DISTRIBUIÇÃO AMOSTRAL DE PROBABILIDADE 
A Distribuição Amostral de Probabilidade é um estudo das relações existentes entre uma 
população e as amostras dela extraídas. 
É útil em: 
- estimação de parâmetros populacionais; 
- determinação das causas de diferenças observadas entre amostras. 
Constitui o que chamamos de inferência estatística que consiste em inferir conclusões 
importantes sobre uma população a partir da análise de resultados observados em amostras aleatórias. 
Como toda conclusão deduzida a partir da amostragem é acompanhada de um grau de incerteza ou 
risco, o problema fundamental da inferência estatística é medir este grau de incerteza ou risco das 
generalizações. 
Parâmetro: medida numérica que descreve uma população. Genericamente representado por θ. 
Exemplos: média (μ), variância (σ2 ). 
Estatística ou estimador: medida numérica que descreve uma amostra. Genericamente 
representado por 

. 
Exemplos: média (
x
), variância ( s
2 
). 
Estimativa: valor numérico de um estimador. 
Uma distribuição amostral é a distribuição de probabilidade de um estimador (ou estatística) 
da amostra formada quando amostras de tamanho n são colhidas várias vezes de uma população. Por 
exemplo, se o estimador da amostra for a sua média, a distribuição será uma distribuição amostral de 
médias das amostras (Figura 1). 
 
Figura 1: Distribuição Amostral da média 
 
A Distribuição Amostral é uma distribuição de probabilidade que indica até que ponto uma 
estatística amostral tende a variar devido a variações casuais na amostragem aleatória. 
Uma vez que a estatística amostral é uma variável aleatória, estaremos interessados não 
apenas no seu modelo probabilístico, mas também na sua média ou valor esperado e sua variância. 
2 
 
 
 
1.1 - DISTRIBUIÇÃO AMOSTRAL DAS MÉDIAS 
 
Considerando uma população X com parâmetros e . Se tirar uma amostra aleatória de 
tamanho n e calcular a sua média tem-se um valor 
1x
. Tirando uma segunda amostra temos uma nova 
média 
)x( 2
 em geral diferente de 
1x
, e assim, para cada diferente amostra de tamanho n tem-se um 
diferente valor da média amostral, X. Tem-se, portanto, que a média amostral, é uma variável que 
muda de valor, de amostra em amostra. Tem, portanto, sentido falar da distribuição de médias 
amostrais, uma vez que X é uma variável aleatória. 
Para facilitar o entendimento um exemplo será apresentado abaixo. 
Exemplo 
Seja uma população constituída por cinco funcionários de uma pequena lanchonete com os seguintes 
salários mínimos 2 , 3 , 4 , 4 , 5, respectivamente. O salário do funcionário da lanchonete é definido 
como a variável aleatória X. Então, determine: 
a) a distribuição de probabilidade X. 
b) a média (), a variância (2) e o desvio padrão () da v.a. X. 
c) todas as amostras possíveis de tamanho n=2, com reposição, da população dos salários e apresente a 
média. Faça a distribuição amostral da média (dist. de probabilidade da média). 
d) a média (E(
x
)), a variância (Var(
x
 )) e o desvio padrão (DP(
x
 )) da v.a. média amostral. 
f) o gráfico da distribuição da amostral média. 
Resolução 
a) a distribuição de probabilidade de X. 
Distribuição de probabilidade dos salários dos funcionários da lanchonete. 
X 2 3 4 5 ∑ 
f(x) 1/5 1/5 2/5 1/5 1 
 
b) = 3,6 ; 2 = 1,04 ; = 1,02 
 
c) 
Todas as amostras possíveis de tamanho n=2, com reposição, da população dos salários. 
(X1 , X2) = {(2 , 2) ; (2 , 3) ; (2 , 4) ; (2 , 4) ; (2 , 5) ; (3 , 2) ; (3 , 3) ; (3 , 4) ; (3 , 4) ; 
(3 , 5) ; (4 , 2) ; (4 , 3) ; (4 , 4) ; (4 , 4) ; (4 , 5) ; (4 , 2) ; (4 , 3) ; (4 , 4) ; (4 , 4); (4 ,5); 
(5 , 2) ; (5 , 3) ; (5 , 4) ; (5 , 4) ; (5 , 5)}. 
 
Média das amostras 
X
: {
1x
=2; 
2x
=2,5; 
3x
=3; 
4x
=3; 
5x
=3,5; 
6x
=2,5; 
7x
=3; 
8x
=3,5; 
9x
=3,5; 
10x
=4; 
11x
=3; 
12x
=3,5; 
13x
=4; 
14x
=4; 
15x
=4,5; 
16x
=3; 
17x
=3,5; 
18x
=4; 
19x
=4; 
20x
=4,5; 
21x
=3,5; 
22x
=4; 
23x
=4,5; 
24x
=4,5; 
25x
=5} 
 
Distribuição de probabilidade da média dos salários dos funcionários da lanchonete. 
X
 2 2,5 3 3,5 4 4,5 5 ∑ 
f(x) 1/25 2/25 5/25 6/25 6/25 4/25 1/25 1 
 
d) a média (E(
x
)), a variância (Var(
x
 )) e o desvio padrão (DP(
x
 )) da v.a. média 
amostral. 
X
 2 2,5 3 3,5 4 4,5 5 ∑ 
f(
x
) 1/25 2/25 5/25 6/25 6/25 4/25 1/25 1,00 
X
∙f(
x
) 2/25 5/25 15/25 21/25 24/25 18/25 5/25 90/25=3,60 
2
X
∙f(
x
) 4/25 12,5/25 45/25 73,5/25 96/25 81/25 25/25 337/25=13,48 
3 
 
 
 
Então, média da distribuição amostral da média é 



n
i
i
,)x(fX)X(E
1
563
 
variância da distribuição amostral da média é 
520634813 222 ,,,)]X(E[)X(E)X(Var 
 
desvio padrão da distribuição amostral da média ou erro padrão 
  720520 ,,XDP 
 
Assim, é provado que a média das médias amostrais é igual à média populacional. E que a 
variância da distribuição das médias é igual à variância populacional dividida pelo tamanho da 
amostra. 
 
f) o gráfico da distribuição da amostral média. 
 
 
Teorema 1: Seja X uma variável aleatória com média µ e variância σ2, e seja (X1,X2,X3,..., Xn) uma 
amostra aleatória. Então, 
  XE
 e 
 
n
XVar
2

 
em que: 
 XE
: média da distribuição amostral da média 
 XVar
: variância da distribuição amostral da média 
 XDP
: desvio padrão da distribuição amostral da média ou erro padrão 
n: tamanho da amostra 
 
Teorema Central do Limite: Para amostras aleatórias (X1 , X2 , X3 , ... , Xn), retiradas de uma população 
com média µ e variância σ2, a distribuição amostral da média aproxima-se de uma distribuição normal 
com média µ e variância 
n
2
, quando n é grande, ou seja, 






n
 
2
 ;N~X
. 
 
Corolário1: Se (X1 , X2 , X3 , ... , Xn) for uma amostra aleatória da população X com média (µ) e 
variância (σ2), 
n)XX(X
n
 
1
, então 
n
X
Z



 Z~N(0 ; 1) 
Caso deseja-se calcular o erro amostral da média (e), basta fazer a diferença entre a estatística 
X
 e o parâmetro µ, isto é, 
4 
 
 
 
 Xe
 
Corolário2: A distribuição do erro amostral da média aproxima-se de uma distribuição normal com 
média zero e variância 
n
2
, isto é, 
n
X
Z



 

 
n
e
Z


 
 
Z~N(0 ; 1) 
 
 
Exemplo: 
Sabe-se que a distribuição do quociente de inteligência (QI), das crianças da escola X, é Normal com 
média populacional de 102 pontos e variância populacional igual a 100 pontos
2
. Se 15 alunos desta 
escola forem selecionados ao acaso, determine: 
 
a) a média e o desvio padrão da distribuição amostral do QI médio. 
  102 XE 
  582
15
1002
,
n
XDP 
 
 
b) a probabilidade de estas crianças apresentarem um QI médio inferior a 98 pontos. 
 






15
100
 102;N~X
 
  ?XP  98
 
551
15
10
10298
,
n
X
Z 



 
 
    %,,,ZPXP 0660606055198 
 
 
 
c) a probabilidade de estas crianças apresentarem um QI médio superior a 107 pontos. 
  ?XP 107
 
941
15
10
102107
,
n
X
Z 



 
 
      %,,,ZP,ZPXP 62202619009738119411941107 
 
ou 
      %,,,ZP,ZPXP 622026190941941107 d) a probabilidade de estas crianças apresentarem um QI médio entre 99 a 104 pontos. 
  ?XP  10499
 
161
15
10
10299
,Z 


 e 
770
15
10
102104
,Z 


 
       16177077016110499 ,ZP,ZP,Z,PXP 
 
  %,,,,XP 636565633012302077935010499 
 
5 
 
 
 
1.2 - DISTRIBUIÇÃO AMOSTRAL DA DIFERENÇA DE DUAS MÉDIAS 
 
Sejam duas populações X1 e X2 (normais) com parâmetros 1 , 
2
1

 e 
2
2

, respectivamente. 
Retirando todas as possíveis amostras (independentes) das duas populações e considerando todas as 
combinações possíveis dessas amostras das duas populações, podemos obter uma distribuição das 
diferenças das médias 
 21 XX 
, chamadas Distribuição Amostral das Diferenças das Médias. 
Sendo 






1
2
1
11
n
 

 ;N~X
 e 






2
2
2
22
n
 

 ;N~X
, a média e a variância de 
21 XX 
, denotadas 
respectivamente por 
 21 XXE 
 e 
 21 XXVar 
 são dadas por: 
- média da distribuição amostral da diferença de duas médias 
2121
  )XX(E
 
- variância da distribuição amostral da diferença de duas médias é obtida por: 
2
2
2
1
2
1
21
nn
)XX(Var


 
 
Dessa forma, tem-se: 







2
2
2
1
2
1
2121
n
 
n
;N~XX

 
A variável normal padronizada será: 
   
2
2
2
1
2
1
2121
nn
XX
Z





 
 
Caso X1 e X2 não tenham distribuição normal, os resultados continuam sendo válidos para n1 e 
n2 suficientemente grandes. 
 
Exemplo 
A distribuição dos salários (salários mínimo) de operários de uma grande fábrica é Normal. O salário 
médio populacional do sexo masculino é igual a 6,5 e variância populacional de 1,69. E para as 
mulheres o salário médio é de 5,5 e variância populacional de 2,25. Se 25 homens e 30 mulheres forem 
recém-contratados, determine: 
a) média e o desvio padrão da distribuição amostral da diferença das duas médias salariais entre os 
sexos. 
0155562121 ,,,)XX(E   
3780
30
252
25
691
2
2
2
1
2
1
21 ,
,,
nn
)XX(DP 
 
 
b) a probabilidade dos salários médios diferir entre os sexos no máximo em 1,5 salários mínimos. 







30
252
25
691
 5506
,,
;,,N~XX FM
 
  ?,XXP FM  51
      
321
30
252
25
691
555651
2
2
2
1
2
1
2121 ,
,,
,,,
nn
XX
Z 







 
    90,66% 906580 1,32ZP 51  ,,XXP FM
 
6 
 
 
 
1.3 - DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO 
 
Seja X uma população e que a probabilidade da ocorrência de um evento é p, enquanto a não-
ocorrência é q, isto é, q=1-p. Pode-se constatar que esta população tem distribuição Binomial, logo 
com média np e variância npq. 
Considerando todas as amostras possíveis de tamanho n extraída desta população para cada 
amostra, tem-se a distribuição amostral da proporção denotado por 
pˆ
, obtida por 
n
x
pˆ 
 
em que 
n: tamanho da amostra 
x: número de elementos da amostra que apresentam a característica em estudo. 
Então, a média da distribuição amostral da proporção é dada por 
    p
n
np
xE
nn
x
EpˆE 






1
 
e variância da distribuição amostral da proporção é obtida por 
   
n
pq
npq
n
xVar
nn
x
VarpˆVar 






22
11
 
 
Assim, para n suficientemente grande, pode-se considerar a distribuição amostral de 
pˆ
 
aproximada da distribuição Normal, isto é 






n
pq
 ,pN~pˆ
. 
Tendo em vista o Teorema Central do Limite tem-se que: 
n
pq
ppˆ
Z


 Z~N (0, 1) 
Exemplo: 
Sabe-se que 20% dos estudantes do Ensino Médio da cidade Y são fumantes. Se 150 estudantes forem 
selecionados ao acaso, determine: 
a) a média e desvio padrão da distribuição amostral da proporção de alunos fumantes. 
  20,ppˆE 
 
  03270
150
8020
,
,,
n
pq
pˆDP 


 
 
b) a probabilidade de mais 25% dos alunos serem fumantes. 






150
0,8 0,2.
 0,2; N~pˆ
 
  ?,pˆP  250
 
531
150
8020
20250
,
,,
,,
n
pq
ppˆ
Z 





 
      6,30%0,06301 531 531 531  ,ZP,ZP,pˆP
 
 
7 
 
 
 
CAPÍTULO II 
 
2. INTERVALOS DE CONFIANÇA 
 
A estimativa de um parâmetro por pontos (pontual) não possui uma medida do possível erro 
cometido na estimação. 
Uma maneira de expressar a precisão da estimação é estabelecer limites, que com certa 
probabilidade incluam o verdadeiro valor do parâmetro da população. Esses limites são chamados 
“limites de confiança”: determinam um intervalo de confiança no qual deverá estar o verdadeiro valor 
do parâmetro. 
Logo, a estimativa por intervalo consiste na fixação de dois valores tais que (1-) seja a 
probabilidade de que o intervalo, por eles determinado, contenha o verdadeiro valor do parâmetro, em 
que: 
 : nível de significância 
(1-) : coeficiente de confiança ou nível de confiabilidade 
Logo, a partir de informações da amostra, devemos calcular os limites de um intervalo, 
valores críticos, que em (1-)% dos casos inclua o valor do parâmetro a estimar e em % dos casos 
não inclua o valor do parâmetro. 
 
2.1. INTERVALO DE CONFIANÇA PARA A MÉDIA 
2.1.1. QUANDO A VARIÂNCIA POPULACIONAL 2 FOR CONHECIDA: 
 
Deseja-se estimar a média da população X conhecendo o valor da variância 2, ou seja X:N (? , 2). 
Com a utilização das distribuições amostrais, 







 

n
, Nx
2 , 
Procedimentos para a construção do intervalo de confiança (IC): 
 Retira-se da população uma amostra casual simples de n elementos. 
 Calcula-se a média da amostra 
x
. 
 Calcula-se o desvio padrão da média amostral 
nn
2
x




. 
 Fixa-se o nível de significância  e determina-se o valor de Z correspondente. 
2
)-zP(z e 
2
)zP(z seja, ou )zz(P
22



 
 
8 
 
 
 
 
 
Usando uma notação simplificada para o intervalo de confiança para a média populacional, 
temos: 
IC[; (1-)100%] = 
 oex 
 
em que 
n
ze
2

 
 
isto é 
IC[ , 1-] = 







n
zx;
n
zx


22
 
, 
ou 













n
zx
n
zx
 
22
 
, com (1-) de confiabilidade. 
 
Exemplo: 
Uma máquina automática de refrescos é regulada de modo que a quantidade suprida de cada vez tenha 
distribuição aproximadamente normal com desvio padrão de 1,3 dl. Determinar o intervalo de 96% de 
confiança para a quantidade média de todos os refrescos servidos sabendo que uma amostra de 30 
copos de refresco acusou conteúdo médio de 21,0 ,dl. 
Solução: 
n = 30 
0,21x 
  = 1,3 (desvio padrão populacional conhecido) 
(1-) = 0,96 (1-/2) = 0,98 z0,98= 2,05 
 Logo: 
IC[; (1-)100%] = 
 oex 
=







n
zx


2
 
IC[; 96%] = 







30
31
05221 
30
31
05221
,
,;
,
,
 
IC[; 96%] = 
 21,49 5120 ;,
 ou 20,51 <  < 21,49 
Conclusão: Estima-se que a quantidade média dos refrescos servidos pela máquina está entre 20,51 dl e 
21,49 dl com uma confiança de 96%. 
 
2.1.2. INTERVALO DE CONFIANÇA PARA A MÉDIA QUANDO A VARIÂNCIA 
POPULACIONAL 2 FOR DESCONHECIDA:O procedimento padrão é o mesmo que o adotado para anteriormente. 
- Retira-se uma amostra de n elementos da população. 
- Calcula-se a média da amostra 



n
i
ix
n
x
1
1
. 
- Calcula-se a variância amostral: 















  
 
2
1 1
22
n
1
 - 
1
1
 
n
i
n
i
ii xx
n
s
 
9 
 
 
 
A variável 
x
x
Z



 tem distribuição normal. Quando não conhecemos a variância 2, 
devemos usar seu estimador s
2
 e tem-se: 
 
n
s
n
s
sxDP x 
2. A variável definida como 
xs
x
t




 é denominada variável com distribuição t de Student com  graus de liberdade, 
em que  = n-K (n é o número de informações independentes da amostra e K número de parâmetros da 
população a serem estimados além do parâmetro inerente ao estudo). 
Quando n é grande, s
2
 se aproxima bastante de 2, o que faz com que a variável t se aproxime 
da variável normal Z. 
* Observe que 
xs
 é o estimador de 
x
 (estimador do erro padrão). 
Usando uma notação simplificada para o intervalo de confiança para a média populacional, 
temos: 
IC[ , (1-)100%] = 







n
tx;
n
tx


22
 
 
ou 













n
tx
n
tx
 
22
 
, com (1-) de confiabilidade 
Exemplo: 
Certo estudo deseja estimar o número médio de óbitos do sexo masculino por dependência alcoólica na 
região X. O quadro abaixo apresenta o número de óbitos dessa região de 1995 a 2007. 
19 25 32 21 30 27 22 18 31 18 23 26 20 
Admitindo que o número de mortes tem distribuição Normal. Determine: 
a) o intervalo de 95% de confiança para o número médio de óbitos do sexo masculino por dependência 
alcoólica na região X. 
n=13 
x
24 s=4,92 (1-)=0,95 /2=0,025 
  1-13 ;025,0t
2,179 
IC[; 95%] =
  






n
s
tx , 12 ; 0250
 
IC[; 95%] =







13
924
179224
,
,
=
 97224 ,
 
IC[; 95%] = 
 26,97 0321 ;,
 mortes 
 
Conclui-se com 95% de certeza que o número médio populacional de mortes do sexo 
masculino por dependência alcoólica na região X está entre 21,03 e 26,97. 
 
b) o erro máximo se aumentar o nível de confiança para 98%. 
  663
13
924
681212 010 ,
,
,
n
s
te ;,o 
 mortes 
 
10 
 
 
 
2.1.3. INTERVALO DE CONFIANÇA PARA A MÉDIA COM GRANDES AMOSTRAS 
 
É importante saber que a população submetida a amostragem tem distribuição Normal, ou ao 
menos aproximadamente Normal, caso não a tenha essas técnicas não podem ser utilizadas. Então, para 
grandes amostras aplica-se o Teorema Central do Limite, ou seja para n suficientemente grande (n≥30) 
os dados têm distribuição aproximadamente Normal. 
Portanto, o intervalo de confiança é dado por: 
IC[; (1-)100%] = 
 oex 
 
IC[; (1-)100%] =







n
s
zx
2

 
 
Exemplo: 
Um estudo selecionou 90 estudantes do Colégio X para estimar o escore médio a resistência à distração 
aplicada pelo teste WISC-III. O índice médio e o desvio padrão amostral a resistência à distração é de 
91,36 e 23,78 pontos, respectivamente. Determine: 
a) o intervalo de 90% de confiança para o escore médio populacional dos alunos do Colégio X. 
 
3691,x 
 s= 23,78 n = 90 
(1-) = 0,90  = 0,10 /2 = 0,05 z0,05= 1,65 
IC[; 90%] =







n
s
zx
2

 
IC[; 90%] =







90
7823
6513691
,
,,
=
 1443691 ,, 
 
IC[; 90%] = 
 95,50 2287 ;,
 pontos 
 
Conclusão: Pode-se afirma, em nível de 90% de confiança, que o escore médio a resistência à distração 
dos estudantes do colégio X está entre 87,22 e 95,50 pontos. 
 
b) o erro máximo se aumentar o nível de confiança para 94%. 
714
90
7823
881
2
,
,
,
n
s
zeo  
 pontos 
 
2.2. INTERVALO DE CONFIANÇA PARA A DIFERENÇA DE MÉDIA 
2.2.1. QUANDO AS VARIÂNCIAS POPULACIONAIS FOREM CONHECIDAS 
 
A construção do Intervalo de confiança (IC) é semelhante a realizada para a média quando 
conhecemos a variância populacional. Deve-se observar a distribuição para a diferença das médias. 
Sejam duas amostra de tamanho n1 e n2 retiradas respectivamente de populações com 
distribuições normais independentes X1 e X2 com média 1 e 2 e desvios padrões 1 e 2. O IC para a 
diferença das médias (1 - 2) será; 
IC[1 - 2 , (1-)100%] = 
 









2
2
2
1
2
1
2
21021
nn
z)xx(e)xx(


 
ou 


















2
2
2
1
2
1
2
2121
2
2
2
1
2
1
2
21 ( 
nn
z)xx()
nn
z)xx(
 com (1-) de confiabilidade. 
11 
 
 
 
Exemplo: 
1. Um grupo de pesquisadores deseja verificar a diferença entre o escore médio da memória imediata 
dos adolescentes e adultos, sabendo que a variância populacional do escore dos adolescentes é 1,6 
pontos
2
 e dos adultos é 2,0 pontos
2
. Foram selecionados 60 adolescentes e 50 adultos e obtiveram o 
seguinte escore médio 7,5 e 6,3 pontos, respectivamente. Considerando Normal a distribuição do 
escore obtido no teste de memória imediata, determine: 
a) o intervalo de 95,4% de confiança para diferença dos escores médios. 
IC[1-2 ; 95,4%]=









2
2
2
1
2
1
023021
nn
z)xx( ,
 
IC[1-2 ; 95,4%]=







50
02
60
61
023657
,,
,),,(
 
IC[1-2 ; 95,4%]=
 52021 ,, 
 
IC[1-2 ; 95,4%]=
 721 ; 680 ,,
 pontos 
 
Conclui-se que, em nível de 95,4%, pode-se afirmar que a diferença entre o escore médio da memória 
imediata dos adolescentes e adultos está entre 0,68 e 1,72 pontos. 
 
2.2.2. QUANDO AS VARIÂNCIAS POPULACIONAIS 
 
FOREM DESCONHECIDAS 
Para o caso de pequenas amostras, considerando pequenas se (n1+n2)< 30, é utilizada a 
distribuição t de Student. O intervalo de confiança é dado por: 
IC[1-2 ; (1-)] = 
 
   

























2121
2
22
2
11
2
21021
11
2
11
nnnn
snsn
t)xx(e)xx( 
 
Exemplo: 
Para um particular produto A, a média de vendas por estabelecimento no último ano, em uma amostra 
de 10 estabelecimentos foi de 3.425,00 reais e desvio padrão amostral de 200 reais. Para um segundo 
produto B, a média de vendas por estabelecimento, em uma amostra de tamanho 12, foi de 3.250,00 
reais e desvio padrão amostral de 175 reais. Supondo-se que as amostras tenham sido retiradas de 
populações normais, estimar a diferença entre o nível médio de vendas por estabelecimento no último 
ano, utilizando um intervalo de confiança de 90%. 
s
2
A= 200,00 s
2
B= 175 1- = 90% 
n =10 n = 12 (
Ax
- 
Bx
) = 175,00 
Ax
 = 50 
Bx
 = 60 t10%/2= 1,725 
 
   

















2121
2
22
2
11
2
11
2
11
nnnn
snsn
te /o 
 
   
87137
12
1
10
1
21210
175112200110
7251
22
,,eo 














 
IC[1-2 ; 90%]=
     312,87 ; 133787137175021 ,,e)xx( 
 reais 
 
Conclusão: Pode-se afirmar, em nível de 90% de confiança, que a diferença entre a venda média dos 
dois produtos está entre R$ 37,13 e R$ 312,87. 
 
122.2.3. GRANDES AMOSTRAS 
Para o caso em que as amostras forem suficientemente grandes, (n1+n2)  30, a distribuição 
aproxima-se da distribuição normal e o intervalo de confiança para a diferença das médias é dado por: 
IC[1-2 , (1-)100%]=









2
2
2
1
2
1
2
21
n
s
n
s
z)xx( 
 
Exemplo: 
Certo estudo deseja-se estimar a diferença entre as jornadas excessivas de trabalho dos motoristas de 
caminhão de um grupo que se envolveu em acidentes e outro que não se envolveu. Foram entrevistados 
80 motoristas que se envolveram em acidentes, constatando que o tempo médio de trabalho é de 12,5 
horas e variância amostral de 5,3 horas
2
, enquanto que o tempo médio de trabalho de 100 motoristas 
não envolvidos em acidentes foi de 8,6 horas e variância amostral de 3,9 horas
2
. Determine: 
a) o intervalo de 95% confiança do tempo médio da jornada de trabalhos dos motoristas. 
n1=80 
1x
=12,5 s1=5,3 
n2=100 
2x
=8,6 s2=3,9 
 
IC[1-2 ; 95%]=
 









2
2
2
1
2
1
025021021
n
s
n
s
z)xx(e)xx( ,
 
IC[1-2 ; 95%]=







100
93
80
35
96168512
,,
,),,(
 
IC[1-2 ; 95%]=
 65093 ,, 
 
IC[1-2 ; 95%]=
 554 ; 253 ,,
 horas 
 
Conclusão: Pode-se afirmar com 95% de certeza que o tempo médio da jornada de trabalhos dos 
motoristas está entre 3,25 e 4,55 horas. 
 
b) o erro máximo se aumentar o nível de confiança para 97%. 
2
2
2
1
2
1
0150
n
s
n
s
ze ,o 
 
700
100
93
80
35
172 ,
,,
,eo 
 hora 
 
13 
 
 
 
2.3. INTERVALO DE CONFIANÇA PARA PROPORÇÃO 
 
Seja uma amostra de tamanho n ≥ 100. Deseja-se construir um intervalo de confiança para a 
proporção populacional p o procedimento é semelhante aos anteriores, como descrito abaixo: 
- Calcula-se a proporção da amostra 
n
x
pˆ 
, em que x é o número de ocorrência do experimento. 
- Como desconhecemos a verdadeira proporção, determina-se o desvio padrão para a distribuição 
amostral da proporção utilizando sua estimativa 
 
n
qˆpˆ
spˆDP pˆ 
. 
- Fixa-se o nível de significância  e determina-se o valor de z correspondente. 
-  

















1 z
n
qˆpˆ
ppˆ
P , que desenvolvido determina o intervalo de confiança para a proporção, isto é: 
IC[
p
, (1-)100%] = 
  






n
qˆpˆ
zpˆ;
n
qˆpˆ
zpˆepˆ
22
0 
 
ou 
 

















n
qˆpˆ
zpˆ
n
qˆpˆ
zpˆ
22
 p 
, com (1-) de confiabilidade. 
Exemplo: 
Para se estimar a porcentagem de alunos de um curso favoráveis à modificação do currículo escolar, 
tomou-se uma amostra de 100 alunos, dos quais 80 foram favoráveis à mudança. 
a) Determine o erro da estimativa admitindo-se 96% de confiança. 
n=100 
80
100
80
,pˆ 
 1-= 0,96 
n
qˆpˆ
ze 
2
0 
 
0820
100
2080
0520 ,
,,
,e 


 
O erro cometido na estimativa é de 0,082 
 
b) Para a situação anterior, determine a estimação intervalar para a verdadeira porcentagem de alunos 
favoráveis à mudança. 
IC[
p
, 96%] = 
   08200,8 082080082080 ,;,,,, 
 
IC[
p
, 96%] = 
 88200 71800 ,;,
 
ou 
0,7180 < p < 0,8820 ou 71,80% < p < 88,20% 
 
 
Pode-se afirmar com 96% de confiabilidade que a proporção dos alunos da faculdade favoráveis à 
mudança curricular está entre 71,80% e 88,20%. 
 
14 
 
 
 
CAPÍTULO III 
3. TESTE DE HIPÓTESE 
 
Frequentemente devemos tomar decisões sobre populações com base em informações 
amostrais das mesmas (decisões estatísticas). Na tomada de decisões é útil formular hipóteses ou 
suposições sobre as populações em estudo. Tais hipóteses, que podem ser verdadeiras ou não, 
chamam-se hipóteses estatísticas e, em geral, consistem de afirmações sobre as distribuições de 
probabilidade das populações, como por exemplo: 
a) A altura média da população brasileira é 1,65m? 
b) A proporção de brasileiros com a doença X é 40% (p = 0,40); 
c) A idade dos alunos da UEM tem uma distribuição normal? 
 
Testes de Hipóteses: é uma regra de decisão para aceitar ou rejeitar uma hipótese estatística com base 
nos elementos da amostra determinar se amostras observadas diferem significativamente dos resultados 
esperados 
Os Testes de Hipóteses podem ser de dois tipos: 
i) Não Paramétricos: quando formulamos hipóteses com respeito à natureza da distribuição 
da população. Estes testes não dependem dos parâmetros populacionais, nem de suas 
respectivas estimativas itens (c) e (d). 
ii) Paramétricos: quando formulamos hipóteses com respeito ao valor de um parâmetro 
populacional, itens (a) e (b). 
 
Neste tópico, vamos tratar somente dos testes paramétricos, pois se referem às hipóteses sobre 
parâmetros populacionais, isto é, feita uma determinada afirmação (ou suposição) sobre o parâmetro de 
uma população, desejamos inferir se os resultados de uma amostra desta população contrariam ou não 
tal afirmação. 
Os testes de hipótese representam uma regra de decisão que permite aceitar ou rejeitar uma 
hipótese formulada. Têm-se, então, as duas seguintes hipóteses iniciais: 
 
1) Hipótese nula ( H0): é aquela que será testada. Representa o oposto da suposição do pesquisador e 
deve ser formulada em termos de igualdade. 
2) Hipótese alternativa (H1): representa a suposição que o pesquisador quer provar. 
 
As hipóteses estatísticas para o parâmetro  (média (μ), proporção (p) e diferença de média 
(μ1-μ2)), podem ser formuladas como segue: 
 
- Teste Bilateral (TB): quando utilizamos ambas as “caudas” da distribuição normal padronizada 
H
H
0 0
1 0
:
:
 
 





 
- Teste Unilateral à Direita (TUD): quando utilizamos a “cauda” direita da distribuição normal 
padronizada. 
H
H
0 0
1 0
:
:
 
 





 
- Teste Unilateral à Esquerda (TUE): quando utilizamos a “cauda” esquerda da distribuição normal 
padronizada 
H
H
0 0
1 0
:
:
 
 





 
15 
 
 
 
O objetivo de se testar uma hipótese nula é tomar uma decisão, se possível correta. Devemos 
não rejeitar ou rejeitar H0, que é a hipótese usada como referência. 
Suponhamos que exista essa hipótese, a qual será considerada válida até prova em contrário, 
referente a um dado parâmetro da população. Essa hipótese será testada com base em resultados 
amostrais, podendo ser aceita ou rejeitada. 
Para melhor entendermos a regra de decisão adotada, é interessante estudarmos os tipo de erros 
que podemos cometer e as respectivas probabilidades de cometermos esses erros. 
Podemos cometer dois tipos de erros, ou seja: 
Erro Tipo I – ou de primeira espécie, constitui-se em rejeitar H0, quando H0 é verdadeira. A 
probabilidade desse erro será simbolizada por  ( nível de significância), isto é 
 = P( cometer erro tipo I) = P(rejeitar H0  H0 é verdadeiro) 
 
Erro Tipo II ou de segunda espécie, constitui-se em não rejeitar H0, quando H0 é falso. A 
probabilidade de cometer esse erro será simbolizada por , isto é 
 = P( cometer erro Tipo II) = P( aceitar H0 H0 é falso) 
 
Esquematicamente, o quadro abaixo mostra as diversas situações que podem ocorrer num teste 
de hipótese: 
DECISÃO 
(Teste) 
REALIDADE 
H0 é verdadeira H0 é falsa 
Não rejeitar H0 Decisão correta Erro tipo II 
Rejeitar H0 Erro tipo I Decisão correta 
 
Procedimentogeral do teste de Hipótese 
A construção de um teste de hipótese, para um parâmetro populacional, consiste em: 
a) dado uma variável X de uma população normal e uma hipótese sobre determinado 
parâmetro  dessa população (por exemplo, afirmamos que esse valor é um número 0); 
b) colhe-se uma amostra aleatória de ”n” elementos dessa população, e através dela deseja-se 
inferir o parâmetro  para aceitar ou rejeitar tal hipótese. 
 
Passo para construção de um teste de hipótese paramétrico: 
A sequencia que pode ser usada sistematicamente para qualquer teste de hipótese. 
Passo 1: Enuncie H0 e H1 - deve ser feito no início da pesquisa, antes de se realizar a experiência 
amostral. 
caso (a) 
Testes bilateral 





01
00
θθ:H
θθ:H 
caso (b) 
Teste unilateral a direita 





01
00
θθ:H
θθ:H 
Caso (c) 
Teste unilateral a esquerda 





01
00
θθ:H
θθ:H 
 
Passo 2: Use a teoria estatística e as informações para decidir qual estatística (estimador) será usada no 
julgamento de H0 (“Z” ou “t-Student” ). 
Passo 3: Construa a região crítica (RA= Região de Aceitação de H0 e RC= Região crítica ou região de 
Rejeição de Ho , conforme o tipo de teste. Fixar o nível de significância () e determinar os respectivos 
valores na distribuição normal padronizado (Z ou Z/2 ) ou na distribuição t-Studente (t ou t/2). 
 
16 
 
 
 
 
 
Passo 4: Use as informações fornecidas pela amostra para encontrar o valor da estatística que definirá a 
decisão 
Passo 5: Conclusão. 
 
3.1. TESTES PARA A MÉDIA DE UMA POPULAÇÃO 
 
Este teste é utilizado para validar um método ou produto por comparação com um valor 
conhecido. 
 
3.1.1. PROCEDIMENTO DO TESTE 
 
Passo 1: Hipóteses Estatísticas 
 
caso (a) 
Testes bilateral 
H
H
0 0
1 0
:
:
 
 





 
caso (b) 
Teste unilateral a direita 
H
H
0 0
1 0
:
:
 
 





 
Caso (c) 
Teste unilateral a esquerda 
H
H
0 0
1 0
:
:
 
 





 
 
 
Passo 2: Estatística Teste 
 
i) Para variância populacional conhecida: 
Como 
)n(N~X 2 ; 
 para qualquer tamanho de amostra (n), a estatística (ou variável) do 
teste é: 
n
X
zcal

0
 
 
2i) Para variância populacional desconhecida: 
Com 2 é desconhecido deve-se estimá-lo. Assim a variável do teste é “t” com n-1 graus de 
liberdade. 
ns
μX
t 0cal


 
3i) Para grandes amostras 
Pelo teorema Central do Limite tem-se 
)n(N~X 2 ; 
 para n suficientemente grande 
(n≥30) se a distribuição amostral se aproxima da distribuição Normal. Nestas condições a estatística do 
teste será: 
ns
μX
z 0cal


 
 
Passo 3: Região de Rejeição ou Região Crítica 
Fixar o limite do erro tipo I, , e determinar a região crítica. A decisão de rejeitar ou não H0, ou seja 
decidir se a diferença 
)X( 
 é ou não significativa, é tomada com base na região de rejeição H0 que 
17 
 
 
 
é construída de modo que a probabilidade de rejeitar H0 dado que H0 é verdadeiro, é α, em que α é o 
nível de significância do teste. A construção da região de rejeição (RR) depende também do tipo de 
teste que será realizado. 
 
i) Para variância 2 conhecida ou desconhecida com n≥30: 
 
Teste Bilateral: RR corresponde aos valores de z tais que 
2zzcal 
 ou 
2zzcal 
. 
Teste Unilateral à Direita: RR corresponde ao valor de z tal que 
zzcal 
. 
Teste Unilateral à Esquerda: RR corresponde ao valor de z tal que 
zzcal 
. 
 
 
 
2i) Para 2 desconhecida 
 
Teste Bilateral: RR corresponde aos valores de t tais que 
2cal tt 
 ou 
2cal tt 
. 
Teste Unilateral à Direita: RR corresponde ao valor de t tal que 
 ttcal
. 
Teste Unilateral à Esquerda: RR corresponde ao valor de t tal que 
 ttcal
. 
 
 
 
 
Passo 4: Decisão 
 
Se o valor da estatística do teste zcal ou tcal pertencer à região de rejeição(RR), rejeita-se a 
hipótese H0 em nível α de significância. Caso contrario, não se pode rejeitá-la, ou seja pertencer à 
região de aceitação (RA) não se pode rejeitar H0. 
 
Passo 5: Conclusão 
 
 
18 
 
 
 
Exemplo 1: 
Um grupo de pesquisadores estabeleceu que os cigarros contêm em média 30 miligramas ou mais de 
nicotina e existe a certeza de se produzir câncer no pulmão. Um fumante está disposto a se arriscar se a 
média populacional de nicotina for menor que 30 miligramas e desvio padrão populacional igual 8. 
Ensaios sobre 100 cigarros da marca A mostraram uma média de 26 miligramas de nicotina. Sabendo 
que os dados têm distribuição Normal. Determine a decisão que o fumante deve tomar, com um nível 
de significância de 2%. 
Como, 0 = 30,  = 8, n = 100, 26x  , e  = 2%, tem-se: 
 
Passo 1: Hipóteses 





30
30
1
0


:H
:H 
ou 
H0: O conteúdo médio de nicotina nos cigarros é de 30 miligramas e o fumante não se arrisca a fumar. 
H1: O conteúdo médio de nicotina nos cigarros é significativamente inferior a 30 miligramas e o 
fumante se arrisca a fumar. 
 
Passo 2: Estatística do teste 
Uma vez que  é conhecido, a estatística do teste é: 
5
100
8
30260 




n
X
zcal 
 
Passo 3: Região de rejeição ou crítica 
Teste é unilateral à esquerda e  = 0,02. Da tabela tem-se 
06,2z 
 e assim: 
 
 
Passo 4: Decisão 
Como 
zzcal 
, rejeita-se H0 em um nível de significância de 2%. 
 
Passo 5: Conclusão: 
Com 98% de certeza, há evidências de que o conteúdo médio de nicotina nos cigarros seja inferior a 30 
miligramas. Portanto o fumante se arrisca a fumar. 
 
 
 
19 
 
 
 
Exemplo 2: 
Alguns pesquisadores estão desconfiados de que a média das receitas municipais per capita das 
cidades pequenas (menos de 20.000 habitantes) é maior do que a das receitas do estado, que é de 1229 
unidades. Para comprovar ou não esta hipótese, foi sorteada dez cidades pequenas e obteve os 
seguintes resultados: 
1230 582 576 2093 2621 1045 1439 717 1838 1359 
Sabendo que os dados têm distribuição Normal. Com nível de 5% de significância, verifique se esta 
desconfiança procede. 
Como, 0 = 1229 ; n = 10 ; 1350x  ; s = 675,8 e  = 5%, tem-se: 
 
Passo 1: Hipóteses 





1229
1229
1
0


:H
:H 
ou 
H0: A média das receitas municipais per capita das cidades pequenas é de 1229 unidades. 
H1: A média das receitas municipais per capita das cidades pequenas é significativamente 
superior a 1229 unidades. 
 
Passo 2: Estatística do teste 
Uma vez que  é desconhecido e n < 30, a estatística do teste é: 
570
10
8675
12291350
 0 ,
,ns
X
tcal 




 
Passo 3: Região rejeição ou crítica 
O teste é unilateral à direita, os graus de liberdade são dados por: 
gl=n-1=10-1=9 e sendo  = 0,05, da tabela tem-se t = 1,83. 
 
Passo 4: Decisão 
Como 
ttcal 
, não se rejeita H0 em um nível de significância de 5%. 
 
Passo 5: Conclusão: 
Com 95% de certeza, há evidências de que a média das receitas municipais per capita das 
cidades pequenas seja igual a 1229 unidades. 
 
20 
 
 
 
Exemplo 3: 
Um grupo de pesquisadores acredita que o motorista de caminhão depois de se envolverem em 
acidente por ter dormido ao volante, trabalha em média 8 horas por dia. Então, esses pesquisadores 
entrevistaram 60 motoristas que já se envolverem em acidente por ter dormido ao volante, obtendo a 
média de trabalho de12,5 horas e desvio padrão amostral de 3,5 horas. Considerando um nível de 
significância de 4%, verifique se a jornada de trabalho dos motoristas de caminhão difere 8 horas. 
 
Como, 0 = 8, n = 60, 
5,12x 
 s=3,5 e  = 4%, tem-se: 
 
Passo 1: Hipóteses 





8 
8
1
0


:H
:H 
ou 
H0: A jornada de trabalho dos motoristas de caminhão é 8 hs. 
H1: A jornada de trabalho dos motoristas de caminhão difere 8 hs. 
 
Passo 2: Estatística do teste 
Uma vez que  é desconhecido e os dados não apresentam distribuição Normal, mas o 
tamanho da amostra é suficientemente grande, utilizando o Teorema Central do Limite a estatística do 
teste é: 
969
60
53
85120 ,
,
,
ns
X
zcal 




 
Passo 3: Região rejeição ou crítica 
Teste é bilateral e  = 0,04. Da tabela tem-se 
06,2z 2 
 e assim: 
 
 
Passo 4: Decisão 
Como 
2cal zz 
, rejeita-se H0 em um nível de significância de 4%. 
 
Passo 5: Conclusão: 
Com 96% de certeza, há evidências de que a jornada de trabalho dos motoristas de caminhão 
difere 8 hs. 
21 
 
 
 
3.2. TESTE PARA PROPORÇÃO 
 
Quando a finalidade da amostragem é julgar a validade de uma alegação acerca de uma 
proporção populacional, é apropriado um teste de uma amostra. A metodologia depende do número de 
observações amostrais: grande ou pequeno. Para amostras 100 ou mais observações, a distribuição 
Normal é aceitável; para tamanhos amostrais menores, deve-se usar a distribuição Binomial. 
Neste estudo será apresentado o teste para grandes amostras. Os testes de grandes amostras 
tanto para média como para proporções são bastante parecidos. A única distinção entre os dois é 
maneira de obter o desvio padrão da distribuição amostral da proporção em que 
n
qp
)p(DP ooo 
 
A seguir tem-se registrado o procedimento para fazer um teste de hipótese para uma 
proporção com grandes amostras. 
 
Passo 1: Hipóteses 
 
Teste bilateral T. unilateral à direita T. unilateral à esquerda 
caso (a) 





01
00
pp:H
pp:H 
caso (b) 





01
00
p p:H
pp:H 
caso (c) 





01
00
pp:H
pp:H 
 
Passo 2: Estatística do teste 
 
Para n  30, com o auxilio do teorema Central do Limite o 
)p(N~pˆ
n
qp
 ; 000
, logo a estatística do 
teste é dada por: 
n
qp
ppˆ
Zcal
00
0
 
Passo 3: Região de rejeição 
 
Fixar o limite do erro  e determinar a região de rejeição ou crítica. 
 
Teste Bilateral: RR corresponde aos valores de z tais que 
2cal zz 
 ou 
2cal zz 
. 
Teste Unilateral à Direita: RR corresponde ao valor de z tal que 
 zzcal
. 
Teste Unilateral à Esquerda: RR corresponde ao valor de z tal que 
 zzcal
. 
 
 
 
 
Passo 4: Decisão 
 
A decisão é tomada com base na região de rejeição de H0, em que α é a probabilidade de 
22 
 
 
 
rejeitar H0 dado que H0 é verdadeiro. Lembrando que α é o nível de significância do teste. 
Se o valor da estatística do teste zcal pertencer à região de rejeição, rejeita-se a hipótese H0 em 
nível α de significância. Caso contrario, não se pode rejeitá-la, ou seja pertence à região de aceitação 
não se pode rejeitar H0. 
 
 
Exemplo 
O consumidor de certo produto acusou o fabricante, dizendo que mais de 20% das unidades fabricadas 
apresentam defeito. Para confirmar sua acusação, ele usou uma amostra de tamanho 500, em que 27% 
das peças eram defeituosas. Verifique se o consumidor tem razão, utilizando um nível de significância 
de 10%. 
pˆ
=0,27 ; 
0,80q e 20,0p 00 
; e  = 10% 
Como, n = 500 então 
),(N~pˆ
500
0,800,20
 ; 200

 , tem-se: 
 
Passo 1: Hipóteses 





200
200
1
0
,p:H
,p:H 
ou 
H0: A proporção das unidades fabricadas que apresentam defeito é 20%. 
H1: A proporção das unidades fabricadas que apresentam defeito é significativamente superior a 20% 
 
Passo 2: Estatística teste 
 
A estatística do teste é: 
913
500
8020
200270
00
0 ,
,,
,,
n
qp
ppˆ
zcal 





 
Passo 3: Região de rejeição 
O Teste é unilateral à direita e sendo  = 0,10, da tabela tem-se 
281,z 
. Assim: 
 
 
Passo 4: Decisão 
Como 
 zzcal
, não se rejeita H0 ao nível de significância de 10%, 
 
Passo 5: Conclusão 
Com 90% de certeza, há evidências de que a proporção das unidades fabricadas que apresentam 
defeitos seja significativamente de 20%. 
23 
 
 
 
3.3. TESTE PARA DUAS VARIÂNCIAS 
 
O teste para diferença de duas variâncias é utilizado para comparar as variabilidades entre 
duas populações independentes, ou seja verificar se as dispersões dos valores de duas populações 
diferem significativamente por meio das variâncias. 
Para a realização deste teste é necessário a distribuição Fisher de Snedecor. Caracterizado 
pelos graus de liberdade associados às quantidades presentes no numerador e no denominador de F. 
A variável definida como 
2
2
2
1 ssF 
 é denominada variável com distribuição de F de 
Snedecor com ν1 e ν2 graus de liberdade. 
Para usar a tabela F de Snedecor, deve-se conhecer: o nível de significância desejado e os 
graus de liberdade das duas populações (ν1= n1-1; ν2=n2-1). Por exemplo, têm-se duas populações 
independentes com tamanho de amostra n1=13 e n2=21, com nível de significância igual a 10%, 
determine o valor de 
2F
 e 
21F 
: 
      282121 ; 1-13 ; 0,051n ; 1-n ; 210 ; ; 2 2121 ,FFF ,  
 
Em geral, apenas tem tabelas da distribuição F Snedecor correspondentes à cauda à direita. Deste modo 
deve-se usar a seguinte artifício: 
 
   
3940
542
111
1-13 ; 1-21 ; 05012
2 1 21
 ; ; 2
,
,FF
F
,
;;

 
 
 
 
3.8.1 - PROCEDIMENTO DO TESTE 
 
Passo 1: Hipóteses Estatísticas 
 
Teste bilateral T. unilateral à direita T. unilateral à esquerda 






2
2
2
11
2
2
2
10


:H
:H 






2
2
2
11
2
2
2
10


:H
:H 






2
2
2
11
2
2
2
10


:H
:H 
 
Passo 2: Estatística do Teste 
 
Se as populações têm distribuição Normal, a estatística teste é obtida por 
2
2
2
1
calF
s
s

 
 
Passo 3: Região de Rejeição 
Teste bilateral T. unilateral à direita T. unilateral à esquerda 
 
 
Passo 4: Decisão 
Se Fcal pertencer à região de rejeição (RR), rejeita-se a hipótese H0 em nível α de 
significância. 
24 
 
 
 
Se Fcal pertencer à região de aceitação (RA), não se rejeita a hipótese H0 em nível α de 
significância. 
 
Exemplo 
Dois programas de treinamento de funcionários foram efetuados. Com o programa antigo foram 
treinados 16 funcionários apresentando uma variância de 146 erros
2
 e média de 25 erros. No programa 
novo foram treinados 13 funcionários com variância de 200 erros
2
 e média de 32 erros. Verifique se as 
variâncias da taxa de erros dos funcionários diferem entre os programas de treinamento, com 10% de 
nível de significância. 
Como, 
14621 s
 ; n1 = 16 
2002 s
 ; n2 = 13 e  = 10%, tem-se: 
 
Passo 1: Hipóteses Estatísticas 
 






2
2
2
11
2
2
2
10


:H
:H 
 
Passo 2: Estatística do Teste 
 
730
200
146
F
2
2
2
1
cal ,
s
s

 
 
Passo 3: Região de Rejeição 
 
      622113 ; 1-16 ; 0,051n ; 1-n ; 210 ; ; 2 2121 ,FFF,  
 
 
 
   
400
482
111
1-16 ; 1-13 ; 05012
2 1 21
 ; ; 2
,
,FF
F
,
;;

 
 
 
 
 
Passo 4: Decisão 
 
Como Fcal pertence à região de aceitação, não se rejeita a hipótese H0 em nível 10% de 
significância. 
 
Passo 5:Conclusão 
 
Com 90% de confiança, há evidências que as variâncias da taxa de erros com os programas de 
treinamentos são significativamente iguais. 
25 
 
 
 
3.4. TESTES PARA DUAS MÉDIAS 
 
Nos testes de médias são utilizados o valor da variância populacional ou um estimador (s
2
), 
para a comparação das duas médias é necessário analisar o que ocorre com as variâncias das duas 
populações, em algumas situações podem ser conhecidas, em outras podem ser desconhecidas e iguais 
ou desconhecidas e diferentes. Para aplicar os testes de duas médias, exige-se a independência das duas 
amostras. Estes testes são utilizados, por exemplo, para comparar dois métodos de ensino, dois 
métodos analíticos, duas marcas, duas cidades, diferença entre sexos e dentre outros. 
 
3.4.1 - PROCEDIMENTO DO TESTE 
 
Passo 1: Hipóteses Estatísticas 
 Teste bilateral 
 










0
0
 
211
210
211
210




:H
:H
ou
:H
:H 
 
 Teste Unilateral à Direita 
 










0
0
 
211
210
211
210




:H
:H
ou
:H
:H 
 
 Teste Unilateral à Esquerda 
 










0
0
 
211
210
211
210




:H
:H
ou
:H
:H 
 
Passo 2: Estatística do Teste 
i) Para variâncias populacionais 
2
1
 e 
2
2
 conhecidas: 
Como 







2
2
2
1
2
1
2121 
nn
;N~XX

, a estatística (ou variável) do teste é dada por: 
2
2
2
1
2
1
2121
nn
)()XX(
Zcal





 
 
Note pela hipótese que Ho 
021  
, então Z será: 
2
2
2
1
2
1
21 0
nn
)XX(
Zcal




 
 
2i) Para variâncias populacionais 
2
1
 e 
2
2
 desconhecidas e iguais: 
Quando 
2
1
 e 
2
2
 são desconhecidas e iguais, com n1+n2<30, devem-se estimá-los. Assim a 
variável do teste é t com n1+n2-2 graus de liberdade é: 
 
26 
 
 
 
   
   
















2121
2
22
2
11
2121
11
2
11
nnnn
snsn
xx
tcal
 
 
Note pela hipótese que Ho 
021  
, então tcal será: 
 
 
   
















2121
2
22
2
11
21
11
2
11
0
nnnn
snsn
xx
tcal
 
 
3i) Para variâncias populacionais
2
1
 e 
2
2
 desconhecidas e diferentes: 
Quando 
2
1
 e 
2
2
 são desconhecidas e diferentes, com n1+n2<30, devem-se estimá-los. Assim 
a variável do teste é t com n1+n2-2 graus de liberdade é dada por: 
2
2
2
1
2
1
2121
n
s
n
s
)()XX(
tcal



 
 
Note pela hipótese que Ho 
021  
, então tcal será: 
 
2
2
2
1
2
1
21 0
n
s
n
s
)XX(
tcal



 
 
4i) Para grandes amostras 
Pelo teorema Central do Limite tem-se 
)n(N~X 2 ; 
 para n suficientemente grande 
(n1+n2≥30) se a população não tiver distribuição Normal. Nestas condições a estatística do teste será: 
2
2
2
1
2
1
21 0
n
s
n
s
)XX(
Zcal



 
 
Passo 3: Região de Rejeição 
 
Fixar o limite do erro  e determinar a região crítica. 
i) Para variância 
2
1
 e 
2
2
 conhecidas ou desconhecidas com n1+n2≥30: 
 
 
 
27 
 
 
 
2i) Para variância 
2
1
 e 
2
2
 desconhecida com n1+n2<30: 
 
 
 
 
Passo 4: Decisão 
 
Se o valor da estatística do teste zcal ou tcal pertencer à região de rejeição, rejeita-se a hipótese 
H0 em nível α de significância. Caso contrario, não se pode rejeitá-la, ou seja se zcal ou tcal pertencer à 
região de aceitação não se pode rejeitar H0. 
 
Exemplo 1 
Uma escola de informática deseja verificar se a velocidade média de digitação difere entre o método 
tradicional e método cego. De outros estudos o desvio padrão populacional do método tradicional é 5,2 
e outro método é 4,3. Para isso foram selecionados dois grupos de pessoas e ensinado um método para 
cada grupo. Os resultados (palavras/min.) estão no quadro abaixo e apresentam distribuição 
aproximadamente Normal. 
 Alunos 1 2 3 4 5 6 7 8 9 10 11 12 
1 Método tradicional 33 40 39 36 31 40 30 34 38 42 35 46 
2 Método cego 32 42 44 37 35 40 33 37 36 43 38 45 
 
Verifique se a velocidade média de digitação do método tradicional difere método cego, com nível de 
2% de significância. 
Como, 
251 ,
 ; 
371 x
 ; n1 = 12 ; 
342 ,
 ; 
5382 ,x 
 ; n2 = 12 e  = 2%, tem-se: 
 
 
Passo 1: Hipóteses 
 
 
211
210







:H
:H 
 
Passo 2: Estatística do Teste 
 
   
770
12
34
12
25
53837
22
2
2
2
1
2
1
21 ,
,,
,
nn
)XX(
Zcal 







 
 
28 
 
 
 
Passo 3: Região de Rejeição 
 
 
 
Passo 4: Decisão 
 
Como zcal pertence à região de aceitação, não se rejeita H0 em nível 2% de significância. 
 
Passo 5: Conclusão 
 
Com nível de 2% de significância, há evidencias que as médias de velocidade de digitação 
não diferem significativamente entre os métodos estudados. 
 
 
Exemplo 2 
Dois programas de treinamento de funcionários foram efetuados. Com o programa antigo foram 
treinados 16 funcionários apresentando uma variância de 146 erros
2
 e média de 28 erros. No programa 
novo foram treinados 13 funcionários com variância de 200 erros
2
 e média de 32 erros. Verifique se as 
médias da taxa de erros dos funcionários diferem entre os programas de treinamento, com 10% de 
nível de significância. 
Como, 
28x1 
 ; 
146s21 
 ; n1 = 16 ; 
32x2 
 ; 
200s22 
 ; n2 = 13 e  = 10%, tem-se: 
 
Passo 1: Hipóteses 
 
 
211
210







:H
:H 
 
Passo 2: Estatística do Teste 
 
Como já foi verificado que as variâncias são iguais no exemplo do tópico 3.3, então estatística do teste 
é obtida por: 
 
 
       
































13
1
16
1
21316
200113146116
3228
11
2
11
2121
2
22
2
11
21
nnnn
snsn
xx
tcal
820,tcal 
 
 
Passo 3: Região de Rejeição 
  703121316 5 ,t ;% 
 
 
29 
 
 
 
Passo 4: Decisão 
 
Como zcal pertence à região de aceitação, não se rejeita a hipótese H0 em nível 10% de 
significância. 
 
Passo 5: Conclusão 
 
Com 90% de certeza, há evidencias que as médias da taxa de erros dos funcionários não 
diferem significativamente entre os programas de treinamento. 
 
 
Exemplo 3 
O tempo de produção de uma determina peça em duas fábricas mostrou que: 
- na fábrica A, numa amostra de 16 funcionários, demora em média 13 minutos para produzir 
uma peça, com desvio padrão de 2 minutos; 
- na fábrica B, em uma amostra de 10 funcionários, demora em média 11 minutos para 
produzir a mesma peça, e desviopadrão de 4 minutos. 
Verifique se a média do tempo de produção das peças da fábrica B é menor que a fábrica A, com nível 
de 5% de significância. 
Como, 
13Ax
 ; 
2As
 ; nA = 16 ; 
11Bx
 ; 
4Bs
 ; nB = 10 e  = 5%, tem-se: 
 
Passo 1: Hipóteses 
 
 
1
0





AB
AB
:H
:H

 
 
Passo 2: Estatística do Teste 
 
Como as variâncias são significativamente diferentes, então estatística do teste é obtida por: 
471
10
4
16
2
1311
2222
,
)()(
n
s
n
s
)XX(
t
B
B
A
A
AB
cal 






 
 
Passo 3: Região de Rejeição 
  71112-1016 5 ,t ;% 
 
 
Passo 4: Decisão 
 
Como zcal pertence à região de aceitação, não se rejeita H0 em nível 5% de significância. 
 
Passo 5: Conclusão 
 
Com 95% de certeza, há evidencias que as médias do tempo de produção das peças não 
diferem significativamente entre as fábricas. 
30 
 
 
 
Exemplo 4 
Um estudo da diferença entre os salários dos professores do ensino fundamental dos colégios 
particulares e públicos, obteve que : 
- uma amostra de 100 professores particulares apontou média salarial de 1.130,00 R$ com 
desvio padrão de 225,00 R$; 
- uma amostra de 120 professores do ensino público apresentou uma média salarial de 
880,00 R$ com desvio padrão de 130,00 R$. 
Verifique se o salário médio dos professores dos colégios particulares é significativamente maior que 
dos professores do ensino público, com α=2%. 
Como, 
13011 .x 
 ; 
2251 s
 ; n1 = 100 ; 
8802 x
 ; 
1302 s
 ; n2 = 120 e  = 2%, tem-se: 
 
Passo 1: Hipóteses 
 
 
211
210







:H
:H 
 
Passo 2: Estatística do Teste 
 
839
120
130
100
225
8801301
22
2
2
2
1
2
1
21 ,
.
n
s
n
s
)XX(
Zcal 






 
 
Passo 3: Região de Rejeição 
 
 
 
Passo 4: Decisão 
 
Como zcal pertence à região de rejeição, rejeita-se a hipótese H0 em nível 2% de significância. 
 
Passo 5: Conclusão 
 
Com 98% de confiança, há evidencias que o salário médio dos professores dos colégios 
particulares é significativamente maior que dos professores do ensino público.