Buscar

Apostila Estatística II

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 67 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 67 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 67 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

UNIVERSIDADE FEDERAL FLUMINENSE 
PÓLO UNIVERSITÁRIO DE VOLTA REDONDA 
DEPARTAMENTO DE ENGENHARIA DE PRODUÇÃO 
 
 
 
 
 
 
 
 
 
 
 
Estatística II 
 
 
 
CAROLINA CONDÉ MARQUES 
ORIENTADORA: ELIANE DA SILVA CHRISTO 
 
 
 
 
 
 
 
 
 
 
Volta Redonda 
2010 
 
2 
 
ÍNDICE 
Capítulo 1 Inferência Estatística .................................................................................. 2 
Capítulo 2 Distribuição de Amostragem da Média .................................................... 3 
Capítulo 3 Estimador ou Estatística ............................................................................ 6 
Capítulo 4 Estimação Pontual ...................................................................................... 6 
Capítulo 5 Estimação Intervalar .................................................................................. 7 
Intervalo de Confiança para Média quando a Variância é conhecida, IC para Média 
quando a Variância é desconhecida, IC para Proporção Populacional, Determinação do 
tamanho necessário da Amostra para estimar a Média, Determinação do tamanho 
necessário da Amostra para estimar a Proporção, IC para Variância Populacional, IC 
para Diferença de duas Médias, IC para Diferença de duas Proporções, Exercícios 
Capítulo 6 Teste de Hipótese .......................................................................................22 
Teste da Média Populacional para Variância conhecida, Teste da Média Populacional 
para Variância desconhecida, Teste da Proporção Populacional, Teste da Igualdade de 
Variâncias, Teste da Variância (usando Distribuição Quiquadrado), Teste da Diferença 
entre duas Médias usando Distribuição Normal Padronizada e usando Distribuição t de 
Student, Exercícios 
Capítulo 7 Teste Quiquadrado ....................................................................................37 
Teste de Aderência, Teste de Independência, Teste de Homogeneidade, Exercícios 
Capítulo 8 Análise de Variância – ANOVA ...............................................................46 
Estimativa dos Tratamentos entre a Variância da População, Estimativa dos 
Tratamentos dentro da Variância da População, Comparando Estimativas da Variância, 
Tabela ANOVA, Exercícios 
Capítulo 9 Regressão Linear .......................................................................................51 
Método dos Mínimos Quadrados, Coeficiente de Determinação, Coeficiente de 
Correlação, Exercícios 
Apêndices........................................................................................................................58 
Tabela da Distribuição Normal-Padrão, Tabela da Distribuição t, Tabela da Distribuição 
Quiquadrado, Tabela da Distribuição F 
Bibliografia ....................................................................................................................66 
 
 
 
3 
 
Capítulo 1 - INFERÊNCIA ESTATÍSTICA 
Aprendendo o desconhecido a partir do conhecido 
A Estatística Inferencial compreende as técnicas por meio das quais são tomadas 
decisões sobre uma população, decisões baseadas unicamente na observação de uma 
amostra. Devido ao fato de que tais decisões são tomadas em condições de incerteza, 
requer-se, na estatística inferencial, o uso de conceitos de probabilidade. 
- Parâmetros da população: medidas características da população 
- Estatísticas da amostra: medidas características de uma amostra 
Em estudos anteriores foram apresentados vários modelos probabilísticos utilizados em 
problemas reais como a distribuição normal, binomial por exemplo. 
Estes modelos probabilísticos dependem de grandezas que foram consideradas 
conhecidas, os parâmetros. No modelo normal os parâmetros são a média e a variância 
enquanto no modelo binomial o parâmetro é a probabilidade de sucesso. 
Nos problemas reais estes parâmetros devem ser determinados antes da construção do 
modelo. Como os parâmetros muitas vezes não são observáveis (por exemplo, se a 
população for muito grande exigindo um trabalho exaustivo e de custo elevado, ou se os 
ensaios forem destrutivos) as informações sobre os mesmos podem ser obtidas através 
de valores das variáveis em questão, uma vez que estes são observáveis. 
Cada um dos valores possíveis de uma variável é denominado observação da mesma, 
estatística. 
Portanto, a solução é tentar obter os parâmetros a partir de uma amostra de n (n < N) 
observações das variáveis. Pode-se assim, obter possíveis valores do parâmetro e 
verificar hipóteses se os mesmos são verdadeiros ou não. Ao contrário da população, as 
observações são variáveis aleatórias e variam de amostra para outra. Assim, pode-se 
falar de população das médias amostrais ou distribuição das médias amostrais. 
Resumo 
Inferência estatística: tirar conclusões a respeito da população, baseando-se em uma 
amostra da mesma. 
 
 
 
 
 
 
4 
 
Capítulo 2 - DISTRIBUIÇÃO DE AMOSTRAGEM DA MÉDIA 
Parâmetro 
(medida que descreve certa 
característica dos elementos 
da população) 
 
Simbologia 
 
Fórmula para o cálculo 
 
Média 
 
 1 2
1
... 1 nn
i
i
X X X
X X
N N 
  
   
 
Variância 
 
2 
2
1
1
( )
N
i
i
X
N


 
 
Desvio-padrão 
 
 2
1
1
( )
N
i
i
X
N


 
 Tabela 2.1 – Distribuição de Amostragem da Média (Parâmetro) 
 
Estatística 
(medida que descreve certa 
característica dos elementos 
da amostra) 
 
Simbologia 
 
Fórmula para o cálculo 
 
Média 
 
X 
1 2
1
... 1 nn
i
i
X X X
X
n n 
  
  
 
Variância 
 
2S 
2
1
1
( )
1
n
i
i
X X
n 


 
 
Desvio-padrão 
 
S 2
1
1
( )
1
n
i
i
X X
n 


 
 Tabela 2.2 - Distribuição de Amostragem da Média (Estatística) 
 
A distribuição de amostragem da média é a distribuição de probabilidade para os 
possíveis valores da média da amostra X baseados em um particular tamanho da 
amostra. 
Para qualquer tamanho dado n de amostra tomada de uma população com média  , o 
valor da amostra X irá variar de amostra para amostra. 
A distribuição de amostragem da média é descrita através da determinação do valor 
esperado E( X ), ou média da distribuição e através do desvio padrão da distribuição das 
médias  , usualmente chamado de erro padrão da média. Em geral, o valor esperado e 
o erro padrão da média são descritos como: 
E( X ) =  ;  x = 

√�
 
 
5 
 
Exemplo: Suponha que a média de uma população bastante grande seja  = 50,0 e o 
desvio padrão  = 12,0. Determinamos a distribuição de amostragem das médias das 
amostras de tamanho n = 36, em termos de valor esperado da seguinte forma: 
E( X ) =  = 50,0 
 x = 

√�
 = 
��,�
√��
 = 
��,�
�
 = 2,0 
 
Observações: 
1) Ao fazer amostras de uma população finita (amostragem sem reposição), deve-se 
incluir um fator de correção finita na fórmula do erro padrão da média: 

x = 

√�
�
���
���
 
2) Se o desvio padrão da população for desconhecido, o erro padrão da média pode 
ser estimado, usando-se o desvio padrão da amostra como um estimador do 
desvio padrão da população: 
sx = 
�
√�
 
A fórmula para o erro padrão estimado da média quando se inclui o fator de 
correção finita é: 
sx = 
�
√�
�
���
���
 
O erro padrão da média fornece a base principal para a inferência estatística no que diz 
respeito a uma população com média desconhecida. Um teorema em estatística que 
conduz o uso do erro padrão da média é o seguinte: 
 
Teorema do Limite Central: À medida que se aumenta o tamanho da amostra, a 
distribuição de amostragem da média se aproxima da forma da distribuição normal, 
qualquer que seja a forma da distribuição da população. Na prática, a distribuição de 
amostragem da média pode ser considerada como aproximadamente normal sempre que 
o tamanho da amostra for n ≥ 30. 
Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 127 
 
 
 
6 
 
Seja X uma população de média  a variância ² ,ou seja, N( ; ²). Seja (x1, x2, ..., 
xn) uma amostra aleatória então x1, x2, ..., xn são independentes. Então: 
 
x 
= E( X ) =  ;  x = 
 ²
√� 
Então se X ~ N( ; ²) , temos X ~ N(  ; 
 ²
√�
 ) 
Variável Normal Padronizada: Zx = 
X �  

√�
 
 
Exemplo: Um auditor toma uma amostra aleatória de tamanho n = 36 de uma 
população de 1000 contas a receber. Não se conhece o desvio padrão da população, mas 
o desvio padrão da amostra é S = $ 43,00. Se o verdadeiro valor da média da população 
de contas a receber é  = $ 260,00, qual a probabilidade de que a média da amostra 
seja menor ou igual a $ 250,00? 
Solução 
a distribuição de amostragem é descrita pela média e pelo erro padrão: 
E( X ) =  = $ 260,00 
Sx = 
�
√�
 = 
��
√��
 = 
��
�
 = 7,17 
Nota: S é usado como estimador de  já que n = 36 (> 30) 
 Zx = 
X � 
�
√�
 
 = 
���,������,��
�,��
 = 
� ��,��
�,�� = - 1,39
 
 
Portanto, P ( X ≤ 250,00) = P(Z ≤ -1,39) 
E P(Z ≤ -1,39) = 0,5000 - P(-1,39 ≤ Z ≤ 0) = 0,5000 – 0,4177 = 0,0823 
Logo, a probabilidade de que a média seja menor ou igual a $ 250,00 é igual a 8,23%. 
 
 
 
 
 
7 
 
Capítulo 3 - ESTIMADOR OU ESTATÍSTICA 
Dada uma amostra aleatória, estimador ou estatística é qualquer variável aleatória 
função dos elementos amostrais. Observe: 
θ : Parâmetro 
θ : estimador ou estatística (ex: X , S, Sx , ...) 
Estimativa: é o valor numérico de um estimador. 
 
Qualidade de um estimador: 
Sejam os estimadores θ1 e θ2 de um mesmo parâmetro. Qual o melhor estimador? 
Para resolver esse problema leva-se em consideração alguns conceitos sobre qualidade 
de um estimador, já que nunca pode-se conhecer o valor do parâmetro θ e sendo assim 
não se pode afirmar que θ1 é “mais correto” que θ2 , ou vice versa. 
1) ESTIMADOR JUSTO ou NÃO VIESADO 
Diz-se que θ é justo se o seu valor esperado for θ 
E(θ) = θ 
Exemplo: E( X ) =  
 
2) ESTIMADOR EFICIENTE 
Variância mínima 
Um estimador θ1 será mais eficiente que θ2 se e somente se: 
 ²( θ1) <  ²( θ2) 
 
 
Capítulo 4 - ESTIMAÇÃO PONTUAL 
Na estimação por ponto calcula-se um único valor (estimativa) para o parâmetro 
populacional. Assim, temos: 
X = 
1 2
1
... 1 nn
i
i
X X X
X
n n 
  
  é uma estimativa pontual de  
S² = 
2
1
1
( )
1
n
i
i
X X
n 


 é uma estimativa pontual de  ², ou seja S² é um estimador de 
qualidade de  ². 
 
 
8 
 
Capítulo 5 - ESTIMAÇÃO INTERVALAR 
Os métodos de estimação por intervalo que serão estudados são baseados no 
pressuposto de que possa ser usada a distribuição normal de probabilidade. Tal 
pressuposição é garantida sempre que: 
A) População normalmente distribuída e σ conhecido, mesmo que n < 30 
B) n ≥ 30 (Teorema do Limite Central), independente de σ ser conhecido ou não. 
 
Um Intervalo de Confiança para a média é um intervalo estimado, construído com 
respeito à média da amostra, pelo qual pode ser especificada a probabilidade de o 
intervalo incluir o valor da média da população. O grau de confiança associado a um 
intervalo de confiança indica a percentagem de tais intervalos que incluiriam o 
parâmetro que se está estimando. 
 
X ± Zx x ou X ± ZxSx 
1 - α grau de confiança 
α grau de significância 
 
 
5.1 - Intervalo de Confiança para Média populacional  quando a Variância σ² é 
conhecida 
Neste caso sabe-se da distribuição amostral da média que a média amostral X tem 
distribuição normal  e desvio padrão �
√�
 
Assim a variável associada a X é a normal padronizada Zx = 
X � 
�
√�
 
 
E o intervalo de confiança: 
P ( X - Zα/2 σ
√�
 <  < X + Zα/2 σ
√�
 ) = 1 - α 
 
 
 
 
9 
 
Exemplo: Para uma dada semana, foi tomada uma amostra aleatória de 30 empregados 
horistas selecionados de um grande número de empregados de uma fábrica, a qual 
apresentou um salário médio de X = $ 180,00 com um desvio padrão da população de 
 = $ 14,00. Estime o salário médio para todos os empregados horistas da fábrica 
admitindo-se um grau de confiança de 95%. 
Solução 
�
1 − � = 0,95
� = 0,05
�/2 = 0,025
 
Logo, obtemos da tabela da Distribuição Normal – Padrão (Apêndice) Zα/2 = 1,96. 
Temos então, X ± Zα/2 x = X ± 1,96 x 
P ( X - Zα/2 σ
√�
 <  < X + Zα/2 σ
√�
 ) = 1 - α 
P ( 180,00 – 1,96��,��
√��
 <  < 180,00 + 1,96��,��
√��
 ) = 0,95 
P (180,00 – 1,96(2,56) <  < 180,00 + 1,96(2,56) ) = 0,95 
P ( 174,98 <  < 185,02 ) = 0,95 
Conclusão: podemos dizer que o nível do salário médio para todos os empregados está 
entre $ 174,98 e $ 185,02, com um grau de confiança de 95% nesta estimativa. 
Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 129 
 
 
5.2 - Intervalo de Confiança para Média populacional  quando a Variância  ² 
é desconhecida 
Neste caso deve-se estimar a variância populacional  ². Então S2, a variância amostral, 
é um estimador de qualidade de  ² 
S² = 
�
�
 Σ ( X – X )² 
Sendo o tamanho da amostra menos que 30, ou seja n ≤ 30, define-se a variável 
padronizada tx = 
X � 
�
√�
 
Esta variável tem uma distribuição de probabilidade t de Student com ν = n – 1 graus 
de liberdade. 
 
10 
 
Nota: quanto maior o grau de liberdade, mais a distribuição se aproxima da distribuição 
normal. 
E temos o intervalo de confiança: 
P ( X - tα/2 �
√�
 <  < X + tα/2 �
√�
 ) = 1 - α 
 
Exemplo: A vida média de operação para uma amostra de n = 10 lâmpadas é X = 4000 
horas com o desvio padrão da amostra S = 200 horas. Supõe-se que o tempo de 
operação das lâmpadas, em geral, tenha distribuição aproximadamente normal . Estime 
a vida média de operação para a população de lâmpadas da qual foi extraída a amostra, 
usando um intervalo de confiança de 95%. 
Solução 
�
1 − � = 0,95
� = 0,05
�/2 = 0,025
 ; graus de liberdade g.l. ν = n – 1 = 10 - 1 = 9 
Logo, obtemos da tabela da Distribuição t (Apêndice), o valor de tα/2 = 2,262. 
Nota: como desconhecemos o desvio padrão da população  , sabendo apenas o desvio 
padrão amostral S e n < 30, usamos a variável t de Student. 
Temos então, X ± tα/2 Sx = X ± 2,262 Sx 
P ( X - tα/2 �
√�
 <  < X + tα/2 �
√�
 ) = 1 - α 
P (4000 – 2,262 ���
√��
 <  < 4000 + 2,262 ���
√��
 ) = 0,95 
P ( 4000 – 2,26(63,24) <  < 4000 + 2,26(63,24) ) = 0,95 
P (3857 <  < 4142 ) = 0,95 
Conclusão: a vida média para a população de lâmpadas está no intervalo de 3857 à 4142 
horas. 
Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 130 
 
 
 
 
 
11 
 
Resumo 
Estimação por Intervalo da Média da População 
População Tamanho da amostra  conhecido  desconhecido 
 
Normalmente 
distribuída 
 
 
 
Grande (n ≥ 30) 
 
X ± Zα/2 x 
 
X ± Zα/2Sx * 
 
Pequeno (n < 30) 
 
X ± Zα/2 x 
 
X ± tα/2Sx 
 Tabela 5.1 – Estimação por Intervalo da Média da População 
* Z é utilizado como uma aproximação de t. 
 
 
5.3 - Intervalo de Confiança para a Proporção populacional 
A distribuição de probabilidade aplicável à proporções é a distribuição de probabilidade 
binomial. Contudo, a construção de um intervalo de confiança para uma proporção 
populacional desconhecida, usando a distribuição binomial, acarreta cálculos 
extenuantes. Assim, utiliza-se a distribuição normal como aproximação da binomial 
para a construção de intervalos de confiança para as proporções. 
Suponha uma certa população com proporção p de objetos defeituosos. Neste caso, o 
estimador não tendencioso de p é a proporção amostral f. Para grandes amostras (n ≥ 
30), a proporção amostral f tem distribuição aproximadamente normal e a variável 
normal padronizada é: 
Zx = 
���
�
�(���)
�
 
Sendo o erro padrão estimado da proporção é: sf = �
�(���)
�
 
 
Desse modo, o intervalo de confiança fica sendo: 
P (f - Zα/2�
�(���)
�
 ≤ p ≤ f + Zα/2�
�(���)
�
 ) = 1 - α 
 
Exemplo: Um administrador de uma universidade coletadados sobre uma amostra 
aleatória de âmbito nacional de 230 alunos de curso de Engenharia e encontra que 54 de 
 
12 
 
tais estudantes têm diploma técnico. Usando um intervalo de confiança de 90%, estimar 
a proporção nacional de estudantes que possuem diploma técnico. 
Solução 
�
1 − � = 0,90
� = 0,10
�/2 = 0,05
 ; logo Zα/2 = 1,65 
Temos então, f ± Zα/2 sf = f ± 1,65 sf 
 f = 
��
���
 = 0,235 
Ou seja, a proporção amostral de alunos que têm diploma técnico é igual a 23,5%. 
Sendo o erro padrão sf = �
�(���)
�
 = �
(�,���)(�,���)
���
 = 0,028 
Temos o intervalo de confiança associado: 
P ( 0,235 – (1,65)(0,028) ≤ p ≤ 0,235 + (1,65)(0,028) ) = 0,90 
P ( 0,235 – 0,046 ≤ p ≤ 0,235 + 0,046 ) = 0,90 
P ( 0,189 ≤ p ≤ 0,281 ) = 0,90 
Conclusão: a proporção de estudantes no país que estudam Engenharia e já possuem 
diploma técnico está no intervalo entre 18,9% à 28,1%. 
Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 149 
 
 
5.4 - Determinação do Tamanho necessário da Amostra para estimar a Média 
Suponhamos que se conhece o tamanho desejado do intervalo de confiança bem como o 
grau de confiança a ele associado. Se  é conhecido, sendo baseado no uso da 
distribuição normal: 
Zα/2 = 
X � 
�
√�
 
Então, o tamanho necessário da amostra é: 
 n = �² ² 
�²
 
 
 
13 
 
Onde: Z é o valor usado para o grau de confiança específico (Tabela da Distribuição 
Normal Padrão – Apêndice) 
 é o desvio padrão da população 
e = X −  é o fator de erro permitido no intervalo 
 
No caso da amostragem sem reposição de uma população finita de tamanho N, tem-se 
que: 
Zα/2 = 
X � 
�
√�
 �
���
���
 
E sendo e = X −  o erro de estimativa, explicitando-se n, tem-se que: 
n = 
�²�²�
(���)�²��²�²
 
Nota: Ao determinar o tamanho da amostra, qualquer resultado fracionário é sempre 
arredondado. 
 
Exemplo: Um analista do departamento pessoal deseja estimar o número médio de 
horas de treinamento anual para os funcionários da empresa, com um fator de erro de 
3,0 horas (para mais e para menos) e com 90% de confiança. Baseado em dados de 
outras divisões, ele estima o desvio padrão das horas de treinamento em  = 20,00 
horas. Qual o tamanho mínimo necessário da amostra? 
Solução 
n = �² ² 
�²
 = 
�,��² ��,��²
�²
 = 121 
 
Conclusão: o tamanho mínimo da amostra deve ser 121 horas de treinamento. 
Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 129 
 
 
 
 
 
14 
 
5.5 - Determinação do Tamanho necessário da Amostra para estimar a Proporção 
Considere uma população com uma proporção p de objetos que apresentam certas 
características de interesse. Para um intervalo de confiança de 100(1-α)% construído a 
partir de uma grande amostra (n ≥ 30) extraída com uma proporção f de objetos com a 
característica considerada, extraída com reposição, tem-se que: 
Zα/2 = 
���
�
�(���)
�
 
onde f – p = e é o erro de estimativa. 
Explicitando-se n, tem-se: n = �² 
�(���)
 
�²
 
 
Exemplo: Com objetivo de estimar a proporção de itens defeituosos numa produção, 
um Engenheiro de Produção deseja extrair uma amostra de itens. Uma amostra piloto de 
40 itens apresentou 4 defeituosos. Qual deve ser o tamanho da amostra definitiva para 
que o erro de estimação seja no máximo 3% a um nível de confiança de 95%? 
Solução 
f = �
��
 = 0,1; e = 0,03 
�
1 − � = 0,95
� = 0,05
�/2 = 0,025
 ; logo Zα/2 = 1,96 
n = 
�² 
�(���)
 
�²
 = �,��² �,�(���,�)
�,��²
 = 384,16 
Conclusão: o tamanho da amostra deve ser 385. 
 
 
5.6 - Intervalo de Confiança para Variância populacional 
Se uma variável aleatória x admite distribuição normal de probabilidades com média µ e 
variância σ² 
�² (� − 1)
�²
 
 
 
 
15 
 
Tem distribuição Quiquadrado χ²(n – 1) 
O Intervalo de Confiança escrito em função da variável χ²(n – 1) assume a forma: 
P( χ²(1 – α/2) ≤ χ² ≤ χ²(α/2) ) = 1 – α 
Substituindo-se o valor do χ² no intervalo, obtém-se: 
 P( χ²1 – α/2 ≤ 
�² (���)
�² ≤ χ²α/2 ) = 1 – α 
P( �
�² (���/�)
 ≤ �²
�² (�−1)
 ≤ �
�²(�/�)
 ) = 1 – α 
P ( �² (�−1)
�²(���/�)
 ≤ σ² ≤ �² (�−1)
�²(�/�)
 ) = 1 – α 
 
Exemplo: Uma máquina produz uma grande quantidade de peças e o número de peças 
defeituosas da produção se distribui normalmente com variância σ²(x) = 16. Com o 
objetivo de diminuir a variabilidade do processo, foi providenciada uma reforma na 
máquina. Uma amostra aleatória de 51 peças produzidas após a reforma forneceu 
variância 14. Construa um intervalo de confiança de 98% para a nova variância 
populacional. 
Solução 
n = 51 peças, logo gl (grau de liberdade) = n – 1 = 50 
Variância amostral s² = 14 
1 – α = 98% ; α = 0,02 ; α/2 = 0,01 
Da Tabela de Distribuição Quiquadrado (Apêndice), temos: 
 χ²(1 – α/2) = χ²(0,99) = 76,2 
χ² (α/2) = χ²(0,01) = 29,7 
Teremos então o seguinte intervalo de confiança para a variância: 
P ( �² (�−1)
�²(���/�)
 ≤ σ² ≤ �² (�−1)
�²(�/�)
 ) = 1 – α 
P ( 14(51 – 1)
��,�
 ≤ σ² ≤ 14(51 – 1)
��,�
 ) = 0,98 
P ( 9,186 ≤ σ² ≤ 23,569) = 0,98 
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, 
Ciências Contábeis. p. 149 
 
16 
 
5.7 Intervalo de Confiança para Diferença de duas Médias 
Consideramos duas populações normais, ou seja, N (µ1 ; σ²1) e N (µ2 ; σ²2) 
independentes e com σ²1 e σ²2 conhecidas. Assim, ao selecionarmos amostras das duas 
populações de tamanho n1 e n2, pelo Teorema do Limite Central, sabemos: 
 X 1 ~ N( µ1; 
�₁²
�₁
 ) e X ₂ ~ N( µ₂; 
�₂²
�₂
 ) 
Logo, X ₁ - X ₂ ~ (µ₁ - µ₂; �₁²
�₁
 - �₂²
�₂
 ) 
Assim, o Intervalo de confiança: 
P( ( X ₁ - X ₂) - Zα/2��₁²
�₁
+ 
�₂²
�₂
 
 < (µ₁ - µ₂) < ( X ₁ - X ₂) + Zα/2��₁²
�₁
+ 
�₂²
�₂
 
 ) = 1 – α 
 
Observação: Caso σ₁² e σ₂² não sejam conhecidos, e a amostra n < 30, devemos 
aproximar o valor da variância populacional pela variância amostral s₁² e s₂² e substituir 
a variável Normal Padronizada, Z, pela variável t de Student. 
 
Exemplo: Duas populações normais independentes, com distribuições x1 e x2, 
apresentam σ(x1) = 5 e σ(x2) = 2. Uma amostra aleatória de 12 elementos da primeira 
população apresentou x1 = 34. Uma amostra aleatória de 8 elementos da segunda 
população apresentou x2 = 9,4. Calcule o intervalo de confiança de 98% para a 
diferença µ₁ - µ₂. 
Solução 
P( ( X ₁ - X ₂) - Zα/2��₁²
�₁
+ 
�₂²
�₂
 
 < (µ₁ - µ₂) < ( X ₁ - X ₂) + Zα/2��₁²
�₁
+ 
�₂²
�₂
 
 ) = 1 – α 
P [ (34 – 9,4) – Zα/2� �²
��
+
�²
�
 < (µ₁ - µ₂) < (34 – 9,4) + Zα/2� �²
��
+
�²
�
 ] = 0,98 
�
1 − � = 0,98
� = 0,02
�/2 = 0,01
 ; logo, temos Zα/2 = 2,325 
P [ 24,6 – 2,325(1,607) < (µ₁ - µ₂) < 24,6 + 2,325(1,607) ] = 0,98 
Assim, o intervalo de confiança para a diferença µ₁ - µ₂ será: 
P [ 20,864 < (µ₁ - µ₂) < 28,336 ] = 0,98 
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, 
Ciências Contábeis. p.140, 141 
 
17 
 
5.8 Intervalo de Confiança para a diferença entre duas Proporções 
A distribuição amostral da proporção em duas populações pode ser amostrada, 
considerando-se amostras de tamanho n1 da primeira população e amostras de tamanho 
n2 da segunda população. Obtém-se: 
µ (f₁) = p₁ µ (f₂) = p₂ 
σ²(f₁) = �₁�₁
�₁
 σ²(f₂) = �₂�₂
�₂
 
q₁ = (1- f₁) q₂ = (1- f₂) 
Se x = f₁ - f₂ , então temos: 
µ (x) = µ (f₁) - µ (f₂) = p₁ - p₂ e 
σ²(x) = σ²(f₁) + σ²(f₂) = �₁�₁
�₁
 + �₂�₂
�₂
 , portanto σ(x) = �f₁q₁
n₁
+ 
f₂q₂
n₂
 
Aplicando-se a mudança de variável de x para Z: 
Z = 
�� µ
�
 = (�₁ � �₂) � (�₁ � �₂)
��₁�₁
�₁
� 
�₂�₂
�₂
 
 
Logo, o Intervalo de Confiança: 
P [ (f₁ - f₂) - Zα/2��₁�₁�₁
+ 
�₂�₂
�₂
 < p₁ - p₂ < (f₁ - f₂) + Zα/2��₁�₁
�₁
+ 
�₂�₂
�₂
 ] = 1 – α 
 
Exemplo: Duas máquinas produzem o mesmo tipo de peça, que são misturadas para 
embalagem posterior. Uma amostra de 40 peças da primeira máquina apresentou 1 peça 
defeituosa, enquanto uma amostra de 36 peças da segunda máquina apresentou 2 peças 
defeituosas. Calcule, ao nível de 98%, um intervalo de confiança para a diferença das 
proporções de peças defeituosas na produção dessas máquinas. 
Solução 
f₁ = �
��
 = 0,025 f₂ = �
��
 = 0,055 
q₁ = (1 – f₁) = 0,975 q₂ = (1- f₂) = 0,945 
n₁ = 40 n₂ = 36 
 
18 
 
�
1 − � = 0,98
� = 0,02
�/2 = 0,01
 ; logo, temos Zα/2 = 2,325 
Portanto, o intervalo de confiança será: 
P [ (f₁ - f₂) - Zα/2��₁�₁
�₁
+ 
�₂�₂
�₂
 < (p₁ - p₂) < (f₁ - f₂) + Zα/2��₁�₁
�₁
+ 
�₂�₂
�₂
 ] = 1 – α 
P [ - 0,03 – 2,325 (0,0453) < (p₁ - p₂) < - 0,03 + 2, 325 (0,0453) ] = 0,98 
P [ - 0,135 < (p₁ - p₂) < 0,0753 ] = 0,98 
Conclusão: A diferença das proporções de peças defeituosas na produção dessas 
máquinas varia de -13,5% à 7,53%. 
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, 
Ciências Contábeis. p.145 
 
Exercícios 
5.1) Deseja-se estimar a média do valor de vendas, por estabelecimento varejista, 
durante o último ano, de um determinado produto. O número de estabelecimentos 
varejistas é bastante grande. Determinar o intervalo de confiança de 95% dado que os 
valores de venda,são considerados normalmente distribuídos, sendo X = $ 3425, σ = $ 
200, e n = 25. 
Resposta: $3346,60 à $3503,40 
 
5.2) O diâmetro médio de uma amostra de n = 12 bastões cilíndricos incluídos em um 
carregamento é de 2,350 mm com desvio padrão de 0,050mm. A distribuição dos 
diâmetros de todos os bastões incluídos no carregamento é aproximadamente normal. 
Determinar o intervalo de confiança de 99% para estimar o diâmetro médio de todos os 
bastões incluídos no carregamento. 
Resposta: 2,307 à 2,393 mm 
Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 140 
 
5.3) Procurando dimensionar a ajuda de custo para seus 50 vendedores, uma empresa 
acompanhou os gastos de 15 vendedores e verificou despesa média de 20 u.m. Se a 
empresa acredita que o desvio padrão para o gasto é 2 u.m., determine um intervalo de 
confiança de 98% para o gasto médio dos vendedores desta empresa. 
 
19 
 
Resposta: 18,98 à 21,02 u.m. 
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, 
Ciências Contábeis. p. 114 
 
5.4) Uma amostra de 5 elementos selecionados de uma população normal de 200 
elementos apresentou os valores: 120, 98, 106, 145, 92. Calcule o intervalo de confiança 
de 95% para a média da população. 
Resposta: 85,94 à 138,46 
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, 
Ciências Contábeis. p. 121 
 
5.5) Uma empresa de pesquisa de mercado faz contato com uma amostra de 100 
homens em uma grande comunidade e verifica que uma proporção de 0,40 na amostra 
prefere lâminas de barbear da marca YY em vez de qualquer outra marca. Determine o 
intervalo de confiança de 95% para proporção de todos os homens na comunidade que 
preferem a lâmina de barbear YY. 
Resposta: 0,30 à 0,50; ou 30% à 50% 
 
5.6) Para uma amostra de 30 empregados de uma grande empresa, o salário médio 
horário foi X ₁ = $ 7,50 com s₁ = $ 1,00. Em uma segunda grande empresa, o salário 
médio horário para uma amostra de 40 empregados foi X ₂ = $ 7,05 com s₂ = $ 1,20. 
Estimar a diferença dos salários médios horários das duas empresas, usando um 
intervalo de confiança de 90%. 
Resposta: $ 0,02 à $ 0,88 por hora 
Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 152 
 
5.7) Um pequeno fabricante comprou um lote de 200 pequenas peças eletrônicas de um 
saldo de estoques de uma grande firma. Para uma amostra aleatória de 50 destas peças, 
constatou-se que 5 eram defeituosas. Estimar a proporção de todas as peças que são 
defeituosas no carregamento, utilizando um intervalo de confiança de 95%. 
Resposta: 0,03 à 0,17; ou 3% à 17% 
Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 152 
 
20 
 
5.8) Um guarda de trânsito vistoriou 200 carros em um bairro de certa cidade e 
constatou que 25 motoristas não estavam usando o cinto de segurança no momento da 
vistoria. Determine um intervalo de confiança de 95% para a proporção de motoristas 
que usam regularmente o cinto de segurança neste bairro. 
Resposta: 0,8292 à 0,9208; ou 82,92% à 9,08% 
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, 
Ciências Contábeis. p. 132 
 
5.9) O departamento de controle de qualidade amostrou aleatoriamente 60 lâmpadas 
produzidas antes e depois de um ajuste nas máquinas de sua linha de produção, obtendo 
antes do ajuste 4 defeituosas e depois 3 defeituosas. Ao nível de confiança de 95%, 
pode-se afirmar que a diferença das proporções de lâmpadas defeituosas produzidas 
após o ajuste antes do ajuste apresentam diferença significativa? 
Resposta: Não. (- 0,100 < p₁ - p₂ < 0,067) 
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, 
Ciências Contábeis. p. 146 
 
5.10) Para um produto particular, a média de vendas por estabelecimento no último ano, 
em uma amostra de n = 10 estabelecimentos foi X = $ 3425 com s = $ 200. Supõe-se 
que as vendas por estabelecimento sejam normalmente distribuídas. Estimar (a) 
variância e (b) o desvio padrão das vendas deste produto em todos os estabelecimentos, 
no ultimo ano, utilizando um intervalo de confiança de 90%. 
Resposta: (a) 21278 < σ² < 108271 ; (b) 145,9 < σ < 329,0 
Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 153, 154 
 
5.11) Deseja-se conhecer a permanência média de pacientes em um hospital, a fim de 
estudar uma possível obra de ampliação do mesmo. Dispõe-se de dados referentes à 
permanência expressos em dias de 600 pacientes, obtendo-se os seguintes resultados X
= 12,3 dias, s = 8 dias. Pede-se: (a) Encontre o intervalo de confiança de 95% para a 
permanência média. (b) Qual a probabilidade de risco de µ > 13? 
Resposta: (a) 11,6599 à 12,9401 dias; (b) 0,01618; ou 1,62% 
 
5.12) Em um parque existe uma população muito grande de esquilos. De uma amostra 
aleatória de 40 destes esquilos achou-se que 4 estão infectados com o bacilo da peste. 
 
21 
 
Pede-se: (a) Determine um intervalo de confiança de 95% para a verdadeira proporção 
de esquilos infectados na população. (b) de que tamanho deveria ser tomada a amostra 
para estimar a dita proporção com um erro não maior que 5% com um nível de 
confiança de 99%? 
Resposta: (a) 0,007 à 0,192; ou 0,7% à 19,2%; (b) 238 
 
5.13) As caixas de cereal produzidos em uma fábrica devem ter um conteúdo de 16 o. 
Um inspetor tomou uma amostra que forneceu os seguintes pesos em o: 
15,7; 15,7; 16,3; 15,8; 16,1; 15,9; 16,2; 15,9; 15,8; 15,66 
Diga se é razoável que o inspetor, utilizando um coeficiente de confiança de 95% 
ordene que o fabricante seja multado. 
Resposta: 15,746 a 16,065 o. O inspetor não deve multar o fabricante já que o valor esperado 
está dentro do intervalo de confiança das amostras analisadas. 
 
5.14) Uma amostra de 800 eleitores indicou uma preferência de 25% para um 
determinado candidato. Pede-se: (a) Determine um intervalo de 98% de confiança para 
a proporção de todos os eleitores que têm preferência por esse candidato. (b) determine 
o tamanho necessário da amostra para se obter um intervalo de confiança de 98% para a 
proporção na população com uma amplitude de ± 2%. 
Resposta: (a) 0,214 à 0,286; ou 21,4% à 28,6% (b) 2537 
 
5.15) Umafundição produz blocos para motor de caminhões. Os blocos têm furos para 
as camisas e deseja-se verificar qual é o diâmetro médio no processo do furo. A empresa 
retirou uma amostra de 36 blocos e mediu os diâmetros de 36 furos (1 a cada bloco). A 
amostra acusou média de 98,0 mm e desvio padrão de 4,0 mm. Construa um intervalo 
de confiança de 99%. Se o processo deveria ter média de 100 mm, há evidência (com o 
mesmo nível de confiança) de que a média do processo não está no valor ideal? 
Explique. 
Resposta: 96,2828 a 99,7171 mm. A média está por baixo do valor ideal com uma confiança de 
99%. 
 
5.16) Duas máquinas são usadas para encher garrafas de plástico com detergente para 
lavagem de pratos. Os desvios-padrão do volume de enchimento são conhecidos como 
sendo 1 = 0,10 onça fluida e 2 = 0,15 onça fluida para as duas máquinas, 
respectivamente. Duas amostras aleatórias de n1 = 12 garrafas da máquina 1 e n2 = 10 
garrafas da máquina 2 são selecionadas. Os volumes médios de enchimento nas 
amostras são 1 = 30,87X onças fluidas e 2 = 30,68X onças fluidas. Suponha 
 
22 
 
normalidade. Construa um intervalo bilateral de confiança de 90% para a diferença nas 
médias do volume de enchimento. Interprete esse intervalo. 
 
Resposta: 0,099 < (µ₁ - µ₂) < 0,281 
 
 
5.17) Uma amostra aleatória de dez recém nascidos em uma maternidade deu os 
seguintes valores de peso, em quilogramas, no momento do nascimento: 
 
2,8; 3,2; 4,1; 3,5; 3,4; 3,0; 3,2; 3,2; 2,7; 2,3 
 
Suponha que o peso de recém nascidos é uma variável aleatória normal X. 
(a) Supondo que o desvio padrão de X seja conhecido e igual a 0,5 kg, determine 
um intervalo de confiança de 95% para o valo da média dos pesos de recém 
nascidos nessa maternidade. 
(a) Se o desvio padrão de X é um valor desconhecido, determine um intervalo de 
confiança de 95% para esse valor médio. 
(b) Repita os itens (a) e (b) para um intervalo de confiança de 99%. 
(c) Compare os intervalos obtidos nos itens anteriores e verifique se o intervalo 
aumenta ou diminui (i) quando o desvio padrão é desconhecido e (ii) quando o 
nível de confiança aumenta. 
 
Resposta: (a) 2,8201 à 3,4399 kg ; (b) 2,7723 à 3,4877 Kg ; (c) 2,72 à 3,53 Kg ; 2,62 à 3,63 
Kg; (d) O IC aumenta quando o desvio padrão é desconhecido e também quando o nível de 
confiança aumenta. 
 
5.18) Os seguintes números são as notas de 15 estudantes do curso de Estatística II: 
6,5; 4,0; 5,0; 6,0; 7,5; 3,5; 8,0; 4,5; 7,0; 5,5; 4,0; 5,5; 8,5; 6,5; 5,5 
Supondo que a população de notas está normalmente distribuída, construa um intervalo 
de confiança de 95% para a variância σ² e desvio padrão σ. 
Resposta: 1,2187 < σ² < 5,6542; 1,1040 < σ < 2,3779 
 
 
 
 
 
 
 
 
 
23 
 
Capítulo 6 - TESTE DE HIPÓTESE 
Quando quisermos avaliar um parâmetro populacional, sobre o qual não possuímos 
nenhuma informação com respeito a seu valor, não resta outra alternativa a não ser 
estimá-lo através do intervalo de confiança. 
No entanto, se tivermos alguma informação com respeito ao valor do parâmetro que 
desejamos avaliar, podemos testar esta informação no sentido de aceita-la como 
verdadeira ou rejeitá-la. 
- Ho Hipótese nula: informação à respeito do valor do parâmetro que queremos avaliar 
- Ha Hipótese alternativa: afirmação à respeito do valor do parâmetro que aceitamos 
como verdadeiro caso Ho seja rejeitada. 
Portanto, o Teste de Hipótese é uma regra de decisão que permite aceitar ou rejeitar 
como verdadeira uma hipótese nula Ho, com base na evidência amostral 
Isto significa que utilizaremos uma amostra desta população para verificar se a amostra 
confirma ou não o valor do parâmetro informado pela hipótese Ho. 
 
Na realização de um teste de hipótese, dois erros podem ser cometidos: 
ERRO TIPO I: é aquele que se comete ao rejeitar uma hipótese que é correta. A 
probabilidade desse erro é simbolizada por α e é definido pelo nível de significância 
exigido no teste. 
ERRO TIPO II: é o erro que se comete ao aceitar uma hipótese que é incorreta. A 
probabilidade desse erro é simbolizada por β. 
A medida que diminui α o β é aumentado e vice-versa, por isso é difícil controlar os 
dois erros simultaneamente. Na prática, é comum usar apenas α e teremos os testes de 
significância. 
 
Construção de um Teste de Hipótese 
a) Formular as hipóteses Ho e Ha 
b) Escolher a variável teste 
c) Arbitrar o nível de significância α 
d) Determinar as regiões de aceitação e rejeição de Ho 
e) Conclusão: aceitar ou rejeitar Ho 
 
 
6.1 - Teste da Média Populacional para σ² conhecida 
 
24 
 
No caso de um teste da média de uma população, com a variância conhecida, as 
hipóteses são: 
Ho: µ = µo 
Ha: µ ≠ µo (Teste bilateral) 
 µ < µo (Teste unilateral esquerdo) 
 µ > µo (Teste unilateral direito) 
 
A variável teste é a normal padronizada: 
Zx = 
X � 
�
√�
 com reposição 
Zx= 
X � 
�
√�
 �
���
���
 sem reposição 
 
Exemplo: Uma amostra aleatória de 40 elementos retirados de uma população normal 
com desvio padrão σ = 3 apresentou um valor médio igual à X = 60. Teste, ao nível de 
significância de 5%, a hipótese de que a média populacional seja igual a 59. 
Solução 
Hipóteses Ho: µ = 59 
 Ha: µ > 59 
Utilizamos a variável Normal Padronizada Z, já que o desvio padrão é conhecido. 
Assim, calculando Zc, temos: 
Zc = 
X � 
�
√�
 
 = 
�����
�
√��
 = 2,108 
Ao nível de 5% de significância, ou seja, sendo α = 0,05 , obtemos na tabela da 
Distribuição Normal – Padrão (Apêndice), o valor de Zα = 1,64. 
 
 
Definimos assim uma região de aceitação (RA) e uma região crítica (RC) para a 
hipótese nula, Ho: 
 
25 
 
 
Figura 6.1 - Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, 
Administração, Ciências Contábeis. p. 159
 
Conclusão: o valor de Zc = 2,108 > Zα = 1,64 , está na região crítica para a hipótese 
nula, Ho. Portanto, ao nível de significância de 5%, rejeita-se Ho, ou seja, a média 
populacional é superior a 59. 
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, 
Ciências Contábeis. p. 159, 160
 
 
 
6.2 - Teste da Média Populacional para σ² desconhecida 
A distribuição t de Student é apropriada para o uso como estatística de teste de hipótese 
quando a amostra é pequena (n < 30), a população está normalmente distribuída e σ é 
desconhecido. 
As hipóteses são: 
Ho: µ = µo 
Ha: µ ≠ µo (Teste bilateral) 
 µ < µo (Teste unilateral esquerdo) 
 µ > µo (Teste unilateral direito) 
 
A variável teste padronizada: 
tx = 
X � 
�
√�
 com reposição 
tx = 
X � 
�
√�
 �
���
���
 sem reposição 
com ν = n – 1 graus de liberdade. 
 
26 
 
Exemplo: Uma amostra de 12 elementos retirados ao acaso de uma população normal 
apresentou X = 100 e Sx = 5. Teste ao nível de significância de 5%, a hipótese de que a 
média populacional seja 102. 
Solução 
Hipóteses Ho: µ = 102 
 Ha: µ < 102 
Utilizamos a variável t já que a amostra é pequena (n = 12), a população é normalmente 
distribuída e o desvio padrão é desconhecido. Assim, calculando tc, temos: 
tc = 
X � 
�
√�
 
 = 
�������
�
√��
 = - 1,39 
 
Ao nível de 5% de significância, ou seja, sendo α = 0,05 , obtemos da tabela de 
Distribuição t de Student (Apêndice), o valor de tα = - 1,79. 
Definimos, portanto, as regiões de aceitação (RA) e região crítica (RC) para a hipótese 
nula Ho: 
 
Figura 6.2 - Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, 
Administração, Ciências Contábeis. p. 160
 
Conclusão: o valor de tc = - 1,39 > tα = - 1,79, está na região de aceitação para a 
hipótese Ho. Portanto, ao nível de significância de 5%, aceita-se Ho, ou seja, aceita-se a 
hipótese de que a média populacional seja 102 . 
Da Silva,E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, 
Ciências Contábeis. p. 160 
 
 
 
 
 
 
27 
 
6.3 - Teste da Proporção Populacional 
As hipóteses são: 
Ho: p = p0 
Ha: p ≠ p0 (Teste bilateral) 
 p < po (Teste unilateral esquerdo) 
 p > po (Teste unilateral direito) 
onde p0 é o valor de p sob a hipótese Ho. 
Sob a hipótese nula a proporção amostral f, no caso de grandes amostras (n ≥ 30) tem 
distribuição aproximadamente normal com média µ e desvio padrão sf = �
�(���)
�
 
A estatística teste é a variável normal padronizada associada a f: 
Zx = 
���
�
�(���)
�
 com reposição 
 
Exemplo: Uma máquina está regulada quando produz 3% de peças defeituosas. Uma 
amostra aleatória de 80 peças selecionadas ao acaso apresentou 3 peças defeituosas. 
Teste ao nível de 2% a hipótese de que a máquina está regulada. 
Solução 
A hipótese a ser testada é que a máquina está regulada, ou seja p = 0,03. 
A probabilidade obtida a partir das amostras é: 
f = 
�
��
 = 0,0375 
Hipóteses Ho: p = 0,03 
 Ha: p > 0,03 
Calculamos o valor da variável teste Zc: 
Zc = 
���
�
�(���)
�
 = 
�,������,��
�
�,��(�,��)
��
 = 0,393 
Ao nível de significância de 2%, obtemos da tabela da Distribuição Normal – Padrão o 
valor de Zα = 2,055. 
 
 
28 
 
Definimos, assim, uma região de aceitação (RA) e uma região crítica (RC) para a 
hipótese nula, Ho: 
 
Figura 6.3 - Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, 
Administração, Ciências Contábeis. p. 164
 
Conclusão: O valor Zc = 0,393 situa-se à esquerda do valor de Zα = 2,055 obtido na 
tabela. Portanto está na região de aceitação da hipótese nula. Assim, aceita-se Ho, ou 
seja, p = 0,03, ao nível de significância de 2% a máquina está regulada. 
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, 
Ciências Contábeis. p. 163, 164 
 
 
6.4 - Teste de Igualdade de Variâncias 
Em muitas aplicações deseja-se verificar se duas populações têm variâncias iguais 
(populações homocedásticas) ou variâncias diferentes (populações heterocedásticas). 
Suponha que uma variável normalmente distribuída, tenha variância σ1² numa 
população 1 e σ2² em outra população 2. 
Nota: Por uma questão de referência, considera-se índice 1 para a maior variância e 
índice 2 para a menor. 
Em algumas aplicações deseja-se saber se σ1² > σ2². 
As hipóteses são Ho: σ1² = σ2² (Homocedasticidade) 
 Ha: σ1² > σ2² (Heterocedasticidade) 
A distribuição F é a distribuição de probabilidade apropriada para a razão das variâncias 
de duas amostras tomadas independentemente de populações normalmente distribuídas. 
Portanto, teste se baseia na razão de variâncias amostrais: Fc = �₁²
�₂²
 
com (n₁ - 1) graus de liberdade no numerador e (n₂ - 1) graus de liberdade no 
denominador, para uma amostra de tamanho n₁ da população 1 e n₂ da população 2 e 
sendo S12 e S22 as estimativas de σ1² e σ2² respectivamente. 
 
29 
 
A hipótese Ho será rejeitada num nível de significância α se Fc > Fα,(n1 - 1),(n2 - 2) e aceita 
caso contrário. 
*sendo Fc o valor calculado através das variâncias amostrais e Fα,(n1 - 1),(n2 - 2) o valor 
obtido da tabela da Distribuição F (Apêndice). 
 
Exemplo: É projetado um novo processo de moldagem para reduzir a variabilidade dos 
diâmetro de fundição. Para uma amostra de n1 = 10 fundições com o processo antigo, 
teve-se s1 = 5,8 mm. Para uma amostra de n2 = 8 fundições com o novo processo, teve-
se s2 = 4,2 mm. Considerando-se α = 5%, pode-se afirmar que a variação do processo 
antigo é maior que no novo processo? 
Solução 
Processo antigo: n1 = 10; s1 = 5,8 mm; s12 = 33,64 
Novo processo: n2 = 8; s2 = 4,2 mm; s22 = 17,64 
Hipóteses Ho: σ1² = σ2² 
 Ha: σ1² > σ2² 
Variável Teste: Fc = �₁²
�₂²
 = ��,��
��,��
 = 1,91 
Regra de decisão α = 5% 
gl 1: ν1 = n1 – 1 = 10 – 1 = 9; gl2: ν2 = n2 – 1 = 8 – 1 = 7 
logo, Ftabelado = 3,68 
Conclusão: Fc = 1,91 < Ftabelado= 3,68, portanto aceita-se Ho. Ou seja, a um nível de 
significância de 5%, não existe diferença na variabilidade dos dois processos. 
 
 
6.5 - Teste da Variância (usando a Distribuição Quiquadrado) 
Para uma população normalmente distribuída, a razão 
 
�² (���)
�² 
segue uma distribuição de probabilidade χ², existindo uma Distribuição Quiquadrado 
diferente de acordo com (n – 1) graus de liberdade. 
 
 
30 
 
Portanto, a estatística usada para testar um valor hipotético da variância da população 
 χ² = 
�² (���)
�² 
 
Exemplo: A média da vida útil para uma amostra de n = 10 lâmpadas é x = 4000 horas, 
com um desvio padrão de s = 200 horas. Supõe-se que a vida útil das lâmpadas, em 
geral, seja normalmente distribuída. Suponha que, antes de ser coletada a amostra, foi 
feita a hipótese de que o desvio padrão não era maior do que σ = 150. Com base nos 
resultados amostrais, teste tal hipótese ao nível de significância de 1%. 
Solução 
Hipóteses Ho: σ² ≤ 22500 (σ² = 150²) 
 Ha: σ² > 22500 
Variável teste χ² = 
�² (���)
�²
 = 
���² (����)
���²
 = 16 
Da tabela da Distribuição Quiquadrado, obtemos o valor de χ²(α = 1% ; gl = 10- 1 = 9) = 21,67. 
Conclusão: Como χ²calculado =16 < χ²tabelado = 21,67, aceita-se Ho, ao nível de 
significância de 1%. Ou seja, o desvio padrão não é maior que σ = 150. 
 
 
6.6 - Teste da Diferença entre duas Médias (usando Distribuição Normal - 
Padronizada) 
O melhor estimador para µ1 e µ2 é X 1 e X 2, respectivamente. 
A distribuição amostral de X 1 e X 2 é normal e Zc = 
� X �� X �
�� ( µ� � µ�)
��₁²
�₁
�
�₂²
�₂
 
As hipóteses são Ho: µ1 = µ2 
 Ha: µ1 ≠ µ2 
 
 
 
 
31 
 
 
Figura 6.4 Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, 
Administração, Ciências Contábeis. p. 139 
O teste da diferença entre duas médias é, portanto, um teste bilateral e assim temos uma 
região de aceitação (- Zα/2 < Zc < Zα/2) e duas regiões críticas ( Zc < - Zα/2 e Zc > Zα/2). 
Tomamos a decisão comparando-se esses valores de Zc e Zα/2. 
 
Exemplo: A média de salários semanais de uma amostra de n1 = 30 empregados em 
uma grande indústria é X 1 = 180,00 , com desvio padrão amostral de s1 = 14,00. Para 
uma outra grande empresa, uma amostra de n2 = 40 empregados apresentou média X 2 = 
170,00 , com desvio padrão de s2 = 10,00. Teste a hipótese de que não existe diferença 
entre os valores dos salários semanais médios nas duas firmas, usando nível de 
significância de 5%. 
Solução 
Hipóteses Ho: µ1 = µ2 
 Ha: µ1 ≠ µ2 
 Sendo, X 1 = 180,00 X 2 = 170,00 
 s1 = 14,00 s2 = 10,00 
 n1 = 30 n2 = 40 
Nota: como n1 e n2 são suficientemente grandes, o desvio padrão amostral se aproxima 
do desvio padrão populacional. 
Zc = 
� X ��
X ��
��₁²
�₁
�
�₂²
�₂
 = 
�������
���²
��
� 
��²
��
 = 3,327 
 
α = 5%, logo temos da tabela Normal – Padrão (Apêndice): Zα/2 = 1,96 
Conclusão: Como Zc = 3,327 > Zα/2, rejeita-se Ho num nível de significância de 5%. Ou 
seja, as duas firmas apresentam diferença entre os valores médios dos salários semanais. 
Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 176 
 
 
32 
 
6.7 - Teste da Diferença entre duas Médias (usando Distribuição t de Student) 
No caso anterior, se σ² não for conhecido ou os tamanhos das amostras (n1 e n2) for 
menor que 30, use aproximação de σ²(x) por s²(x), utilizando a distribuição t de Student. 
tc = 
� X ₁� X ₂��(µ₁ � µ₂) 
��₁²
�₁
�
�₂²
�₂
 
Assim como no caso anterior, sendo este um teste bilateral, temos uma região de 
aceitação (- tα/2 < tc < tα/2) e duas regiões críticas ( tc < - tα/2 e tc> tα/2). Tomamos a 
decisão comparando-se esses valores de tc e tα/2. 
 
Exemplo: Para uma amostra aleatória de n1 = 10 lâmpadas, a vida útil média foi 
X 1 = 4000 horas, com s1 = 200. Para outra marca de lâmpadas, cuja vida útil também 
supõe-se ser normalmente distribuída, uma amostra n2 = 8, apresentou média X 2 = 
4300 horas, e desvio padrão amostral s2 = 250. Teste a hipótese de que não existe 
diferença entre a média de vida útil das duas marcas de lâmpadas, usando nível de 
significância de 1%. 
Solução 
Hipóteses Ho: µ1 = µ2 
 Ha: µ1 ≠ µ2 
Sendo, X 1 = 4000 X 2 = 4300 
 s1 = 200 s2 = 250 
 n1 = 10 n2 = 8 
tc = 
� X �� X �
�
��₁²
�₁
�
�₂²
�₂
 = 
���������
�
���²
��
�
���²
�
 = - 2,76 
A tabela da Distribuição t (Apêndice) nos fornece t (α/2 = 0,005 ; gl = 16) = 2,921 
Obs: graus de liberdade gl = n1 + n2 – 2 = 10 + 8 -2 =16 
Conclusão: Como tc encontra-se na região de aceitação (- tα/2 < tc = - 2,76 < tα/2). 
Conclui-se que, aceita-se Ho, ao nível de significância de 1%. Ou seja, a média da vida 
útil das duas marcas de lâmpadas são iguais. 
Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 177 
 
33 
 
Exercícios 
6.1) O fabricante de um novo automóvel compacto afirma que o consumo médio de 
gasolina é de 35 milhas por galão, em estrada. Em 40 provas, o carro fez uma média de 
34,5 milhas por galão com um desvio padrão de 2,3 milhas por galão. Pode-se afirmar 
que o fabricante está mentindo, ao nível de significância de 5%? 
Resposta: Não se pode afirmar que o fabricante está mentindo. Aceita-se Ho 
Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 173 
 
6.2) O valor médio de vendas por estabelecimento varejista, durante o último ano, de 
um particular produto, foi de X = $ 3425 para uma amostra de n = 25 estabelecimentos. 
Com base em dados de vendas de outros produtos similares, supõe-se que a distribuição 
das vendas seja normal e que o valor do desvio padrão da população seja σ = $ 200. Foi 
afirmado que o verdadeiro valor de vendas por estabelecimento é no mínimo de $ 3500. 
Testar esta afirmação ao nível de significância de (a) 5% e (b) 1%. 
Resposta: (a) Rejeita Ho; (b) Aceita Ho 
Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 172 
 
6.3) Uma população normal apresenta historicamente o valor médio de 60 unidades. 
Um analista, duvidando que este valor persista na atualidade, levantou uma amostra 
aleatória de 20 elementos, obtendo valor médio de 55 unidades com desvio padrão de 2 
unidades. Teste ao nível de significância de 5% a hipótese de que a média histórica é 
verdadeira. 
Resposta: Rejeita-se Ho 
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, 
Ciências Contábeis. p.161 
 
6.4) Um projeto de investimento está sendo avaliado pelo método pay-back. Uma 
simulação envolvendo vários cenários futuros forneceu os seguintes tempos de retorno 
do investimento (em anos): 2,8; 4,3; 3,7; 6,4; 3,2; 4,1; 4,4; 4,6; 5,2; 3,9. Teste ao 
nível de 10% a hipótese de que o tempo médio de retorno seja de 4 anos. 
Resposta: Aceita-se Ho 
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, 
Ciências Contábeis. p.162 
 
 
34 
 
6.5) A proporção de mulheres que ocupam cargo administrativo nas empresas é 
tradicionalmente de 15%. Um levantamento efetuado entre 200 administradores revelou 
que 40 eram mulheres. Teste ao nível de significância de 5% a hipótese de que a 
proporção de mulheres que ocupam cargo administrativo não tenha aumentado. 
Resposta: Rejeita-se Ho, a proporção de mulheres aumentou. 
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, 
Ciências Contábeis. p.165 
 
6.6) Uma agência de viagens tem um tradicional plano de férias que é oferecido a todos 
os possíveis clientes que procuram a agência. O índice de respostas positivas é 
historicamente 20%. Este ano, uma amostra aleatória de 50 potenciais clientes mostrou 
que 15 adquiriram o plano de férias. Teste ao nível de 6% a hipótese de que o percentual 
de respostas positivas não tenha aumentado este ano. 
Resposta: Rejeita-se Ho, o número de respostas favoráveis aumentou. 
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, 
Ciências Contábeis. p.166 
6.7) Deseja-se testar a diferença entre duas médias da renda de duas comunidades. Para 
uma amostra de n₁ = 30 famílias na primeira comunidade, a renda média anual é $15500 
com desvio padrão amostral de s₁ = 1800. Para uma amostra de n₂ = 40 famílias na 
segunda comunidade, a renda média anual é $14600 e s₂ = 2400. Teste a hipótese ao 
nível de significância de 1%. 
Resposta: Aceita-se Ho, as duas comunidades apresentam montante médio de renda iguais. 
 
6.8) Com objetivo de testar a eficiência de dois métodos de aprendizagem, eles foram 
aplicados durante um ano em duas escolas da mesma organização. Ao final do curso, 
selecionou-se uma amostra aleatória de 10 alunos de cada escola e a mesma tarefa foi 
proposta a estes alunos. No primeiro grupo, o tempo médio para concluir a tarefa foi 
2h46min, enquanto no segundo grupo a média foi de 2h31min, com desvio padrão de 
23min e 16min respectivamente. Supondo que a distribuição do tempo de realização das 
tarefas são normais, é possível afirmar que o segundo método é mais eficiente que o 
primeiro ao nível de significância de 5%? 
Resposta: Aceita-se Ho. Os métodos têm a mesma eficiência. 
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, 
Ciências Contábeis. p.172 
 
 
35 
 
6.9) Um órgão de defesa do consumidor testa regulamente o peso de botijões de gás 
para uso doméstico. Eles devem apresentar um peso médio líquido de 13kg, com desvio 
padrão não superior a 250g. Uma amostra aleatória realizada no depósito de uma 
companhia engarrafadora de gás revelou entre 26 botijões um desvio padrão de 305g. 
Testar a hipótese de os botijões estarem dentro das especificações, contra a alternativa 
de os botijões estarem fora de especificação, ao nível de 5%. 
Resposta: Aceita-se Ho. Ao nível de significância de 5%, o produto está dentro da especificação. 
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, 
Ciências Contábeis. p.182, 183 
 
6.10) Uma amostra aleatória de 20 elementos selecionados de uma população normal 
apresentou s²(x) = 1,3. Teste ao nível de significância de 5% a hipótese σ²(x) = 4, contra 
a alternativa σ²(x) < 4. 
Resposta: Rejeita Ho, a variância da população é menor que 4. 
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração, 
Ciências Contábeis. p.180 
 
6.11) O peso dos camundongos em um laboratório é uma variável que se distribui 
normalmente com média 25,0 g e desvio padrão igual a 0,8 g. Uma alimentação 
balanceada é dada aos camundongos durante certo período. Supõe-se que a alimentação 
não muda a variância dos pesos. Uma amostra de 25 camundongos é selecionada e 
verifica-se que o peso médio dessa amostra é igual a 25,2 g. testar a hipótese de que 
houve aumento do peso médio ao nível de significância de 5%. 
Resposta: Aceita Ho, os pesos se mantiveram igual a um nível de significância de 5%. 
 
6.12) O rótulo de uma garrafa indica que ela contém 1,5 litros de um refrigerante. Um 
órgão de fiscalização deseja testar esta afirmação e multar o fabricante se constatar que 
o valor médio da quantidade de refrigerante for inferior a 1,5 litros. Com esta finalidade, 
o órgão faz uma amostra aleatória de 30 garrafas e obtém uma médiaamostral de 1,482 
litros e um desvio padrão amostral de 0,025 litros. Verificar se a afirmação do fabricante 
pode ser rejeitada ao nível de 10% e de 5%. 
Resposta: Rejeita-se a afirmação do fabricante a um nível de significância de 10% e de 5%. 
 
6.13) O fabricante de uma droga medicinal reivindicou que ela era 90% eficaz em curar 
uma alergia, em um período de 8 horas. Se a droga é aplicada a 200 doentes curando a 
170 deles, pode-se considerar correta a reivindicação do fabricante? 
 
36 
 
Resposta: Rejeita Ho, a afirmação do fabricante não é correta a um nível de significância de 5%. 
 
6.14) Acredita-se que duas marcas de cigarros, a e b, são semelhantes quanto ao 
conteúdo de nicotina. Um laboratório fez 5 determinações do conteúdo de nicotina(em 
miligramas) para cada marca, com os seguintes resultados: 
Marca A: 31; 35; 28; 34; 33 
Marca B: 27; 26; 30; 28;25 
Com base nestas observações, pode-se manter a hipótese de que as duas marcas 
apresentam igual conteúdo de nicotina? Considere que a variância populacional é igual 
a variância amostral. 
Resposta: Rejeita Ho, as duas marcas não apresentam o mesmo conteúdo de nicotina a um nível 
de 5%. 
 
6.15) Examinaram-se duas classes constituídas de 40 e de 50 alunos, respectivamente. 
Na primeira, o grau médio foi 74, com desvio padrão 8, enquanto, na segunda, a média 
foi 78, com desvio padrão 7. Há uma diferença significativa entre os aproveitamentos 
das duas classes, no nível de significância de (a) 5% e (b) 1%? 
Resposta: (a) Rejeita Ho, há diferença significativa entre os aproveitamentos das duas classes 
com um nível de significância de 5% e a segunda classe é, provavelmente, melhor. (b) Não há 
diferença significativa entre as classes num nível de significância de 1%. 
 
6.16) Para testar o efeito de um novo medicamento no tratamento da diabete ele é 
ministrado a 9 pacientes cujos conteúdos de açúcar no sangue, em jejum, forma 
determinados antes e depois de algum tempo de iniciado o tratamento. Obteve-se os 
seguintes resultados, em mg/ 100ml: 
 
Paciente 1 2 3 4 5 6 7 8 9 
Antes 120 110 118 128 126 124 132 139 125 
Depois 116 112 114 120 130 123 124 130 118 
 Tabela 6.1 – Pacientes antes e depois do tratamento 
Pode-se concluir, com base nesta experiência, a um nível de significância de 5%, que o 
medicamento é eficaz na redução do açúcar no sangue? 
Resposta: Rejeita Ho, as médias de açúcar são diferentes antes e depois, a um nível de 
significância de 5%. Conclui-se que o medicamento é eficaz na redução do açúcar no sangue. 
 
 
37 
 
6.17) Uma máquina que empacota bolsas de café automaticamente está regulada para 
empacotar bolsas cujos pesos estão distribuídos normalmente com média µ e variância 
400. A máquina foi regulada para µ = 500 gramas. Decide-se escolher uma amostra de 
16 bolsas a cada 30 minutos com o objetivo de verificar se a produção está controlada 
ou não , isto é, se µ = 500 gramas ou não. Se uma dessas amostras tem média 492 
gramas, deve-se deter a produção para verificar se a máquina está corretamente 
regulada? 
Resposta: Aceita Ho, a produção não seria interrompida. Conclui-se que a máquina esteja 
corretamente regulada. 
 
6.18) Criou-se dois grupos de animais, com 50 animais em cada grupo, com duas dietas 
diferentes. Ao final de 5 meses o peso médio do grupo 1 foi 149,2 gramas, com um 
desvio padrão de 8 gramas; o segundo grupo apresentou um peso médio de 152,3 
gramas, com desvio padrão de 10 gramas. Devemos aceitar a hipótese de que uma dieta 
é melhor que a outra? 
Resposta: A segunda dieta é melhor que a primeira, a um nível de significância de 5%. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
38 
 
Capítulo 7 - TESTE QUIQUADRADO 
O Teste Quiquadrado como um procedimento de Teste de Hipótese 
Os procedimentos correspondem a três testes que utilizam a Distribuição Quiquadrado 
e se relacionam todos com a comparação de freqüências, obtidas em amostras, de certas 
categorias, com freqüências esperadas baseadas, em cada caso, em hipóteses 
particulares. Deste modo, os procedimentos são Testes de Hipótese e, portanto, possuem 
relação com a análise dos resultados de uma amostra. 
- Teste de Aderência 
- Teste de Independência 
- Teste de Homogeneidade 
 
7.1 - Teste de Aderência 
O teste de Aderência é um teste não paramétrico que é utilizado para verificar se uma 
variável apresenta determinada distribuição de probabilidade (Distribuição Normal, 
Binomial, Poison). 
As hipóteses são: 
Ho: os resultados ocorrem com as freqüências previstas pelo modelo probabilístico. 
Ha: os resultados ocorrem com freqüências diferentes das previstas pelo modelo. 
Sendo observada uma amostra de n valores da variável em estudo, a variável teste é o 
valor quiquadrado para testar a diferença entre padrões obtidos e esperados de 
freqüência: 
χ²c = 
� (�� � ��)²
��
 
onde fo e fe são as freqüências observadas e esperadas, respectivamente. 
Obtemos χ²crítico da tabela da Distribuição do Quiquadrado (Apêndice) observando o 
nível de significância α e os graus de liberdade, ν = k - m - 1, sendo k = número de 
categorias dos dados e m = número dos valores de parâmetros estimados com base na 
amostra. 
Regra de decisão: A hipótese Ho é rejeitada num nível de significância α se χ²calculado > 
χ²crítico e aceita caso contrário. 
 
Exemplo: Um distribuidor regional de sistemas de ar condicionado dividiu sua região 
em quatro territórios. A um presumível comprador da agência de distribuição informou-
 
39 
 
se que as instalações do sistema estariam mais ou menos igualmente distribuídas entre 
os quatro territórios. O presumível comprador toma uma amostra aleatória de 40 
instalações realizadas no ano anterior, com base nos arquivos da companhia, e verifica 
que a quantidade instalada em cada uma das quatro áreas é a apresentada na primeira 
linha da tabela (fo), enquanto a hipótese de que as instalações estão distribuídas de igual 
maneira, é dada na segunda linha, a distribuição uniforme esperada (fe). 
 Território 
Total A B C D 
Freqüência observada fo 6 12 14 8 40 
Freqüência esperada fe 10 10 10 10 40 
 Tabela 7.1 – Instalações do sistema nos diferentes territórios 
Pode-se afirmar que as freqüências estão igualmente distribuídas entre os quatro 
territórios a um nível de significância de 5%? 
Solução 
Hipóteses 
Ho: a quantidade de instalações está igualmente distribuída entre os quatro territórios; 
Ha: a quantidade de instalações não está igualmente distribuída entre os quatro 
territórios. 
Calcula-se o valor do quiquadrado: 
χc² = 
� (�� � ��)²
��
 = 
(� ���)²
��
 + 
(�� ���)²
��
 + 
(�� ���)²
��
 + 
(� ���)²
��
 = 
��
��
 = 4,0 
Sendo o nível de significância proposto, α = 5%, e calculando-se os graus de liberdade, 
obtemos da tabela da Distribuição do Quiquadrado (apêndice) o valor de χ²crítico. 
gl: ν = k – m – 1 = 4 – 0 – 1 = 3 
Nota: a hipótese nula é de que as frequências são igualmente distribuídas, nenhuma 
estimação de parâmetro é envolvida, e m = 0. 
χ2crítico (ν = 3; α = 0,05) = 7,81 
Conclusão: Como χ²calculado = 4,0 < 7,81, aceita-se Ho num nível de significância de 5%. 
Ou seja, pode-se afirmar que as freqüências estão igualmente distribuídas entre os 
quatro territórios. 
Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 195, 196, 197 
 
 
 
40 
 
7.2 - Teste de Independência 
Os Testes de Independência envolvem duas variáveis, e o que se testa é a hipótese de 
que as duas variáveis são estatisticamente independentes. A independência implica que 
o conhecimento da categoria na qual se classifica uma observação com respeito a uma 
variável não afeta a probabilidade de estar em uma das diversas categorias das outras 
variáveis. 
As hipóteses são: Ho: as duas variáveis são independentes 
 Ha: as duas variáveis não são dependentes 
Como intervêm duas variáveis, as freqüências observadas sãocolocadas em uma Tabela 
de Contingência. As dimensões de tal tabela são definidas pela expressão r x k, onde r 
indica o número de linhas e k indica o número de colunas. 
A variável teste será: 
χc² = 
� (�� � ��)²
��
 
sendo fo e fe são as freqüências observadas e esperadas, respectivamente. 
onde a freqüência esperada é equivalente à fe = 
Σ � Σ �
�
 
Nota: recomenda-se fazer uma tabela de contingência para frequências esperadas 
Com ν = (r – 1)(k – 1) graus de liberdade e o nível de significância α proposto, 
encontramos o valor de χcrítico² na tabela da Distribuição do Quiquadrado (Apêndice). 
Regra de decisão: Rejeita-se Ho, ao nível de significância α se χcalculado² > χcrítico² e 
aceita-se caso contrário para (r – 1)(k – 1) graus de liberdade. 
 
Exemplo: A tabela seguinte apresenta a reação dos estudantes à expansão do programa 
de atletismo do colégio, segundo o nível do curso, em que a “divisão inferior” indica 
estudante de primeiro ou segundo ano e “divisão superior” indica estudante de terceiro 
ou de ultimo ano. 
Reação Nível do Curso Total 
Divisão inferior Divisão superior 
A favor 20 19 39 
Contra 10 16 26 
Total 30 35 65 
 Tabela 7.2 – Frequência observada da reação dos estudantes à expansão do programa de atletismo 
Testar a hipótese de que o nível do curso e a reação à expansão do programa de 
atletismo são variáveis independentes, utilizando nível de significância de 5%. 
 
41 
 
Solução 
Ho: o nível do curso e a reação à expansão do programa de atletismo são independentes. 
Ha: o nível do curso e a reação à expansão do programa de atletismo não são 
independentes. 
Calculando-se a freqüência esperada através de fe = 
Σ � Σ �
�
 
por exemplo: fe = 
(��)(��)
��
 = 18, e assim consecutivamente, constrói-se a tabela da 
freqüência esperada: 
Reação Nível do Curso Total 
Divisão inferior Divisão superior 
A favor 18 21 39 
Contra 12 14 26 
Total 30 35 65 
 Tabela 7.3 – Frequência esperada da reação dos estudantes à expansão do programa de atletismo 
Calcula-se então o valor do quiquadrado: 
χ²calculado = 
� (�� � ��)²
��
 = 
(�����)²
��
 + 
(�� ���)²
��
 + 
(�����)²
��
 + 
(�����)²
��
 = 1,03 
Sendo o nível de significância α = 5%, e graus de liberdade: ν = (r – 1)(k – 1) 
= (2 – 1)(2 – 1) = 1; obtemos da tabela da Distribuição do Quiquadrado (Apêndice), o 
valor de χ²crítico 
χ²crítico = ( ν = 1; α = 0,05) = 3,84 
Conclusão: Portanto, sendo χ²calculado = 1,03 < 3,84, à um nível de significância de 5%, 
aceita-se Ho. Ou seja, as duas variáveis, nível do curso e reação à expansão do programa 
de atletismo, são independentes. 
Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 211, 212 
 
 
7.3 - Teste de Homogeneidade 
O Teste de Homogeneidade corresponde ao teste das diferenças entre K proporções 
amostrais. O teste quiquadrado pode ser utilizado para testar a diferença entre K 
proporções amostrais, utilizando para a análise das freqüências uma estrutura tabular de 
2 x K. A hipótese nula é a de que não existe diferença entre as diversas proporções 
populacionais (ou, que as diferentes proporções amostrais poderiam ter sido extraídas, 
ao acaso, da mesma população). 
 
42 
 
Observe as hipóteses: 
Ho: π1 = π2 = π3 = ... = πk (sendo π a probabilidade de cada proporção amostral) 
Ha: nem todas as probabilidades são iguais 
As informações são contidas na Tabela de Contingência. As dimensões de tal tabela são 
definidas pela expressão r x k, onde r indica o número de linhas e k indica o numero de 
colunas. 
A variável teste será: 
χ² = 
� (�� � ��)²
��
 
onde a freqüência esperada é equivalente à fe = 
Σ � Σ �
�
 , e n é o total geral, ou seja, o 
total do somatório de todas as linhas da tabela de contingência (que por sua vez, é igual 
ao somatório de todas as colunas). 
Nota: recomenda-se fazer uma tabela de contingência para frequências esperadas 
Com ν = (r – 1)(k – 1) graus de liberdade e o nível de significância α proposto, 
encontramos o valor de χcrítico² na tabela da Distribuição do Quiquadrado (Apêndice) 
Regra de decisão: Rejeita-se Ho, ao nível de significância α se χcalculado² > χcrítico² e 
aceita-se caso contrário para (r – 1)(k – 1) graus de liberdade. 
 
Exemplo: Foi realizada uma pesquisa de opinião dentre os votantes de 4 municípios 
para comparar as proporções de votantes a favor do candidato A para o governo do 
estado. Foi selecionada uma amostra aleatória de 300 pessoas em cada município, 
obtendo-se os resultados apresentados na tabela a seguir: 
 Municípios 
Eleitores 1 2 3 4 Total 
a favor de A 126 103 109 98 436 
outro candidato 174 197 191 202 764 
Total 300 300 300 300 1200 
 Tabela 7.4 – Frequência observada da pesquisa de opinião dentre os votantes de cada município 
Considerando os dados da amostra pode-se dizer que há evidência de que a proporção 
de votantes a favor do candidato A nos 4 municípios, num nível de significância de 5%, 
é diferente? 
 
 
 
 
43 
 
Solução 
Hipóteses: Ho: π1 = π2 = π3 = π4 (sendo π a proporção de votantes no candidato A em 
cada município) 
Ha: nem todas as cidades tem a mesma proporção de votantes no cadidato A 
Calculando-se a freqüência esperada através de fe = 
Σ � Σ �
�
 
por exemplo: fe = 
(���)(���)
����
 = 109, e assim consecutivamente, constrói-se a tabela da 
freqüência esperada: 
 Municípios 
Eleitores 1 2 3 4 Total 
a favor de A 109 109 109 109 436 
outro candidato 191 191 191 191 764 
Total 300 300 300 300 1200 
 Tabela 7.5 – Frequência esperada da pesquisa de opinião dentre os votantes de cada município 
Calcula-se então o valor do quiquadrado: 
χ²calculado = 
� (�� � ��)²
��
 = 
(�������)²
���
 + 
(��� ����)²
���
 + 
(�������)²
���
 + 
(�� ����)²
���
 + 
(��� ����)²
���
 + 
(��� ����)²
���
 + 
(��� ����)²
���
 + 
(��� ����)²
���
 = 6,43 
Sendo o nível de significância proposto α = 5% e os graus de liberdade: 
ν = (r – 1)(k – 1) = (2 – 1)(4 – 1) = 3 
χ²crítico (α = 0,05; ν = 3) = 7,81 
Conclusão: Portanto, sendo χ²calculado = 6,43 < 7,81, aceita-se Ho, num nível de 
significância de 5%. Ou seja, a proporção de votantes no candidato A é a mesma para os 
quatro municípios. 
Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 213, 214 
 
Exercícios 
7.1) Em 200 lançamentos de uma moeda, foram observadas 115 caras e 85 coroas. Teste 
a hipótese de que a moeda é legal utilizando um nível de significância de (a) 5% e (b) 
1%. 
Resposta: Rejeita-se a hipótese de que a moeda é legal a um nível de significância de 5%. Não 
se tem o mesmo resultado a um nível de significância de 1%. 
 
 
44 
 
7.2) A tabela abaixo apresenta as freqüências observadas, ao lançar-se um dado 120 
vezes. Testar a hipótese de o dado ser honesto. 
Face 1 2 3 4 5 6 
Freqüência observada 25 17 15 23 24 16 
 Tabela 7.5 – Frequência observada no lançamento de um dado 
Resposta: Aceita Ho, o dado é honesto a um nível de significância de 5%. 
 
7.3) Historicamente, um fabricante de televisores vende 40% de aparelhos com telas 
pequenas, 40% com telas médias e 20% de aparelhos com telas grandes. Com o fim de 
estabelecer programas apropriados de produção para o próximo mês, toma uma amostra 
aleatória de 100 vendas durante o atual período e encontra que 55 dos televisores 
adquiridos eram pequenos, 35 do tamanho médio e 10 grandes. Teste a hipótese de que 
o padrão histórico de vendas prevalece, usando nível de significância de 1%. 
Resposta: χc² = 11,25. Rejeita-se Ho. 
Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 197 
 
7.4) Em geral, 20% dos clientes em potencial visitados pelo vendedor de uma firma 
fazem uma compra. Durante o período de testes, um novo vendedor faz 30 visitas à 
possíveis clientes e realiza três vendas. Teste a hipótese nula de que este padrão de 
vendasnão difere do padrão histórico, usando nível de significância de 5% 
Resposta: χc² = 1,30. Aceita-se Ho. 
Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 198 
 
7.5) Foi realizado um estudo sobre os clientes de determinada loja e comparou-se a 
relação entre duas variáveis, idade e sexo. Dada a tabela abaixo, com a freqüência 
observada, teste a hipótese de independência entre as duas variáveis ao nível de 
significância de 1%. 
Idade Sexo Total 
Masculino Feminino 
Menos de 30 60 50 110 
30 e mais 80 10 90 
Total 140 60 200 
 Tabela 7.6 – Frequência observada de idade e sexo de clientes 
Resposta: χc² = 27,8. Rejeita-se a hipótese nula de independência a um nível de significância de 
1%. 
Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 199, 20 
 
45 
 
7.6) Um gerente de um departamento de pessoal estima que uma proporção de π = 0,40 
dos empregados de uma grande empresa participará de um novo programa de 
investimento em ações. São feitos contatos com uma amostra aleatória de n = 50 
empregados, sendo que 10 deles indicam sua intenção de participar. Teste , através do 
uso do quiquadrado o valor hipotético da proporção da população, ao nível de 
significância de 5% 
Resposta: Rejeita-se Ho 
 
7.7) Nas experiências que Mendel realizou com ervilhas, ele observou 315 redondas e 
amarelas, 108 redondas e verdes, 101 enrugadas e amarelas e 32 enrugadas e verdes. De 
acordo com a sua teoria da hereditariedade, os números deveriam estar na proporção 
9:3:3:1. Há evidência para se duvidar de sua teoria, ao nível de significância de (a) 1% e 
(b) 5%? 
Resposta: (a) Aceita Ho; (b) Aceita Ho 
 
7.8) Em um determinado dia, o gerente de um supermercado observou o número de 
clientes que escolheram cada um dos 8 caixas disponíveis na saída. Os resultados estão 
dados na tabela a seguir: 
CAIXA I II III IV V VI VII VIII TOTAL 
Freqüência 80 100 130 145 120 110 60 55 800 
 Tabela 7.7 – Frequência observada da escolha entre os caixas de um supermercado 
Diga se o gerente pode afirmar que existe preferência por um dos caixas num nível de 
significância igual a 0,05. 
Resposta: Rejeita Ho, existe evidência de que há preferência por um dos caixas. 
 
7.9) Uma amostra de peças forneceu a seguinte tabela de contingência sobre a qualidade 
da peça por linha de produção. O gerente afirma que a qualidade da peça independe da 
linha de produção, realize um teste de hipótese para verificar se o gerente está certo. 
Linha Qualidade 
Aceitável 
Qualidade 
Defeituosa 
Primeira 368 32 
Segunda 285 15 
Terceira 176 24 
 Tabela 7.8 – Frequência observada da qualidade da peça por linha de produção 
Resposta: Os dados mostram evidência de que o gerente não está certo na sua afirmação a um 
nível de significância de 5%. 
 
46 
 
7.10) Dois pesquisadores selecionaram amostras de uma mesma cidade com o objetivo 
de estimar o número de pessoas que correspondem aos grupos classificados segundo o 
salário familiar por mês: A, B, C (os intervalos em reais são os mesmos para cada 
grupo). Os resultados obtidos foram: 
Pesquisador Grupo Total 
A B C 
P1 20 100 150 270 
P2 30 80 150 260 
Total 50 180 300 530 
 Tabela 7.9 – Frequência observada do número de pessoas em cada grupo de salário familiar 
Os dados apresentam evidência de que as amostras de um dos pesquisadores são 
suspeitas? 
Resposta: Pode-se dizer que, a um nível de significância de 5% os dois pesquisadores 
selecionaram as amostras corretamente. 
 
7.11) Ao fazer um certo cruzamento, um geneticista esperava uma segregação de 4 A 
para 1 B. Em uma amostra ao acaso de 500 ele observou 380 A e 120 B. Os dados 
verificam a relação esperada? Use nível de significância de 1%. 
Resposta: A um nível de significância de 1% os dados verificam a relação esperada. 
 
7.12) Determinado veículo utilitário está sofrendo pesadas críticas de seus proprietários, 
com relação à grande freqüência de defeitos no pneu traseiro esquerdo. Preocupado com 
sua imagem, e procurando defender-se de eventuais pedido de indenização, o fabricante 
do veículo resolveu coletar informações sobre 152 ocorrências de defeitos, 
classificando-as por posição do pneu. Os resultados estão na tabela a seguir. Usando 
nível de significância de 5%, há razão para acreditar que a probabilidade de defeito é 
diferente para algumas posições? 
Posição do pneu Dianteiro 
esquerdo 
Dianteiro 
direito 
Traseiro 
esquerdo 
Traseiro 
direito 
Total 
Freqüência 35 32 57 28 152 
 Tabela 7.10 – Frequência observada de defeitos por posição de pneu 
Resposta: Há uma evidência de que as freqüências de ocorrência dos defeitos dependem da 
posição do pneu a um nível de significância de 5% 
 
 
 
 
 
47 
 
Capítulo 8 - ANÁLISE DE VARIÂNCIA 
A Análise de Variância ou ANOVA é empregada para testar a igualdade entre k médias 
de uma mesma população. 
Nota: Utilizada para médias amostrais obtidas de populações normalmente distribuídas. 
Todavia, descobriu-se que o procedimento de teste não é grandemente afetado por 
violações da hipótese de normalidade, quando as populações são unimodais e os 
tamanhos das amostras são aproximadamente iguais. 
Assumimos que uma amostra aleatória simples de tamanho ni tenha sido selecionada de 
cada uma das k populações ou tratamentos. 
 
8.1 - Estimativa dos Tratamentos – Entre a variância da população 
A estimativa dos tratamentos entre a variância da população σ² é chamada de quadrado 
da média devido ao tratamento, e é denotada por MSTR (Mean Square due to 
Treatments): 
MSTR = 
∑ �¡ (�̅¡� ��)²�¡��
���
 
Sendo, 
 ni = número de observações para o tratamento i; 
 �̅¡ = média da amostra para o tratamento i; 
 �� = média global dos tratamentos; 
 k = número de tratamentos. 
O numerador SSTR = ∑ �¡ (�̅¡ − ��)²�¡�� é chamado de soma dos quadrados devido aos 
tratamentos e é denotado por SSTR (Sum of Squares due to Treatments). O 
denominador, (k – 1) representa os graus de liberdade associados à SSTR. Então temos: 
MSTR = 
����
���
 
Sendo a hipótese nula Ho verdadeira, o MSTR fornece uma estimativa sem viés da 
variância da população σ². 
 
 
 
 
 
 
48 
 
8.2 - Estimativa dos Tratamentos – Dentro da variância da população 
Esta estimativa de tratamentos dentro da variância da população σ² é chamada de 
quadrado da média devido aos erros e é denotada por MSE (Mean Square due to Error). 
A fórmula para MSE é: 
MSE = 
∑ (�¡ ��)�¡²�¡��
���
 
Sendo: 
 ni = número de observações para o tratamento i; 
 si2 = variância da amostra para o tratamento i; 
 N = número total de observações; 
 k = número de tratamentos. 
Onde o numerador SSE = ∑ (�¡ −1)�¡ ²�¡�� é a soma dos quadrados devido aos erros 
(Sum of Squares due to Error). O denominador de MSE (N – k) corresponde aos graus 
de liberdade associados ao SSE. 
 
Hipóteses Ho: µ1 = µ2 = µ3 = ... = µk 
 Ha: Nem todas as médias são iguais 
 
8.3 - Comparando as estimativas da Variância 
Teste F 
Considere que Ho seja verdadeira. O MSTR e MSE fornecem duas estimativas 
independentes, sem viés, de σ². Para populações normais, a distribuição amostral da 
razão de duas estimativas independentes de σ² segue uma distribuição F. Portanto, se a 
hipótese nula é verdadeira, a distribuição amostral de MSTR/MSE é uma distribuição F 
com os graus de liberdade iguais a (k – 1) para numerador e (N – k) para denominador. 
Variável teste: Fc = 
����
���
 
Sendo o nível de significância α dado, e os graus de liberdade: ѵ₁ = (k – 1) do 
numerador e ѵ₂ = (N – k) do denominador, obtemos da tabela de Distribuição F 
(Apêndice) o valor de Fα 
Regra de Decisão: Rejeitar Ho se Fc > Fα. 
 
 
 
49 
 
8.4 - Tabela ANOVA 
Os resultados dos cálculos precedentes podem ser exibidos convenientemente em uma 
tabela denominada Tabela de Análise de Variância. A soma dos quadrados

Outros materiais

Materiais relacionados

Perguntas relacionadas

Perguntas Recentes