Apostila de Estatística II

•

USP-PS

Sophia Carrijo

24.10.2017

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 55 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 55 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 55 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Estatística I

56.480 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Universidade de São Paulo 
Faculdade de Zootecnia e Engenharia de Alimentos
Departamento de Ciências Básicas
Cx. Postal 23, CEP:13630-970 - Pirassununga - SP - Fone: (019) 3565-4143 ou 3565-4117 - FAX: (019) 561-8606
APOSTILA
DE
ESTATÍSTICA II
Prof. Dr. César Gonçalves de Lima
E_mail: cegdlima@usp.br
Pirassununga - SP
2002
Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br>
1
SUMÁRIO
Página
1. Introdução à Inferência Estatística ............................................................................................... 2
1.1. Como selecionar uma amostra ................................................................................................. 2
1.2. Outras técnicas de Amostragem ............................................................................................... 3
1.3. Definições iniciais .................................................................................................................... 3
1.4. Distribuições amostrais ............................................................................................................ 4
1.5. A distribuição amostral da média .............................................................................................. 4
1.6. A distribuição amostral da proporção ....................................................................................... 5
2. Algumas distribuições importantes ............................................................................................. 7
2.1. A distribuição de Qui-quadrado ................................................................................................ 7
2.2. A distribuição t-Student ............................................................................................................ 8
2.3. A distribuição F-Snedecor ....................................................................................................... 9
3. Estimação .................................................................................................................................. 10
3.1. Características de um bom estimador por ponto ........................................................................ 11
3.2. Estimação por intervalo ............................................................................................................ 11
3.2.1. Intervalo de confiança para a média populacional ................................................................. 11
3.2.2. Intervalo de confiança para a proporção ................................................................................. 13
4. Testes de hipóteses ...................................................................................................................... 14
4.1. Procedimentos básicos para a construção de um teste de hipóteses ............................................ 17
4.2. Teste sobre a média de uma distribuição normal quando a variância é conhecida ...................... 18
4.3. Nível descritivo do teste ........................................................................................................... 19
4.4. Teste de hipóteses para a proporção .......................................................................................... 20
5. Outros testes de hipóteses ............................................................................................................ 20
5.1. Teste sobre a média de uma distribuição normal quando a variância é desconhecida ................. 20
5.2. Teste para a variância de uma distribuição normal ................................................................... 21
5.3. Comparação das variâncias de duas populações normais ........................................................... 22
5.4. Comparações das médias de duas populações normais .............................................................. 24
5.4.1. Comparações das médias de duas populações normais quando as variâncias são desco-
nhecidas, mas iguais .............................................................................................................. 24
5.4.2. Comparações das médias de duas populações normais quando as variâncias são desco-
nhecidas e diferentes ............................................................................................................. 26
5.4.3. Comparações das médias de duas populações normais quando as observações são parea-
das ........................................................................................................................................ 27
6. Correlação e regressão linear simples .......................................................................................... 28
6.1. Correlação linear de Pearson .................................................................................................... 29
6.2. Regressão linear simples .......................................................................................................... 31
6.2.1. O modelo para regressão linear simples ................................................................................. 32
6.2.2. Sobre os estimadores dos parâmetros da regressão ................................................................. 35
7. Testes de qui-quadrado ................................................................................................................ 37
7.1. Teste de aderência, ajustamento ou adequação de um modelo ................................................... 37
7.2. Testes em tabelas de contingência ............................................................................................ 39
7.2.1. Teste de homogeneidade ....................................................................................................... 39
7.2.2. Teste de Independência ......................................................................................................... 40
Distribuições de probabilidades ....................................................................................................... 42
Tábua I: Normal padrão .................................................................................................................. 43
Tábua II: Qui-quadrado ................................................................................................................... 44
Tábua III: t de Student .................................................................................................................... 45
Tábua IV: F-Snedecor ..................................................................................................................... 46
Revisão de somatórios .................................................................................................................... 47
Exercícios propostos ....................................................................................................................... 49
Bibliografia recomendada ............................................................................................................... 54
Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br>
2
1. INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA
Nas aulas anteriores (Estatística I) aprendemos como resumir descritivamente uma massa de
dados (através de medidas de tendência central, dispersão, assimetria e curtose), como apresentar esses
resultados (através de gráficos e tabelas) e conhecemos alguns modelos probabilísticos (binomial,
Poisson e normal) usados para descrever fenômenos comuns em nossa área de atuação. A partir de
agora, veremos como reunir todas essas informações com o intuito de estudar um ramo bastante
importante da Estatística, conhecido como Inferência Estatística, que estuda como fazer afirmações
sobre certas características de uma população, baseando-se em resultados obtidos em uma amostra.
Neste contexto, entende-se por população qualquerconjunto de indivíduos ou objetos que têm pelo
menos uma variável comum observável e por amostra, qualquer subconjunto da população.
Exemplo 1.1 Consideremos uma pesquisa feita para estudar o ganho de peso dos bovinos de
corte de um rebanho de 700 animais. Selecionamos uma amostra de 40 animais e anotamos os seus
pesos no início e no final de um determinado mês. A partir desses dados calculamos os ganhos de
peso. Neste caso a população é formada pelos 700 animais e a amostra pelos 40 animais selecionados.
Na verdade, como estamos interessados no ganho de peso, a população é formada pelos ganhos de
peso dos 700 animais e a amostra pelos ganhos de peso dos 40 animais selecionados. Estudando a
distribuição dos ganhos de peso da amostra, esperamos que esta reflita a distribuição dos ganhos de
peso do plantel. Com os dados em mãos, podemos estar interessados, simplesmente, em estimar o
ganho de peso médio dos bovinos de corte ou então, em testar se o ganho de peso médio desses
bovinos, neste particular mês, foi superior a 10kg.
A solução desses problemas será tratada com detalhes nas próximas aulas sobre Estimação
de Parâmetros e Testes de Hipóteses, respectivamente.
1.1 COMO SELECIONAR UMA AMOSTRA
As observações colhidas numa amostra são tão mais informativas quanto mais conhecemos
sobre a população de onde a amostra foi retirada. Por exemplo, para selecionarmos 40 animais de um
lote de 700, devemos conhecer algumas características desses animais (raça, sexo, idade etc.) que
podem influenciar nos resultados da variável em estudo.
A maneira de se obter uma amostra é tão importante e existem tantas formas de fazê-la, que
esses procedimentos constituem uma especialidade dentro da Estatística, conhecida como Técnicas
de Amostragem.
Distinguiremos dois tipos de amostragem: a probabilística e a não-probabilística. A amostra-
gem será chamada de probabilística se todos os elementos da população tiverem probabilidades co-
nhecidas e diferentes de zero, de fazer parte da amostra; caso contrário, a amostragem será chamada de
não-probabilística. A amostragem probabilística implica um sorteio com regras bem determinadas,
cuja realização somente será possível se a população em estudo for finita e totalmente acessível.
As técnicas de Inferência Estatística pressupõem que as amostras utilizadas no estudo sejam
probabilísticas, o que muitas vezes não se pode conseguir. Nesses casos, o bom senso deverá indicar
quando o processo de amostragem, mesmo não sendo probabilístico, pode ser, para efeitos práticos,
considerado como tal.
O caso mais simples de amostragem probabilística é chamado de Amostragem Casual
Sim-ples ou Aleatória, onde se atribui a cada elemento da população a mesma probabilidade de
seleção, ou seja, a mesma chance de fazer parte da amostra.
Podemos obter uma amostra casual simples (a.c.s.) escrevendo o nome de cada elemento da
população num cartão, misturando-os numa urna e sorteando tantos cartões quantos forem os
elementos que desejamos na amostra. O sorteio poderá ser feito com reposição (o cartão sorteado volta
à urna antes do próximo sorteio) ou sem reposição (o cartão sorteado não volta mais à urna). Se a
população for muito numerosa, podemos utilizar uma tabela de números aleatórios para facilitar o
sorteio.
Se estivermos interessados em sortear uma amostra casual simples de n elementos de uma
população finita de tamanho N, o número de amostras possíveis será igual a (N)n se o processo de
Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br>
3
retirada for com reposição, e 



n
N
 se o processo de retirada for sem reposição. A relação n/N é
chamada fração de amostragem.
1.2.. OUTRAS TÉCNICAS DE AMOSTRAGEM
Amostragem Sistemática: é utilizada quando os elementos da população apresentam-se
ordenados e a retirada dos elementos da amostra é feita periodicamente. Por exemplo, de um rebanho
de N
 
= 700 bovinos de corte, cujos dados estão registrados em fichas numeradas de 001 a 700,
podemos retirar uma amostra de n = 10 animais utilizando o seguinte procedimento:
 i) sorteamos um número de 1 a 70 (note que 700/10=70), que corresponderá ao número da ficha do
primeiro animal que fará parte da amostra;
 ii) as demais fichas (animais) serão retiradas, periodicamente, de 70 em 70.
Amostragem por Conglomerados: é utilizada quando a população apresenta uma subdi-
visão natural em pequenos grupos ou conglomerados. Para retirarmos uma amostra, sorteamos um
número suficiente de conglomerados e os seus elementos constituirão a amostra. Neste caso, as
unidades de amostragem são os conglomerados e não os elementos individuais da população. Este tipo
de amostragem é adotado por motivos de ordem prática e econômica.
Amostragem Estratificada: é utilizada quando a população pode ser dividida em dife-
rentes subpopulações ou estratos, sendo razoável supor que a variável de interesse apresenta um
comportamento bastante diverso de estrato para estrato e um comportamento razoavelmente homogê-
neo dentro de cada estrato. Neste caso, se o sorteio dos elementos da amostra não considerar tais
estratos, pode ocorrer que os diversos estratos não sejam convenientemente representados na amostra,
a qual estaria mais influenciada pelas características da variável nos estratos mais favorecidos pelo
sorteio. A amostragem estratificada consiste em especificar quantos elementos da amostra serão
retirados de cada estrato. Geralmente são considerados três tipos de amostragem estratificada: a
uniforme, a proporcional e a ótima. Na amostragem uniforme, sorteia-se igual número de elementos
em cada estrato; na proporcional, o número de elementos sorteados em cada estrato é proporcional ao
número de elementos existentes no estrato e na amostragem ótima, em cada estrato, retiramos um
número de elementos proporcional ao número de elementos do estrato e também à variabilidade da
variável de interesse no estrato, medida por seu desvio padrão.
Para maiores detalhes sobre estas e outras técnicas de amostragem consulte, por exemplo:
COCHRAN, W.G. Técnicas de Amostragem, Fundo de Cultura, Rio de Janeiro, 1955.
1.3. DEFINIÇÕES INICIAIS
Para facilitar a linguagem usada, iremos diferenciar as características da amostra e da
população. Chamaremos de parâmetro qualquer medida usada para descrever uma característica da
população e de estatística, qualquer medida usada para descrever uma característica da amostra, ou
seja, qualquer função dos elementos da amostra. Geralmente, usamos letras gregas minúsculas para
simbolizar os parâmetros e letras do nosso alfabeto para as estatísticas, como por exemplo:
Descrição Parâmetro(população)
Estatística
(amostra)
Número de elementos N n
Média µ X
Variância σ2 S2
Desvio padrão σ S
Coeficiente de correlação ρ(X,Y) r(X,Y)
Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br>
4
1.4 DISTRIBUIÇÕES AMOSTRAIS
Já sabemos que o problema básico da Inferência Estatística consiste em se fazer uma
afirmação sobre parâmetros através de resultados obtidos na amostra. Suponhamos que o interesse
esteja em fazer afirmações sobre um parâmetro θ (média, mediana, variância ou coeficiente de
correlação, por exemplo) de uma certa população representada pela v.a. X. Desta população,
sorteamos, com reposição, uma a.c.s. de n elementos e a nossa decisão sobre θ será baseada na
estatística T = f(X
1
, X
2
, ...,X
n
), que é uma função dos valores amostrais (X
1
,X
2
,...,X
n
). Colhida uma
amostra particular x1, x2, ..., xn calculamos o valor da estatística T (t1, por exemplo) e baseado neste
valor faremos uma afirmação (ou inferência) sobre o parâmetro θ.
A afirmação sobre o parâmetro θ será melhor compreendida se soubermos o que acontece
com a estatística T quando retiramos todas as possíveis amostras de tamanho n da população, de
acordo com o plano amostral adotado. Adistribuição dos possíveis valores da estatística T é chamada
de distribuição amostral ou por amostragem da estatística T e desempenha um papel fundamental na
teoria usada na Inferência Estatística.
O procedimento utilizado para a obtenção da distribuição amostral da estatística T pode ser
resumido da seguinte maneira:
 i) Da população X, estamos interessados no parâmetro θ.
 ii) De acordo com um certo procedimento de amostragem, retiramos todas as amostras de tamanho n
da população X.
iii) Para cada amostra (Xi1, Xi2, ...,Xin) calculamos o valor ti da estatística T, i = 1, 2, ...
iv) Os valores ti formam uma nova população cuja distribuição de probabilidades recebe o nome de
distribuição amostral da estatística T.
1.5. A DISTRIBUIÇÃO AMOSTRAL DA MÉDIA
Consideremos uma população identificada pela v.a. X, cuja média µ = E(X) e variância σ2 =
Var(X) são conhecidas.
Exemplo 1.2. Consideremos, sem perda de generalidade, a população X = {4, 10, 16} com N
= 3 elementos, média µ = 10 e variância σ2 = 24. Para cada uma das 32 = 9 amostras de tamanho n =
2, retiradas, com reposição, da população X, vamos calcular a média e a variância amostrais utilizando
os seguintes estimadores:
X = ∑
=
n
1i
iX
n
1
 
 
e S2 = ∑ −
− =
n
1i
2
i )XX()1n(
1
 
e obtemos:
Amostra X S2
(4; 4) 4 0
(4; 10) 7 18
(4; 16) 10 72
(10; 4) 7 18
(10; 10) 10 0
(10; 16) 13 18
(16; 4) 10 72
(16; 10) 13 18
(16; 16) 16 0
Utilizando esses resultados, construímos a distribuição de probabilidades da estatística X :
x 4 7 10 13 16
P( X = x ) 1/9 2/9 3/9 2/9 1/9
e baseada nesta distribuição de probabilidades, temos que:
Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br>
5
E( X ) = 4.(1/9) + ... + 16.(1/9) = 10 ⇒ E( X ) = 10
E( 2X ) = 4 .(1/9) + ... + 16 .(1/9) = 112 ⇒ Var( X ) = 112 - (10)2 = 12 ⇒ Var( X ) = 12
ou seja, que
E( X ) = µ = 10 Var( X ) = σ2/n = 24/2 = 12
Observe que as diversas amostras produzem estimativas diferentes da média e da variância populacio-
nais. Esta flutuação das médias amostrais ( X ) em torno da média populacional (µ) pode ser quantifi-
cada através da variância da média amostral ,
 
Var( X ). Esses resultados numéricos obtidos indepen-
dem da distribuição da v.a. X e podem ser generalizados no seguinte teorema:
Teorema 1. Seja X uma população com média µ e variância σ2 e seja (X1, ..., Xn) uma a.c.s. de
tamanho n retirada desta população. Então, E( X ) = µ e Var( X ) = σ2/n.
Precisamos determinar agora qual é o modelo probabilístico da curva referente à distribuição
de X. A obtenção dessa informação exige recursos matemáticos que estão fora dos objetivos deste
curso. Apresentaremos, somente, os resultados mais importantes.
Primeiramente, se X é uma v.a. com distribuição normal de média µ e variância σ2, pode-se
demonstrar que a distribuição da estatística X também será normal de mesma média, µ, mas com
variância σ2/n, isto é:
X ~ N(µ, σ2) ⇒ X ~ N(µ, σ2/n)
No caso mais geral, onde a distribuição da v.a. X não é normal ou é desconhecida, devemos
usar os resultados do importante teorema apresentado a seguir.
Teorema 2. Para amostras casuais simples de tamanho n retiradas de qualquer população com média
µ e variância σ2, a distribuição amostral da média aproxima-se de uma distribuição normal
com média µ e variância σ2/n, quando n tende para infinito. (Teorema do Limite Central).
A rapidez dessa convergência depende da distribuição da população da qual a amostra é
retirada: se a distribuição for simétrica e unimodal a convergência é bastante rápida. Para amostras
com mais de 30 elementos, a aproximação pela distribuição normal pode ser considerada boa.
Um outro resultado bastante interessante e que será utilizado freqüentemente nas próximas
aulas está apresentado no seguinte corolário:
Corolário 1: Se (X1, X2, ...,Xn) é uma a.c.s. de tamanho n da população X que tem média µ e
variância σ2, então a variável Z = 
n
X
2σ
µ−
 ~ N(0, 1) quando n tende para infinito.
1.6 A DISTRIBUIÇÃO AMOSTRAL DA PROPORÇÃO
Consideremos agora uma população em que a proporção de elementos portadores de uma certa
característica é p. Por exemplo: a proporção de funcionários da lavoura que tem curso colegial
completo; a proporção de eleitores de um determinado candidato; a proporção de animais com
determinada doença etc..
Em qualquer um dos exemplos, cada elemento da população pode assumir dois valores:
X =


aacterístic tem a caremento não0, se o el
rística a caracteemento tem1, se o el
Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br>
6
onde ter a característica significa “ter o curso colegial completo”, ou “ser eleitor de um determinado
candidato”, ou mesmo “ter uma determinada doença”. Assumindo que P(X=1) = p e P(X=0) = 1-p,
temos:
E(X) = 1.(p) + 0.(1-p) = p ⇒ E(X) = p
E(X2) = 1.(p) + 0.(1-p) = p
Var(X) = p - (p)2 = p(1-p) ⇒ Var(X) = p(1-p)
Retirada uma a.c.s., com reposição, de n elementos da população X, indicamos por Sn o total
de indivíduos portadores da característica na amostra. Já sabemos que Sn ~ B(n; p), isto é, Sn tem
distribuição binomial de parâmetros n e p. Definindo 
�
pcomo sendo a proporção (ou freqüência
relativa) de indivíduos que têm a característica na amostra, isto é pˆ = Sn /n, a distribuição amostral de
pˆ apresenta probabilidades iguais às probabilidades da distribuição de Sn, embora os valores assumi-
dos por pˆ e Sn sejam diferentes. Então:
E( pˆ ) = p e Var( pˆ ) = p(1-p)/n
(Note a analogia de �pcom X ...)
Para n grande, usando o Teorema do Limite Central, concluímos que
pˆ ~ N(p; p(1-p)/n) e Z = 
n
)p1(p
ppˆ
−
−
 ~ N(0; 1)
Exemplo 1.3 Foi sorteada uma amostra de 500 coelhos de uma granja e os animais foram
inspecionados com respeito à presença de sarna de focinho e patas. Para estimar a "proporção de
animais com sarna de focinho e patas", usamos a estatística
pˆ = nSn
onde Sn corresponde ao número de animais com sarna de focinho e patas e n ao número total de
coelhos na amostra. Se Sn
 
= 300 coelhos têm sarna de focinho e patas, uma estimativa da proporção de
coelhos portadores de sarna, nessa granja, é �p= 300/500 = 0,60 e uma estimativa da variância dessa
proporção é 0,60*0,40/500 = 0,00048.
Enfim, além da média X e da proporção pˆ , podemos estudar a distribuição amostral de qual-
quer estatística T = f(X1, X2, ...,Xn), mas quanto mais complexa for esta função f(.), mais difícil será a
derivação matemática das propriedades da estatística T.
Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br>
7
2 ALGUMAS DISTRIBUIÇÕES IMPORTANTES
Agora, conheceremos outras distribuições de probabilidades que serão usadas em alguns testes
de hipóteses e na construção de alguns intervalos de confiança bastante úteis em situações práticas. De
cada distribuição serão conhecidas algumas características principais, como o gráfico, a média, a
variância e os procedimentos usados no cálculo de probabilidades usando as Tábuas apresentadas no
final da apostila. Também serão informadas as situações mais comuns onde essas distribuições são
aplicadas.
2.1 DISTRIBUIÇÃO DE QUI-QUADRADO (χχ2)
Definição 2.1
 Seja {Z1, ..., Zν} uma amostra aleatória de n elementos retirada de uma distri-
buição normal padronizada N(0; 1). Então, a variável Q = 21Z + ... + 2Zν = ∑ν
=1i
2
iZ tem dis-
tribuição qui-quadrado com ν graus de liberdade (gl), isto é, Q ~ 2 )(νχ .
Pode-se provar que E(Q) = ν e Var(Q) = 2ν. O número de graus de liberdade (ν) refere-se ao
número de variáveis normais independentes Z
i
, ao quadrado, que compõem a variável Q. A Figura 1
apresenta o gráfico da distribuição qui-quadrado com ν = 5 gl é:
Figura 1 - 
 Distribuição qui-quadrado com 5 g.l.
A distribuição Qui-quadradotem diversas aplicações em Estatística e para o cálculo de proba-
bilidades usaremos a Tábua II, que fornece os valores críticos qc tais que P(Q > qc) = p, para alguns
valores de p e de ν. Por exemplo, se Q ~ 2 )10(χ e procuramos o valor crítico, qc, tal que 0,05 = P(Q >
qc), iremos encontrá-lo na interseção da linha correspondente a ν = 10gl e da coluna correspondente a
p = 0,05, ou seja, q
c
 = 18,307. De modo análogo, se procuramos qc tal que P(Q > qc) = 0,95, iremos
encontrar o valor 3,940. Esses resultados estão representados na Figura 2.
PROBABILIDADE p
ν ... 0,100 0,05 0,04 ...
... ... ... ↓ ... ...
10 ... 15,987 → 18,307 19,021 ...
... ... ... ... ... ...
Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br>
8
Figura 2 - Valores críticos bilaterais da distribuição χ ( )10
2
 
para 1-α = 90%
Uma estatística importante que será utilizada na construção de Intervalos de Confiança e nos
Testes de Hipóteses sobre a variância de uma população normal é
∑
=



 −
σ
n
1i
2
i XX
= ( )∑
=
−
σ
n
1i
2
i2
XX1 = 
2
2S)1n(
σ
−
 ~ 
2
)1n( −χ
2.2 DISTRIBUIÇÃO t DE STUDENT
É uma das mais importantes distribuições usadas na inferência estatística sobre médias de
populações normais.
Definição 2.2 Sejam as variáveis Z ~ N(0,1) e Q ~ 2 )(νχ , independentes. Então, a variável
 
T= 
νQ
Z
 tem distribuição t de Student com ν graus de liberdade.
Pode-se provar que E(T) = 0 e Var(T) = ( )2−νν . O gráfico da distribuição t- Student é muito
parecido com o da distribuição N(0; 1), sendo o primeiro apenas um pouco mais achatado que o
segundo. Quando o número de graus de liberdade é grande, os gráficos das distribuições Normal e t-
Student são praticamente iguais. O gráfico da distribuição t-Student com ν = 12 gl está apresentado na
Figura 3.
Figura 3 - Gráfico da distribuição t-Student com ν = 12 graus de liberdade
Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br>
9
A Tábua III fornece valores críticos tc tais que P(T > tc) = p, para alguns valores de p e de ν.
Por exemplo, se T ~ t(12) e p = 0,025, o valor tc = 2,179 será encontrado na interseção da linha corres-
pondente a 12 gl e da coluna correspondente à probabilidade p = 0,025.
PROBABILIDADE p
ν ... 0,030 0,025 0,020 ...
... ... ... ↓ ... ...
12 ... 2,076 → 2,179 2,303 ...
... ... ... ... ... ...
Quando o número de graus de liberdade da distribuição t-Student é grande, podemos usar a
Tábua I da distribuição N(0,1) para obter os valores críticos tc. Uma estatística importante que será
usada na construção de Intervalos de Confiança e nos testes de hipóteses sobre médias de populações
normais é: T = 
n
S
X
2
µ−
 ~ t(n-1) , ou seja, tem distribuição t-Student com ν = n-1 graus de liberdade.
2.3 DISTRIBUIÇÃO F DE SNEDECOR
Essa distribuição é bastante usada na comparação de variâncias de duas populações com distri-
buição normal.
Definição 2.3. Sejam as v.a. U ~ 2
1ν
χ e V ~ 2
2ν
χ , independentes. Então a variável F =
2
1
V
U
ν
ν
 tem distribuição F de parâmetros ν1 e ν2
onde os parâmetros ν1 e ν2 correspondem, respectivamente, ao número de graus de liberdade do
numerador e do denominador da variável F. Pode-se provar que:
E(F) = 
22
2
−ν
ν
 e Var(F) = ( )( ) ( )42
22
2
2
21
21
2
2
−ν−νν
−ν+νν
.
A Figura 4 apresenta o gráfico da distribuição F(ν1 = 10; ν2 = 12)
Figura 4 - Gráfico da distribuição F(10; 12).
Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br>
10
Os valores críticos fc tais que P(F > fc) = 0,05, para alguns valores de ν1 e ν2 podem ser
encontrados na Tábua IV. Por exemplo, para uma variável com distribuição F(10,12), o valor 2,75 é
encontrado na interseção da linha correspondente a ν2=12gl (denominador) e ν1=10 gl (numerador):
ν1 GRAUS DE LIBERDADE DO NUMERADOR
ν2 ... 9 10 12 ...
... ... ... ↓ ... ...
12 ... 2,80 → 2,75 2,69 ...
... ... ... ... ... ...
Com a Tábua IV podemos também encontrar os valores críticos tais que P(F < fc) = 0,05
usando a identidade F(ν1; ν2) = ( )12 ;F
1
νν
. Por exemplo, se F ~ F(10; 12) e estamos interessados no
valor crítico inferior, fc, que P(F < fc) = 0,05, devemos primeiramente procurar o valor crítico na inter-
seção da linha correspondente a (ν2 =) 10 gl com a coluna correspondente a (ν1 =) 12 gl. A partir deste
valor (2,91), obtemos o valor crítico de interesse fazendo: fc = 1/2,91 = 0,34.
Uma estatística importante que será utilizada na construção de Intervalos de Confiança para o
quociente de duas variâncias e nos testes de hipóteses envolvendo as variâncias de duas populações
normais é:
F = 2
2
2
1
S
S
 ~ F(n1-1; n2-1)
ou seja, tem distribuição F-Snedecor com ν1 = (n1-1) e ν2 = (n2-1) graus de liberdade, onde n1 e n2 são
os tamanhos das amostras retiradas das populações 1 e 2, respectivamente, cujos resultados são
utilizados no cálculo das estimativas das variâncias 21S e 
2
2S .
3 ESTIMAÇÃO
Na produção de generalizações sobre a população com base em resultados obtidos de uma
amostra, estão envolvidos a estimação e o teste de hipóteses sobre parâmetros.
Basicamente, a estimação de parâmetros pode ser feita de duas maneiras: por ponto e por
intervalo. Par a obtenção de bons estimadores pontuais, existem alguns métodos como: o Método dos
Mínimos Quadrados, o Método da Máxima Verossimilhança, o Método dos Momentos etc. No
entanto, estes métodos não serão apresentados com detalhes nesta apostila, podendo ser encontrados
em outros textos básicos de Inferência Estatística (ver a bibliografia sugerida no final da apostila).
Exemplo 3.1 A cada eleitor de uma amostra de 500 eleitores é feita uma pergunta a respeito
da eleição de um determinado candidato. A resposta à pergunta poderá ser sim (favorável) ou não
(contrário à eleição do candidato). A estimação da proporção (p) de eleitores favoráveis à eleição do
candidato é feita utilizando-se o estimador
pˆ = (número de eleitores favoráveis à eleição)/(número de eleitores na amostra)
Deste modo, se 320 eleitores responderam sim à pergunta, uma estimativa da proporção de eleitores
favoráveis à eleição do candidato é 
�
p= 320/500 = 0,64 = 64%.
Dúvidas: Será que pˆ é um bom estimador de p? Será que pˆ proporciona boas estimativas de p?
Para responder a estas (e outras) perguntas iremos conhecer as características de um bom
estimador por ponto, que serão apresentadas a seguir.
Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br>
11
3.1 CARACTERÍSTICAS DE UM BOM ESTIMADOR POR PONTO
Os estimadores por ponto ou pontuais são assim denominados porque especificam um único
valor para o parâmetro. Em algumas situações podemos estar interessados em saber se um estimador
tem boas qualidades; já em outras, podemos ter mais de um estimador para o mesmo parâmetro e
desejamos escolher o melhor deles. Neste caso o julgamento pode ser feito analisando as seguintes
propriedades desses estimadores:
 i) T é um estimador justo, não viesado ou não tendencioso do parâmetro θ se E(T) = θ.
 ii) T é um estimador consistente do parâmetro θ se for justo e se Var(T)lim
n ∞→
 = 0.
iii) Se T1 e T2 são dois estimadores justos do parâmetro θ e ainda Var(T1) < Var(T2), então T1 é dito ser
mais eficiente que o estimador T2.
Dos estimadores que já conhecemos, pode-se provar que X e pˆ são estimadores justos e con-
sistentes dos parâmetros µ e p, respectivamente. Um estimador não viesado e consistente para a vari-
ância populacional σ2 é:
S2 = ( )∑
=
−
−
n
1i
2
i XX 1)(n
1
 = 














−
∑
∑
=
=
n
1i
2
n
1i
i
2
i
n
X
 - X 
1)(n
1
(para maiores detalhes,ver FONSECA & MARTINS, 1982, pg.155-157)
3.2 ESTIMAÇÃO POR INTERVALO
A estimativa por ponto de um parâmetro θ é bastante útil, embora não dê qualquer indicação
da precisão a ela associada. É desejável que uma estimativa por ponto esteja acompanhada por alguma
medida do erro da estimativa. Por exemplo, uma estimativa pontual pode ser acompanhada de algum
intervalo a respeito dessa estimativa, juntamente com alguma medida de segurança ou de confiança de
que o verdadeiro valor do parâmetro caia neste intervalo. Nesta situação, estamos falando da estima-
ção de parâmetros por intervalo.
O estimador por intervalo que tem associada uma probabilidade, recebe o nome de Intervalo
de Confiança (I.C.). Os limites inferior e superior desse intervalo são chamados de limites (inferior e
superior) de confiança. A probabilidade de que o I.C. contenha o verdadeiro valor do parâmetro θ é
chamada de Coeficiente de Confiança e é denotada pela letra grega γ (gama). A amplitude de um I.C. é
calculada fazendo-se a diferença entre os dois limites de confiança (superior e inferior).
Nosso objetivo é encontrar um estimador por intervalo que produza intervalos pequenos, se
possível, e incluam o verdadeiro valor do parâmetro θ com uma confiança (γ) alta.
3.2.1 INTERVALO DE CONFIANÇA PARA A MÉDIA POPULACIONAL
Já sabemos que se uma variável aleatória X
 
tem distribuição N(µ; σ2), a média X obtida a
partir de uma amostra de tamanho n tem distribuição N(µ; σ2/n ) e a variável Z = 
n
X
2σ
µ−
~ N(0, 1).
Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br>
12
Fixando uma probabilidade γ, iremos considerar um
intervalo simétrico em relação à origem, tal que γ =
P(-zc< Z < zc), onde zc (ver Figura 5) pode ser
obtido da Tábua I e o seu valor depende exclusiva-
mente da confiança (γ) que desejamos na estimativa
por intervalo. Então:
 Figura 5 - Distribuição normal padrão
γ = cc








≤µ−≤−
σ
z
n
X
zP
2
 = 



+≤µ≤− σσ
n
zX
n
zXP
cc 
e o I.C. para a média populacional, µ, com um coeficiente de confiança γ, é
I.C.(µ; 100γ%) = 


+−
σσ
n
zX;
n
zX
cc 
e dizemos que este intervalo contem o verdadeiro valor da média populacional com uma confiança de
100γ%. Note que este I.C. é centrado na média X e a sua amplitude é igual a 2
n
z
�
c .
O coeficiente de confiança (γ) deve ser entendido da seguinte maneira: “se a partir de K
amostras independentes de tamanho n, calculamos K intervalos de confiança (diferentes) para a média
µ, pelo menos K*γ desses intervalos deverão cobrir (incluir) o verdadeiro valor de µ”.
Exemplo 3.2 Sabemos que o peso de bovinos Nelore aos 210 dias de idade tem distribuição
normal com variância 400kg2. Baseado numa amostra de 30 animais, com peso médio de 186kg:
a) construir um I.C. para o peso médio (populacional) desses bovinos com um coeficiente de
confiança γ = 0,95;
b) idem, para γ = 0,99;
c) calcular a confiança que se tem na afirmação de que o verdadeiro peso médio desses bovinos é
[180; 192] kg.
Resolução:
(a)
Da Tábua I, o valor de zc, tal que 0,95 = P(-zc < Z < zc) é zc = 1,96. Com os valores amostrais e a
fórmula acima definida calcular os limites de confiança:
0,95 = 



+≤µ≤−
30
2096,1186
30
2096,1186P ⇒ I.C.(µ; γ=95%) = [ ]3,16178,84; 19 kg, ou seja,
este intervalo (de amplitude 14,32kg) contem o verdadeiro valor do peso médio dos bezerros com
95% de confiança.
(b)
0,99 = P(-zc < Z < zc) ⇒ zc = 2,58. Assim, o I.C.(µ; γ=99%) = [176,58; 195,42] kg, contem o
verdadeiro valor do peso médio dos bezerros, com uma confiança de 99%.
(c)
a amplitude do I.C.(µ) é 192−180 = 12kg ⇒ 12 = 2. zc 20
30
 ⇒ zc = 1,64 ⇒ γ = P(-1,64<Z<1,64) =
2P(0<Z<1,64) = 2(0,4495) = 0,8990, ou seja, é de 89,9% a confiança na afirmação de que o verda-
deiro peso médio dos bezerros está contido no intervalo [180; 192]kg.
Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br>
13
Geralmente não conhecemos a variância populacional (σ2) e neste caso precisamos estimá-la
com base em dados de uma amostra representativa da população, usando um bom estimador como S2,
por exemplo. Quando o tamanho da amostra é relativamente grande (n>30), o Teorema do Limite
Central garante que a v.a. T = 
n
S
X
2
µ−
 ~ N(0; 1) e neste caso, o I.C.(µ) é calculado através de:
I.C.(µ; 100γ%) = 


+−
n
S
zX;
n
S
zX cc 
Quando o tamanho da amostra é pequeno, não podemos usar o Teorema do Limite Central e a
estatística T, definida anteriormente, não tem distribuição N(0; 1), mas sim, distribuição t-Student
com ν = n−1 graus de liberdade. Esta nova distribuição de probabilidades tem um único parâmetro, ν,
chamado número de graus de liberdade.
 Por exemplo, vamos encontrar o valor
crítico tc = 2,093, tal que γ = 0,95 = P(-tc <T< tc)
e T~t(19), na interseção da linha correspondente a
ν = 19g.l. e coluna correspondente a p = 0,025
(ver Figura 6).
 Verifique que na Tábua III tc = 1,729 para
γ = 90% e tc = 2,861 para γ = 99%.
 Figura 6 - Distribuição t(19)
Fixado um valor para o coeficiente de confiança (γ) e obtido o valor crítico, tc, na Tábua III, o
I.C.(µ, 100γ%) é calculado através da fórmula:
I.C.(µ; 100γ%) = 


+−
n
S
 t X; 
n
S
 t X cc
Exemplo 3.3. Dez animais foram alimentados com uma certa ração durante 15 dias e
verificou-se que os ganhos de peso foram: 2,71; 2,93; 3,10; 3,12; 3,23; 3,76; 3,89; 4,01; 4,16 e 4,23
kg. Construir um intervalo de confiança para o ganho médio de peso com γ = 0,90.
Resolução:
• uma estimativa da variância populacional é s2 = 


−
− 10
)14,35(2546,126)110(
1 2
 = 0,3081.
• da Tábua III, com γ = 0,90 e 9 g.l. obtemos tc = 1,833; da amostra temos x = 3,51 e então:
• I.C.(µ; γ=90%) = 3,51 ± 1,833
10
3081,0
 = 3,51 ± 0,32 = [3,19; 3,83] kg, ou seja, este intervalo
contem o verdadeiro valor do ganho de peso médio com 90% de confiança.
3.2.2 INTERVALO DE CONFIANÇA PARA A PROPORÇÃO
Fixando-se um coeficiente de confiança γγ e obtendo-se o respectivo valor zc da Tábua I, o
intervalo de confiança para a proporção de sucessos, p, é obtido por:
I.C.(p; 100γ%) = [ ] np)p(1zpˆ ; np)p(1zpˆ cc −+−−
onde 
�
p= (número de sucessos)/(número de tentativas) é uma estimativa da proporção p, calculada a
partir dos n valores amostrais.
Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br>
14
Porém, na maioria das vezes, o valor do parâmetro p não é conhecido, impossibilitando o uso
desta última fórmula. As possíveis soluções para este problema são:
(a) no caso de grandes amostras, substituir na fórmula o valor de p pelo valor de sua estimativa �p ,
calculada a partir dos resultados amostrais
(b) no caso de pequenas amostras, usar a fórmula do Intervalo de Confiança Conservativo para a
proporção, que está baseada no fato de que o produto p(1-p) ≤ 0,25, cuja fórmula é:
IC*(p; 100γ%) = [ ]n/25,0zpˆn/25,0zpˆ cc +− ; 
Exemplo 3.4 Construir um IC para a proporção de eleitores favoráveis ao candidato X, com
um coeficiente de confiança de γ = 0,99, sabendo-se que de uma pesquisa eleitoral envolvendo uma
amostra de 1000 eleitores, somente 248 foram favoráveis à sua eleição.
Resolução:
• na amostra: pˆ = 248/1000 = 0,248 é a proporção de eleitores favoráveis ao candidato X;
• γ = 0,99 = P(-zc
 
≤ Z ≤ zc) ⇒ zc = 2,58
• como n = 1000 é grande, I.C.(p; 99%) = 0,248 ± 2,58 1000)248,01(248,0 − = 0,248 ± 0,035 =
[0,213; 0,283], ou seja, este intervalo (amplitude 0,07) contem a verdadeira proporção de eleitores
favoráveis à eleição do candidato X com uma confiança de 99%.
• se resolvêssemos construir um I.C. Conservativo para a proporção, teríamos:
IC*(p; 99%) =0,248 ± 2,58 100025,0 = 0,248 ± 0,041 = [0,207; 0,289], que tem uma amplitude
de 0,082 unidades.
4. TESTES DE HIPÓTESES
Outro problema fundamental da Inferência Estatística envolve a execução de testes de
hipóteses sobre o valor de parâmetros de interesse de uma população de estudo. Se conhecemos todos
os elementos da população (o que é bem pouco provável...) também deveremos conhecer o verdadeiro
valor de um particular parâmetro de interesse e não precisaremos estimá-lo nem testar hipóteses sobre
o seu valor. Porém, na maioria das vezes, não teremos acesso a todos os elementos da população e as
nossas conclusões deverão ser baseadas em resultados obtidos de uma amostra representativa da
população. Para resolver este problema, buscaremos definir algumas ferramentas estatísticas que
permitam validar ou refutar uma hipótese sobre algum parâmetro (desconhecido) de interesse.
O procedimento básico para a execução de um teste de hipótese sobre a média (µ) de uma
população normal cuja variância (σ2) é conhecida, será introduzido através do Exemplo 3.1.
Exemplo 4.1 Está sendo realizado um leilão de bezerros Nelore com idade de 210 dias,
aproximadamente. Os bezerros são procedentes de duas grandes fazendas: FAZ-1 e FAZ-2. Sabe-se
que os animais da FAZ-1 têm peso médio de 145kg e desvio padrão de 12kg, enquanto os animais da
FAZ-2 têm peso médio de 155kg e desvio padrão de 20kg. Um lote desses animais, de procedência
ignorada, vai para leilão a um preço convidativo e um comprador leigo, para fazer ou não uma oferta,
precisa conhecer a procedência dos animais. O edital do leiloeiro informa que um pouco antes do
leilão será divulgado o peso médio ( x ) de um lote de 25 animais. Com base neste valor, que regra de
decisão o comprador deve usar para saber se o lote de animais que vai para leilão é da FAZ-1 ou da
FAZ-2 ?
Uma resposta imediata é a de considerar que os animais são da FAZ-1 se o valor de x estiver
“próximo” de 145, e da FAZ-2 se o valor de x estiver “próximo” de 155. Podemos definir a seguinte
regra de decisão:
Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br>
15
Se x < 150, os animais são da FAZ-1 e se x ≥ 150, os animais são da FAZ-2
Suponhamos que o comprador seja informado que x = 148kg. Então, de acordo com a regra
de decisão adotada, ele conclui que o lote de animais é procedente da FAZ-1. Porém, ficam algumas
dúvidas sobre esta decisão:
• Será que o comprador pode estar enganado quanto à procedência dos animais?
• É possível que o peso médio de um lote de 25 animais da FAZ-2 seja igual a 148kg?
• É possível que o peso médio de um lote de 25 animais da FAZ-1 seja superior a 150kg?
Note que estas dúvidas sobre a real procedência dos animais continuariam existindo mesmo se
o peso médio da amostra de 25 animais fosse igual a 154kg, ao invés de 148kg... Estudemos os dois
tipos de erro que o comprador pode cometer ao tomar uma decisão numerando-os para facilitar a
linguagem:
Erro tipo I: concluir que os animais são da FAZ-1, quando na verdade são da FAZ-2. Isto acontece
quando a amostra de 25 animais da FAZ-2 apresenta x < 150.
Erro tipo II: concluir que os animais são da FAZ-2, quando na verdade são da FAZ-1. Isto acontece
quando a amostra de 25 animais da FAZ-1 apresenta x ≥ 150.
De forma análoga, vamos definir também duas hipóteses numeradas:
H0: os animais são da FAZ-2, ou seja, o peso dos animais tem uma distribuição com média µ2
 
=
155kg e desvio padrão σ2 = 20kg.
H1: os animais são da FAZ-1, ou seja, o peso dos animais tem uma distribuição com média µ1 =
145kg e desvio padrão σ1 = 12kg.
Indiquemos por R.C.
 (Região Crítica) a região correspondente aos valores de X iguais ou
inferiores a 150, que nos levam a rejeitar a hipótese H0, ou seja, RC = { X ∈ R: X < 150}. Com esta
notação, a probabilidade de cometer cada um dos erros pode ser escrita como:
P(Erro tipo I) = P( X ∈ RC | H0 é verdadeira) = α
P(Erro tipo II) = P( X ∉ RC | H1 é verdadeira) = β
Supondo que o peso dos bezerros Nelore tem distribuição normal e que a hipótese H0 é verda-
deira (os animais são da FAZ-2), X ~ N(155; 16). Assim, a probabilidade de cometer o erro do tipo I
é igual a:
α = P(Erro tipo I) = P ( )6) ~ N(155,1X150 | X <
 = P 


 −
<
16
155150Z = P(Z < -1,25) = 0,10565
Assumindo que a hipótese H1 é verdadeira, X ~ N(145; 5,76) e a probabilidade de cometer o
erro do tipo II é igual a:
β = P(Erro II) = P ( ))5,76 ~ N(145; X50 | 1X ≥
 = P 



−≥
76,5
145150Z = P(Z ≥ 2,08) = 0,01876
Resumindo, temos:
ORIGEM REAL DOS ANIMAIS
DECISÃO
FAZ-1 FAZ-2
os animais são da FAZ-1 sem erro
Erro tipo I
(α = 10,56%)
os animais são da FAZ-2
Erro tipo II
(β = 1,88%) sem erro
Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br>
16
De acordo com a regra de decisão adotada o comprador estará cometendo o Erro tipo I com
maior probabilidade (α = 10,56%) que o Erro tipo II (β = 1,88%). De certo modo, a regra de decisão
estipulada parece privilegiar a afirmação de que os animais são originários da FAZ-1.
Em relação ao mecanismo dos erros, vale observar que:
 i) o tamanho dos erros tipo I e II depende exclusivamente da regra de decisão adotada, que por sua
vez está diretamente relacionada com a região crítica do teste;
 ii) para cada regra de decisão adotada, teremos outros valores de α e β; se escolhermos um valor
para X <150, o valor de α diminuirá, enquanto que o valor de β aumentará. Se, ao contrário,
escolher-mos um valor para X > 150, a probabilidade β diminuirá mas α aumentará.
iii) existe um ponto X em que os valores de α e β são iguais. Com os dados deste exemplo, este
ponto é X = 148,75 e os valores de α e β são iguais a 5,94% (Verifique este resultado, como
exer-cício!!).
iv) no caso geral, onde a hipótese alternativa H1 corresponde a uma desigualdade, o valor de β não
pode ser calculado porque não temos um único valor alternativo para µ.
v)
 
os erros envolvidos num teste de hipótese podem ser generalizados como:
Erro tipo I: consiste em rejeitar H0 quando H0 é verdadeira
Erro tipo II: consiste em aceitar H0 quando H1 é verdadeira
Para testarmos uma hipótese qualquer, é mais comum fixarmos um valor para α (nível de
significância do teste) e encontrarmos a regra de decisão que irá corresponder a P(Erro I) = α. Por
exemplo, fixando-se α = 5% (o que é bastante comum!) tem-se:
α = 0,05 = P ( ))~ N(155,16X: xX c< = P(Z < -1,645) ⇒ -1,645 = 16
155x c −
 ⇒ cx = 148,42kg
onde cx é o valor médio crítico, ao nível de 5% de significância. Neste caso, a regra de decisão pode
ser escrita como:
"Se X < 148,42 kg concluímos que os animais são da FAZ-1 e
 se X ≥ 148,42 kg, concluímos que os animais são da FAZ-2"
Fixando-se α = 5%, β = P(Erro do tipo II) = P ( ); 5,76)145(N~X:42,148X ≥ = P(Z ≥ 1,425)
= 0,0793. Na Figura 7 estão apresentados os valores das probabilidades de ocorrência dos erros dos
tipos I e II.
Figura 7 - Identificação das probabilidades α e β.
A especificação da hipótese alternativa H1 depende do grau de informação que temos sobre o
problema. A seguir serão apresentadas duas outras situações que ocorrem freqüentemente na prática e
as respectivas hipóteses alternativas e regiões críticas associadas.
Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br>
17
Situação 1: suponhamos que os animais possam vir de muitas outras fazendas alem da FAZ-
2 e que o interesse do comprador continua sendo por animais da FAZ-2, porque aos 210 dias esses
animais têm um peso médio nunca inferior ao dos animais das outras fazendas. Neste caso, só iremos
desconfiar que os animais não são da FAZ-2 se o peso médio dos animais for bem inferior a 155 kg.
Neste caso as hipóteses nula e alternativa são, respectivamente:
H0: os animais são da FAZ-2, ou µ = 155kg;
H1: os animaisnão são da FAZ-2, ou µ < 155kg
e a regra de decisão, pode ser escrita como:
"Se X ≥ cx concluímos que os animais são da FAZ-2,
 mas se X < cx concluímos que os animais não são da FAZ-2."
Se, por exemplo, fixarmos α = 5%, o valor crítico xc é obtido fazendo-se:
0,05 = P( X < cx | X ~ N(155; 16) = P(Z < -1,65) ⇒ -1,65 = 16
155x c − ⇒ cx = 148,40 kg
a região crítica fica: RC = { x ∈R: x <148,40} e concluiremos que os animais são da FAZ-2, ao nível
de significância de 5%, somente se x ≥ 148,40kg.
Situação 2: suponhamos agora que não exista razão para o comprador acreditar que a FAZ-2
é melhor, ou seja, existem algumas fazendas melhores e outras piores que a FAZ-2. Porém, o
comprador continua interessado nos animais desta fazenda. Neste caso, somente iremos desconfiar que
os animais não são da FAZ-2, quando o peso médio deles for muito diferente (muito abaixo ou muito
acima) de 155 kg. Neste caso, as hipóteses são escritas como:
H0: os animais são da FAZ-2, ou µ = 155kg;
H1: os animais não são da FAZ-2, ou µ ≠ 155kg
e a regra de decisão, pode ser escrita como:
"Se 
1c
x ≤ X ≤ 
2c
x concluímos que os animais são da FAZ-2,
 mas, se X < 
1c
x ou X > 
2c
x concluímos que os animais não são da FAZ-2."
Se fixarmos α = 5%, existirão muitos valores críticos, 
1c
x e 
2c
x , que satisfazem a condição acima,
mas daremos preferência aos valores críticos que são simétricos à média X . Então:
 0,05 = P( X < 
1c
x ou X > 
2c
x | ~ X ~ N(155,16) = P(Z < -1,96 ou Z > 1,96)
-1,96 = 
16
155x
1c
−
 ⇒ 
1c
x = 147,16kg
 1,96 = 
16
155x
2c
−
 ⇒ 
2c
x = 162,84kg
e a região crítica fica: RC = { x ∈ R | x < 147,16 ou x >162,84} e concluiremos que os animais são
da FAZ-2, ao nível de significância de α = 5%, somente se 147,16 ≤ x ≤ 162,84kg.
4.1 PROCEDIMENTOS BÁSICOS PARA A CONSTRUÇÃO DE UM TESTE DE HI-
PÓTESE
Os procedimentos básicos para a construção de um teste de hipótese sobre o valor de um
parâmetro genérico θ podem ser enumerados da seguinte maneira:
 i) Fixe a hipótese que será colocada à prova, H0: θ = θ0 (hipótese da nulidade), bem como a
hipótese alternativa, H1, que será considerada verdadeira se H0 for rejeitada:
Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br>
18
H1: θ ≠ θ0 (hipótese bilateral ou bicaudal), ou
H1: θ > θ0 (hipótese unilateral à direita), ou
H1: θ < θ0 (hipótese unilateral à esquerda).
Quanto à escolha das hipóteses, FONSECA & MARTINS (1982) afirmaram que “a hipótese H1
geralmente representa a suposição que o pesquisador quer provar, sendo H0 formulada com o
expresso propósito de ser rejeitada. Esse procedimento é conveniente, pois o equívoco de
erroneamente rejeitar H0 é considerado mais sério do que o equívoco de erroneamente aceitar
H1”
 ii) Use a teoria estatística e as informações disponíveis, para decidir qual o estimador de θ será
usado para julgar H0. Por exemplo, se o parâmetro em estudo for µ, o estimador a ser usado é X .
 iii) Fixe α = P(Erro tipo I) e, assumindo que a hipótese H0 é verdadeira, construa a região crítica
(R.C.) do teste.
 iv) Use as informações fornecidas pela amostra, para encontrar o valor da estatística θˆ que definirá a
decisão.
 v) Se o valor da estatística calculada na amostra pertencer à R.C. rejeite a hipótese H0 ao nível de
significância fixado e aceite a hipótese H1 como verdadeira; se o valor da estatística não pertencer
à R.C., aceite a hipótese H0 como verdadeira.
4.2 TESTE SOBRE A MÉDIA DE UMA POPULAÇÃO NORMAL QUANDO A VA-
RIÂNCIA É CONHECIDA
Usando os procedimentos apresentados na seção 4.1, vamos formalizar o teste sobre a média µ
de uma população normal cuja variância σ2 é conhecida (situação que na prática é uma situação pouco
comum!!).
Exemplo 4.2 O peso ao desmame de bezerros Nelore do Campus tem um desvio padrão de
12 kg. Com o objetivo de testar a hipótese de que o peso médio dos bezerros é igual a 220 kg, sorteou-
se uma amostra de 80 animais obtendo-se x = 216kg. Ao nível de significância de 5%, podemos con-
firmar a hipótese feita?
Resolução:
• X = "peso ao desmame de bezerros Nelore", X ~ N(220,144)
Obs: como não temos qualquer informação sobre o "sinal" da hipótese alternativa, optamos pela
hipótese bilateral. O resultado x = 216kg, que é ocasionalmente menor que 220kg, não deve influ-
enciar a escolha da hipótese alternativa.
H0: µ = 220 (o peso médio ao desmame é 220 kg)
H1: µ ≠ 220 (o peso médio ao desmame não é 220 kg)
• estimador: X , que sob H0, tem distribuição N(220; 144/80), ou seja, X ~ N(220; 1,80)
Figura 8. Valores críticos da distribuição
 normal reduzida para α = 5%.
⇒ -1,96 = 
80,1
220x
1c
−
 ⇒ xc1= 217,37kg
⇒ 1,96 = 
80,1
220x
2c
−
 ⇒ xc1= 222,63 kg
Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br>
19
• α = 0,05 = P ( )80)~N(220; 1,X|xXou xX
21 cc
>< ⇒ R.C. = { x ∈ R: x < 217,37 ou x > 222,63}
• como x = 216 kg ∈ R.C., rejeitamos a hipótese H0 ao nível de significância de 5% e concluímos
que o peso médio ao desmame dos bezerros Nelore não é igual a 220kg.
Uma maneira alternativa de realizar este teste de hipótese consiste em escrever a região crítica
em função da v.a. padronizada Z e calcular, com base na média amostral e supondo que a hipótese H0
é verdadeira, um valor zcalc. Posteriormente, verificamos se este valor pertence ou não à R.C. e tiramos
a conclusão sobre o teste de hipótese. Com os dados do Exemplo 3.2, ficaríamos com RC = {z ∈ R:
|z| > 1,96} e zcalc
 
= 
80,1
220216 −
= -2,98, concluindo (mais uma vez, é claro!) que a hipótese H0 deve ser
rejeitada, pois zcalc ∈ R.C. ao nível de 5% de significância.
4.3. NÍVEL DESCRITIVO DO TESTE
O procedimento usual de teste de hipóteses é baseado na adoção de um critério ou regra de
decisão, de tal modo que α = P(Erro tipo I) não exceda um valor pré-fixado. Porem, na maioria das
vezes, a escolha de α é arbitrária. Um procedimento alternativo consiste em calcular o “menor nível
de significância para o qual a hipótese H0 é rejeitada, baseado nos resultados amostrais”. Este valor
é chamado nível descritivo do teste e será denotado por 
�
α (ou “p-value”).
Os passos usados neste procedimento alternativo são bastante parecidos com os do procedi-
mento clássico, sendo que a principal diferença consiste em não construir uma região crítica para o
teste. Ao invés disto, calculamos a probabilidade de ocorrerem valores da estatística mais favoráveis à
rejeição da hipótese H0 que o valor observado. Agindo dessa maneira, se �α for um valor pequeno,
rejeitamos a hipótese H0 a este nível de significância (no mínimo) e assumimos que a hipótese H1 é
verdadeira; caso contrário, aceitamos que a hipótese H0 é verdadeira. Podemos considerar como
pequeno um nível descritivo de até 5%.
Exemplo 4.3. Sabe-se através de pesquisas, que o desvio padrão da produção leiteira de uma
certa raça, no Brasil, é 2,3 kg/vaca/dia. Desejando-se testar a afirmação que a produção média do
rebanho leiteiro de um certo pecuarista é superior a 6,0 kg/vaca/dia, foi sorteada uma amostra de 36
vacas, que forneceu uma média de 6,7 kg/vaca/dia. Com base neste resultado, pede-se:
 a) calcular o nível descritivo do teste e concluir se a afirmação do pecuarista está correta;
 b) usando o procedimento clássico, testar se a afirmação do pecuarista está correta, para α = 5% e
para α = 1%.
Resolução:
• as hipóteses envolvidas no teste são:
H0: µ = 6,0 (a afirmação do pecuarista não está confirmada)
H1: µ > 6,0 (a afirmação do pecuarista está confirmada)
• informações: x = 6,7, σ = 2,3 e n = 36
• o cálculo de 
�
α envolve o cálculo da probabilidade de ocorrerem valores de X favoráveis ao pecua-
rista, ou seja, valores que nos levem a rejeitar H0, baseado na informação da amostra:αˆ = P( X > 6,7) = P








−
>
36
3,2
67,6Z = P(Z >1,83) = 0,0336
e concluímos que a afirmação do pecuarista somente estará correta se assumirmos um nível de
significância igual ou superior a 3,36%.
• para α = 5%, a RC(5%) = {z ∈ R: z > 1,65} e para α = 1%, a RC(1%) = {z ∈ R: z > 2,33}. Como
o valor zcalc = 1,83 pertence à RC(5%) mas não pertence à RC(1%), a hipótese H0 deverá ser rejeita-
da se assumirmos α = 5%, mas deverá ser aceita se assumirmos α = 1%.
Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br>
20
4.4. TESTE DE HIPÓTESE PARA A PROPORÇÃO
A seguir, apresentaremos, através de um exemplo, a construção de um teste de hipótese para a
proporção de sucessos, baseada no roteiro descrito na seção 3.1.
Exemplo 4.4. O consumidor de uma certa vacina acusou o laboratório fabricante, dizendo
que "mais de 3% das suas vacinas estão vencidas". Para confirmar (ou não) sua acusação, ele usou
uma amostra de n = 80 vacinas, das quais k = 4 estavam vencidas. Com base nestes resultados, pede-
se:
a) O que podemos concluir sobre a acusação do consumidor, ao nível α = 0,06?
b) Calcular o nível descritivo do teste e concluir sobre a rejeição da hipótese H0.
Resolução:
(a)
• H0: p = 0,03 (hipótese do fabricante)
H1: p > 0,03 (hipótese do consumidor)
• sob H0, pˆ = n
k
 ~ N 

 −
80
)03,01(03,0
;03,0 ou pˆ ~ N(0,03; 0,000364)
• fixando α = 0,06 e assumindo H0 verdadeira, obtemos RC = {z ∈ R | z > 1,560}
• da amostra: pˆ = 4/80 = 0,05 ⇒ sob H0: zcalc = 
000364,0
03,005,0 −
= 1,05
• como zcalc ∉ RC, não rejeitamos H0 e concluímos que o consumidor não pôde confirmar a sua
acusação, ao nível de significância α = 0,06.
(b)
• αˆ = P(p > 0,05) = P(Z > zcalc) = P(Z >1,05) = 0,5 - 0,35314 = 0,147 = 14,7%, ou seja, o consumidor
somente conseguirá confirmar sua acusação, usando os resultados dessa amostra, se assumir um
nível de significância α ≥ 14,7% (que é um valor muito alto...).
5. OUTROS TESTES DE HIPÓTESES
Baseados nas distribuições de probabilidades Qui-quadrado, t-Student e F-Snedecor nós defi-
niremos alguns testes de hipóteses envolvendo média e variância de uma ou duas populações normais.
5.1. TESTE SOBRE A MÉDIA DE UMA DISTRIBUIÇÃO NORMAL QUANDO A
VARIÂNCIA POPULACIONAL É DESCONHECIDA
Quando a variância σ2 de uma população X ~ N(µ; σ2) é desconhecida, podemos estimá-la
através do estimador S2, já definido anteriormente. Porém, quando a estimativa está baseada numa
amostra de tamanho “pequeno”, a estatística T = 
nS
x
2
0µ−
 
não tem distribuição N(0; 1), mas sim t(n-1).
Baseado no roteiro apresentado na seção 3.1 e nesta estatística T, iremos apresentar o teste para a
média de uma população normal, quando a variância é desconhecida, através do Exemplo 5.1.
Exemplo 5.1. As mudanças observadas no teor de colesterol do sangue de coelhos após o
tratamento com um novo produto, foram medidas em 15 coelhos, cujos resultados foram: 17; 18; 22;
20; 23; 22; 21; 19; 21; 24; 22; 17; 19; 19 e 20 mg/100ml. Podemos afirmar que a mudança média no
teor de colesterol foi inferior a 21 mg/100ml, ao nível de significância α = 0,05?
Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br>
21
Resolução:
• X: "mudança no teor de colesterol no sangue de coelhos", X ~ N(µ; σ2).
• hipóteses: H0 : µ = 21 vs. H1 : µ < 21
• estatística do teste: T = 
15
S
21X
2
−
, que sob H0, tem distribuição t(14)
• fixado α = 0,05 e assumindo H0
 
como
verdadeira, obtemos a região crítica
do teste fazendo:
 0,05 = P( ( )X xc< = P( )T tc<
⇒ t
c
 = -1,761 (Tábua III)
⇒ RC = {t ∈ R: t < -1,761}
Figura 9 - Valor crítico da distribuição t(14) e α = 5%
• com os dados da amostra de n = 15 animais obtemos:
x = ∑
=
15
1i
ix15
1
 = 15
304
 = 20,27 mg/100ml e s2 = ( )∑
=
−
15
1i
2
i 27,20x14
1
 = 4,4952
• calculamos tcalc = 
15
4952,4
2127,20 −
 = -1,33 e verificamos se este valor pertence ou não à RC;
• como tcalc = -1,33 ∉ RC, não rejeitamos H0 e concluímos, ao nível α = 5%, que a mudança no teor
de colesterol do sangue de coelhos não foi inferior a 21 mg/100ml.
• um intervalo de confiança para a média com γ = 95% de confiança é obtido fazendo:
I.C.(µ; 100γ%) = 


+−
15
2,1202
 2,14; 20,27 
15
2,1202
 2,1420,27 = [19,10; 21,44] mg/100ml.
5.2 TESTE PARA A VARIÂNCIA DE UMA DISTRIBUIÇÃO NORMAL
Agora estamos interessados em testar hipóteses sobre a variância (σ2) de uma população
normal que, como sabemos, mede a dispersão dos dados em relação à média populacional. O teste é
baseado na distribuição de qui-quadrado. Resumidamente temos:
1) Hipóteses: H0 : σ2 = 20σ
H1 : σ2 ≠ 20σ (ou H1 : σ2 σ< 20σ ou H1: σ2 > 20σ )
2) Estatística do teste: Q = 2
0
2S)1n(
σ
−
 , que sob H0, tem distribuição χ ( )n−1
2
3) Fixado um nível de significância,
α, a região crítica para o teste
bilateral é:
R.C. = { }2221 � ou Q�Q ><
onde 21χ e 22χ são os valores
críticos obtidos da Tábua II, tais
que 1-α = P( 21χ < Q < 22χ ).
Figura 10
 - Valores críticos do teste bilateral ao nível α.
Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br>
22
4) Com os dados da amostra e assumindo que a hipótese H0 é verdadeira, calculamos S2 e o valor da
estatística: Qcalc = 2
0
2S)1n(
σ
−
.
5) Se Qcalc ∈ R.C. rejeitamos a hipótese H0 e concluímos que a hipótese H1 é verdadeira, ao nível de
significância α; se Qcalc ∉ R.C., a hipótese H0 não deverá ser rejeitada.
6) Para calcularmos um intervalo de confiança para a variância populacional de tamanho γ = 1-α
usamos a expressão:
I.C.(σ2; 100γ%) = 




−−
χχ 21
2
2
2
2 S)1n(
;
S)1n(
 
Exemplo 5.2. Um fabricante de um tipo de aço especial afirma que seu produto tem um
severo controle de qualidade, traduzido pelo desvio padrão da resistência à tensão não superior a 5
kg/cm. Um comprador querendo testar essa informação, tomou uma amostra de 11 cabos e submeteu-
os a um teste de tensão, obtendo x = 263 e s2 = 30. Esses resultados trazem alguma evidência contrária
a afirmação do fabricante, ao nível α = 0,10?
Resolução:
• hipóteses: H0 : σ2 = 25 (hipótese do fabricante)
H1 : σ2 > 25 (hipótese do comprador)
• estatística do teste: Q = 
25
S)111( 2−
, que sob H0 tem distribuição χ( )102 .
• da Tábua II, com α = 0,10 e ν = 10 g.l. obtemos: qc = 15,987 ⇒ RC= {χ2 ∈ R: χ2 > 15,987}
• da amostra temos que s2 = 30 e Qcalc = 25
30)111( −
= 12.
• conclusão: como Qcalc = 12 ∉ RC, não rejeitamos H0 e concluímos, ao nível α = 0,10, que o desvio
padrão da resistência à tensão não é superior a 5 kg/cm, não trazendo evidência contrária à
afirmação do fabricante.
• I.C.(σ2; γ = 90%) = 


−−
940,3307,18
30)111(
;
30)111(
= [ ]14,76;39,16 (kg/cm)2 ou seja, este intervalo contem
o verdadeiro valor da variância da resistência à tensão, com 90% de confiança.
5.3. COMPARAÇÃO DAS VARIÂNCIAS DE DUAS POPULAÇÕES NORMAIS
Agora, o nosso problema envolve duas populações normais e independentes: X1 ~ N(µ1; σ12 ) e
X2 ~ N(µ2; σ22 ), das quais retiramos amostras de tamanhos n1 e n2, respectivamente, com o objetivo de
comparar suas variâncias. Como o teste é baseado na distribuição F-Snedecor, temos uma restrição na
escolha do nível de significância para o teste: somente encontraremos valores críticos tabelados
(Tábua IV) para testes unilaterais com α = 0,05 ou bilaterais com α = 0,10.
O procedimento básico para a execução do teste de hipóteses comparando variâncias de duas
populações normais envolve:
1) Hipóteses: H0: 21σ = 22σ = σ2
H1: 21σ ≠ 
2
2σ ou H1: 
2
1σ > 
2
2σ ou H1: 
2
1σ < 
2
2σ
Material elaborado pelo Prof. Dr. César Gonçalves de Lima<cegdlima@usp.br>
23
2) Estatística do teste: F = 2
2
2
1
S
S
 que, sob H0, tem distribuição F(n1-1,n2-1), onde 21S e 22S são as vari-
âncias das amostras de tamanho n1 e n2, retiradas das populações X1 e X2, respectivamente.
3) Para facilitar a construção da região crítica para o teste bilateral (α = 0,10) ou para o teste unilate-
ral (α = 0,05) tomaremos o cuidado de colocar no numerador da estatística F a maior das duas
variâncias amostrais. Na Tábua IV obtemos o valor crítico fc, com ν1 = (n1 -1) e ν2
 
= (n2 -1) graus
de liberdade, tal que 0,05 = P(F > fc) e então escrevemos R.C. = {F ∈ R: F > fc}, mesmo se a
hipótese alternativa for bilateral.
4) Com as variâncias amostrais, 21s e 22s , calculamos Fcalc = 2
2
2
1
s
s
 (por conveniência, colocamos no
numerador a maior das variâncias amostrais, ou seja, 21s > 22s ).
5) Conclusão: se Fcalc ∈ RC rejeitamos H0 (ao nível de significância α) e aceitamos H1 como verdadei-
ra; se Fcalc
 
∉ RC, aceitamos H0 como verdadeira.
Feito o teste e não rejeitada a hipótese de igualdade das variâncias, podemos calcular uma
estimativa para a variância comum às duas populações, combinando as duas estimativas através da
fórmula:
2
comumS = )2nn(
S)1n(S)1n(
21
2
22
2
11
−+
−+−
Exemplo 5.3. Num experimento com frangos de corte alojados em boxes com 10 aves foram
comparadas duas rações (A e B). Avaliou-se o peso médio (em kg) das aves aos 49 dias de idade. Os
resultados encontrados foram os seguintes:
Ração A 2,10 2,34 2,24 2,07 2,10 2,03 2,20
Ração B 1,89 1,92 1,85 1,82 1,96 1,94
Baseado nesses dados, podemos afirmar, ao nível de significância α = 10%, que os pesos dos dois
grupos de aves são igualmente homogêneos? Ou seja, que têm variâncias iguais ?
Resolução:
• hipóteses: H0: 
2
1σ =
2
2σ = σ
2
 vs. H1: 21σ ≠ 
2
2σ
• estatística do teste: F = 2
2
2
1
S
S
, que sob H0, tem distribuição F(6; 5).
• fixando α = 0,10, da Tábua IV temos fc = 4,95 ⇒ RC = {F ∈ R: F > 4,95}
• 
2
1s = 0,0121 e 
2
2s = 0,0029 ⇒ Fcalc = 0,0121/0,0029 = 4,17 e como Fcalc = 4,17 ∉ RC, não rejeita-
mos H0 e concluímos, ao nível α = 10%, que as variâncias dos pesos dos dois grupos de frangos
de corte são iguais.
• uma estimativa da variância (comum) dos pesos dos dois grupos de frangos de corte é:
2
comums = )267(
0029,0)16(0121,0)17(
−+
∗−+∗−
= 0,0079 kg2
Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br>
24
5.4 COMPARAÇÕES DAS MÉDIAS DE DUAS POPULAÇÕES NORMAIS
Desejamos comparar as médias de duas populações: X1 ~ N(µ1; σ12 ) e X2 ~ N(µ2; σ22 ), cujas
variâncias podem ser conhecidas ou não. As hipóteses envolvidas nas comparações entre as médias
podem ser escritas como:
 H0: µ1 = µ2 (ou H0: µ1 - µ2 = 0)
 H1: µ1 ≠ µ2 (ou H0: µ1 - µ2 ≠ 0) (hipótese bilateral)
ou H1: µ1 > µ2 (ou H0: µ1 - µ2 > 0) (hipótese unilateral à direita)
ou H1: µ1 < µ2 (ou H0: µ1 - µ2 < 0) (hipótese unilateral à esquerda)
A partir de amostras independentes de n1 elementos da população X1 e de n2 elementos da
população X2, podemos estimar a média e a variância (se esta for desconhecida) de cada população
usando os estimadores X e 2S , já conhecidos. De estudos anteriores, também já sabemos que:
a) ( )21 XXE − = E ( )1X - E ( )2X = µ1 - µ2
b) Var ( )21 XX − = Var ( )1X + Var ( )2X - 2∗Cov ( )21 X;X
 = 
1
2
1
n
σ
+ 
2
2
2
n
σ
 - 2∗Cov ( )21 X;X
Quando as populações X1 e X2 são independentes ( )0)X;X(Cov 21 = e as variâncias 21σ e 22σ
são conhecidas, a estatística definida por
Z = 
( ) ( )
2
2
2
1
2
1
2121
nn
XX
σσ
µµ
+
−−−
tem distribuição N(0; 1) e deve ser utilizada nas comparações envolvendo as médias de duas popula-
ções normais. Um intervalo de confiança para a diferença entre as médias pode ser obtido através da
expressão:
I.C.( µ1 - µ2; 100∗γ%) = ( ) ( ) 


 σ
+
σ
+−
σ
+
σ
−−
2
2
2
1
2
1
c21
2
2
2
1
2
1
c21
nn
zXX;
nn
zXX
 
onde zc é o valor crítico obtido na Tábua I, tal que γ = P(-zc < Z < zc).
Porém, é mais comum desconhecermos tanto as médias quanto as variâncias populacionais e
antes de compararmos as médias, precisamos saber se as variâncias das duas populações podem ser
consideradas iguais ou não. Se ainda não temos esta informação, podemos obtê-la através do teste
apresentado na seção 5.3. Em uma outra situação bastante comum, precisaremos comparar as médias
de duas populações que não são independentes, caso em que são feitas observações de uma variável
resposta nos mesmos indivíduos ou em pares deles, em duas situações diferentes.
5.4.1 COMPARAÇÕES ENTRE AS MÉDIAS DE DUAS POPULAÇÕES NORMAIS
QUANDO AS VARIÂNCIAS SÃO DESCONHECIDAS, MAS IGUAIS
Caso a hipótese de igualdade das variâncias seja aceita, a estatística do teste usado para com-
parar as médias de duas populações normais é:
Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br>
25
T = ( ) ( )




+
−−− µµ
21
2
comum
2121
n
1
n
1S
XX
onde 2comumS é a estimativa da variância comum das duas populações. Sob H0: µ1 = µ2, a estatística T
tem distribuição t-Student com (n1 + n2 - 2) graus de liberdade.
Um intervalo de confiança para a diferença entre as médias, µ1 e µ2, pode ser obtido através da
expressão:
I.C.( µ1 - µ2; 100∗γ%) = ( ) ( ) 







++−



+−−
21
2
comumc21
21
2
comumc21
n
1
n
1StXX;
n
1
n
1StXX
 
onde tc é o valor crítico obtido na Tábua I, tal que γ = P(-tc < T < tc).
Exemplo 5.4 Duas soluções químicas, Q1 e Q2, vão ser avaliadas quanto ao valor do pH.
A análise de 21 amostras da solução Q1 acusou um pH médio de 7,68 e desvio padrão 0,016, enquanto
que a análise de 31 amostras de Q2 acusou pH médio de 7,23 e desvio padrão 0,022. Ao nível α = 1%
de significância, podemos afirmar que as duas soluções têm pH médios iguais?
Resolução:
(a) comparação das variâncias:
•
 
hipóteses: H0: 
2
1σ =
2
2σ = σ
2
 vs. H1: 21σ ≠ 
2
2σ
•
 
estatística do teste: F = 2
1
2
2
S
S
, que sob H0, tem distribuição F com ν1 = 31-1 = 30 e ν2 = 21-1 = 20
graus de liberdade.
•
 
fixando alfa = 0,10, da Tábua IV, fc = 2,04 ⇒ RC = {F ∈ R: F > 2,04}
•
 
das amostras: Fcalc = (0,022)2/(0,016)2 = 1,89 e como Fcalc = 1,89 ∉ RC, não rejeitamos H0 e con-
cluímos, α = 10%, que as variâncias dos pH’s das duas soluções podem ser considerados iguais.
•
 
uma estimativa da variância comum do pH das duas soluções é:
2
comums = 
( ) ( )
)22131(
016,0)121(022,0)131( 22
−+
∗−+∗−
= 0,00039
(b) comparação das médias:
•
 
hipóteses: H0: µ1 = µ2 vs. H1: µ1 ≠ µ2
•
 
estatística T = ( )



+
−−
31
1
21
1S
0XX
2
comum
21
, que sob H0, tem distribuição t(50).
•
 
fixando α = 0,01, da Tábua III, obtemos tc = 2,678 ⇒ R.C. = {t ∈ R: t < -2,678 ou t > 2,678}
•
 
das amostras: Tcalc = 
( )



+
−−
31
1
21
100039,0
023,768,7
 = 
00558,0
45,0
 = 80,645
•
 
como Tcalc = 80,645 ∈ R.C., rejeitamos a hipótese de igualdade dos pH’s médios e concluímos, ao
nível α = 1%, que os pH’s médios das duas soluções são diferentes.
Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br>
26
• o intervalo: I.C.(µ1-µ2; 99%) = (7,68 - 7,23) ± 2,678∗ 


+
31
1
21
100039,0 = [ ]465,0;435,0 , contem
a real diferença entre os pH's médios das duas soluções, com uma confiança de 99%.
5.4.2 COMPARAÇÕES ENTRE AS MÉDIAS DE DUAS POPULAÇÕES NORMAIS
QUANDO AS VARIÂNCIAS SÃO DESCONHECIDAS E DIFERENTES
Caso a hipótese de igualdade das variâncias seja rejeitada,não existe um teste exato para
comparar as médias das populações normais, mas de variâncias diferentes e desconhecidas. Este
problema pode ser contornado utilizando-se a estatística
T* = ( ) ( )




+
−−− µµ
2
2
2
1
2
1
2121
n
S
n
S
XX
que tem distribuição aproximada t-Student com ν graus de
liberdade, onde ν é calculado por:
ν = 
1n
n
s
1n
n
s
n
s
n
s
2
2
2
2
2
1
2
1
2
1
2
2
2
2
1
2
1
−




+
−








+
 (Fórmula de Sattertweit)
Um intervalo de confiança aproximado para a diferença entre as médias, µ1 e µ2, pode ser
obtido através da expressão:
I.C.*( µ1 -µ2; 100∗γ%) = ( ) ( ) 



++−+−− ∗∗
2
2
2
1
2
1
c21
2
2
2
1
2
1
c21
n
S
n
S
tXX;
n
S
n
S
tXX
 
onde ∗ct é o valor crítico obtido na Tábua III, tal que γ = P(- ∗ct < T*< ∗ct ), com T* ~ t(ν) e ν é calcula-
do usando-se a Fórmula de Sattertweit.
Exemplo 5.5. Queremos testar se os dois tipos de vigas de aço, A e B, têm a mesma resis-
tência média (em t/cm2), ao nível α = 5% de significância. Avaliando-se 15 vigas do tipo A e 20 vigas
do tipo B, os resultados foram:
Viga amostra média variância
A 15 70,5 81,6
B 20 84,3 246,3
Resolução:
(a) comparação das variâncias: H0: 21σ = 22σ = σ2 vs. H1: 21σ ≠ 22σ
• F = 2
A
2
B
S
S
, que sob H0, tem distribuição F(19; 14) ⇒ fixando alfa = 0,10, da Tábua IV, fc = 2,40
⇒ RC = {F ∈ R: F > 2,40}
• das amostras: Fcalc = 246,3/81,6 = 3,02 ∈ RC, rejeitamos H0 e concluímos, ao nível α = 10%, que
as variâncias das resistências dos dois tipos de vigas são diferentes.
Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br>
27
(b) comparação das médias: H0: µ1 = µ2 vs. H1: µ1 ≠ µ2
• como as variâncias populacionais foram consideradas diferentes, a estatística do teste (aproximado)
é T* = ( )




+
−−
20
S
15
S
0XX
2
2
2
1
21
, que sob H0 tem distribuição t(ν), onde ν = 095893,10
240025,315
 ≅ 31 g.l ⇒ da
Tábua III tc∗ = 2,042 ⇒ RC = { T*∈ R: T* > 2,042}
• 
∗
calcT = 



+
−−
20
3,246
15
6,81
0)3,845,70(
 = 
2137,4
8,13−
 = -3,28 ∈ R.C. ⇒ rejeitamos a hipótese de igualdade resistên-
cias médias e concluímos, α = 5% que as resistências médias das vigas A e B são diferentes.
• I.C.(µ1-µ2; 95%) = (70,5 - 84,3) ± 2,042 


+
20
3,246
15
6,81
= -13,8 ± 8,60 = [ ]5,222,4; −− t/cm2.
5.4.3 COMPARAÇÕES ENTRE AS MÉDIAS DE DUAS POPULAÇÕES NORMAIS
QUANDO AS OBSERVAÇÕES SÃO PAREADAS
Muitas vezes a comparação de médias de duas populações normais pode ser prejudicada pela
ação de fatores externos que não podem ser controlados. Por exemplo, um tratamento com suple-
mentação de alfafa (Trat-A) usado na alimentação de coelhos pode ser considerado melhor que um
tratamento sem suplementação (Trat-B), somente porque os animais escolhidos para receber o Trat-
A têm maior facilidade em ganhar peso que os animais escolhidos para receber o Trat-B e não porque
a suplementação melhora o desempenho. Este problema pode ser contornado utilizando-se um artifício
que consiste em coletar as observações da variável resposta em pares de indivíduos que sejam bastante
homogêneos em todos os sentidos, exceto no que diz respeito àquele fator (ou tratamento) que
desejamos comparar. No exemplo da suplementação de alfafa em coelhos, nós podemos utilizar pares
de coelhos semelhantes quanto a raça, filiação, peso inicial, sexo e idade. Um dos coelhos de cada par
recebe o Trat-A e o outro recebe o Trat-B. Com isso, conseguimos um maior controle de fatores
secundários que podem influenciar os resultados da comparação das médias. Um outro artifício
utilizado nessas situações, consiste em fazer observações da variável antes e depois da aplicação do
tratamento, nos mesmos indivíduos.
Para a comparação das médias das duas populações X ~ N(µX; 2Xσ ) e Y ~ N(µY; 2Yσ ), serão
utilizados n pares de valores (Xi; Yi), para i = 1, 2, 3, ..., n. Definimos uma nova variável D = X - Y e,
consequentemente, teremos uma amostra de n diferenças D1, D2 , ..., Dn que serão utilizadas na
comparação das médias das duas populações. Supondo que a variável D =X − Y tenha distribuição
N(µD; 2Dσ ), segue que D ~ N ( )n; 2DD σµ , onde 2Dσ pode ser estimada utilizando-se o estimador justo
2
DS = ( )∑ −
−
2
i DD1n
1
.
Como µD = E(X − Y) = E(X) − E(Y) = µX − µY, qualquer hipótese feita sobre o parâmetro µD
corresponde a uma hipótese feita sobre as médias das populações X e Y. Por exemplo, as hipóteses
Ho: µX = µY e H1: µX > µY correspondem às hipóteses Ho: µD = 0 e H1: µD > 0, respectivamente.
Deste modo, as hipóteses a serem testadas podem ser escritas como
Ho: µD = µ* (onde µ* é um valor qualquer)
H1: µD ≠ µ* ou H1: µD > µ* ou H1: µD < µ*
e a estatística do teste é T = 
n
S
D
2
D
Dµ−
, que sob Ho: µD = µ*, tem distribuição t(n-1).
Material elaborado pelo Prof. Dr. César Gonçalves de Lima <cegdlima@usp.br>
28
Um intervalo de confiança para a diferença de médias µd = µX − µY, com uma confiança γ pode
ser obtido através de:
I.C.(µd; 100∗γ%) = 



+−
n
StD;
n
StD
2
D
c
2
D
c 
onde tc é o valor crítico obtido da Tabela III, tal que P(-tc < T < tc) = γ, com T ~ t(n-1).
Exemplo 5.6. Com o objetivo de testar (α = 5%) se a suplementação de alfafa aumenta o
ganho médio de peso de coelhos em mais de 0,10kg, foram utilizados 8 pares de coelhos, cujos resul-
tados foram:
Par no 1 2 3 4 5 6 7 8
X (com) 0,72 0,90 0,67 0,83 0,67 0,93 0,80 0,75
Y (sem) 0,32 0,49 0,51 0,45 0,70 0,52 0,35 0,60
D = X − Y 0,40 0,41 0,16 0,38 -0,03 0,41 0,45 0,15
Resolução:
• hipóteses: H0: µD = 0,10 vs. H1: µD > 0,10, com D = X - Y.
• estatística: T = 
8
S
10,0D
2
D
−
, que sob H0, tem distribuição t(7).
• da Tábua III, para α = 5% = P(T > tc), tc = 1,895 ⇒ R.C. = {t ∈ R: t > 1,895}.
• das amostras: d = 0,29 e sD2 = 0,0305 ⇒ tcalc = 
8
0305,0
10,029,0 −
 = 3,08 ∈ R.C.⇒ rejeitamos a hipótese
H0 e concluímos, ao nível de 5% de significância, que a suplementação de alfafa aumenta o ganho
médio de peso de coelhos em mais de 0,10kg.
• I.C.(µD; 90%) = 


∗+∗− 8
0305,0895,119,0;8
0305,0895,119,0
 
= [ ]307,0;073,0 kg, ou seja,
este intervalo contem o verdadeiro aumento de ganho médio de peso de coelhos resultante da su-
plementação com alfafa, com uma confiança de 90%.
6 CORRELAÇÃO E REGRESSÃO LINEAR SIMPLES
Um problema freqüentemente encontrado na prática é o da determinação do valor de uma
grandeza, partindo do conhecimento do valor de outras, ou porque estas últimas são de mais fácil
medida, ou porque estas antecedem no tempo à primeira. Em qualquer dos casos, são utilizadas
fórmulas (ou modelos) para relacionar os valores desconhecidos e conhecidos das diversas grandezas.
Algumas destas fórmulas resultam do emprego do método dedutivo a uma série de postulados
e definições, como por exemplo, as de geometria ou da mecânica racional. Outras resultam apenas da
observação. Por exemplo: a partir de vários valores simultâneos da altura pluviométrica de um rio e
sua vazão, estabelecemos uma expressão (um modelo), relacionando as duas grandezas. As fórmulas
obtidas dedutivamente são ditas teóricas e as que resultam indutivamente das observações são ditas
empíricas. A Análise de Regressão é um método para o estabelecimento de fórmulas empíricas.
Um outro problema bastante freqüente é simplesmente verificarmos se duas grandezas se
relacionam entre si. Ao invés de procurarmos estabelecer modelos, buscamos quantificar o grau de
relacionamento entre elas.
Material elaborado pelo Prof. Dr. César Gonçalves de Lima