VII - Testes de Hipóteses Estatísticas

Estatística II

•

UFRJ

Isabela Caldeira

16/11/2023

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 25 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 25 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 25 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Estatística II

3.264 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

VII - TESTES DE HIPÓTESES
Neste capítulo estudaremos os elementos fundamentais da teoria dos testes de
hipóteses e da sua aplicação à inferência paramétrica. Como veremos, existe uma
dualidade entre os testes de hipóteses e a construção dos intervalos de confiança
estudados no Capítulo VI anterior.
A rejeição de uma hipótese unilateral lançada sobre um parâmetro, para um dado
nível de significância /2, estará associada à não inclusão da estatística observada
dentro de um intervalo de confiança 1  .
As aplicações estudadas focalizam exclusivamente as populações normais,
entendendo-se que, nas condições de aplicação do TCL (Teorema Central do Limite),
estas aplicações aproximam razoavelmente bem os testes correspondentes que
poderiam ser construídos para as populações originais (não normais).
Naturalmente, os conceitos fundamentais da teoria dos testes e a mecânica de suas
aplicações tem, ambos, um caráter geral que não se restringe à uma população em
particular.
Também, focalizaremos aqui apenas a construção de testes clássicos, que são
sempre conclusivos, seja pela rejeição, seja pela não rejeição da hipótese testada
(Hipótese Nula).
Isto significa que a abordagem sequêncial, que contém regiões inconclusivas, não
será estudada.
1. Conceitos Fundamentais
O framework da análise é o da inferência paramétrica:
Temos uma amostra simples X1,X2, . . . ,Xn de uma população X, com suporte em
X , fdp fX. ;, fda FX. ;, ambas dependentes do parâmetro   .
Temos uma estatística TX1,X2, . . . ,Xn para , cuja distribuição de probabilidade
FTt; será usada para a construção dos testes.
Elementos de um Teste de Hipóstese
Um teste estatístico é composto dos seguintes ingredientes:
__________________________
Hugo Boff - Estatística II 2020-I
2
a) Uma hipótese a ser testada.
Esta hipóstese, chamada hipóstese nula, assume o seguinte formato:
H0 :   0
onde 0   é um subcojunto pré-especificado do espaço paramétrico.
Como veremos à frente, o teste de H0 será construído como um teste de rejeição:
A evidência amostral permite, ou não, rejeitar a hipótese H0 ?
Ao ser especificada a região 0 da hipótese nula, ficará implícitamente designada a
região do que se chama a hipótese alternativa:
H1 :   1 onde 1    0
Frisemos que H1 não é a hipótese testada.
H1 é rejeitada se H0 não for rejeitada; H1 é aceita somente se H0 for rejeitada.
b) O Nível de Significância
A tomada de decisão sobre o teste contempla apenas duas opções: Rejeitar ou Não
Rejeitar H0. Ao fazê-lo, dois tipos de erro podem ser cometidos:
Erro I : Rejeitar H0 sendo H0 verdadeira;
Erro II : Não rejeitar H0 sendo H0 falsa.
A implementação do teste requer a determinação prévia da probabilidade de se
cometer ao menos um destes erros. Notemos para estas probabilidades:
  Pêrro I  PRejeitar H0 H0 Verdadeira
  Pêrro II  PNão Rejeitar H0 H1 Verdadeira
As decisões e as probabilidades, segundo H0 é verdadeira (V) ou falsa (F) são
resumidas na tabela abaixo:
__________________________
Hugo Boff - Estatística II 2020-I
3
H0
Decisão
Prob. Verdadeira Falsa
Rejeita  1  
Não Rejeita 1   
Em testes nos quais tanto a hipótese nula como a hipótese alternativa são pontuais,
ambas as probabilidades de erro podem ser calculadas.
Nos testes mais usuais, nos quais as hipóteses especificam intervalos de variação
para o parâmetro testado, como veremos, será a probabilidade de cometer o erro do
tipo I  que será pré-fixada.
A probabilidade  será chamada tamanho do teste ou, mais comumente, nível de
significância do teste. Trata-se, na verdade, de uma cobertura para a região de rejeição
do teste de H0, sendo esta hipótese verdadeira, como veremos na sequência.
c) Uma Região Crítica
A Região Crítica (RC) do teste de H0 é, por definição, a região de rejeição de H0.
Ela pode assumir a forma de intervalos abertos à direita, do tipo RC  T  tc ou
abertos à esquerda RC  T  tc ou a forma de uma união de intervalos de ambos os
tipos: RC  T  t1  T  t2.
Para cada um destes formatos da RC o teste correspondente será nomeado
unilateral à direita, à esquerda ou teste bilateral, respectivamente.
Como mencionamos antes, T é uma estatística para , a qual será a estatística
através da qual o teste é implementado.
O nível crítico tc será o valor que delimitará a região crítica. Este valor será aquele
que corresponde ao nível de significância  que foi pré-fixado.
Ou seja, a região de rejeição do teste estará completamente determinada pela
escolha feita do tamanho  a ser dado ao teste. Isto significa que, dado , a região
crítica RC será tal que:
PRC H0   1
Ou seja, o nível de significância  é o grau de cobertura dado à região de rejeição de
H0.
__________________________
Hugo Boff - Estatística II 2020-I
4
Frequentemente notaremos RC para a região crítica de tamanho .
d) Uma regra de decisão
Sendo uma região de rejeição de H0, a especificação de RC define implícitamente
uma regra de decisão para o teste.
Seja

t  Tx1,x2, . . . ,xn realização amostral da estatística T. A regra de decisão
especifica:
Se

t  RC  Rejeita-se H0 (a probabilidade de erro I será )
Se

t  RC  Não rejeita-se H0, (a probabilidade de erro II será )
No primeiro caso, a rejeição de H0, torna H1 uma hipótese plausível, muito embora
esta não é a hipótese testada. Dizemos neste caso que H1 é "aceita" com a ressalva
acima.
e) Conceitos derivados
Existem dois conceitos derivados deste quadro teórico os quais são de grande
utilidade. O primeiro é o conceito de p-valor (ou p-value), que estabelece um treshold
amostral acima do qual todo teste de tamanho maior que o p-valor leva à rejeição de
H0.
O segundo é o da Função Poder (ou Power Function) a qual mede a probabilidade
de rejeitar H0 quando ela é falsa. Trata-se de um indicador importante para avaliar a
qualidade do teste implementado, uma vez que ele mede a capacidade do teste
identificar corretamente a falsidade de H0 ao longo do intervalo de variação do
parâmetro.
e1. P-Valor
Sendo

t  Tx1,x2, . . . ,xn a estatística observada do teste, o p  valor, notado
P, é a probabilidade que a estatística amostral leve à rejeição de H0, sendo esta
hipótese verdadeira:
P  PT 

t H0 no teste unilateral à direita;
__________________________
Hugo Boff - Estatística II 2020-I
5
P  PT 

t H0 no teste unilateral à esquerda;
P  2minP, P no teste bilateral;
Quanto menor o p-valor P maior a evidência amostral contra H0. Ou seja, menos
verossímil é H0 à luz da amostra.
Um guia qualitativo do grau de evidência amostral contra H0, é proposto por
R.A.Fisher (1924), com a seguinte escala de interpretação para a magnitude do p-valor:
Escala de Fisher
P  valor 0.10 0. 05 0. 025 0. 01 0.005 0. 001
Evidência contra H0 fraca moderada substancial forte muito forte fortíssima
e2. Função Poder
A função poder do teste de H0 para o parâmetro , notada , define-se como a
probabiliade de rejeitar H0 com razão, ou seja:
  PRC |H1 2
Observe que   1   onde  é a probabilidade do erro do tipo II.
Quanto maior o poder do teste, maior a probabilidade de se tomar uma decisão
acertada rejeitando H0.
Por exemplo, considere o teste de H0 :   0 contra H1 :   0 .
Com base na estatistica T para , suponha que a região de rejeição de H0 seja do
tipo:
RC  T  tc
A função poder ideal para este teste terá o formato abaixo:
__________________________
Hugo Boff - Estatística II 2020-I
6
Como vemos no gráfico, é nula a probabilidade da região de H0 e unitária a
probabilidade da região de rejeição, sob H1. Esta é uma situação ideal, para um teste
perfeitamente discriminante.
Vamos ilustrar os conceitos apresentados até aqui através de um exemplo analítico:
Exemplo 1 (Analítico):
Papéis de renda variável negociados em bolsa tem retornos anuais com distribuição
Normal de média  e variância 2. Aqueles que apresentam retorno médio até 0, com
risco 0, são considerados de baixo retorno (B); aqueles cujoretorno médio está acima
de 1, com risco 1, são considerados de alto retorno (A). Naturalmente, temos
0  1 e 0  1. Richardson está analizando os retornos anuais de uma letra
imobiliária e quer saber se ela pode ser classificada como um papel do tipo A ou um
papel do tipo B. Ele então seleciona ao acaso n retornos passados deste papel e, com
base no retorno médio x obtido na amostra, ele implementa o seguinte teste pontual:
H0 :   0   0 contra H1 :   1   1
Ou seja, ele vai testar a hipótese de que a letra imobiliária é um papel de tipo B.
A estatística do teste é a média amostral X e a região crítica será do tipo:
RC  X  xc
Ou seja, Richardson implementará um teste unilateral à direita, pois se a média
amostral for maior que um determinado quantil crítico xc, o ativo não poderá ser do tipo
B e H0 deverá ser rejeitada.
1. Para determinar xc, Richardson admitirá um nível de significância , que é a
probabilidade de ele errar classificando o papel como sendo do tipo A, quando na
realidade ele é do tipo B.
__________________________
Hugo Boff - Estatística II 2020-I
7
Temos então:   PRC  H0  PX  xc  H0, ou seja:
  PZ 
xc  0
0/ n

Pela tabela da Normal achamos z tal que   PZ  z , de modo que:
xc  0
0/ n
 z 
xc  0 
0
n
z 3
Assim, a região de rejeição de H0 será: X  0 
0
n
z, como mostrado na figura
à seguir:
Como regra de decisão: se x  RC  x  0  0
n
z rejeita H0.
Neste caso, a probabilidade de errar rejeitando é de 100%.
Caso contrário, se x  RC  x  0  0
n
z , H0 não é rejeitada.
Neste caso, a probabilidade de errar aceitando Ho é .
A probabilidade de cometer o erro II é calculada assim:
  PRCc  H1  PX  xc  H1  PZ 
xc  1
1/ n

Substituindo xc obtemos:
xc  1
1/ n

0 
0
n
z  1
1/ n

0z  n 1  0
1 de
modo que:
  PZ 
0z  n 1  0
1  4
__________________________
Hugo Boff - Estatística II 2020-I
8
2. O p-valor é: P  PX  x  H0  PZ  x  0
0/ n
.
Naturalmente, o nível de significância escolhido  pode ser maior ou menor que
o p-valor P . Se ele for menor ou igual    P, H0 não é rejeitada; se ele for maior,
  P, H0 é rejeitada.
3. A função poder, em testes pontuais sempre é uma constante, no caso:
  1  ,   1
4. Suponha que Richardson não tem razões para ser mais avesso à um tipo de
erro que ao outro. Ao invés de fixar , ele deseja realizar um teste equilibrado, tal que
  . Qual a região crítica deste teste ?
Vimos acima que   PZ 
xc  0
0/ n
 e   PZ  xc  1
1/ n
  PZ  1  xc
1/ n
.
Logo, a região crítica do teste equilibrado será RC  X  xe,onde xe verifica:
xe  0
0/ n

1  xe
1/ n

xe  
1
0  1 0  
0
0  1 1 5
Como vemos, o quantil crítico do teste equilibrado é uma média ponderada dos
retornos médios sob H0 e sob H1, com pesos determinados pelos riscos relativos. O
quantil do teste equilibrado estará mais próximo de 0 que de 1.
Neste caso, a probabilidade dos erros será dada por:
  PX  xe  H0  PX  xe  H1  
Naturalmente, se     P a hipótese H0 é rejeitada. Caso contrário, ela não é
rejeitada.
A figura abaixo ilustra as regiões críticas iguais,sob H0 e sob H1, do teste
equilibrado.
__________________________
Hugo Boff - Estatística II 2020-I
9
5. Suponha finalmente que, antes de realizar a amostragem, Richardson tenha em
mente valores específicos para  e  que ele quer contemplar. Quantos retornos do
ativo ele deve então observar ?
Dada a região crítica X  xc e o quantil xc dado em 3, temos:
z 
xc  1
1 n  1z  xc  1 n
Usando agora o valor de xc vem:
1z  0 
0
n
z  1 n  0z  1  0 n
 0z  1z  1  0 n
Ou seja:
n  
0z  1z
1  0
2 6
Como o tamanho amostral deve ser um número inteiro, com o semi-colchête
superior   indicamos o arredondamento para cima ou seja, tomamos o primeiro inteiro
superior ao número 
0z  1z
1  0
2.
Exemplo 1 (Numérico): Para ilustrar numericamente o exemplo analítico, tomamos
os seguintes valores (em 1.000 reais/ano)
H0 :   3   2 contra H1 :   5   5
__________________________
Hugo Boff - Estatística II 2020-I
10
Temos também: n  9 ; x  4.0
1. Para o teste de H0 com nível de significância   0.05 5% temos, pela tabela da
Normal-padrão: z  1.65.
Então, por 3, o quantil crítico é: xc  3  2
9
1.65  4.1 . A região crítica de
tamanho 5% será: X  4.1 . Como x  RC  não se rejeita H0.
Ou seja, a evidência amostral não permite rejeitar H0. Assim, há indicações de que
o papel analizado é do tipo B.
A aceitação de H0 está sujeita ao erro tipo II, que ocorre se H0 é de fato falsa.
Calculemos então a probabilidade de ocorrência deste erro, usando 4 :
  PZ  21.65  9 5  3
5
  PZ  0.54
o que dá, usando a tabela da Normal-padrão:   0.294.
Ou seja, temos uma elevada probabilidade de errar aceitando H0.
2. O p-valor do teste é: P  PX  4.0  H0  PZ  4  32/3   PZ  1.5
 0.067
Ou seja, na escala de Fisher, a evidência amostral contra H0 é de fraca a moderada.
Somente testes com probabilidade de erro maior que 6,7% poderão levar à rejeição
de H0.
3. A função poder do teste é constante e igual à 1  , ou seja,   0.706. Esta é
a probabilidade de acertar rejeitando H0.
4. Para a construção do teste equilibrado, usamos 5, e o quantil crítico é dado por:
xe   52  5
3  2
2  5
5  25
7
 3,571
Devido à diferença na volatilidade dos retornos, o retorno crítico é baixo. Este é o
retorno acima do qual o ativo é classificado como do tipo A (retorno Alto), com
probabilidade de errar com esta classificação igual à probabilidade de errar
considerando-o como do tipo B (retorno Baixo).
__________________________
Hugo Boff - Estatística II 2020-I
11
Devido ao baixo tamanho da amostra, esta probabilidade é elevada:
  PZ  3.571  3
2/ 9
  PZ  0.856  0.291
  PZ  3.571  5
5/ 9
  PZ  0.857  0.291
5. Se antes de realizar a amostragem, Richardson deseja uma probabilidade de 5%
para ambos os tipos de erro, qual deverá ser o tamanho da amostra ?
Neste caso,   0.05   de modo que z  1.65 e z  1.65
Então, usando 6 obtemos: n  
21.65  51.65
5  3
2  33.35  n  34
Ou seja, Richardson deverá considerar 34 retornos passados do papel em análise.
2. Testes Compostos em Uma População Normal
Vamos estudar agora a construção de testes compostos, com hipóteses
alternativas múltiplas, para a média e para a variância em populações normais.
Em cada caso, as estatísticas que viabilizam a realização destes testes são as
mesmas daquelas empregadas na construção dos Intervalos de Confiança estuados no
Capítulo VI.
Os testes compostos sobre um parâmetro , admitem as seguintes regras de
decisão:
Unilateral à direita: H0 :   0 contra H1 :   0
Unilateral à esquerda: H0 :   0 contra H1 :   0
Bilatera l H0 :   0 contra H1 :   0
Como a região crítica (RC) do teste é uma região de rejeição de H0, ela sempre
assumirá o formato da hipótese alternativa.
Assim, no primeiro caso acima teremos: RC  T  tc; no segundo caso,
RC  T  tc.
No caso do teste bilateral, a região crítica não é um intervalo, mas a união de dois
intervalos disjuntos: RC  T  t1  T  t2.
__________________________
Hugo Boff - Estatística II 2020-I
12
A) Testes para a média
Sabemos que a média amostral tem distribuição normal: Xn  N,2/n. Deste
modo:
Z  Xn  
/ n
 N0,1 7
1. 2 conhecida
Neste caso, de acôrdo com 7 a estatística do teste é a normal-padrão.
Dada uma cobertura da região crítica de tamanho , consideramos o quantil z tal
que:
PZ  z   para o caso do teste unilateral à direita,
PZ   z   para o caso do teste unilateral à esquerda.
Consideramos o quantil z/2 tal que P|Z|  z/2   no caso do teste bilateral.
Segundo a regra de decisão, o formato dasregiões críticas será:
Para H0 :   0 contra H1 :   0
RC  X  xc  H0  xc  0  
n
z
Para H0 :   0 contra H1 :   0, :
RC  X  xc  H0  xc  0  
n
z  0  
n
z
Para o teste de H0 :   0 contra H1 :   0, teremos:
RC  X  x1  H0  X  x2  H0
 x1  0  
n
z/2 ; x2  0  n
z/2
Em cada um destes casos, rejeita-se H0, com probabilidade de erro 100%, se a
média amostral observada pertence à região crítica. Ou seja, se x  RC.
__________________________
Hugo Boff - Estatística II 2020-I
13
Lembremos que, para o cálculo do p  valor, em cada um destes casos, devemos
observar as definições:
P  PX  x H0 no teste unilateral à direita;
P  PX  x H0 no teste unilateral à esquerda;
P  2minP, P no teste bilateral.
Aceitação de H0 e Intervalo de Confiança
Observe que, no teste bilateral H0 :   0 contra H1 :   0, de tamanho ,
dizer que H0 não é rejeitada equivale dizer que o valor testado 0 pertence à um à um
intervalo de confiança 1   centrado na média amostral x .
Com efeito, se H0 não é rejeitada ao nível de signficância , isto significa que
x  RC.
Ou seja, x  x1  0  
n
z/2 e x  x2  0  n
z/2 .
Logo,
0  
n
z/2  x  0  n
z/2
Ora, estes limites para a média da amostra implicam nos seguintes limites para 0 :
x  
n
z/2  0  x  n
z/2  0  IC1.
Poder dos testes unilateral e bilateral
O poder do teste unilateral à direita, de tamanho , é:
d  PX  xc  H1  PZ 
n xc  
    0
Esta é a probabilidade de decidir corretamente rejeitando H0.
Substituindo xc dado em 3 vem:
n xc  
  z 
n
 0   , de modo que:
d  PZ  z 
n
 0      0
 1
2

z
n
 0

e
1
2
z2dz ;   0
__________________________
Hugo Boff - Estatística II 2020-I
14
Vemos assim que  é crescente com d0   e

lim d  1.
O diagrama abaixo, para   0.05 z  1.65, 0  3,   4, n  81 descreve o
formato típico da função poder do teste unilateral à direita (linha contínua em vermelho):
É fácil checar que a função poder para um teste unilateral à esquerda, de tamanho
, é:
e  PX  xc  H1  PZ 
n xc  
    0
Neste caso,
n xc  
 
n
 0    z , de modo que:
e  PZ  n 0    z    0
 1
2


n
 0z e
1
2
z2dz ;   0
No diagrama abaixo, o poder deste teste é mostrado na linha contínua em azul.
0 1 2 3 4 5 6
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
Média Populacional
Poder
__: Poder Testes Unilaterais; _ _ Poder Teste Bilateral
No teste bilateral, a região crítica de tamanho  se decompõe em uma união de
duas regiões críticas com cobertura /2 cada uma:
b 
PZ  z/2 
n
 0      0
PZ  n 0    z/2    0
__________________________
Hugo Boff - Estatística II 2020-I
15
ou seja:
b 
1
2

z/2 
n
 0

e
1
2
z2dz ;   0
1
2


n
 0z/2 e
1
2
z2dz ;   0
O poder do teste bilateral é representado no diagrama acima pelas linhas
pontilhadas em vermelho e azul, ainda para os valores
  0.05 z/2  1.96, 0  3,   4, n  81
.
Como esperado, o poder do teste bilateral é sempre menor que o poder dos testes
unilaterais, pois ele distribui a mesma cobertura sobre uma região maior do que estes.
Existe uma razão informacional: Nos testes unilaterais, é dado ao problema do teste
mais informação para a rejeição do H0 do que é feito no teste bilateral, uma vez que
uma das regiões, à esquerda ou à direita do valor testado, é excluída.
A supremacia do teste unilateral sobre o teste bilateral, mostra que ele deve ser
implementado sempre que há informação suficiente para excluir uma das regiões da
hipótese alternativa.
Ou seja, o teste bilateral somente é implementado quando não se tem informação
suficiente para excluir os valores maiores ou os valores menores que o valor testado.
Frisemos também que este resultado, mostrado aqui no teste da média em
população Normal, é verdadeiro para o teste de qualquer outro parâmetro, de qualquer
população.
2. 2 desconhecida
Neste caso, como vimos no Capítulo VI, 2 deverá ser estimado, e a estatística do
teste é a v.a.T  Student padrão.
Sendo Sn1
2  1
n  1 i1
n
X i  Xn2 o estimador MVU de 2, vimos em Estatística I
que o quociente entre uma v.a. Normal-padrão e a raiz quadrada de uma v.a.
qui-quadrado dividida pelos seus graus de liberdade, ambas independentes uma da
outra, formam uma v.a. T  Student. Então,
Xn  
Sn1/ n
 Tn  1 8
Deste modo, a região crítica no teste unilateral à direita de H0 :   0 contra
H1 :   0, terá o quantil crítico xc dado por:
__________________________
Hugo Boff - Estatística II 2020-I
16
RC  X  xc  H0  xc  0  s
n
t
onde s é o desvio-padrão amostral e t é o  percentil da v.a. Student-padrão com
n  1 graus de liberdade.
Comparando-se este quantil crítico com aquele do mesmo teste considerado
anteriormente, quando 2 é conhecida, vemos que este apenas substitui o
desvio-padrão populacional  pelo desvio-padrão amostral s e, mutatis mutandis, a
estatística Z (normal) pela estatística T (Student).
A implementação dos testes segue a mesma lógica descrita para o caso em que
2 conhecida.
A consequência de se usar o estimador da variância é visível na função poder do
teste, a qual apresenta valores mais baixos que aqueles obtidos quando 2 é conhecida.
Para mostrar isto, plotamos os valores da função poder para o teste de
H0 :   0 contra H1 :   0, com os parâmetros:
n  21 20g. l. ,   0.05 t  1.725;   s  4, 0  3.
A linha em vermelho é a função poder do teste quando a variância é desconhecida
(estatística t. A curva em  é:
d  
1.725 21
4
3

 21
2

 1
2
 20
2

 120 
1/21  120 t
2
21
2 dt ;   3
A curva em azul é a função poder do teste quando a variância é conhecida
(estatística z:
d  1
2

1.65  21
4
3x

e
1
2
z2dz ;   3
__________________________
Hugo Boff - Estatística II 2020-I
17
1 2 3 4 5 6 7 8
0.0
0.2
0.4
0.6
0.8
1.0
média pop.
poder
d  
1.725 21
4
3

 21
2

 1
2
 20
2

 120 
1/21  120 t
2
21
2 dt
Pelo gráfico vemos que o poder do teste de H0 quando 2 é conhecida domina o
poder do teste de H0 quando 2 é estimada, para os valores relevantes   0  3.
B) Testes para a Variância
Desde o Capítulo II sabemos que:
n  1Sn12
2
 2n  1 9
A distribuição do estimador amostral da variância, assim como ela permite a
estimação intervalar da variância da população, também permite a construção de testes
de hipóteses para ela, usando-se os percentis da v.a. 2n  1.
A construção de testes unilaterais ou bilaterais para a variância seguirá a mesma
lógica apresentada para os testes da média.
Por exemplo, antes da implantação de um programa de treinamento para os
operadores de um processo produtivo na fabricação de lápis de cor, a variância do
número de falhas detectadas no produto era 0
2. Com base em uma amostra aleatória
realizada um ano após a implementação do programa, deseja-se avaliar
estatísticamente se o treinamento melhorou a qualidade do produto reduzindo a
variância do número de falhas.
__________________________
Hugo Boff - Estatística II 2020-I
18
Neste caso, a hipótese adequada a ser testada deverá ser unilateral à esquerda,
pois supõe-se que o treinamento não pode piorar a qualidade do produto:
H0 : 2  0
2 contra H1 : 2  0
2
Ou seja, se a hipótese nula de que o treinamento não resultou em melhora for
rejeitada, a hipótese alternativa de que a melhora ocorreu deverá ser aceita.
Todavia, se o programa de treinamento não foi implementado e que, após um ano,
se quer simplesmente saber se houve ou não learning by doing no desempenho dos
operadores do processo produtivo, com redução ou aumento na variância das falhas, o
teste bilateral será mais adequado:
H0 : 2  0
2 contra H1 : 2  02
Para um testede tamanho , região crítica deste teste será aqui escrita em função
do estimador amostral da variância, unicamente:
RC   Sn1
2  x1   Sn12  x2 10
Usando 9 , vamos achar na tabela da 2n  1 os percentis q1 e q2 tais que
P2n  1  q1  /2  P2n  1  q2
Então, como sob H0,
n  1Sn12
0
2  
2n  1 podemos determinar os quantis
x1 e x2 em 10 : x1 
0
2
n  1 q1 e x2 
0
2
n  1 q2 e a região de rejeição 10 fica:
RC   Sn1
2 
0
2
n  1 q1   Sn1
2 
0
2
n  1 q2 10

Exemplo 2:
No contexto descrito vamos avaliar se houve ou não alteração na variância do
número de falhas, fazendo o teste bilateral para a hipótese H0 : 2  45, que é o nível
da variância antes do treinamento. Ou seja, H0 é a hipótese que o treinamento não
alterou a variância do número de falhas.
Para   0.05 e uma amostra de n  25 trabalhadores submetidos ao treinamento
obtemos na tabela os valores de q1  12.4 e q2  39.5 indicados no gráfico abaixo:
__________________________
Hugo Boff - Estatística II 2020-I
19
24g. l. fq  1
21212
q11eq/2
A estimativa amostral da variância foi: s2  23. Então, de acôrdo com 10, os
limites da região crítica serão:
0
2
n  1 q1 
45
24
12.40  23.5 e
0
2
n  1 q2 
45
24
39.50  74.06.
E a região de região de rejeição fica:
RC   Sn1
2  23.5   Sn12  74.06
Como s2  23  RC, rejeita-se H0.
Ou seja, existe evidência amostral de que a variância da população diminuiu para
um nível abaixo do nível inicial 0
2  45 .A probabilidade de errar rejeitando H0 é de 5%.
3. Testes em Duas Populações Normais Independentes
Podemos efetuar testes de igualdade (ou a proporcionalidade) entre médias de
duas populações normais independentes, assim como podemos também testar a
igualdade (ou a proporcionalidade) entre as variâncias destas duas populações.
Considere duas populações normais independentes: X  N1,1
2 e Y  N2,2
2.
Uma amostra de tamanho n1 é tomada da população X : X1,X2, . . . ,Xn1 , da qual se
extrai os estimadores MVU de 1e 1
2 : X e S1
2  1
n1  1
i1
n1 X i  X2.
Analogamente, uma amostra de tamanho n2 é tomada da população
Y : Y1,Y2, . . . ,Yn2 , da qual se extrai os estimadores MVU de 2 e 2
2 : Y e
S2
2  1
n2  1
i1
n2 Y i  Y2.
__________________________
Hugo Boff - Estatística II 2020-I
20
A) Testes para Comparação das Médias
Estamos interessados em realizar testes comparando as médias das duas
populações.
Para k  , os testes assumem a forma:
H0 : 2  k1  0 contra H1 : 2  k1  0
Quando k  1, estaremos testando a igualdade das médias nas duas populações.
Escolhemos expor a construção do teste apenas no caso bilateral, por uma questão
de economia. A construção dos testes unilaterais, à direita ou à esquerda, segue o
mesmo método estudado no caso de uma população.
As estatísticas deste teste estarão baseadas nos seguintes resultados:
Y  kX  N2  k1;
2
2
n2  k
2 1
2
n1  11
Para a variância, temos com efeito: VY  kX  VY  k2VX  2kCovX,Y a qual se
reduz à VY  k2VX pelo fato de que, em razão da indepedência entre as populações,
a covariância entre as médias amostrais é nula.
O outro resultado diz respeito à distribuição das variâncias amostrais:
n1  1S12
1
2 
n2  1S22
2
2  
2n1  n2  2 12
Este resultado é consequência da normalidade e da independência das populações.
O número de graus de liberdade n1  n2  2 resulta da soma n1  1  n2  1 onde
cada termo são os graus de liberdade da distribuição da variância amostral de cada
população. Esta é uma propriedade reprodutiva da 2.
Como usual, a região crítica do teste bilateral para a diferença das médias será:
RC  Y  kX  x1  Y  kX  x2 13
1. Variâncias 1
2,2
2 conhecidas
Neste caso, a estatística do teste é a v.a Normal-Padrão:
Z 
Y  kX  2  k1
2
2
n2  k
2 1
2
n1
 N0,1 14
__________________________
Hugo Boff - Estatística II 2020-I
21
Sob H0, a estatistica se reduz à
Y  kX
2
2
n2  k
2 1
2
n1
. Deste modo, para um nível de
significância , a região de rejeição do teste de H0 dada em 13 será:
RC  Y  kX  
2
2
n2  k
2 1
2
n1 z/2  Y  kX   
2
2
n2  k
2 1
2
n1 z/2 13

Ou seja, H0 será rejeitada se a estimativa amostral y  kx estiver fora do intervalo
com extremidades 
2
2
n2  k
2 1
2
n1 z/2.
2. Variâncias 1
2,2
2 desconhecidas mas iguais
Neste caso temos 2  12  22. Sinalizamos acima que o estimador MVU da
variância 2, comum às duas populações é:
S2  n1  1S1
2  n2  1S22
n1  n2  2
15
e que, segundo 12, temos:
n1  n2  2 S
2
2
 2n1  n2  2 12
Assim, a estatística:
Y  kX  2  k1
 1n2  k
2 1
n1
/ S
2
2

Y  kX  2  k1
S 1n2  k
2 1
n1
tem distribuição
t  Student.
Ou seja:
Y  kX  2  k1
S 1n2  k
2 1
n1
 Tn1  n2  2 16
Sob H0 esta estatística se reduz à
Y  kX
S 1n2  k
2 1
n1
.Assim para um nível de
significância , e os quantis t/2 da T  Student com n1  n2  2 graus de liberdade, a
região de rejeição do teste de H0 dada em 13 será:
__________________________
Hugo Boff - Estatística II 2020-I
22
RC  Y  kX   s 1n2  k
2 1
n1 t/2  Y  kX   s
1
n2  k
2 1
n1 t/2 13

onde s  s2 é a estimativa do desvio-padrão comum às duas populações .
Ou seja, à semelhança do caso anterior, H0 será rejeitada se a estimativa amostral
y  kx estiver fora do intervalo com extremidades  s 1n2  k
2 1
n1 t/2.
3. Variâncias 1
2,2
2 desconhecidas e distintas
Neste último caso, um teste aproximado apenas poderá ser construído. A
estatística do teste terá distribuição aproximada pela t  Student, novamente. Esta
estatística será aquela dada em 14 na qual substitui-se as variâncias populacionais
pelos seus estimadores amostrais.
Mostra-se que, sob H0 :
Y  kX
S2
2
n2  k
2 S1
2
n1
 T 17
Os graus de liberdade  são calculados pela parte inteira da seguinte expressão:
 

s1
2
n1 
s2
2
n2 
2
1
n11

s1
2
n1 
2  1n21 
s2
2
n2 
2
A hipótese nula H0 será então rejeitada se a estimativa amostral y  kx estiver
fora do intervalo com extremidades  
s2
2
n2  k
2 s1
2
n1 t/2.
B) Testes para Comparação das Variâncias
A igualdade ou proporcionalidade das variâncias das duas populações poderá ser
inspecionada usando a v.a. F  Fisher. Esta variável aleatória se define como o
quociente entre duas v.a.’s qui-quadrado independentes, as quais são divididas pelos
seus respectivos graus de liberdade:
__________________________
Hugo Boff - Estatística II 2020-I
23
1
21/1
2
22/2
 F1,2 17
Trata-se portanto de uma v.a. com dois parâmetros para os graus de liberdade:
1 para o numerador, e 2 para o denominador.
Obviamente, temos a relação:
F2,1  1F1,2
18
A densidade desta variável é representada abaixo para 1,2  1,10 linha preta;
5,10 linha vermelha; 10,10 linha azul; 10,5 linha verde.
0 1 2 3 4 5 6
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
F
f(F)
fFF;1,2 
 122 
 12 
2
2 
 12 
1
2 F
12
2
1  12 F
12
2
; F  0
Vamos construir o teste bilateral para a hipótese:
H0 :
1
2
2
2  k contra H1 :
1
2
2
2  k
A estatística do teste é:
S1
2/1
2
S2
2/2
2  Fn1  1,n2  1 19
Sob H0 a estatística fica:
__________________________
Hugo Boff - Estatística II 2020-I
24
1
k
S1
2
S2
2  Fn1  1,n2  1 19

Deste modo, para um nível de confiança , geralmente tomado a 2,5% ou 5%,
determinamos na tabela da F  Fisher os quantis f1 e f2 tais que:
PFn1  1,n2  1  f1  /2  PFn1  1,n2  1  f2
Finalmente, a região de rejeição de H0 será:
RC  
S1
2
S2
2  kf1n1  1,n2  1  
S1
2
S2
2  kf2n1  1,n2  1 20
Obs.:
As tabelas da F geralmente fixam o nível  e apresentam o quantil f21,2 à direita
tal que PF1,2  f21,2  /2. Para obter o quantil correpondente à área à
esquerda, considere que PF1,2  f11,2  P 1
F1,2
 1
f11,2
 ou, usando
18 : PF1,2  f11,2  PF2,1  1f11,2 .
Assim, temos 1
f11,2
 f22,1 ou seja:
f11,2  1f22,1
18
Aplicando este resultado, à região crítica 20 esta escreve-se agora:
RC  
S1
2
S2
2 
k
f2n2  1,n1  1
   S1
2
S2
2  kf2n1  1,n2  1 20

Exemplo 3:
As notas obtidas pelos alunos de Estatística II nas faculdades de Economia e de
Administração da UFRJ são v.a.’s Normais independentes, com média e variâncias
desconhecidas. Uma amostra com 31 alunos de Economia e 41 alunos de Administração
foi tomada e as estatísticas amostrais obtidas foram: x , s1
2  7.2 , 4.5 para a
Economia e y , s2
2  6.1 , 5.4 para Administração. Como os programas das
disciplinas são similares, e os professores praticamente os mesmos, a comparação
estatística entre as médias e as variâncias fazem sentido. Usamos o nível de
significância de 5%.
__________________________
Hugo Boff - Estatística II 2020-I
25
Solução:
1. Para iluminar o teste das médias, vamos começar fazendo o teste da igualdade
das variâncias. Para   0.5 temos pela tabela da F os quantis à 2,5% :
f230,40  1.94 e f240,30  2.01  f130,40  1/f240,30  0.4975. Colocando
k  1 a região crítica 20 fica:
RC .05  
S1
2
S2
2  0.4975  
S1
2
S2
2  1.94 19

A estatística amostral é
s1
2
s2
2 
4.5
5.4
 0.833  RC .05. Ou seja, a evidência amostral
não permite rejeitar a hipótese da igualdade das variâncias.
2. Vamos agora fazer o teste de igualdade das médias, tomando as variâncias
como iguais, de acôrdo com o resultado do teste anterior.
A região crítica do teste é dado por 13 com k  1.
O percentil crítico da v.a. t  Student à 2,5%, com 70 graus de
liberdade é: t .02570  1.994.
Por outro lado, a estimativa do desvio-padrão populacional, de acôrdo com 15 é:
s2  31  14,5  41  15.4
31  41  2 
351
70
 5.01  s  2.24
Temos também: 141 
1
31  0.238. Então a região crítica fica:
RC .05  Y  kX   2.240.2381.994  Y  kX   2.240.2381.994 
RC .05  Y  kX   1.063  Y  kX   1.063.
A estatística amostral do teste é: y  1x  6.1  7.2  1.1  RC.
Ou seja, a hipótese da igualdade das médias é rejeitada, com probabilidade de erro
de 5%.
Há uma indicação amostral de que o desempenho dos alunos de Economia é
melhor, a rejeição se dá no lado esquerdo da região crítica.
  
__________________________
Hugo Boff - Estatística II 2020-I