Buscar

14 Testes de Hipóteses (1 de 3)

Prévia do material em texto

1
T.E.A. II (Curso Preparatório para o Exame da ANPEC) 
Disciplina: Estatística - Professor: Eduardo Lima Campos
14. TESTES
DE HIPÓTESES
(PARTE 1: CONCEITOS 
E TESTES BÁSICOS)
• Testes de Hipóteses
Uma hipótese estatísticaé uma afirmação 
a respeito de um parâmetro da população. 
Exemplo 14.1- No exemplo das alturas dos 
alunos (8.1), podemos formular a seguinte 
hipótese: “µ (que é a altura média dos 
alunos da turma inteira) é igual a 175 cm”.
Esta hipótese de igualdade é chamada 
hipótese nula, e representada por H0. 
Ela será investigada a partir da amostra.
Se a amostra fornece evidência contra
H0, então rejeitamos esta hipótese. 
Neste caso, aceitamos uma hipótese 
alternativa, representada por H1. 
H1 contradiz o que se afirma em H0. 
No exemplo, teríamos H1: µ ≠ 175.
Caso contrário, se a amostra não fornece 
evidência contra H0, não rejeitamosH0.
Obs - embora não seja rigorosamente correto, 
algumas vezes “aceitar H0” é empregado. 
Veremos que um teste não fornece evidência 
estatística que leva à aceitar a hipótese nula.
No exame da ANPEC, “aceitar 
H0 é tomado como certo”.
Em resumo, diante das hipóteses:
H0: µµµµ = 175 (hipótese nula)
e
H1: µµµµ ≠≠≠≠ 175 (hipótese alternativa),
tomamos uma das seguintes decisões:
não rejeitar H0
ou
rejeitar H 0 (e, neste caso, aceitar H1).
2
T.E.A. II (Curso Preparatório para o Exame da ANPEC) 
Disciplina: Estatística - Professor: Eduardo Lima Campos
Embora o ponto de partida seja a 
hipótese nula, é a hipótese alternativa
que um teste permite evidenciar (ou não). 
É ela, portanto, que queremos tentar 
comprovar, quando formulamos um teste.
• Analogia com um Julgamento
Em nosso sistema judiciário, um júri 
só decide condenar um réu caso haja 
evidência de que ele seja culpado. 
Isto porque o sistema considera mais 
grave condenar um eventual inocente
do que absolver um eventual culpado.
Isto nada mais é do que 
um teste de hipóteses. 
Qual a hipótese nula?
Qual a hipótese alternativa?
R: H0: réu inocente 
H1: réu culpado.
• Erros em Testes de Hipóteses
Um teste de hipóteses não leva 
necessariamente à decisão correta.
Qualquer que seja nossa decisão, 
sempre existe a possibilidade de erro.
Existem 2 tipos de erro que podemos 
cometer ao testar hipóteses: tipo I e tipo II.
O erro tipo I é o erro que consiste em 
rejeitar H0, quando ela é verdadeira.
A probabilidade de cometer este erro é 
denotada por α, e tem um nome específico:
nível de significância.
O nível de significância α de um teste é 
a probabilidade de cometer o erro tipo I
• Nível de Significância
α é pré-especificado por quem vai fazer o 
teste. Os valores usuais são: 0,01, 0,05 e 0,1.
3
T.E.A. II (Curso Preparatório para o Exame da ANPEC) 
Disciplina: Estatística - Professor: Eduardo Lima Campos
Uma questão que pode surgir é: por 
que não trabalhar com um valor de α
bem pequeno, para minimizar a 
possibilidade de cometer o erro tipo I?
 Porque também existe o erro tipo II...
O erro tipo II é o erro que consiste em 
não rejeitar H0, quando ela é falsa.
A probabilidade do erro tipo II 
é designada por β. 
O problema de usar um α muito 
pequeno é que quanto menor o 
valor de α, maior o valor de β.
Obs -α e β não têm uma relação exata. Por 
exemplo, não se pode afirmar que α+β = 1. 
A única coisa que se garante é que 
quando um diminui, o outro aumenta.
 
A única forma de reduzir α e β
simultaneamente é aumentando 
o tamanho da amostra.
Resumo - Erros em um Teste de Hipóteses:
H0 Verdadeira H0 Falsa
Rejeitar H0 Erro Tipo I
Não Rejeitar 
H0
Erro Tipo II
a probabilidade αααα de cometer este 
erro é o nível de significância.
A formulação das hipóteses de um teste 
deve levar em consideração o seguinte:
1) H0 deve ser definida de tal forma 
que o erro de rejeitá-la quando ela for 
verdadeira (isto é, o tipo I) seja mais 
grave do que o erro contrário (tipo II).
• Diretrizes para Formular Hipóteses Isto porque o erro tipo I tem uma 
probabilidade pré-especificada como 
um valor pequeno (isto é, controlada).
2) H1, por outro lado, é a hipótese 
da qual um teste é capaz de fornecer 
evidência estatística (= conclusão de 
que a hipótese é verdadeira, sujeita a
uma probabilidade de erro controlada).
4
T.E.A. II (Curso Preparatório para o Exame da ANPEC) 
Disciplina: Estatística - Professor: Eduardo Lima Campos
• Métodos para Testar Hipóteses
Há três métodos para testar hipóteses:
1. Método do Intervalo de Confiança
2. Método da Região Crítica
3. Método do P-Valor
• Testando uma Hipótese a partir 
de um Intervalo de Confiança
O teste de H0: µ = k contra H1: µ ≠ k, 
ao nível de significância α, pode ser 
feito usando o IC de 100(1-αααα)% (daí 
a notação 100(1-α)% que adotamos!).
A regra de decisão é a seguinte: 
• Se k não pertence ao IC, rejeitamos H0
• Caso contrário, ou seja, se k 
pertence ao IC, não rejeitamos H0
• IC`s e Testes de Hipóteses (Bilaterais)
O IC com grau 
de confiança::
permite testar ao 
nível de significância:
90% 0,1
95% 0,05
99% 0,01
Exemplo 14.2- (exemplo 12.3) Uma AAS 
de 25 trabalhadores de uma fábrica foi 
selecionada, fornecendo salário médio 
de R$ 400,00 e desvio padrão R$ 450,00. 
Considerando a população Normal, teste 
a hipótese de que o salário médio dos 
empregados da fábrica seja R$ 600,00, 
ao nível de significância α = 0,1. 
Solução: As hipóteses de interesse são:
H0: µ = 600 (hipótese nula);
H1: µ ≠ 600 (hipótese alternativa).
O IC90%(µ) foi (exemplo 12.3): 
[246,01;553,99].
Basta verificar se este intervalo contém 
o 600. De imediato, vemos que não.
Assim, rejeitamos H0, ao nível α = 0,1.
Exemplo 14.3- (exemplo 12.4) Suponha que a 
vida útil de uma marca de tv`s de LED seja 
normalmente distribuída. A partir de uma 
amostra de 16 tv`s, estimou-se uma vida 
útil média de 8.900 horas, e um 
desvio padrão igual a 500 horas.
Teste se o tempo médio das tv`s desta marca 
é igual a 9.000, ao nível de significância 0,05.
5
T.E.A. II (Curso Preparatório para o Exame da ANPEC) 
Disciplina: Estatística - Professor: Eduardo Lima Campos
Solução: As hipóteses de interesse são:
H0: µ = 9.000 (hipótese nula);
H1: µ ≠ 9.000 (hipótese alternativa).
O IC95%(µ) foi (exemplo 12.4): 
[8.633,6;9166,4].
Basta verificar se este intervalo contém 
o 9.000. De imediato, vemos que sim.
Assim, não rejeitamosH0, ao nível α = 0,05.
Erro conceitual comum:
Não rejeitar H0 ao nível α porque a estimativa 
de µ pertence ao IC de 100(1-α)%.
Por que isto está errado?
Resposta: a estimativa sempre está 
dentro no intervalo, por construção. 
O correto seria: não rejeitar H0 ao nível 
α se k (isto é, o valor de µ contemplado 
em H0) pertencer ao IC de 100(1-α)%.
• O Método da Região Crítica
Embora o método do IC seja simples 
e conveniente, o método da região crítica 
é o método formal para testar hipóteses. 
Para a explicação deste método, é 
necessário definir 2 quantidades:
- Estatística de teste
- Região crítica
A estatística de testeé uma estatística 
(= função das v.a.`s na amostra) baseada 
no estimador do parâmetro de interesse.
Seja µ a média de uma população 
Normal com σ conhecido. A estatística 
do teste de H0: µ = k contra H1: µ ≠ k é:
.
n/
kX
Z
σ
−=
Quando H0 é verdadeira(µ = k), sabemos que: 
Portanto, se houver evidência de que o 
resultado acima não seja válido, então 
é porque H0 não deve ser verdadeira.
).1,0(N~
n/
kX
Z
σ
−=
6
T.E.A. II (Curso Preparatório para o Exame da ANPEC) 
Disciplina: Estatística - Professor: Eduardo Lima Campos
O valor observado de Z é: 
.
n/
kx
z0 σ
−=
Se z0 é um valor que seria pouco provável
caso Z ~ N(0,1), isto é uma evidência
contra Z ~ N(0,1) (rigorosamente, contra 
E(Z) = 0) e, portanto, evidência contra H0.
A região crítica RC é o conjunto dos 
valores de z0 que levam à rejeição de H0.
Para o teste de H0: µ = k contra 
H1: µ ≠ k (σ conhecido):
RC = (-∞,-zα/2]∪[zα/2,∞).
este valor é chamado valor crítico.
• Por Que Rejeitar H0 Quando z0 ∈∈∈∈ RC?
Note que, se H0 é verdadeira:
P(Z∈RC) = P[(Z≤-zα/2)∪(Z≥zα/2)] = α, 
que é um valor pré-especificado e baixo.
Assim, se z0∈RC, temos que decidir entre:
1 - H0 é verdadeira, e o evento Z∈RC, cuja 
ocorrência era improvável (probabilidade 
α) acabou ocorrendo por obra do acaso
ou
2 - H0 é falsa.
O mais lógico é optar pela alternativa 2.
Assim, tomamos a decisão de rejeitar H0.
Resumo:
Se o valor observado da estatística de 
teste pertencer à RC, a amostra fornece 
evidência estatística para rejeitar H0.
Nesta situação, tomamos a 
decisão de rejeitar H0.
Se o valor observado da estatística de 
teste não pertencer à RC, a amostra não 
fornece evidência para rejeitar H0. 
Nesta situação, tomamos a 
decisão de não rejeitar H0. 
7
T.E.A. II (Curso Preparatório para o Exame da ANPEC) 
Disciplina: Estatística - Professor: Eduardo Lima Campos
Exemplo 14.1(cont.) 
Vamos usar o método da RC 
para conduzir o seguinte teste:
H0: µµµµ = 175
x
H1: µµµµ ≠≠≠≠ 175,
ao nível de significância α = 0,05. 
(considere σ conhecido, igual a 6)
Valores Críticos da Normal para Testes
Bilaterais (iguais aos dos IC`s de 100(1-α)%):
Para α = 0,01 ⇒ z0,005= 2,575.
Para α = 0,05 ⇒ z0,025= 1,96.
Para α = 0,1 ⇒ z0,05= 1,645.
Como α = 0,05:
RC = (-∞,-1,96]∪[1,96,∞).
.8634,1
5/6
175180
5/6
175x
z0 =
−=−=
Este valor não pertence à RC.
Logo, não rejeitamos H0.
Para calcular z0, precisamos da estimativa 
da média que já foi obtida no exemplo 8.1: 
Se σ é desconhecido, a estatística do 
teste de H0: µ = k contra H1: µ ≠ k é:
.
n/S
kX
T
−=
Quando H0 é verdadeira (µ = k), a 
estatística acima, como já vimos, não 
segue distribuição Normal, e sim t de 
Student com n-1 graus de Liberdade. 
O valor observado de T é: 
.
n/s
kx
t0
−=
E a região crítica é: 
RC = (-∞,-tn-1;α/2]∪[tn-1;α/2,∞).
No exemplo 14.1, vamos agora considerar σ
desconhecido e testar as mesmas hipóteses:
H0: µµµµ = 175
x
H1: µµµµ ≠≠≠≠ 175,
A estimativa de σ já foi obtida no 
capítulo 12, exemplo 12.2: s = 6. O valor 
crítico também é o mesmo encontrado na 
tabela t naquele exemplo: t4;0,025= 2,776.
8
T.E.A. II (Curso Preparatório para o Exame da ANPEC) 
Disciplina: Estatística - Professor: Eduardo Lima Campos
Assim:
RC = (-∞,-2,776]∪[2,776,∞).
.8634,1
5/6
175180
5/s
175x
t0 =
−=−=
Este valor não pertence à RC.
Logo, não rejeitamos H0.
Erro conceitual comum:
Não rejeitar H0 porque t0 (ou z0) 
pertence ao IC de 100(1-α)%.
Por que isto está errado?
Resposta: o valor calculado da estatística 
de teste não tem nada a ver com IC. 
Estariam sendo misturados 2 métodos.
O correto seria: 
não rejeitar H0 porque k pertence ao IC
ou
rejeitar H0 porque t0 ou (z0) pertence à RC
Exemplo 14.2(cont.) - Considerando a 
população Normal, use o método da RC 
para testar a hipótese de que o salário 
médio dos empregados da fábrica seja 
igual a R$ 600,00, ao nível α = 0,1.
Solução:
1 - As hipóteses de interesse são:
H0: µ = 600 (hipótese nula);
H1: µ ≠ 600 (hipótese alternativa).
O nível de significância pedido é α = 0,1.
2 - A região crítica do teste é:
RC = (-∞,-t24;0,05]∪[t24;0,05,∞).
Do exemplo 12.3, temos que t24;0,05= 1,711.
Revendo a consulta à Tabela t do ex. 12.3:
9
T.E.A. II (Curso Preparatório para o Exame da ANPEC) 
Disciplina: Estatística - Professor: Eduardo Lima Campos
3 - Cálculo de t0:
4 - Verifica-se que t0 pertence à RC.
5 - Conclusão: rejeitamos H0, ao nível 0,1. 
.2222,2
90
200
5/450
600400
25/s
600x
t0 −=−=
−=−=
Em algumas situações específicas, não 
estaremos preocupados em evidenciar 
se o parâmetro de interesse (µ, nos 
exemplos até aqui) é diferente de k, e 
sim se ele é maior ou menor do que k.
Isto conduz ao estudo de testes unilaterais.
• Testes Unilaterais/Unicaudais
Exemplo 14.4- Um fabricante afirma 
que seus cigarros contém, em média, no 
máximo 30mg de nicotina. Queremos 
verificar a partir de uma amostra se 
existe evidência contra esta afirmação.
Neste caso, H1, que é a hipótese que queremos 
evidenciar não é µ ≠ 30, e sim µµµµ > 30. 
Assim é mais apropriado estabelecer 
como hipótese alternativa H1: µ > 30.
Neste caso, H0: pode ser: µ ≤ 30 ou µ = 30. 
A região crítica é definida com base na 
hipótese alternativa, e será, neste caso:
RC = [zα;∞), se σ for conhecido ou
RC = [tn-1;α;∞), se σ for desconhecido.
não dividimos α por 2!
Valores Críticos da Normal
(Testes Unilaterais): 
Para α = 0,01 ⇒ z0,01= 2,33.
Para α = 0,05 ⇒ z0,05= 1,645.
Para α = 0,1 ⇒ z0,1 = 1,28.
O método do IC não pode ser 
aplicado para testes unilaterais!
Exemplo 14.4(cont.) - Foi coletada uma 
amostra de 25 cigarros, fornecendo média 
31,5 mg. O desvio padrão populacional é 
conhecido, e igual a 3 mg. Ao nível α = 0,05, 
os dados refutam a afirmação do fabricante?
Solução: RC = [1,645;∞) e z0 = 2,5, que 
pertence à RC. Desta forma, rejeita-se H0, 
ao nível de significância α = 0,05. Os dados 
refutam a afirmação do fabricante, a este nível.
10
T.E.A. II (Curso Preparatório para o Exame da ANPEC) 
Disciplina: Estatística - Professor: Eduardo Lima Campos
Considere agora o desvio padrão σ
desconhecido e estimado, com s = 3 mg. 
Da tabela t, t24;0,05= 1,711, 
e assim: RC = [1,711;∞).
t0 = 2,5, que pertence à RC acima, 
portanto a conclusão permanece.
Obs - se H1 for µ < 30, a RC 
passa a ser: (-∞;-zα] ou (-∞;-tn-1;α].
Exemplo 14.5- Um pesquisador deseja 
estudar a relação entre renda e despesa 
com alimentação, em certa localidade.
O interesse específico é na estimativa da 
propensão marginal ao consumo (no 
caso, de alimentos) β nesta localidade.
Sabendo-se que alimentação é um bem 
normal, quais seriam as hipóteses 
adequadas para o pesquisador?
Solução:
Se houver relação do consumo de alimentos 
com a renda, espera-se que seja positiva. 
Assim:
H0: β = 0 (não há relação);
H1: β > 0 (há relação).
Este teste envolve um 
modelo de regressão linear.
Exercício 14.1 -Um economista afirma que o 
índice de endividamento médio das empresas 
de certo setor é superior a 30. Você decide 
verificar esta hipótese, a partir de uma AAS 
de 9 empresas. Sua amostra forneceu média 
52 e desvio padrão 30. Se os índices de 
endividamento seguem distribuição Normal, 
sua amostra fornece evidência favorável à 
afirmação do economista, aos 3 níveis usuais?
R: t0 = 2,2 ⇒ há evidência aos níveis 0,05 e 0,1.
As hipóteses de interesse são:
H0: p = k 
H1: p≠ k,
sendo p uma proporção populacional 
(por exemplo, de eleitores que 
pretendem votar em um certo candidato).
• Teste para uma Proporção O teste baseia-se no seguinte resultado 
aproximado (para grandes amostras):
).1,0(N
n
)p1(p
pp̂
Z ≈−
−=
O teste resultante será válido apenas em 
grandes amostras (é um teste assintótico).
proporção amostral.
11
T.E.A. II (Curso Preparatório para o Exame da ANPEC) 
Disciplina: Estatística - Professor: Eduardo Lima Campos
Estatística de Teste
A estatística de teste é obtida substituindo 
em Z o valor considerado em H0 (p = k):
.
n
)k1(k
kp̂
Z
−
−=
O teste consiste em calcular o valor da 
estatística Z para a amostra observada:
e verificar se z0 pertence à RC, que 
é baseada na distribuição Normal.
,
n
)k1(k
kp̂
z
0 −
−=
Exemplo 14.6- Uma corretora afirma 
que 30% dos seus clientes são avessos 
ao risco. Uma AAS de 64 clientes 
revela que 20 são avessos ao risco. 
Teste a afirmação da corretora, ao 
nível de significância α = 0,1.
Solução:
As hipóteses de interesse são:
H0: p = 0,3 
H1: p≠ 0,3,
sendo p a proporção do total de clientes 
da corretora que são avessos ao risco.
α = 0,1 ⇒ z0,05 = 1,645, e assim: 
RC = (-∞,-1,645]∪[1,645,∞).
.2182,0
64
)3,01(3,0
3,03125,0
z0 =−
−=
Como z0 não pertence à RC, não 
rejeitamos H0 ao nível α = 0,1.
Exercício 14.2- (ver exercício 12.1) Uma 
corretora faz contato com uma AAS de 
100 clientes e verifica que 40% dos 
clientes desta amostra se dizem avessos 
ao risco. Se p é a proporção de clientes 
que se consideram avessos ao risco, 
use o IC de 90% calculado no exemplo 
10.1 para testar as hipóteses H0: p = 0,5 
x H1: p ≠ 0,5, ao nível correspondente.
R: IC90%(p) = [0,3194;0,4806].
Rejeita-se H0 ao nível 0,1.
12
T.E.A. II (Curso Preparatório para o Exame da ANPEC) 
Disciplina: Estatística - Professor: Eduardo Lima Campos
Exemplo 14.7- Uma emissora de TV 
afirma que o índice de audiência de seu 
programa “carro chefe”, em determinada 
localidade e horário, é de 60%. Um 
instituto de pesquisa entrevista 400 
pessoas naquela localidade. Se 220 
entrevistados assistem ao programa no 
horário em questão, existe evidência 
estatística contra a afirmativa feita pela 
emissora, ao nível de significância 0,05?
Solução:
As hipóteses de interesse são:
H0: p = 0,6 
H1: p < 0,6,
sendo p a proporção de audiência do 
programa na população em estudo.
Para α = 0,05: 
RC = (-∞,-1,645].
.04,2
400
)6,01(6,0
6,055,0
z
0
−=
−
−=
Como z0 pertence à RC, 
rejeitamos H0 ao nível α = 0,05.
Conclusão:
A amostra fornece evidência contra a 
afirmativa da emissora, ao nível 0,05.
E aos outros níveis usuais?
• Decisão x Nível de Significância
No exemplo 14.7, rejeitamos H0 aos 
níveis 0,05 e 0,1, mas não ao nível 0,01.
Ou seja:
a decisão em um teste depende do 
nível de significância estabelecido!
Note então que:
Se uma hipótese não é rejeitada a um 
certo nível de significância, também não
o será a níveis inferiores (a RC diminuirá).
Por outro lado: 
Se uma hipótese é rejeitada a um certo 
nível de significância, também o será a 
níveis superiores (pois a RC aumentará).
13
T.E.A. II (Curso Preparatório para o Exame da ANPEC) 
Disciplina: Estatística - Professor: Eduardo Lima Campos
Podemos definir um “ponto de corte”, isto é, 
um valor de α abaixo do qual não rejeitamos 
H0, e acima do qual passamos a rejeitar H0.
Este ponto é chamado p-valor do teste.
O p-valor de um teste é o menor 
valor de αααα que nos leva a rejeitar H0.
P-Valor ou Nível Descritivo
O p-valor, também chamado nível 
descritivo, é utilizado para testar 
hipóteses de uma forma direta.
A regra de decisão é a seguinte:
se p-valor ≤ α ⇒ rejeitamos H0
se p-valor > α ⇒ não rejeitamos H0
• Testando Hipóteses Usando o P-Valor 
Exemplo 14.8- O p-valor obtido para um 
teste foi 0,07. Qual a conclusão do teste 
para os 3 níveis de significância usuais?
Solução: 
Para α = 0,01 ou 0,05, não rejeitamos H0
(pois o p-valor é maior do que ambos);
Para α = 0,1, rejeitamos H0
(pois o p-valor é menor do que 0,1).
• Cálculo do P-Valor
O p-valor de um teste é dado pela 
probabilidade, calculada sob H0, 
de que a estatística de teste assuma 
um valor igual ou “mais extremo”
do que o valor calculado na amostra.
Mais extremo = mais “dentro” da RC. 
Para elucidar a definição, considere o teste 
de H0: µ = k contra H1: µ > k, em que z0
é o valor observado da estatística de teste.
Note que, se z0 > zα, o p-valor fica 
menor do que α. Isto corresponde 
à situação em que H0 é rejeitada.
14
T.E.A. II (Curso Preparatório para o Exame da ANPEC) 
Disciplina: Estatística - Professor: Eduardo Lima Campos
Se z0 = zα, o p-valor é 
igual a α, e H0 é rejeitada.
Por outro lado, se z0 < zα, o p-valor 
fica maior do que α. Isto corresponde 
à situação em que H0 não é rejeitada.
Exemplo 14.9- Calcule o p-valor do teste 
do exemplo 12.4, e utilize-o para formular 
sua conclusão aos níveis usuais.
Solução:
.0062,04938,05,0)5,2(ZPvalor -p
0H
=−=≥=
Conclusão?
indica que a probabilidade é calculada sob H0
• P-Valor para um Teste Bilateral
Em um teste bilateral, o p-valor é obtido 
multiplicando o p-valor unilateral por 2.
R: p-valor = 2*0,0062 = 0,0124.
No exemplo 14.9, se H1: µ ≠ 30:
Exercício 14.3- No exemplo 14.7, calcule 
o p-valor do teste, e utilize-o para formular 
suas conclusões aos níveis usuais.
R: 0,0207.
P-Valor para o Teste t
Quando a variância é desconhecida, e 
usamos o teste t, a tabela t não permite 
determinar o p-valor com exatidão.
O cálculo pode ser feito via 
função DIST.T do excel.
O comando é DIST.T.CD(t0;g.l.), se o teste é 
unilateral e DIST.T.BC(t0;g.l.) se é bilateral.

Continue navegando