Testes de Hipóteses

•
UFJF

Isadora Lupchinski
13/07/2015
E aí, curtiu este material?
Ajude a incentivar outros estudantes a melhorar o conteúdo
Gostou desse material? Compartilhe! 🧡
Inferência Estatística I

36 Materiais compartilhados
Baixe o app para aproveitar ainda mais
Leia os materiais offline, sem usar a internet. Além de vários outros recursos!
Prévia do material em texto
Visão Geral
• Existem duas grandes áreas em Inferência 
Estatística: estimação de parâmetros e testes 
de hipóteses.
• Estimação de parâmetros:
– Estimação Pontual
– Estimação por Intervalo (Intervalos de 
Confiança)
Inferência Estatística
Testes de HipótesesTestes de Hipóteses
Visão Geral
• Em estatística, uma hipótese é uma afirmativa 
sobre uma característica da população.
• Um teste de hipóteses é um procedimento 
padrão para se testar uma afirmativa sobre uma 
característica da população.
Motivação
• Suponha que a distribuição do nível de 
colesterol para a população de homens 
hipertensos e fumantes nos Estados Unidos 
seja aproximadamente normal com uma média 
µ desconhecida.
Motivação
• No entanto, sabemos que a média do nível de 
colesterol para a população geral de todos os 
homens de 20 a 74 anos é 211 mg/100ml.
• Então, ficaríamos admirados se o nível médio 
de colesterol da subpopulação de homens 
fumantes e hipertensos fosse 211 mg/100ml.
Motivação
• Se selecionarmos uma amostra aleatória de 25 
homens desse grupo e seu nível médio de 
colesterol for x = 220 mg/100ml, a média da 
amostra é compatível com a média suposta de 
211 mg/100ml?
Motivação
• Sabemos que certa variabilidade amostral pode 
ser esperada. O que acontece se a média 
amostral é 230 mg/100ml ou 250 mg/100ml? 
• Qual a distância que 211 precisa estar de x, 
antes de concluirmos que µ é realmente igual a 
algum outro valor?
Exemplos
• Em uma pesquisa experimental, o objetivo pode 
ser inicialmente o de estimar parâmetros, por 
exemplo, podemos estar interessados em estimar 
a produtividade média de uma nova linhagem de 
milho híbrido. 
• Porém, o objetivo final pode ser a utilização desta 
estimativa para outras inferências (considerações).
Exemplos
• Podemos, por exemplo, comparar esta 
produtividade com uma linhagem padrão e talvez 
recomendar que a linhagem padrão seja 
substituída pela nova.
• Em outras situações, podemos estar 
interessados em verificar se um novo germicida 
é mais eficaz que um padrão e assim por diante.
Introdução
• Frequentemente, o objetivo de uma investigação 
não é somente estimar um parâmetro, mas 
decidir qual das duas afirmações contraditórias 
sobre o parâmetro está “correta” (há evidências 
amostrais para não rejeitar uma afirmação).
• Os métodos de decisão compreendem a parte da 
inferência estatística chamada teste de hipóteses.
Hipóteses Estatísticas
• Assim, como em estimação assumiremos que 
podemos obter uma amostra aleatória de uma 
densidade .
• Uma hipótese estatística ou simplesmente 
hipótese, é uma alegação ou afirmação sobre a 
distribuição de uma ou mais variáveis aleatórias.
Hipóteses Estatísticas
• Exemplos:
• Se a hipótese especifica completamente a 
distribuição, então ela é chamada de hipótese 
simples. Caso contrário, ela é chamada de 
hipótese composta. 
Hipóteses Estatísticas
• Em qualquer problema de teste de hipóteses, 
existem duas suposições contraditórias em 
consideração.
• Exemplos:
Hipóteses Nula e Alternativa
• A hipótese nula, representada por H0, é a 
alegação inicialmente assumida como 
verdadeira (a suposição de afirmação de 
prioridade). É uma afirmativa de que o valor de 
um parâmetro populacional (proporção, média 
ou desvio padrão, por exemplo) é igual a um 
valor especificado.
• A hipótese alternativa representada por H1 é a 
afirmação contraditória a H0.
Hipóteses Nula e Alternativa
• Estas hipóteses devem ser mutuamente 
exclusivas.
Comentários - H0 e H1
• Há uma analogia familiar a isso em um processo 
criminal.
• Uma alegação é a afirmação de que o acusado é
inocente (suposição considerada inicialmente 
verdadeira).
• Somente com presença de forte evidência do 
contrário é que o júri deve desprezar tal alegação 
em favor da afirmação alternativa de que o 
acusado é culpado.
Comentários - H0 e H1
• Nesse sentido, a alegação de inocência é a 
hipótese favorecida ou protegida.
• De maneira semelhante, no teste de hipóteses 
estatísticas, o problema é formulado de modo 
que uma das alegações seja inicialmente 
favorecida.
Exemplo
• Você observa, em uma lata de refrigerante, que 
o volume médio é de 354 ml. Como você não 
tem nenhuma informação adicional para validar 
esta afirmação, ela pode ser vista como uma 
hipótese que pode ou não estar “correta”. 
• Problema de teste de hipóteses!!!
Exemplo
• Para testá-las, deve-se efetuar uma amostra 
aleatória de n latas para, após a medição de 
seus volumes, verificar se estes dados dão 
sustentação ou não ao volume esperado.
Testes Unilaterais e Bilaterais
Ho :  = 354 ml
H1 :   354 ml
Ho :  = 354 ml
H1 :  < 354 ml
ou
Ho :  = 354 ml
H1 :  > 354 ml
BILATERAL
UNILATERAL
IMPORTÂNCIA
NA DIFERENÇA
IMPORTÂNCIA NO 
SINAL DA DIFERENÇA
MENOR
MAIOR
interesse em mostrar que as latinhas contêm, em média, 
um volume MENOR / MAIOR que 354 ml. 
O que é um Teste de Hipóteses?
ESTUDO
DE UM
FENÔMENO
FORMULAÇÃO
DE 
HIPÓTESES
EVIDÊNCIA
AMOSTRAL
TESTE DE
HIPÓTESE
NÃO REJEITA
REJEITA
Teste de Hipóteses
• Um teste de hipóteses é um procedimento
ou uma regra de decisão que nos possibilita 
decidir por H0 ou H1, com base na informação 
contida na amostra.
Teste de Hipóteses 
• A hipótese nula será rejeitada em favor da 
hipótese alternativa somente se a evidência da 
amostra sugerir que H0 seja falsa.
• Se a amostra não contradisser fortemente H0, 
continuaremos a acreditar na hipótese nula.
• As duas conclusões possíveis de um teste de 
hipóteses são rejeitar H0 ou não rejeitar H0.
Aceitar/Não Rejeitar H0
• Não podemos aceitar nenhuma hipótese como 
verdadeira!!!
• Devemos reconhecer que não estamos 
provando a hipótese nula, estamos apenas 
dizendo que a evidência amostral não é forte o 
bastante para garantir a rejeição da hipótese 
nula.
Aceitar/Não Rejeitar H0
• Exemplo: Quando um júri não encontra 
evidência suficiente para condenar um suspeito, 
o veredito é de não culpado, não se dá um 
veredito de inocente.
• O termo aceitar é, de alguma forma, enganoso, 
porque parece implicar que a hipótese nula foi 
provada (É enganoso afirmar que há evidência 
suficiente para se aceitar a hipótese nula).
Aceitar/Não Rejeitar H0
• Caso a amostra coletada não contrarie a 
hipótese nula, a única afirmação que pode ser 
feita é a de que não existem evidências 
estatísticas suficientes para rejeitar H0. 
• Assim, a hipótese nula não é aceita. Ela é, 
tecnicamente falando, não rejeitada.
Teste de Significância
• Não existem evidências estatísticas suficientes 
para rejeitar H0 : teste estatisticamente não 
significativo.
• Existem evidências estatísticas suficientes para 
rejeitar H0 : teste estatisticamente significativo. 
• Teste de Hipóteses ou Teste de Significância.
Componentes de um Teste de 
Hipóteses
• Uma estatística de teste é uma função da 
amostra (variável aleatória) na qual a decisão 
(rejeitar ou não H0) se baseia.
• Valor da estatística de teste: uma função dos 
dados da amostra (número).
• A região de rejeição ou região crítica é o conjunto 
de todos os valores da estatística de teste para 
os quais H0 será rejeitada.
Componentes de um Teste de 
Hipóteses
• Observação: A hipótese nula será então 
rejeitada se, e somente se, o valor da estatística 
do teste calculado ou observado cair na região 
de rejeição.
Componentes de um Teste de 
Hipóteses
• Nível de Significância (denotado por ):
• É a probabilidade de rejeitar a hipótese nula 
quando ela é verdadeira.
• São comuns as escolhas 0,05; 0,01 e 0,10. É
tipicamente predeterminado.
Nível de Significância• O procedimento de teste correspondente é
chamado de teste nível  (um teste nível 5%, 
por exemplo).
Componentes de um Teste de 
Hipóteses
• Valores Críticos:
• Valor, ou valores, que separa(m) a região crítica 
dos valores da estatística de teste que não 
levam à rejeição da hipótese nula.
• Por exemplo:
Teste Bilateral
H0: µ = 100
H1: µ  100
Significa menor ou maior que
100
Valores que são significativamente distantes de 100
 é dividido igualmente
entre as duas caudas 
da região crítica
Não Rejeita H0Rejeita H0 Rejeita H0
Teste Unilateral Direito
H0: µ  100
H1: µ > 100
Valores que são 
significativamente 
distantes de 100100
Pontos à direita
Não rejeita H0 Rejeita H0
Teste Unilateral Esquerdo
H0: µ  100
H1: µ < 100
100
Valores que são
significativamente
distantes de 100
Pontos à
Esquerda
Não rejeita H0Rejeita H0
Erros em Teste de Hipóteses
Erro Tipo I: o erro de rejeitar a hipótese nula 
quando ela é verdadeira.
Erro Tipo II: o erro de deixar de rejeitar a hipótese 
nula quando ela é falsa.
Situação Decisões possíveis 
Hipótese nula é verdadeira Hipótese nula é falsa 
Não rejeição da hipótese nula Sem erro Erro Tipo II 
Rejeição da hipótese nula 
 
Erro Tipo I Sem erro 
 
Erros em Teste de Hipóteses
Verdadeiro Estado da Natureza
Decidimos rejeitar
a hipótese nula
Não rejeitamos a
hipótese nula
A hipótese
nula é
verdadeira
A hipótese
nula é
falsa
Erro tipo I
(rejeição de uma 
H0 verdadeira)

Erro tipo II
(não rejeição de 
uma Ho falsa)

Decisão
correta
Decisão
correta
Decisão
Erros em Teste de Hipóteses
• Notação:
– : probabilidade de um erro tipo I.
– : probabilidade de um erro tipo II.
Controle dos Erros Tipos I e II
• Dois tipos de erro podem ser cometidos num 
teste de hipóteses.
• Seria ótimo se pudéssemos ter sempre =0 e
=0, mas na realidade, isto não é possível, 
então devemos tentar administrar as 
probabilidades de erro  e .
• Procuramos procedimentos para o qual a 
probabilidade de cometer qualquer tipo de erro 
seja pequena.
Controle dos Erros Tipos I e II
• Matematicamente, pode-se mostrar que ,  e o 
tamanho amostral n estão todos relacionados, 
de modo que quando escolhemos ou 
determinamos quaisquer dois deles, o terceiro 
fica automaticamente determinado.
• A prática usual na pesquisa e na indústria é
selecionar os valores de  e n de modo que o 
valor de  fica determinado.
Controle dos Erros Tipos I e II
• Dependendo da gravidade do erro tipo I, tente 
usar o maior valor tolerável de .
• Para erros tipo I com conseqüências mais 
sérias, selecione valores menores de . 
• Escolha, então, um tamanho amostral n tão 
grande quanto razoável, com base em 
considerações de tempo, custo e outros fatores 
relevantes.
Considerações Práticas 
• Para qualquer  fixo, um aumento no tamanho 
amostral n causará um decréscimo em .
• Para qualquer tamanho amostral n fixo, um 
decréscimo em  causará um aumento em . 
Reciprocamente, um aumento em  causará um 
decréscimo em .
• Para diminuir tanto  como , aumente o 
tamanho da amostra.
Proposição
• Suponha que um experimento e o tamanho de 
uma amostra sejam fixos, e que seja escolhida 
uma estatística de teste. Então, reduzir o 
tamanho da região de rejeição para obter um 
menor valor de  resulta em um valor maior de 
para qualquer valor de parâmetro específico 
consistente com H1. 
Comentários
• Uma vez que a estatística de teste e n (tamanho 
da amostra) forem fixados, não há região de 
rejeição que tornará simultaneamente,  e 
todos os ’s pequenos.
• Uma região de rejeição deve ser escolhida para 
cumprir um compromisso entre  e .
Erros em Teste de Hipóteses
• Qual dos dois tipos de erro é o mais 
grave e que deve ser evitado?
Exemplo 1
• Façamos uma analogia com a decisão de um 
juiz: o que será mais grave? Condenar um 
inocente ou absolver um culpado? 
• É claro que será mais grave a condenação de 
um inocente. Rejeitar a hipótese nula sendo ela 
verdadeira equivale a condenar um inocente, 
logo o Erro Tipo I é o mais grave. 
Exemplo 2
• Estamos testando um novo medicamento 
(NEW) a ser utilizado no tratamento de AIDS. O 
tratamento já estabelecido é o AZT e a sua 
utilização prolonga o tempo de vida do paciente 
em média por k0 meses.
• O laboratório que produz NEW diz que seu 
medicamento é melhor e coletou informações 
de 12 pacientes.
Exemplo 2
• Note que um erro mais grave é dizer que o NEW 
é melhor que o AZT quando na realidade não é
(e todos os pacientes mudam para um tratamento 
menos eficaz), do que dizer que NEW não é
melhor que AZT quando na realidade ele é ( e 
todos os pacientes continuam com um tratamento 
que é comprovado).
Comentários
• Devido às diretrizes sugeridas para especificar 
H0 e H1, um erro tipo I geralmente é mais sério 
que um erro tipo II.
• A abordagem adotada será especificar o valor 
maior de  que pode ser tolerado e encontrar 
uma região de rejeição que tenha esse valor de 
. Isso torna  o menor possível, sujeito ao 
limite em .
Nível de Significância
• O valor resultante de  é denominado nível de 
significância do teste.
• Esse é o mesmo  introduzido na Unidade 
Estimação Intervalar, onde definimos o nível de 
confiança para um intervalo de confiança como 
a probabilidade γ= 1- . 
• O procedimento de teste correspondente é
chamado de teste nível  (um teste nível 5%, por 
exemplo).
Nível de Significância
• Os níveis tradicionais de significância são 0.10, 
0.05 e 0.01, embora o nível dependa da 
seriedade de um erro tipo I.
• Quanto mais sério for esse erro, menor deve ser 
o nível de significância.
Poder do Teste
• Usamos β para designar a probabilidade de 
deixarmos de rejeitar uma hipótese nula falsa 
(erro tipo II). 
• Segue que (1 − β) é a probabilidade de 
rejeitarmos uma hipótese nula falsa, isto é, a 
probabilidade de se apoiar uma hipótese 
alternativa verdadeira.
• O poder ou potência do teste é dado por (1 − β).
Poder do Teste
• A probabilidade do erro tipo II (β) pode ser 
calculada para cada valor do parâmetro 
consistente com a hipótese alternativa. 
• Conseqüentemente, um teste de hipóteses 
pode ter muitos valores diferentes de poder, 
dependendo dos valores particulares escolhidos 
como alternativas à hipótese nula.
Etapas de um Teste de 
Hipóteses
• Passo 1: Indique o parâmetro de interesse e 
descreva-o no contexto do problema.
• Passo 2: Determine o valor nulo (valor 
especificado) e a hipótese nula.
• Passo 3: Especifique a hipótese alternativa 
apropriada.
Etapas de um Teste de 
Hipóteses
• Passo 4: Valor da estatística de teste - uma 
função dos dados da amostra na qual a decisão (rejeitar 
ou não a hipótese nula) se baseia.
• Passo 5: Especifique a região de rejeição -
conjunto de todos os valores estatísticos do teste para 
os quais a hipótese nula será rejeitada.
A área da região de rejeição é igual ao nível de 
significância (), que estabelece a probabilidade 
de rejeitar Ho quando ela é verdadeira.
Etapas de um Teste de 
Hipóteses
• Unilateral à direita ou teste de 
cauda superior:
Ho:  = 50
H1:  > 50
• Unilateral à esquerda ou teste de 
cauda inferior: 
Ho:  = 50
H1:  <50
• Bilateral:
Ho:  = 50
H1:   50
 
Etapas de um Teste de 
Hipóteses
• Passo 6 : Decida se a hipótese nula deve ser 
rejeitada ou não e enuncie a conclusão no 
contexto do problema.
• Critérios de Decisão: 
– Método Tradicional
– Método do Valor P
– Método do Intervalo de Confiança
Intervalos de Confiança
• Um intervalo de confiança de um parâmetro 
contém os valores prováveis daquele 
parâmetro.• Devemos portanto, rejeitar uma afirmativa de 
que o parâmetro populacional tenha um valor 
que não esteja incluído no intervalo de 
confiança.
Método Tradicional
A hipótese nula será então rejeitada se, e 
somente se, o valor estatístico do teste 
calculado ou observado cair na região de 
rejeição (o valor da estatística de teste é comparado com o valor 
crítico).
Método do Valor P
• Similar ao método tradicional.
• A principal diferença é a maneira pela qual é
tomada a decisão para rejeitar a hipótese nula.
• O procedimento encontra a probabilidade 
(Valor P) de obter um resultado e deixamos a 
decisão para o leitor ou pesquisador.
Método do Valor P
• Rejeite a hipótese nula se o valor P for menor 
ou igual a .
• Deixe de rejeitar a hipótese nula se o valor P for 
maior que .
• Ao invés de usar um =0.05, por exemplo, 
simplesmente identificamos o valor P e 
deixamos a decisão para o leitor.
Valor P
• É a probabilidade de se obter um valor da 
estatística de teste que seja, no mínimo, tão 
extremo quanto aquele que representa os dados 
amostrais, supondo que a hipótese nula seja 
verdadeira.
Valores P grandes
Resultados amostrais 
não são incomuns. 
Não é uma diferença 
significante da hipótese 
nula.
Valores P pequenos
Resultados amostrais 
incomuns. Diferença 
significante da hipótese 
nula.
InterpretaçãoValor P
A
estatística de
teste está à direita ou 
à esquerda do
centro
?
Valor P = área
à esquerda da
estatística de teste
Valor P = 2 vezes
a área à esquerda
da estatística de teste
Valor P = área
à direita da
estatística de teste
Unilateral esquerdo Unilateral direito
À direitaÀ esquerda
Bilateral
Valor P = 2 vezes
a área à direita
da estatística de teste
Que
tipo de teste
?
µ µ µ µ
Valor P Valor P é duas
vezes esta área
Valor P
Estatística de teste Estatística de teste Estatística de teste Estatística de teste
Início
Valor P é duas
vezes esta área