AULA 16 - Teste de hipótese

•

UFRN

Jardel Rocha

04.08.2014

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 44 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 44 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 44 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Estatística para Engenharia de Produção

73 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Universidade Federal do Rio Grande do Norte
Centro de Tecnologia - CT
Departamento de Engenharia de Produção
ESTATÍSTICA PARA ENGENHARIA
DE PRODUÇÃO
Prof. Luciano Queiroz
Natal/RN 20/03/14
Sumário
 Inferência estatística
 Teste de hipótese
 Como calcular as probabilidades de se cometer os erros 𝜶 𝒆 𝜷 ?
 Como estabelecer uma regra de decisão que leve à rejeição da
hipótese nula?
 Os conceitos e cálculos serão ilustrados com um exemplo dos
conteúdos de duas sacolas com aparências idênticas.
Calculando 𝜶 𝒆 𝜷
 Há duas sacolas idênticas, sacola A e sacola B. Cada uma tem vinte
cupons, e os valores dos cupons diferem bastante de acordo com a
sacola. Os valores e as respectivas frequências são mostrados na Tabela
1.2 e na Figura 1.4.
Exemplo da Sacola
Exemplo da Sacola
 Suponha que você concordou em participar de um jogo no qual você
recebe a quantia total da sacola, isto é, ganha R$1.890 se for a sacola B
ou paga R$560 se for a sacola A. É claro que ninguém quer a sacola A.
Apenas uma sacola será mostrada a você, e com base em uma
amostra do conteúdo da sacola, você terá que decidir se quer ficar
com essa sacola ou se você prefere a outra sacola.
 Sem olhar o conteúdo da sacola, uma amostra de tamanho um (n = 1)
será retirada. A seleção do cupom será feita após misturar bem o
conteúdo da sacola, para garantir igual probabilidade para todos os
vinte cupons.
Exemplo da Sacola
 Com base no procedimento acima, você deverá tomar uma decisão
baseada nas seguintes hipóteses:
 H0: A sacola da qual você retirou o cupom é a sacola A.
 H1: A sacola da qual você retirou o cupom é a sacola B.
 Observação: Escolhe-se a sacola A para a hipótese nula porque é a
sacola indesejada.
Exemplo da Sacola
 Quais são os dois tipos de erros que se pode cometer ao se decidir por
uma dessas duas hipóteses?
 Erro do tipo I = rejeitar H0 quando H0 é verdadeira = você decide que a
sacola mostrada é a sacola B, quando na verdade é a sacola A.
 Erro do tipo II = não rejeitar H0 quando H1 é verdadeira = você decide
que a sacola mostrada é a sacola A, quando na verdade é a sacola B.
Exemplo da Sacola
 Como se pode montar um procedimento de decisão, com base em
apenas uma observação, que auxiliará na escolha de H0 ou em sua
rejeição?
 Considere, primeiro, as situações óbvias e que não levam a cometer erro
algum. Se o cupom selecionado for de -R$1.000, então a sacola
mostrada é a sacola A, pois é a única que contém tal valor. Portanto,
não se rejeita H0. Da mesma forma, se o cupom selecionado for de
R$1.000, a sacola mostrada é a sacola B, e rejeita-se H0.
Exemplo da Sacola
 Para pensar!
 Suponha que o valor do cupom selecionado fosse de R$60? Essa
observação o levaria a crer que a sacola mostrada é a A ou a B?
 Por que?
 Como você responderia essas perguntas se o valor do cupom fosse de
R$10?
 Na discussão anterior, uma regra de decisão está sendo formada. Em
estatística uma regra de decisão tem um significado próprio.
Exemplo da Sacola
 Definição 1.9: Uma regra de decisão é uma regra formal que, baseando-
se nos dados observados, indica quando rejeitar a hipótese nula.
Normalmente a regra de decisão especifica um conjunto de valores que
são incompatíveis com H0.
Definição
 Observe no exemplo das sacolas como se poderia estabelecer uma
regra de decisão para auxiliar na escolha das hipóteses em questão. A
escolha será feita com base em quão provável é um evento de ser
observado. Em outras palavras, precisa-se estabelecer quais são as
probabilidades de sair cada valor dos cupons, de forma que a seleção
seja feita de forma completamente aleatória sem privilegiar nenhum
cupom.
 As probabilidades por sacolas são mostradas na Tabela a seguir.
Regra de decisão
Regra de decisão
 Chama-se a atenção para algumas características das distribuições de
probabilidades para as sacolas na Tabela 1.3. Os cupons com valores de
R$30 e R$40 têm a mesma probabilidade de seleção,
independentemente da sacola. Já os cupons de R$10, R$20, R$50 e R$60
dão alguma evidência das suas procedências.
 Por exemplo, se o cupom de R$10 ou R$20 forem selecionados, as
probabilidades de serem da sacola A são muito maiores. Portanto,
dever-se-ia concluir que a sacola mostrada é a A.
Regra de decisão
 Usando o mesmo raciocínio, se os cupons selecionados forem os de R$50
ou R$60 dever-se-ia concluir que a sacola mostrada é a B, uma vez que
as probabilidades de seleção desses valores na sacola B são bem
maiores que na sacola A.
 No cenário acima, os valores mais altos dos cupons sugerem que a
sacola mostrada é a sacola B, pois a seleção desses valores na sacola B
é bem mais provável que na sacola A. Em estatística os valores que
levam à rejeição de H0 são chamados extremos.
Regra de decisão
 Definição 1.10: Direção extrema é a direção dos valores que estabelece
a menor plausibilidade para sustentar a hipótese nula.
Definição
 Rejeitar H0 se os valores observados forem ≥ R$60. Para toda regra de
decisão há um valor crítico que, a partir do qual, se estabelece uma
correspondente região de rejeição, ver Figura 1.5.
Regra de Decisão 1
Regra de decisão 1
 No exemplo das sacolas, considerando a regra de decisão 1, a região
de rejeição compreenderia os cupons com valores iguais a R$60 e a
R$1.000, e o correspondente valor crítico seria de R$60. Como já foi
discutido, é possível que um erro seja cometido ao se utilizar uma regra
de decisão. Calcula-se a seguir as probabilidades de se cometer os erros
do tipo I e II quando a regra de decisão 1 é escolhida.
 H0: A sacola da qual você retirou o cupom é a sacola A.
 H1: A sacola da qual você retirou o cupom é a sacola B.
Regra de Decisão 1
 Como o erro do tipo I pode ocorrer apenas quando H0 é verdadeira,
observam-se os valores na Figura 1.6 (a).
 𝛼 = a probabilidade de rejeitar H0 quando H0 é verdadeira = a
probabilidade de selecionar um cupom de R$60 ou de R$1.000 da
sacola A = 0,05.
Regra de Decisão 1
 Como o erro do tipo II pode ocorrer apenas quando H1 é verdadeira,
observam-se os valores na Figura 1.6 (b).
 𝛽 = a probabilidade de não rejeitar H0 quando H1 é verdadeira = a
probabilidade de selecionar um cupom de -R$1.000 ou de R$10 ou de
R$20 ou de R$30 ou de R$40 ou de R$50 da sacola B = 0,60.
Regra de Decisão 1
 O nível de significância 𝛼 = 0,05 é um valor pequeno, em contraste, 𝛽 =
0,60 é um valor bastante grande. Você está satisfeito(a) com esses níveis
𝜶 𝒆 𝜷? Você não gostaria que ambos fossem ainda menores? Há várias
regras de decisão, e é claro que a e b dependerão da regra utilizada.
 Existe uma relação entre 𝜶 𝒆 𝜷. Mostra-se a seguir mais duas regras para
melhor compreensão de como 𝜶 𝒆 𝜷 estão relacionados.
 Como se pode observar na regra de decisão 1, 𝛽 tinha um valor
bastante expressivo devido à pequena área de rejeição. A seguir
aumentar-se-á a área de rejeição para se ter uma postura menos estrita.
Regra de Decisão 1
 Rejeitar H0 se os valores observados forem ≥ R$50.
 𝛼 = a probabilidade de rejeitar H0 quando H0 é verdadeira = a
probabilidade de selecionar um cupom de R$50 ou de R$60 ou de
R$1.000 da sacola A = 0,10.
Regra de Decisão 2
 Rejeitar H0 se os valores observados forem ≥ R$50.
 𝛽 = a probabilidade de não rejeitar H0 quando H1 é verdadeira = a
probabilidade de selecionar um cupom de R$-1.000 ou de R$10 ou de
R$20 ou de R$30 ou de R$40 da sacola B = 0,30.
Regra de Decisão 2
 Rejeitar H0 se os valores observados forem ≥ R$50.
 Assim, aumentando a região de rejeição, a probabilidade de se
cometer o erro do tipo I, a, aumentoue a probabilidade do erro do tipo
II, b, diminuiu.
Regra de Decisão 2
 Rejeitar H0 se os valores observados forem ≥ R$40.
 ∝ = a probabilidade de rejeitar H0 quando H0 é verdadeira = a
probabilidade de selecionar um cupom de R$40 ou de R$50 ou de R$60
ou de R$1.000 da sacola A= 0,20.
Regra de Decisão 3
 Rejeitar H0 se os valores observados forem ≥ R$40.
 𝛽 = a probabilidade de não rejeitar H0 quando H1 é verdadeira = a
probabilidade de selecionar um cupom de R$-1.000 ou de R$10 ou de
R$20 ou de R$30 da sacola B = 0,20.
Regra de Decisão 3
 Rejeitar H0 se os valores observados forem ≥ R$40.
 Pela segunda vez, um novo aumento da região de rejeição levou a um
aumento da probabilidade do erro do tipo I e uma consequente
diminuição da probabilidade do erro do tipo II.
Regra de Decisão 3
Resumo
 Para um valor fixo de 𝛼, o melhor teste será aquele que tem o menor
valor de 𝛽. Equivalentemente, para um valor fixo de 𝛼, o melhor teste
será aquele que possui o maior poder.
 O poder do teste também depende do nível de significância 𝛼 do teste.
Para um tamanho de amostra fixo, quanto maior o valor de 𝛼, o valor de
𝛽 tende a diminuir e, assim, o poder do teste tende a aumentar.
 Em geral, os pesquisadores preferem um teste que tenha poder mais
elevado dentre os testes com o mesmo 𝛼. Existe, portanto, uma relação
entre 𝛼 e 1- 𝛽.
Observação
 Dessa forma, deve ficar claro que as probabilidades dos erros se
movimentam em sentidos contrários. Portanto, não é possível diminuir ao
mesmo tempo as probabilidades de se cometer os dois tipos de erro. Em
suma, terá que haver um comprometimento.
Relação 𝜶 e 𝜷
 Vimos que se pode rejeitar ou não uma hipótese usando um nível de
significância 𝛼 , um valor crítico e uma correspondente região de
rejeição, que é a abordagem clássica. A seguir, será apresentada outra
maneira equivalente e bastante comum, na literatura científica, de se
obter o mesmo resultado final.
 Observação: A abordagem mostrada aqui foi a de calcular o nível de
significância 𝛼 e 𝛽 , depois de estabelecido um valor crítico. Outra
maneira de se fazer seria exatamente o oposto, isto é, dado um nível de
significância 𝛼 estabelecer o valor crítico correspondente. Uma vez
determinado o valor crítico calcula-se então 𝛽.
Valor P
 Suponha que um cupom foi selecionado. A questão é: se H0 é de fato
verdadeira (a sacola mostrada é a A) quão provável é a seleção do
cupom observado? Que tal calcular-se quão provável é a seleção do
cupom observado ou valores mais extremos, o que daria ainda mais
evidências contra H0?
 No exemplo das sacolas, valores mais altos dão indícios contra H0, por
conseguinte, nesta situação os valores altos são os valores extremos.
Calcula-se, portanto, as probabilidades de se observar o valor
selecionado ou ainda valores mais altos, usando a suposição de que H0
é verdadeira.
Valor P
 Definição 1.13: O valor-p é a probabilidade de encontrar o valor
observado na amostra ou valores mais extremos, assumindo que a
hipótese nula, H0, é verdadeira.
 Observação: Quanto menor for o valor-p, mais forte será a evidência
fornecida pela amostra contra H0. Por outro lado, quanto maior for o
valor-p, menor será a evidência contra H0.
Definição
 Valor-p, valor observado = R$30 e 𝛼 = 0,10.
 Suponha que o cupom selecionado seja o de R$30. O valor-p será a
probabilidade de observar valores maiores ou iguais a R$30 na sacola A
(assumindo H0 verdadeira). Olhando o gráfico de frequências, constata-
se que seis cupons têm valores ≥ R$30. Isso leva a um valor-p = 6/20 =
0,30, que é maior que o nível de significância de 0,10. Observa-se
também que o valor selecionado não está dentro da região de rejeição
associada ao 𝛼 = 0,10. Portanto, valor-p > 𝛼 leva a não rejeição de H0.
Exemplo da sacola
Exemplo da sacola
 Valor-p, valor observado = R$60 e 𝛼 = 0,10
 Suponha agora que o cupom selecionado seja o de R$60. O valor-p será
a probabilidade de observar valores maiores ou iguais a R$60 na sacola
A (assumindo H0 verdadeira). Olhando o gráfico de frequências,
constata-se que um cupom tem valor ≥ R$60. Isso leva a um valor-p =
1/20 = 0,05, que é menor que o nível de significância de 0,10. Observa-se
dessa vez que o valor selecionado está dentro da região de rejeição
associada ao a = 0,10. Portanto, valor-p < 𝛼 leva à rejeição de H0.
Exemplo da sacola
Exemplo da sacola
 Seguindo o mesmo procedimento resume-se na Tabela as informações
da abordagem clássica e a abordagem do valor-p para diferentes
valores observados.
Exemplo da sacola
 Se valor-p ≤ 𝛼 -> rejeita-se H0 e os dados SÃO estatisticamente
significantes.
 Se valor-p > 𝛼 -> não se rejeita H0 e os dados NÃO SÃO estatisticamente
significantes.
Relação entre valor-p e 𝜶
 É de fundamental importância diferenciar entre ANTES de se observar os
dados e estabelecer uma regra de decisão, e DEPOIS de se observar os
dados e tomar uma decisão. Antes de se observar os dados pode-se
estabelecer uma regra de decisão e calcular o respectivo nível de
significância 𝛼 . Quando a regra de decisão 1 foi utilizada, o 𝛼
correspondente era de 0,10. O 𝛼 = 0,10 será a probabilidade de se
cometer um erro segundo o processo utilizado.
 Depois que se observar a amostra, a decisão do pesquisador pode estar
certa ou pode estar errada. Logo, a probabilidade de se ter cometido
um erro, uma vez observada a amostra, é igual a zero ou igual a 1.
Observação importante
 De acordo com um estudo conduzido pela American College of Sports Medicine
Journal e Science in Sports and Exercise, homens que se exercitam enquanto ingerem
suplemento de cromo não ficam mais fortes que os homens que não tomam esse
suplemento. Dezesseis homens foram monitorados durante o estudo. Metade deles
recebeu o suplemento de cromo e a outra metade recebeu um placebo (substância
sem efeito). No final do programa de treinamento ambos os grupos ficaram mais fortes,
mas não houve diferença estatística entre os ganhos de força para os dois grupos.
 Considere as seguintes hipóteses:
 H0: Não há diferença de ganho de força entre os dois grupos.
 H1: O grupo que recebeu o suplemento de cromo tem um ganho de força maior.
 Baseado no estudo acima, qual hipótese foi escolhida?
 O valor-p para testar as hipóteses acima foi pequeno o suficiente? Justifique a sua
resposta.
Exercício 1.4
Exercício 1.5
 A Tabela 1.6 abaixo resume as hipóteses, e os resultados para três diferentes estudos.
 (a) Para qual dos três estudos há mais suporte para sustentar a hipótese nula?
 (b) Suponha que o estudo A tenha concluído pela hipótese de que o tempo médio de
vida é < 54 meses, mas a hipótese verdadeira é de que o tempo médio de vida é ≥ 54
meses. Na linguagem estatística (“estatisquês”) qual seria esse tipo de erro (I ou II)?
 (c) Se o resultado do estudo C não fosse estatisticamente significante, que hipótese
você teria escolhido?
Exercício 1.5