Inferência Estatística_Teste de Hipóteses

•

UFOP

6

1

6

1

0

Estudante Graduação

23/09/2013

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 9 páginas

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Estatística I

56.868 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Teste de Hipóteses 
Estudaremos outro aspecto de inferência estatística: o Teste de Hipóteses. 
 
Objetivo: Decidir se uma conjectura sobre determinada característica de uma ou mais populações é, ou não, 
apoiada pela evidência obtida dos dados amostrais. Tal conjectura é o que se chama hipótese estatística, e a 
regra usada para decidir se ela é verdadeira ou não é o teste de hipótese. 
Os testes de hipóteses permitem-nos tomar decisões em presença da variabilidade, ou seja, verificar se estamos 
diante de uma diferença real (significativa) ou de uma diferença devida simplesmente à flutuação aleatória ao 
processo. 
 
Hipótese estatística: Uma hipótese estatística, que denotaremos por H, é qualquer afirmação sobre a população 
em estudo. 
Na formulação de um teste de hipóteses, duas hipóteses são definidas. A hipótese de investigação, Ha, 
denominada hipótese alternativa e a hipótese nula, H0, que consiste na negação de Ha. Então, o teste de 
hipóteses consiste numa regra de decisão entre H0 e Ha. Nesta regra de decisão são utilizadas as informações 
obtidas na amostra. 
 
Exemplo: 
1) Um pesquisador deseja estudar o efeito de certa substância no tempo de reação de seres vivos a um certo tipo 
de estímulo. Um experimento é desenvolvido com cobaias que são inoculadas com a substância e submetidas a 
um estímulo elétrico, com seus tempos de reação (em segundos) anotados. Admite-se que o tempo de reação 
segue, em geral, o modelo N(8 seg; 2 seg). O pesquisador desconfia, entretanto, que o tempo médio sofre 
alteração por influência da substância. 
Neste caso, as hipóteses de interesse são: 
H0: as cobaias apresentam tempo de reação padrão 
Ha: as cobaias apresentam tempo de reação alterado 
Em termos estatísticos, tais hipóteses envolvem o parâmetro  e podem ser escritas como: 
H0:  = 8,0 seg 
Ha:  ≠ 8,0 seg 
 
Por conveniência técnica, sempre, deixamos a igualdade na hipótese nula e em Ha a hipótese que desejamos 
investigar. 
Queremos decidir entre H0 e Ha. 
Em todo processo de decisão existe a chance de uma decisão errada. Neste processo de decisão dois tipos de 
erro são possíveis, como mostra o quadrado seguinte. 
 
Erros possíveis associados a teste de hipóteses 
 
 
Podemos rejeitar H0 quando H0 é verdadeira, que consiste no erro tipo I e podemos não rejeitar H0 quando H0 é 
falsa, que consiste no erro tipo II. 
No exemplo anterior, estes dois erros são: 
Erro tipo I: concluir que as cobaias apresentam tempo de reação alterado quando na verdade ele não é  concluir 
que  ≠ 8 quando na verdade  = 8. 
Erro tipo II: concluir que as cobaias apresentam tempo de reação padrão quando na verdade ele é  concluir que 
 = 8 quando na verdade  ≠ 18. 
 
As probabilidades do erro tipo I e do erro tipo II serem cometidos são, respectivamente: 
 = P(erro tipo I) = P(rejeitar H0 | H0 verdadeira) = nível de significância do teste 
 = P(erro tipo II) = P(não rejeitar H0 | H0 falsa) 
Os dois tipos de erro são indesejáveis. 
Para um tamanho de amostra fixo, isto é, coletados os dados, não é possível controlar os dois erros 
simultaneamente. 
Então, queremos encontrar uma regra de decisão entre H0 e Ha tal que o erro tipo I seja controlado. 
 
Vamos controlar este erro pré-fixando a probabilidade de sua ocorrência em um valor a pequeno. 
O valor de  é estabelecido pelo pesquisador. É usual trabalhar com valores de  menores ou iguais a 5%, sendo 
que o mais comum é o de 5% (a = 0,05). 
 
A capacidade de um teste identificar diferenças que realmente existem, ou seja, de rejeitar H0 quando é realmente 
falsa, é denominada poder do teste e é definida como 1 – . 
O poder do teste = P(rejeitar H0 | H0 falsa) = 1 – . 
 
Etapas para Testar uma Hipótese Estatística 
1. Definir a hipótese nula H0 e a hipótese alternativa Ha. 
2. Escolher a estatística de teste adequada. 
3. Escolher o nível de significância  e estabelecer a região crítica. 
4. Calcular o valor da estatística de teste com base em uma amostra de tamanho n extraída da população. 
5. Concluir. Rejeitar H0 se o valor calculado da estatística está na região crítica. Não rejeitar H0 em caso 
contrário. 
 
Uma forma alternativa de testar uma hipótese estatística – atualmente mais usada – é através da probabilidade de 
significância ou p-valor. 
 
O p-valor nos fornece a probabilidade, calculada supondo H0 verdadeira, de que ocorram valores tão ou mais 
extremos que o observado para a estatística de teste. Portanto, o p-valor (ou valor p) é o menor nível de 
significância que conduz à rejeição da hipótese nula H0, calculado com os dados amostrais. 
 
Se p-valor for menor do que o limite tolerável, , para a probabilidade do erro tipo I, decide-se por rejeitar H0. Ou 
seja, se p-valor <   rejeitar H0. 
 
Interpretações de p-valor: 
p  0,10 - Não existe evidência contra Ho (H0 não é rejeitada) 
p < 0,10 - Fraca evidência contra H0 (H0 não é rejeitada) 
p < 0,05 - Evidência significativa contra H0 (H0 é rejeitada) 
p < 0,01 - Evidência altamente significativa... 
p < 0,001 - Evidência muito altamente significativa... 
 
 
 
 
 
 
 
Exemplo: Suspeita-se de que o tempo gasto para a extração de minério utilizando-se uma nova técnica esta 
sendo maior do que o tempo gasto com a técnica padrão, que é em média 69,8 h. É sabido, de estudos anteriores, 
que o tempo gasto com a nova técnica tem distribuição normal com desvio-padrão de 1,86 h. Para verificar essa 
suspeita, foram feitas 50 extrações utilizando-se a nova técnica e o tempo gasto em cada uma delas foi medido, 
obtendo-se média igual a 70,59 h. 
Solução: 
Deseja-se testar se o tempo gasto com a nova técnica é superior ao tempo gasto com a técnica padrão. 
Isto é, queremos testar se: H0 :  = 69,8 versus Ha :  > 69,8 (teste unilateral direito). 
Temos que: s = 1,86, n = 50 
Como os dados são de uma distribuição normal com s conhecido usamos a estatística de teste Z. 
 
 
 
 
 
 
 
RC.: Zobs > z , para a = 0,05 RC.: Zobs > 1,64 
 
 
 
 
Logo, há evidências de que o tempo gasto para extração de minério com a nova técnica é maior que o tempo 
gasto com a técnica padrão, ao nível de significância  de 5%. 
 
p-valor = P(Z>3,00) = 0,5 - P(0<Z<3,00) = 0,5 - 0,4987 = 0,0013. Assim, a hipótese H0 de que o tempo gasto com 
a nova técnica não é superior ao tempo gasto com a técnica padrão (H :  = 69,8) seria rejeitada com qualquer 
nível de significância  maior que o valor p encontrado ( > 0,0013). 
Para  = 0,05, temos 0,0013 < 0,05  evidências muito altamente significativas contra H0 
 
00,3
50
86,1
80,69590,70  obsZ
n
XZ


Como Zobs > 1,64, conclui-se que 
existem evidências amostrais para se 
rejeitar Ho, ao nível de significância  = 
5%. 
 
 
 
 
 
 
Exemplo1: Um teste de resistência à ruptura feito em uma amostra de seis cordas acusou resistência média de 
3770 kg com desvio padrão de 66 kg. O fabricante afirma que seu produto tem resistência média superior a 3650 
kg. Considerando que a resistência à ruptura da população de cordas segue uma distribuição normal, pode-se 
justificar a alegação do fabricante, no nível de significância de 1%? 
 
O teste de interesse é: 
H0 : A alegação não é válida 
Ha : A alegação do fabricante é válida 
 
Isto é, 
H0 :  = 3650 versus Ha :  > 3650. 
 
Sendo 2 desconhecido usaremos o estimador S2. 
 
Assumindo que a amostra de 6 cordas é de uma população N( ; ), usaremos a estatística de teste T, pois  é 
desconhecido e n é pequeno 
 
 
 
 
 
 
 
 
RC.: Tobs > t ; n-1 
 
Para  = 0,01 e  = n - 1 = 6 - 1 = 5 graus de liberdade  t5, 0,01 = 3,365 (valor encontrado na tabela da distribuição 
t). 
RC.: Tobs > 3,365 
 
 
 
Portanto, como Tobs pertence à RC, decidimos pela rejeição da hipótese nula, ou seja, a alegação do fabricante é 
provável, ao nível de significância de 1%. 
 
p-valor = P(T > 4,45). Nesse casonão é possível, com a tabela t que temos, determinar exatamente o valor p. 
Podemos afirmar que é menor que 0,005 (probabilidade correspondente a t = 4,032 com 5 gl). Assim, a hipótese 
H0 seria rejeitada com qualquer nível de significância maior que o valor p. 
Considerando o nível de significância  = 0,01, rejeitamos H0, pois p < 0,01. 
 
Exemplo 2:Deseja-se investigar se uma moléstia que ataca o rim altera o consumo de oxigênio desse órgão. Para 
indivíduos sadios, admite-se que esse consumo tem distribuição Normal com média 12 cm3/min. Os valores 
medidos em 16 pacientes com a moléstia foram: 14,4; 12,9; 15,0; 13,7; 13,5; 14,6; 13,0; 13,7; 14,5; 14,8; 13,9; 
14,0; 14,3; 15,0; 13,3 e 12,9. Qual seria conclusão, ao nível de 1% de significância? 
O teste de interesse é: 
H0 : A moléstia não altera a média de consumo renal de oxigênio 
Ha : Indivíduos portadores da moléstia têm média de consumo renal de oxigênio alterada 
 
Isto é, 
H0 :  = 12 versus Ha :  ≠ 12. 
 
Sendo 2 desconhecido usaremos o estimador S2. 
 
 
 
 
 
   
11
22
2





 
n
xxS
n
xxS ii
n
s
XT 
66 3770  SX
45,4
666
36503770


obsT
Assumindo que a amostra de 16 pacientes é de uma população N( ; ), usaremos a estatística de teste T. 
 
 
 
 
 
 
 
p-valor = 2P(T>|Tobs|) = 2P(T>|10,893|) , olhando na tabela t, para  = 15, temos que o valor de p será muito menor 
que 0,005, pois o maior valor de t, na tabela, é 2,947. p deve ser  0. Assim, a hipótese H0 seria rejeitada com 
qualquer nível de significância  
 
Suponha que o interesse do pesquisador, no exemplo anterior, era verificar se a moléstia que ataca o rim aumenta 
o consumo de oxigênio desse órgão. 
 
O teste realizado nesse caso é o unilateral direito. 
 
H0 :  = 12 Ha :  > 12. 
 
RC.: Tobs > t ; n-1 
 
Para  = 0,01 e n = 15  t0,01 ; 15 = 2,602 , RC.: Tobs > 2,602 
 
 
 
 
 
p-valor = P(T > 10,893) << 0,005, pela tabela da distribuição t de Student com 15 graus de liberdade. Assim, a 
hipótese H0 seria rejeitada com qualquer nível de significância  
 
Ou, como Tobs = 10,893 pertence à região crítica, H0 é rejeitada ao nível de significância de 1%. Isto é, os dados 
confirmam a hipótese de que a moléstia aumenta o consumo médio de oxigênio no rim, ao nível de significância  
= 0,01. 
n
s
XT 
893,10
16723,0
12969,13


obsT
 
 
 
 
 
 
Exemplo: Um laboratório farmacêutico introduz no mercado um novo comprimido contra dor de cabeça, retirando 
de circulação o antigo, com a justificativa de que o novo produto tem ação mais rápida. O remédio que estava no 
mercado tem um tempo médio de 37 minutos para o início do efeito. Em uma amostra de 34 pessoas que 
tomaram o novo comprimido, obteve-se um tempo médio de 36 minutos, com desvio padrão de 4 minutos. Ao 
nível de significância de 5% podemos afirmar que o novo comprimido tem ação mais rápida? 
Solução: 
H0 :  = 37 (o novo comprimido não é melhor que o antigo) 
Ha :  < 37 ( o novo comprimido tem ação mais rápida que o antigo) 
Estamos diante de uma situação em que não conhecemos a distribuição, mas o tamanho da amostra, n = 34, 
pode ser considerada grande. Devemos, pois, usar o Teorema Central do Limite. 
 
 
Pela tabela da distribuição Normal, z0,05 = -1,64. Então, a RC é dada por: Z < -1,64. 
O valor de Z calculado, Zobs, com base na amostra não está na região de rejeição, RC. Logo, não rejeitamos H0 e 
concluímos que o tempo médio de ação do novo comprimido não é inferior ao tempo médio de ação do 
comprimido que estava no mercado, ao nível  = 0,05. 
 
Utilizando o p valor, teríamos: p = P(Z < -1,46) = 0,5 - 0,4279 = 0,0721. Assim, a hipótese H0 seria rejeitada com 
qualquer nível de significância 0,0721 Para o nível de significância  = 0,05, temos que p > 0,05, portanto não 
rejeitamos H0. 
 
 
 
 
 
 
 
 
 
 
 
 
Exemplo: Um modelo genético sugere que 80% das plantas oriundas do cruzamento de dois tipos de sementes 
serão da variedade anã. Após observar o crescimento de 200 destas plantas, constatou-se que 144 eram anãs. 
Os dados contradizem o modelo genético? 
Solução: 
Sejam p a proporção de plantas da variedade anã e p0 a proporção sugerida pelo modelo genético. As hipóteses 
são: 
 
H0: p = p0 isto é H0: p = 0,80 
Ha : p  p0 isto é Ha: p  0,80 
 
 
 
 
 
Estatística de teste: 
 
 
 
RC.: Zobs < - Z /2 ou Zobs > Z/2., 
 
Para  = 0,05, temos, pela tabela, Z/2 = 1,96  RC.: Zobs < -1,96 ou Zobs > 1,96. 
 
Como Zobs < -1,96, ao nível de significância de 5% rejeitamos a hipótese nula, ou seja, os dados contradizem o 
modelo genético. 
 
P-valor = 2P(Z>|2,83|) = 2.P(Z>2,83) = 2(0,5 – 0,4977) = 2.(0,0023) = 0,0046. A hipótese H0 seria rejeitada com 
qualquer nível de significância 0,0046 Portanto, os dados mostram fortes evidências contra H0, contra o 
modelo genético.
 
 
 
 
 
72,0
200
144ˆ p
0,72 0,80 2,83
0,80.0, 20
200
obsZ

  