Baixe o app para aproveitar ainda mais
Prévia do material em texto
Teste de Hipóteses Estudaremos outro aspecto de inferência estatística: o Teste de Hipóteses. Objetivo: Decidir se uma conjectura sobre determinada característica de uma ou mais populações é, ou não, apoiada pela evidência obtida dos dados amostrais. Tal conjectura é o que se chama hipótese estatística, e a regra usada para decidir se ela é verdadeira ou não é o teste de hipótese. Os testes de hipóteses permitem-nos tomar decisões em presença da variabilidade, ou seja, verificar se estamos diante de uma diferença real (significativa) ou de uma diferença devida simplesmente à flutuação aleatória ao processo. Hipótese estatística: Uma hipótese estatística, que denotaremos por H, é qualquer afirmação sobre a população em estudo. Na formulação de um teste de hipóteses, duas hipóteses são definidas. A hipótese de investigação, Ha, denominada hipótese alternativa e a hipótese nula, H0, que consiste na negação de Ha. Então, o teste de hipóteses consiste numa regra de decisão entre H0 e Ha. Nesta regra de decisão são utilizadas as informações obtidas na amostra. Exemplo: 1) Um pesquisador deseja estudar o efeito de certa substância no tempo de reação de seres vivos a um certo tipo de estímulo. Um experimento é desenvolvido com cobaias que são inoculadas com a substância e submetidas a um estímulo elétrico, com seus tempos de reação (em segundos) anotados. Admite-se que o tempo de reação segue, em geral, o modelo N(8 seg; 2 seg). O pesquisador desconfia, entretanto, que o tempo médio sofre alteração por influência da substância. Neste caso, as hipóteses de interesse são: H0: as cobaias apresentam tempo de reação padrão Ha: as cobaias apresentam tempo de reação alterado Em termos estatísticos, tais hipóteses envolvem o parâmetro e podem ser escritas como: H0: = 8,0 seg Ha: ≠ 8,0 seg Por conveniência técnica, sempre, deixamos a igualdade na hipótese nula e em Ha a hipótese que desejamos investigar. Queremos decidir entre H0 e Ha. Em todo processo de decisão existe a chance de uma decisão errada. Neste processo de decisão dois tipos de erro são possíveis, como mostra o quadrado seguinte. Erros possíveis associados a teste de hipóteses Podemos rejeitar H0 quando H0 é verdadeira, que consiste no erro tipo I e podemos não rejeitar H0 quando H0 é falsa, que consiste no erro tipo II. No exemplo anterior, estes dois erros são: Erro tipo I: concluir que as cobaias apresentam tempo de reação alterado quando na verdade ele não é concluir que ≠ 8 quando na verdade = 8. Erro tipo II: concluir que as cobaias apresentam tempo de reação padrão quando na verdade ele é concluir que = 8 quando na verdade ≠ 18. As probabilidades do erro tipo I e do erro tipo II serem cometidos são, respectivamente: = P(erro tipo I) = P(rejeitar H0 | H0 verdadeira) = nível de significância do teste = P(erro tipo II) = P(não rejeitar H0 | H0 falsa) Os dois tipos de erro são indesejáveis. Para um tamanho de amostra fixo, isto é, coletados os dados, não é possível controlar os dois erros simultaneamente. Então, queremos encontrar uma regra de decisão entre H0 e Ha tal que o erro tipo I seja controlado. Vamos controlar este erro pré-fixando a probabilidade de sua ocorrência em um valor a pequeno. O valor de é estabelecido pelo pesquisador. É usual trabalhar com valores de menores ou iguais a 5%, sendo que o mais comum é o de 5% (a = 0,05). A capacidade de um teste identificar diferenças que realmente existem, ou seja, de rejeitar H0 quando é realmente falsa, é denominada poder do teste e é definida como 1 – . O poder do teste = P(rejeitar H0 | H0 falsa) = 1 – . Etapas para Testar uma Hipótese Estatística 1. Definir a hipótese nula H0 e a hipótese alternativa Ha. 2. Escolher a estatística de teste adequada. 3. Escolher o nível de significância e estabelecer a região crítica. 4. Calcular o valor da estatística de teste com base em uma amostra de tamanho n extraída da população. 5. Concluir. Rejeitar H0 se o valor calculado da estatística está na região crítica. Não rejeitar H0 em caso contrário. Uma forma alternativa de testar uma hipótese estatística – atualmente mais usada – é através da probabilidade de significância ou p-valor. O p-valor nos fornece a probabilidade, calculada supondo H0 verdadeira, de que ocorram valores tão ou mais extremos que o observado para a estatística de teste. Portanto, o p-valor (ou valor p) é o menor nível de significância que conduz à rejeição da hipótese nula H0, calculado com os dados amostrais. Se p-valor for menor do que o limite tolerável, , para a probabilidade do erro tipo I, decide-se por rejeitar H0. Ou seja, se p-valor < rejeitar H0. Interpretações de p-valor: p 0,10 - Não existe evidência contra Ho (H0 não é rejeitada) p < 0,10 - Fraca evidência contra H0 (H0 não é rejeitada) p < 0,05 - Evidência significativa contra H0 (H0 é rejeitada) p < 0,01 - Evidência altamente significativa... p < 0,001 - Evidência muito altamente significativa... Exemplo: Suspeita-se de que o tempo gasto para a extração de minério utilizando-se uma nova técnica esta sendo maior do que o tempo gasto com a técnica padrão, que é em média 69,8 h. É sabido, de estudos anteriores, que o tempo gasto com a nova técnica tem distribuição normal com desvio-padrão de 1,86 h. Para verificar essa suspeita, foram feitas 50 extrações utilizando-se a nova técnica e o tempo gasto em cada uma delas foi medido, obtendo-se média igual a 70,59 h. Solução: Deseja-se testar se o tempo gasto com a nova técnica é superior ao tempo gasto com a técnica padrão. Isto é, queremos testar se: H0 : = 69,8 versus Ha : > 69,8 (teste unilateral direito). Temos que: s = 1,86, n = 50 Como os dados são de uma distribuição normal com s conhecido usamos a estatística de teste Z. RC.: Zobs > z , para a = 0,05 RC.: Zobs > 1,64 Logo, há evidências de que o tempo gasto para extração de minério com a nova técnica é maior que o tempo gasto com a técnica padrão, ao nível de significância de 5%. p-valor = P(Z>3,00) = 0,5 - P(0<Z<3,00) = 0,5 - 0,4987 = 0,0013. Assim, a hipótese H0 de que o tempo gasto com a nova técnica não é superior ao tempo gasto com a técnica padrão (H : = 69,8) seria rejeitada com qualquer nível de significância maior que o valor p encontrado ( > 0,0013). Para = 0,05, temos 0,0013 < 0,05 evidências muito altamente significativas contra H0 00,3 50 86,1 80,69590,70 obsZ n XZ Como Zobs > 1,64, conclui-se que existem evidências amostrais para se rejeitar Ho, ao nível de significância = 5%. Exemplo1: Um teste de resistência à ruptura feito em uma amostra de seis cordas acusou resistência média de 3770 kg com desvio padrão de 66 kg. O fabricante afirma que seu produto tem resistência média superior a 3650 kg. Considerando que a resistência à ruptura da população de cordas segue uma distribuição normal, pode-se justificar a alegação do fabricante, no nível de significância de 1%? O teste de interesse é: H0 : A alegação não é válida Ha : A alegação do fabricante é válida Isto é, H0 : = 3650 versus Ha : > 3650. Sendo 2 desconhecido usaremos o estimador S2. Assumindo que a amostra de 6 cordas é de uma população N( ; ), usaremos a estatística de teste T, pois é desconhecido e n é pequeno RC.: Tobs > t ; n-1 Para = 0,01 e = n - 1 = 6 - 1 = 5 graus de liberdade t5, 0,01 = 3,365 (valor encontrado na tabela da distribuição t). RC.: Tobs > 3,365 Portanto, como Tobs pertence à RC, decidimos pela rejeição da hipótese nula, ou seja, a alegação do fabricante é provável, ao nível de significância de 1%. p-valor = P(T > 4,45). Nesse casonão é possível, com a tabela t que temos, determinar exatamente o valor p. Podemos afirmar que é menor que 0,005 (probabilidade correspondente a t = 4,032 com 5 gl). Assim, a hipótese H0 seria rejeitada com qualquer nível de significância maior que o valor p. Considerando o nível de significância = 0,01, rejeitamos H0, pois p < 0,01. Exemplo 2:Deseja-se investigar se uma moléstia que ataca o rim altera o consumo de oxigênio desse órgão. Para indivíduos sadios, admite-se que esse consumo tem distribuição Normal com média 12 cm3/min. Os valores medidos em 16 pacientes com a moléstia foram: 14,4; 12,9; 15,0; 13,7; 13,5; 14,6; 13,0; 13,7; 14,5; 14,8; 13,9; 14,0; 14,3; 15,0; 13,3 e 12,9. Qual seria conclusão, ao nível de 1% de significância? O teste de interesse é: H0 : A moléstia não altera a média de consumo renal de oxigênio Ha : Indivíduos portadores da moléstia têm média de consumo renal de oxigênio alterada Isto é, H0 : = 12 versus Ha : ≠ 12. Sendo 2 desconhecido usaremos o estimador S2. 11 22 2 n xxS n xxS ii n s XT 66 3770 SX 45,4 666 36503770 obsT Assumindo que a amostra de 16 pacientes é de uma população N( ; ), usaremos a estatística de teste T. p-valor = 2P(T>|Tobs|) = 2P(T>|10,893|) , olhando na tabela t, para = 15, temos que o valor de p será muito menor que 0,005, pois o maior valor de t, na tabela, é 2,947. p deve ser 0. Assim, a hipótese H0 seria rejeitada com qualquer nível de significância Suponha que o interesse do pesquisador, no exemplo anterior, era verificar se a moléstia que ataca o rim aumenta o consumo de oxigênio desse órgão. O teste realizado nesse caso é o unilateral direito. H0 : = 12 Ha : > 12. RC.: Tobs > t ; n-1 Para = 0,01 e n = 15 t0,01 ; 15 = 2,602 , RC.: Tobs > 2,602 p-valor = P(T > 10,893) << 0,005, pela tabela da distribuição t de Student com 15 graus de liberdade. Assim, a hipótese H0 seria rejeitada com qualquer nível de significância Ou, como Tobs = 10,893 pertence à região crítica, H0 é rejeitada ao nível de significância de 1%. Isto é, os dados confirmam a hipótese de que a moléstia aumenta o consumo médio de oxigênio no rim, ao nível de significância = 0,01. n s XT 893,10 16723,0 12969,13 obsT Exemplo: Um laboratório farmacêutico introduz no mercado um novo comprimido contra dor de cabeça, retirando de circulação o antigo, com a justificativa de que o novo produto tem ação mais rápida. O remédio que estava no mercado tem um tempo médio de 37 minutos para o início do efeito. Em uma amostra de 34 pessoas que tomaram o novo comprimido, obteve-se um tempo médio de 36 minutos, com desvio padrão de 4 minutos. Ao nível de significância de 5% podemos afirmar que o novo comprimido tem ação mais rápida? Solução: H0 : = 37 (o novo comprimido não é melhor que o antigo) Ha : < 37 ( o novo comprimido tem ação mais rápida que o antigo) Estamos diante de uma situação em que não conhecemos a distribuição, mas o tamanho da amostra, n = 34, pode ser considerada grande. Devemos, pois, usar o Teorema Central do Limite. Pela tabela da distribuição Normal, z0,05 = -1,64. Então, a RC é dada por: Z < -1,64. O valor de Z calculado, Zobs, com base na amostra não está na região de rejeição, RC. Logo, não rejeitamos H0 e concluímos que o tempo médio de ação do novo comprimido não é inferior ao tempo médio de ação do comprimido que estava no mercado, ao nível = 0,05. Utilizando o p valor, teríamos: p = P(Z < -1,46) = 0,5 - 0,4279 = 0,0721. Assim, a hipótese H0 seria rejeitada com qualquer nível de significância 0,0721 Para o nível de significância = 0,05, temos que p > 0,05, portanto não rejeitamos H0. Exemplo: Um modelo genético sugere que 80% das plantas oriundas do cruzamento de dois tipos de sementes serão da variedade anã. Após observar o crescimento de 200 destas plantas, constatou-se que 144 eram anãs. Os dados contradizem o modelo genético? Solução: Sejam p a proporção de plantas da variedade anã e p0 a proporção sugerida pelo modelo genético. As hipóteses são: H0: p = p0 isto é H0: p = 0,80 Ha : p p0 isto é Ha: p 0,80 Estatística de teste: RC.: Zobs < - Z /2 ou Zobs > Z/2., Para = 0,05, temos, pela tabela, Z/2 = 1,96 RC.: Zobs < -1,96 ou Zobs > 1,96. Como Zobs < -1,96, ao nível de significância de 5% rejeitamos a hipótese nula, ou seja, os dados contradizem o modelo genético. P-valor = 2P(Z>|2,83|) = 2.P(Z>2,83) = 2(0,5 – 0,4977) = 2.(0,0023) = 0,0046. A hipótese H0 seria rejeitada com qualquer nível de significância 0,0046 Portanto, os dados mostram fortes evidências contra H0, contra o modelo genético. 72,0 200 144ˆ p 0,72 0,80 2,83 0,80.0, 20 200 obsZ
Compartilhar