Prévia do material em texto
1 T.E.A. II (Curso Preparatório para o Exame da ANPEC) Disciplina: Estatística - Professor: Eduardo Lima Campos 14. TESTES DE HIPÓTESES (PARTE 1: CONCEITOS E TESTES BÁSICOS) • Testes de Hipóteses Uma hipótese estatísticaé uma afirmação a respeito de um parâmetro da população. Exemplo 14.1- No exemplo das alturas dos alunos (8.1), podemos formular a seguinte hipótese: “µ (que é a altura média dos alunos da turma inteira) é igual a 175 cm”. Esta hipótese de igualdade é chamada hipótese nula, e representada por H0. Ela será investigada a partir da amostra. Se a amostra fornece evidência contra H0, então rejeitamos esta hipótese. Neste caso, aceitamos uma hipótese alternativa, representada por H1. H1 contradiz o que se afirma em H0. No exemplo, teríamos H1: µ ≠ 175. Caso contrário, se a amostra não fornece evidência contra H0, não rejeitamosH0. Obs - embora não seja rigorosamente correto, algumas vezes “aceitar H0” é empregado. Veremos que um teste não fornece evidência estatística que leva à aceitar a hipótese nula. No exame da ANPEC, “aceitar H0 é tomado como certo”. Em resumo, diante das hipóteses: H0: µµµµ = 175 (hipótese nula) e H1: µµµµ ≠≠≠≠ 175 (hipótese alternativa), tomamos uma das seguintes decisões: não rejeitar H0 ou rejeitar H 0 (e, neste caso, aceitar H1). 2 T.E.A. II (Curso Preparatório para o Exame da ANPEC) Disciplina: Estatística - Professor: Eduardo Lima Campos Embora o ponto de partida seja a hipótese nula, é a hipótese alternativa que um teste permite evidenciar (ou não). É ela, portanto, que queremos tentar comprovar, quando formulamos um teste. • Analogia com um Julgamento Em nosso sistema judiciário, um júri só decide condenar um réu caso haja evidência de que ele seja culpado. Isto porque o sistema considera mais grave condenar um eventual inocente do que absolver um eventual culpado. Isto nada mais é do que um teste de hipóteses. Qual a hipótese nula? Qual a hipótese alternativa? R: H0: réu inocente H1: réu culpado. • Erros em Testes de Hipóteses Um teste de hipóteses não leva necessariamente à decisão correta. Qualquer que seja nossa decisão, sempre existe a possibilidade de erro. Existem 2 tipos de erro que podemos cometer ao testar hipóteses: tipo I e tipo II. O erro tipo I é o erro que consiste em rejeitar H0, quando ela é verdadeira. A probabilidade de cometer este erro é denotada por α, e tem um nome específico: nível de significância. O nível de significância α de um teste é a probabilidade de cometer o erro tipo I • Nível de Significância α é pré-especificado por quem vai fazer o teste. Os valores usuais são: 0,01, 0,05 e 0,1. 3 T.E.A. II (Curso Preparatório para o Exame da ANPEC) Disciplina: Estatística - Professor: Eduardo Lima Campos Uma questão que pode surgir é: por que não trabalhar com um valor de α bem pequeno, para minimizar a possibilidade de cometer o erro tipo I? Porque também existe o erro tipo II... O erro tipo II é o erro que consiste em não rejeitar H0, quando ela é falsa. A probabilidade do erro tipo II é designada por β. O problema de usar um α muito pequeno é que quanto menor o valor de α, maior o valor de β. Obs -α e β não têm uma relação exata. Por exemplo, não se pode afirmar que α+β = 1. A única coisa que se garante é que quando um diminui, o outro aumenta. A única forma de reduzir α e β simultaneamente é aumentando o tamanho da amostra. Resumo - Erros em um Teste de Hipóteses: H0 Verdadeira H0 Falsa Rejeitar H0 Erro Tipo I Não Rejeitar H0 Erro Tipo II a probabilidade αααα de cometer este erro é o nível de significância. A formulação das hipóteses de um teste deve levar em consideração o seguinte: 1) H0 deve ser definida de tal forma que o erro de rejeitá-la quando ela for verdadeira (isto é, o tipo I) seja mais grave do que o erro contrário (tipo II). • Diretrizes para Formular Hipóteses Isto porque o erro tipo I tem uma probabilidade pré-especificada como um valor pequeno (isto é, controlada). 2) H1, por outro lado, é a hipótese da qual um teste é capaz de fornecer evidência estatística (= conclusão de que a hipótese é verdadeira, sujeita a uma probabilidade de erro controlada). 4 T.E.A. II (Curso Preparatório para o Exame da ANPEC) Disciplina: Estatística - Professor: Eduardo Lima Campos • Métodos para Testar Hipóteses Há três métodos para testar hipóteses: 1. Método do Intervalo de Confiança 2. Método da Região Crítica 3. Método do P-Valor • Testando uma Hipótese a partir de um Intervalo de Confiança O teste de H0: µ = k contra H1: µ ≠ k, ao nível de significância α, pode ser feito usando o IC de 100(1-αααα)% (daí a notação 100(1-α)% que adotamos!). A regra de decisão é a seguinte: • Se k não pertence ao IC, rejeitamos H0 • Caso contrário, ou seja, se k pertence ao IC, não rejeitamos H0 • IC`s e Testes de Hipóteses (Bilaterais) O IC com grau de confiança:: permite testar ao nível de significância: 90% 0,1 95% 0,05 99% 0,01 Exemplo 14.2- (exemplo 12.3) Uma AAS de 25 trabalhadores de uma fábrica foi selecionada, fornecendo salário médio de R$ 400,00 e desvio padrão R$ 450,00. Considerando a população Normal, teste a hipótese de que o salário médio dos empregados da fábrica seja R$ 600,00, ao nível de significância α = 0,1. Solução: As hipóteses de interesse são: H0: µ = 600 (hipótese nula); H1: µ ≠ 600 (hipótese alternativa). O IC90%(µ) foi (exemplo 12.3): [246,01;553,99]. Basta verificar se este intervalo contém o 600. De imediato, vemos que não. Assim, rejeitamos H0, ao nível α = 0,1. Exemplo 14.3- (exemplo 12.4) Suponha que a vida útil de uma marca de tv`s de LED seja normalmente distribuída. A partir de uma amostra de 16 tv`s, estimou-se uma vida útil média de 8.900 horas, e um desvio padrão igual a 500 horas. Teste se o tempo médio das tv`s desta marca é igual a 9.000, ao nível de significância 0,05. 5 T.E.A. II (Curso Preparatório para o Exame da ANPEC) Disciplina: Estatística - Professor: Eduardo Lima Campos Solução: As hipóteses de interesse são: H0: µ = 9.000 (hipótese nula); H1: µ ≠ 9.000 (hipótese alternativa). O IC95%(µ) foi (exemplo 12.4): [8.633,6;9166,4]. Basta verificar se este intervalo contém o 9.000. De imediato, vemos que sim. Assim, não rejeitamosH0, ao nível α = 0,05. Erro conceitual comum: Não rejeitar H0 ao nível α porque a estimativa de µ pertence ao IC de 100(1-α)%. Por que isto está errado? Resposta: a estimativa sempre está dentro no intervalo, por construção. O correto seria: não rejeitar H0 ao nível α se k (isto é, o valor de µ contemplado em H0) pertencer ao IC de 100(1-α)%. • O Método da Região Crítica Embora o método do IC seja simples e conveniente, o método da região crítica é o método formal para testar hipóteses. Para a explicação deste método, é necessário definir 2 quantidades: - Estatística de teste - Região crítica A estatística de testeé uma estatística (= função das v.a.`s na amostra) baseada no estimador do parâmetro de interesse. Seja µ a média de uma população Normal com σ conhecido. A estatística do teste de H0: µ = k contra H1: µ ≠ k é: . n/ kX Z σ −= Quando H0 é verdadeira(µ = k), sabemos que: Portanto, se houver evidência de que o resultado acima não seja válido, então é porque H0 não deve ser verdadeira. ).1,0(N~ n/ kX Z σ −= 6 T.E.A. II (Curso Preparatório para o Exame da ANPEC) Disciplina: Estatística - Professor: Eduardo Lima Campos O valor observado de Z é: . n/ kx z0 σ −= Se z0 é um valor que seria pouco provável caso Z ~ N(0,1), isto é uma evidência contra Z ~ N(0,1) (rigorosamente, contra E(Z) = 0) e, portanto, evidência contra H0. A região crítica RC é o conjunto dos valores de z0 que levam à rejeição de H0. Para o teste de H0: µ = k contra H1: µ ≠ k (σ conhecido): RC = (-∞,-zα/2]∪[zα/2,∞). este valor é chamado valor crítico. • Por Que Rejeitar H0 Quando z0 ∈∈∈∈ RC? Note que, se H0 é verdadeira: P(Z∈RC) = P[(Z≤-zα/2)∪(Z≥zα/2)] = α, que é um valor pré-especificado e baixo. Assim, se z0∈RC, temos que decidir entre: 1 - H0 é verdadeira, e o evento Z∈RC, cuja ocorrência era improvável (probabilidade α) acabou ocorrendo por obra do acaso ou 2 - H0 é falsa. O mais lógico é optar pela alternativa 2. Assim, tomamos a decisão de rejeitar H0. Resumo: Se o valor observado da estatística de teste pertencer à RC, a amostra fornece evidência estatística para rejeitar H0. Nesta situação, tomamos a decisão de rejeitar H0. Se o valor observado da estatística de teste não pertencer à RC, a amostra não fornece evidência para rejeitar H0. Nesta situação, tomamos a decisão de não rejeitar H0. 7 T.E.A. II (Curso Preparatório para o Exame da ANPEC) Disciplina: Estatística - Professor: Eduardo Lima Campos Exemplo 14.1(cont.) Vamos usar o método da RC para conduzir o seguinte teste: H0: µµµµ = 175 x H1: µµµµ ≠≠≠≠ 175, ao nível de significância α = 0,05. (considere σ conhecido, igual a 6) Valores Críticos da Normal para Testes Bilaterais (iguais aos dos IC`s de 100(1-α)%): Para α = 0,01 ⇒ z0,005= 2,575. Para α = 0,05 ⇒ z0,025= 1,96. Para α = 0,1 ⇒ z0,05= 1,645. Como α = 0,05: RC = (-∞,-1,96]∪[1,96,∞). .8634,1 5/6 175180 5/6 175x z0 = −=−= Este valor não pertence à RC. Logo, não rejeitamos H0. Para calcular z0, precisamos da estimativa da média que já foi obtida no exemplo 8.1: Se σ é desconhecido, a estatística do teste de H0: µ = k contra H1: µ ≠ k é: . n/S kX T −= Quando H0 é verdadeira (µ = k), a estatística acima, como já vimos, não segue distribuição Normal, e sim t de Student com n-1 graus de Liberdade. O valor observado de T é: . n/s kx t0 −= E a região crítica é: RC = (-∞,-tn-1;α/2]∪[tn-1;α/2,∞). No exemplo 14.1, vamos agora considerar σ desconhecido e testar as mesmas hipóteses: H0: µµµµ = 175 x H1: µµµµ ≠≠≠≠ 175, A estimativa de σ já foi obtida no capítulo 12, exemplo 12.2: s = 6. O valor crítico também é o mesmo encontrado na tabela t naquele exemplo: t4;0,025= 2,776. 8 T.E.A. II (Curso Preparatório para o Exame da ANPEC) Disciplina: Estatística - Professor: Eduardo Lima Campos Assim: RC = (-∞,-2,776]∪[2,776,∞). .8634,1 5/6 175180 5/s 175x t0 = −=−= Este valor não pertence à RC. Logo, não rejeitamos H0. Erro conceitual comum: Não rejeitar H0 porque t0 (ou z0) pertence ao IC de 100(1-α)%. Por que isto está errado? Resposta: o valor calculado da estatística de teste não tem nada a ver com IC. Estariam sendo misturados 2 métodos. O correto seria: não rejeitar H0 porque k pertence ao IC ou rejeitar H0 porque t0 ou (z0) pertence à RC Exemplo 14.2(cont.) - Considerando a população Normal, use o método da RC para testar a hipótese de que o salário médio dos empregados da fábrica seja igual a R$ 600,00, ao nível α = 0,1. Solução: 1 - As hipóteses de interesse são: H0: µ = 600 (hipótese nula); H1: µ ≠ 600 (hipótese alternativa). O nível de significância pedido é α = 0,1. 2 - A região crítica do teste é: RC = (-∞,-t24;0,05]∪[t24;0,05,∞). Do exemplo 12.3, temos que t24;0,05= 1,711. Revendo a consulta à Tabela t do ex. 12.3: 9 T.E.A. II (Curso Preparatório para o Exame da ANPEC) Disciplina: Estatística - Professor: Eduardo Lima Campos 3 - Cálculo de t0: 4 - Verifica-se que t0 pertence à RC. 5 - Conclusão: rejeitamos H0, ao nível 0,1. .2222,2 90 200 5/450 600400 25/s 600x t0 −=−= −=−= Em algumas situações específicas, não estaremos preocupados em evidenciar se o parâmetro de interesse (µ, nos exemplos até aqui) é diferente de k, e sim se ele é maior ou menor do que k. Isto conduz ao estudo de testes unilaterais. • Testes Unilaterais/Unicaudais Exemplo 14.4- Um fabricante afirma que seus cigarros contém, em média, no máximo 30mg de nicotina. Queremos verificar a partir de uma amostra se existe evidência contra esta afirmação. Neste caso, H1, que é a hipótese que queremos evidenciar não é µ ≠ 30, e sim µµµµ > 30. Assim é mais apropriado estabelecer como hipótese alternativa H1: µ > 30. Neste caso, H0: pode ser: µ ≤ 30 ou µ = 30. A região crítica é definida com base na hipótese alternativa, e será, neste caso: RC = [zα;∞), se σ for conhecido ou RC = [tn-1;α;∞), se σ for desconhecido. não dividimos α por 2! Valores Críticos da Normal (Testes Unilaterais): Para α = 0,01 ⇒ z0,01= 2,33. Para α = 0,05 ⇒ z0,05= 1,645. Para α = 0,1 ⇒ z0,1 = 1,28. O método do IC não pode ser aplicado para testes unilaterais! Exemplo 14.4(cont.) - Foi coletada uma amostra de 25 cigarros, fornecendo média 31,5 mg. O desvio padrão populacional é conhecido, e igual a 3 mg. Ao nível α = 0,05, os dados refutam a afirmação do fabricante? Solução: RC = [1,645;∞) e z0 = 2,5, que pertence à RC. Desta forma, rejeita-se H0, ao nível de significância α = 0,05. Os dados refutam a afirmação do fabricante, a este nível. 10 T.E.A. II (Curso Preparatório para o Exame da ANPEC) Disciplina: Estatística - Professor: Eduardo Lima Campos Considere agora o desvio padrão σ desconhecido e estimado, com s = 3 mg. Da tabela t, t24;0,05= 1,711, e assim: RC = [1,711;∞). t0 = 2,5, que pertence à RC acima, portanto a conclusão permanece. Obs - se H1 for µ < 30, a RC passa a ser: (-∞;-zα] ou (-∞;-tn-1;α]. Exemplo 14.5- Um pesquisador deseja estudar a relação entre renda e despesa com alimentação, em certa localidade. O interesse específico é na estimativa da propensão marginal ao consumo (no caso, de alimentos) β nesta localidade. Sabendo-se que alimentação é um bem normal, quais seriam as hipóteses adequadas para o pesquisador? Solução: Se houver relação do consumo de alimentos com a renda, espera-se que seja positiva. Assim: H0: β = 0 (não há relação); H1: β > 0 (há relação). Este teste envolve um modelo de regressão linear. Exercício 14.1 -Um economista afirma que o índice de endividamento médio das empresas de certo setor é superior a 30. Você decide verificar esta hipótese, a partir de uma AAS de 9 empresas. Sua amostra forneceu média 52 e desvio padrão 30. Se os índices de endividamento seguem distribuição Normal, sua amostra fornece evidência favorável à afirmação do economista, aos 3 níveis usuais? R: t0 = 2,2 ⇒ há evidência aos níveis 0,05 e 0,1. As hipóteses de interesse são: H0: p = k H1: p≠ k, sendo p uma proporção populacional (por exemplo, de eleitores que pretendem votar em um certo candidato). • Teste para uma Proporção O teste baseia-se no seguinte resultado aproximado (para grandes amostras): ).1,0(N n )p1(p pp̂ Z ≈− −= O teste resultante será válido apenas em grandes amostras (é um teste assintótico). proporção amostral. 11 T.E.A. II (Curso Preparatório para o Exame da ANPEC) Disciplina: Estatística - Professor: Eduardo Lima Campos Estatística de Teste A estatística de teste é obtida substituindo em Z o valor considerado em H0 (p = k): . n )k1(k kp̂ Z − −= O teste consiste em calcular o valor da estatística Z para a amostra observada: e verificar se z0 pertence à RC, que é baseada na distribuição Normal. , n )k1(k kp̂ z 0 − −= Exemplo 14.6- Uma corretora afirma que 30% dos seus clientes são avessos ao risco. Uma AAS de 64 clientes revela que 20 são avessos ao risco. Teste a afirmação da corretora, ao nível de significância α = 0,1. Solução: As hipóteses de interesse são: H0: p = 0,3 H1: p≠ 0,3, sendo p a proporção do total de clientes da corretora que são avessos ao risco. α = 0,1 ⇒ z0,05 = 1,645, e assim: RC = (-∞,-1,645]∪[1,645,∞). .2182,0 64 )3,01(3,0 3,03125,0 z0 =− −= Como z0 não pertence à RC, não rejeitamos H0 ao nível α = 0,1. Exercício 14.2- (ver exercício 12.1) Uma corretora faz contato com uma AAS de 100 clientes e verifica que 40% dos clientes desta amostra se dizem avessos ao risco. Se p é a proporção de clientes que se consideram avessos ao risco, use o IC de 90% calculado no exemplo 10.1 para testar as hipóteses H0: p = 0,5 x H1: p ≠ 0,5, ao nível correspondente. R: IC90%(p) = [0,3194;0,4806]. Rejeita-se H0 ao nível 0,1. 12 T.E.A. II (Curso Preparatório para o Exame da ANPEC) Disciplina: Estatística - Professor: Eduardo Lima Campos Exemplo 14.7- Uma emissora de TV afirma que o índice de audiência de seu programa “carro chefe”, em determinada localidade e horário, é de 60%. Um instituto de pesquisa entrevista 400 pessoas naquela localidade. Se 220 entrevistados assistem ao programa no horário em questão, existe evidência estatística contra a afirmativa feita pela emissora, ao nível de significância 0,05? Solução: As hipóteses de interesse são: H0: p = 0,6 H1: p < 0,6, sendo p a proporção de audiência do programa na população em estudo. Para α = 0,05: RC = (-∞,-1,645]. .04,2 400 )6,01(6,0 6,055,0 z 0 −= − −= Como z0 pertence à RC, rejeitamos H0 ao nível α = 0,05. Conclusão: A amostra fornece evidência contra a afirmativa da emissora, ao nível 0,05. E aos outros níveis usuais? • Decisão x Nível de Significância No exemplo 14.7, rejeitamos H0 aos níveis 0,05 e 0,1, mas não ao nível 0,01. Ou seja: a decisão em um teste depende do nível de significância estabelecido! Note então que: Se uma hipótese não é rejeitada a um certo nível de significância, também não o será a níveis inferiores (a RC diminuirá). Por outro lado: Se uma hipótese é rejeitada a um certo nível de significância, também o será a níveis superiores (pois a RC aumentará). 13 T.E.A. II (Curso Preparatório para o Exame da ANPEC) Disciplina: Estatística - Professor: Eduardo Lima Campos Podemos definir um “ponto de corte”, isto é, um valor de α abaixo do qual não rejeitamos H0, e acima do qual passamos a rejeitar H0. Este ponto é chamado p-valor do teste. O p-valor de um teste é o menor valor de αααα que nos leva a rejeitar H0. P-Valor ou Nível Descritivo O p-valor, também chamado nível descritivo, é utilizado para testar hipóteses de uma forma direta. A regra de decisão é a seguinte: se p-valor ≤ α ⇒ rejeitamos H0 se p-valor > α ⇒ não rejeitamos H0 • Testando Hipóteses Usando o P-Valor Exemplo 14.8- O p-valor obtido para um teste foi 0,07. Qual a conclusão do teste para os 3 níveis de significância usuais? Solução: Para α = 0,01 ou 0,05, não rejeitamos H0 (pois o p-valor é maior do que ambos); Para α = 0,1, rejeitamos H0 (pois o p-valor é menor do que 0,1). • Cálculo do P-Valor O p-valor de um teste é dado pela probabilidade, calculada sob H0, de que a estatística de teste assuma um valor igual ou “mais extremo” do que o valor calculado na amostra. Mais extremo = mais “dentro” da RC. Para elucidar a definição, considere o teste de H0: µ = k contra H1: µ > k, em que z0 é o valor observado da estatística de teste. Note que, se z0 > zα, o p-valor fica menor do que α. Isto corresponde à situação em que H0 é rejeitada. 14 T.E.A. II (Curso Preparatório para o Exame da ANPEC) Disciplina: Estatística - Professor: Eduardo Lima Campos Se z0 = zα, o p-valor é igual a α, e H0 é rejeitada. Por outro lado, se z0 < zα, o p-valor fica maior do que α. Isto corresponde à situação em que H0 não é rejeitada. Exemplo 14.9- Calcule o p-valor do teste do exemplo 12.4, e utilize-o para formular sua conclusão aos níveis usuais. Solução: .0062,04938,05,0)5,2(ZPvalor -p 0H =−=≥= Conclusão? indica que a probabilidade é calculada sob H0 • P-Valor para um Teste Bilateral Em um teste bilateral, o p-valor é obtido multiplicando o p-valor unilateral por 2. R: p-valor = 2*0,0062 = 0,0124. No exemplo 14.9, se H1: µ ≠ 30: Exercício 14.3- No exemplo 14.7, calcule o p-valor do teste, e utilize-o para formular suas conclusões aos níveis usuais. R: 0,0207. P-Valor para o Teste t Quando a variância é desconhecida, e usamos o teste t, a tabela t não permite determinar o p-valor com exatidão. O cálculo pode ser feito via função DIST.T do excel. O comando é DIST.T.CD(t0;g.l.), se o teste é unilateral e DIST.T.BC(t0;g.l.) se é bilateral.