Baixe o app para aproveitar ainda mais
Prévia do material em texto
Estatí stica – Aula conjunta Contatos: filipe.rosa@ufrgs.br e filipegabrielpoa@gmail.com 1 Testes de hipóteses 1. INTRODUÇÃO Vou começar o assunto dando um exemplo. Maria tem duas moedas. Uma moeda honesta (as duas faces têm a mesma probabilidade de sair num lançamento). A outra é uma moeda viciada. Nesta, a probabilidade de sair coroa é de 2/3. Maria escolhe uma das moedas. José, que tem conhecimento das probabilidades acima mencionadas, tem que adivinhar qual delas foi escolhida. Para tanto, Maria lança três vezes a moeda escolhida. Ao final de cada lançamento, comunica a José o resultado. José estabelece o seguinte critério de decisão: Se os três lançamentos resultarem em coroa, ele vai arriscar que se trata da moeda viciada. Caso contrário, vai arriscar que se trata da moeda honesta. O que José está fazendo é um teste de hipóteses. Num teste de hipóteses fazemos alguma consideração sobre um dado valor. No exemplo acima, José precisa decidir qual das duas moedas foi escolhida. No fundo, quer saber se, para a moeda escolhida, a probabilidade de sair coroa é de 2/3 ou 1/2. Qualquer que seja a sua conclusão, ela estará sujeita a erro. Vamos começar a nos acostumar com os termos utilizados no teste de hipótese. José quer testar a hipótese de, para a moeda escolhida por Maria, a probabilidade de sair coroa ser 1/2. Esta hipótese é chamada de H0 (lê-se agá zero). É também chamada de hipótese nula. Vamos escrever a hipótese H0: H0: P(coroa) = 1/2. (hipótese nula) Caso a probabilidade de sair coroa não seja de 1/2, então a referida probabilidade será de 2/3. Esta outra hipótese é a hipótese alternativa. É chamada de HA. HA: P(coroa) = 2/3. (hipótese alternativa ou H1). Muito bem, agora José define um critério de decisão. Seu critério é baseado no número de coroas que vão sair em três lançamentos. Se saírem duas, uma ou zero coroas, José vai assumir que se trata da moeda honesta. Se saírem três coroas, José vai assumir que se trata da moeda viciada. Escolher o critério de decisão é a parte mais difícil de um teste de hipóteses. Os cálculos são um pouco mais complexos. E muitas vezes estão presentes alguns fatores difíceis de quantificar. Ok, definidas as hipóteses que serão testadas (escolher entre H0 e HA), definido o critério de decisão, agora é só fazer a experiência e ver qual hipótese será escolhida. Muito bem. Vamos supor que Maria lança a moeda três vezes e nas três vezes o resultado é coroa. Neste caso, José rejeita a hipótese H0 e assume como verdadeira a hipótese HA. Veja que a conclusão de José está sujeita a erro. Isto porque é possível que, mesmo que a moeda seja honesta, tenhamos três resultados coroa. Supondo que José tenha errado; rejeitou a hipótese H0, dado que ela é verdadeira, a probabilidade de ele cometer um erro é: ( ) ( ) Esta é justamente a probabilidade de lançarmos três vezes a moeda honesta e sair três coroas. Este erro é o chamado erro do tipo I : rejeitar H0 dado que ela é verdadeira. Estatí stica – Aula conjunta Contatos: filipe.rosa@ufrgs.br e filipegabrielpoa@gmail.com 2 A probabilidade acima é também chamada de nível de significância do teste. O símbolo geralmente utilizado é α (alpha). Nível de significância também é interpretado como a probabilidade de cometer o erro do tipo I. Supondo agora que, em vez de terem saído três coroas, na verdade saíram duas coroas e uma cara. Neste caso, utilizando seu critério de decisão, José aceita H0 como verdadeira e rejeita HA. Neste segundo exemplo, José também está sujeito a erro. Isto porque é possível que, lançando a moeda viciada três vezes, tenhamos pelo menos um resultado cara. Este segundo tipo de erro consiste em aceitar H0 dado que ela é falsa. É chamado de erro do tipo II: aceitar H0 dado que ela é falsa. A probabilidade de ocorrer o erro do tipo II é designada pelo símbolo β. Vamos calcular esta probabilidade: A probabilidade de, em três lançamentos da moeda viciada, obtermos uma, duas ou três caras é: ( ) ( ) ( ) ( ) Logo, β = 70,37% representando a probabilidade de se aceitar H0, quando ela é falsa. Ao subtrairmos o valor de β de 100% encontramos o que os estatísticos chamam de “Poder de teste” Poder de teste = 1 − β = 29,63% O poder do teste é a probabilidade de H0 ser rejeitada dado que ela é falsa. Note como o poder do teste foi baixo. Isto porque José privilegiou a hipótese H0. Ele só a rejeita num caso muito extremo, em que os três resultados forem coroa. Por isto o valor de α foi pequeno, garantindo uma baixa probabilidade de cometer o erro do tipo I. Contudo, em geral, quanto menor o valor de α , maior o valor de β (maior a probabilidade de se cometer o erro do tipo II). Daí a dificuldade de escolher um bom critério de decisão. É comum que, ao reduzirmos a probabilidade de um tipo de erro, a do outro aumente. Teste de hipóteses é apenas isto. Queremos testar se uma dada hipótese H0 é verdadeira. No exemplo dado as hipóteses eram: H0: P(coroa) = ½ HA: P(coroa) = 2/3. Neste exemplo acima, as duas hipóteses atribuíam à probabilidade em estudo um valor único. A hipótese nula atribuía o valor 1/2. A hipótese alternativa atribuía o valor 2/3. Simplificando, a hipótese alternativa poderia ser assim: HA: P(coroa) ≠ 1/2. Outra opção: HA: P(coroa) < 1/2. Ou ainda: HA: P(coroa) > 1/2. No primeiro caso (em que temos o sinal de diferença ≠) o teste é dito bilateral. Nos outros dois casos (com os sinais de ‘>’ e ‘<’) o teste é dito unilateral. 2. TESTE SOBRE A MÉDIA Para entendermos como fazer o teste de hipóteses sobre a média, vejamos alguns exemplos. Nos primeiros exemplos, eu vou dar todas as contas prontas. O objetivo é que vocês não precisem quebrar a cabeça fazendo as contas. Não quero que se preocupem com isso, não por enquanto. A proposta é que apenas entendam a ideia geral do teste. Estatí stica – Aula conjunta Contatos: filipe.rosa@ufrgs.br e filipegabrielpoa@gmail.com 3 Depois, nos exemplos posteriores, aí sim entraremos mais a fundo nas contas envolvidas, certo? 1º tipo de exemplo: entendendo os tipos de teste: bilateral e unilateral. Exemplo 1 Estamos analisando o preço pelo qual a Administração Pública compra um certo produto. Sabemos que, em licitações honestas (livres de fraudes), para uma certa região do país, o preço médio é de R$ 220,00. Foram feitos levantamentos de auditoria recentes em alguns órgãos em que há suspeita de fraudes em licitações. As duas fraudes em análise são as seguintes: • Há prévio acerto entre as licitantes, de forma que o preço contratado é consideravelmente maior que R$ 220,00; • Há acerto prévio entre a licitante vencedora e o órgão, de tal forma que o preço contratado é muito inferior a R$ 220,00. Nestes casos, o grande problema se dará na execução do contrato tendo em vista que, sendo o preço inexeqüível, o contrato não será regularmente cumprido. Num caso concreto, nos deparamos com 30 compras de um determinado órgão público. A média para esta amostra foi de R$ 230,00. Queremos testar a hipótese de as licitações terem sido honestas contra a hipótese alternativa de as licitações terem sido fraudadas. Escreva as hipóteses a serem testadas. Resolução. É natural esperar que, se em um dado órgão ocorrem fraudes a licitações, elas são sistemáticas. Assim, vamos testar a hipótese de as licitações terem sido honestas contra a hipótese alternativa de as licitações terem sido fraudadas. No fundo queremos testar a hipótese se a média da população da qual foi retirada esta amostra é igual a R$ 220,00. H0: µ = 220 HA: µ ≠ 220 Este primeiro tipode teste da média é chamado de teste bilateral. Ele é caracterizado pela hipótese alternativa ser do tipo k ≠ µ (a média é diferente de algo). Por que a palavra bilateral? Porque há duas formas de rejeitarmos a hipótese H0. Se a média da amostra for consideravelmente maior que R$ 220,00, rejeitamos a hipótese por ser mais provável que tenha havido conluio entre as empresas e o preço esteja superfaturado. Ou também, se o valor obtido for consideravelmente menor que R$ 220,00, também rejeitamos a hipótese H0. Desta vez seria mais provável estarmos diante do segundo tipo de irregularidade: há conluio entre a licitante e o órgão contratante. Ou seja, analisamos os valores nos dois sentidos. Tanto os que são muito menores que 220 quanto os que são muito maiores que 220. Por isto o teste é chamado de bilateral. Tanto em um caso quanto em outro, concluímos que a amostra não foi retirada da população das licitações honestas. Estatí stica – Aula conjunta Contatos: filipe.rosa@ufrgs.br e filipegabrielpoa@gmail.com 4 A finalidade do teste de hipóteses é apenas isto. Neste caso, queremos avaliar se 230 é consideravelmente diferente de 220 ou não. Até poderíamos fazer isto de forma intuitiva. Há casos em que a diferença é tanta que nem precisaríamos de teste algum. Se a média da amostra fosse de 500 (mais que o dobro de 220), certamente estaríamos diante de fraudes. Já no caso do exercício, queremos avaliar se 230 é consideravelmente diferente de 220. Intuitivamente, algumas pessoas podem dizer que não é. Essas pessoas tenderiam a aceitar a hipótese de que essas licitações são honestas (hipótese nula). Outras pessoas tenderiam a achar que a diferença é considerável, sendo levadas a rejeitar a hipótese nula. O teste de hipóteses nos fornece uma forma sistemática de testar se os valores envolvidos são consideravelmente diferentes ou não. Bem, encerrando este exercício, a resposta fica: H0: µ = 220 HA: µ ≠ 220 Exemplo 2 Estamos analisando o preço pelo qual a Administração Pública compra um certo produto. Sabemos que, em licitações honestas (livres de fraudes), para uma certa região do país, o preço médio é de R$ 220,00. Foram feitos levantamentos de auditoria recentes em alguns órgãos em que há suspeita de fraudes em licitações. Há um único tipo de fraude em análise, que consiste em acerto entre as licitantes, de forma que o preço contratado é consideravelmente maior que R$ 220,00. Num caso concreto, nos deparamos com 30 compras de um determinado órgão público. A média para esta amostra foi de R$ 230,00. Queremos testar a hipótese de as licitações terem sido honestas contra a hipótese alternativa de as licitações terem sido fraudadas. Escreva as hipóteses a serem testadas. Resolução. Agora, o único tipo de fraude ocorre quando a média dos preços contratados é significativamente maior que 220,00. Ou seja, valores significativamente menores que 220,00 não nos fazem mais rejeitar a hipótese nula, a exemplo do que ocorria no exercício anterior. O teste é unilateral, pois só analisarmos a reta real em um sentido: só valores significativamente maiores que 220,00 nos fazem rejeitar H0. A resposta fica: H0: 220 = µ HA: 220 > µ Estatí stica – Aula conjunta Contatos: filipe.rosa@ufrgs.br e filipegabrielpoa@gmail.com 5 Exemplo 3 Estamos analisando o preço pelo qual a Administração Pública compra um certo produto. Sabemos que, em licitações honestas, para uma certa região do país, o preço médio é de R$ 220,00. Foram feitos levantamentos de auditoria recentes em alguns órgãos em que há suspeita de fraudes em licitações. Há um único tipo de fraude em análise, que consiste acerto prévio entre a licitante vencedora e o órgão, de tal forma que o preço contratado é muito inferior a R$ 220,00. Nestes casos, o grande problema se dará na execução do contrato tendo em vista que, sendo o preço inexequível, o contrato não será regularmente cumprido. Num caso concreto, nos deparamos com 30 compras de um determinado órgão público. A média para esta amostra foi de R$ 230,00. Queremos testar a hipótese de as licitações terem sido honestas contra a hipótese alternativa de as licitações terem sido fraudadas. Escreva as hipóteses a serem testadas. Resolução. Agora, apenas valores significativamente menores que 220,00 nos fazem rejeitar a hipótese nula. Ficamos com: H0: 220 = µ HA: 220 < µ Nos dois últimos exemplos, tivemos testes unilaterais, pois havia uma única forma de rejeitarmos a hipótese nula. Teste de hipóteses para a média – unilateral Exemplo 4 Estamos analisando o preço pelo qual a Administração Pública compra certo produto. Sabemos que, em licitações honestas (livres de fraudes), para certa região do país, o preço médio é de R$ 220,00. Sabemos também que a variância da variável preço, nas licitações honestas, é de 120 Foram feitos levantamentos de auditoria recentes em alguns órgãos em que há suspeita de fraudes em licitações. As duas fraudes em análise são as seguintes: Há prévio acerto entre as licitantes, de forma que o preço contratado é consideravelmente maior que R$ 220,00; Há acerto prévio entre a licitante vencedora e o órgão, de tal forma que o preço contratado é muito inferior a R$ 220,00. Nestes casos, o grande problema se dará na execução do contrato tendo em vista que, sendo o preço inexequível, o contrato não será regularmente cumprido. Num caso concreto, nos deparamos com 30 compras de um determinado órgão público. A média para esta amostra foi de R$ 230,00. Teste a hipótese de as licitações terem sido honestas contra a hipótese alternativa de as licitações terem sido fraudadas. Considere um nível de significância de 5%. Estatí stica – Aula conjunta Contatos: filipe.rosa@ufrgs.br e filipegabrielpoa@gmail.com 6 Resolução. Já vimos que este é um teste bilateral: H0: 220 = µ HA: 220 ≠ µ Se a média da amostra for significativamente diferente de 220, rejeitaremos a hipótese nula. Consideraremos que a média da população da qual foi extraída a amostra não tem média 220. Caso contrário, aceitamos a hipótese nula. Assumiremos que a média da população é sim igual a 220. Ou seja, nosso teste se resume a determinar se 230 é significativamente diferente de 220 ou não. Mas, em termos objetivos: a partir de qual valor já podemos considerar que estamos significativamente afastados de 220? Esta pergunta é respondida pelos valores críticos. Para fazer um teste de hipóteses, a gente sempre dá um crédito para a hipótese nula. Sempre partimos do pressuposto de que ela é verdadeira. Ou seja, iniciamos supondo que a média da população é realmente 220,00. Feito isso, já temos condições de estudar a média amostral ( ̅). Vimos na aula passada que ̅ é uma variável aleatória. Sua esperança coincide com a média da população. Sua variância é igual à variância da população dividida por n (onde n é o tamanho da amostra). Conhecendo o comportamento de ̅ , podemos determinar os valores críticos. São valores que delimitam os casos raros. O nível de significância está intimamente relacionado com os casos raros. Se o nível de significância é de 5%, então os casos raros são aqueles que só ocorrem em 5% das vezes.Supondo que a média populacional seja 220,00, podemos concluir que ̅ tem o seguinte comportamento: • em 95% das vezes, ̅ assume valores entre 216,08 e 223,92 • em 5% das vezes, ̅ assume valores fora deste intervalo. Estes são os valores críticos. São os valores que separam os casos usuais (que ocorrem em 95% das vezes) dos casos raros (que ocorrem em 5% das vezes). Observem que os casos raros foram delimitados de forma que a probabilidade deocorrência seja igual ao nível de significância (5%). Esse cálculo eu poderia passar pra vocês, mas envolveria uma boa base de integrais e pelo que conversamos acredito que não será necessário pra essa cadeira, apenas entender o mecanismo e aplicar isso no Eviews. O resultado obtido para a média amostral, especificamente para o experimento realizado, é chamado de estatística teste. No nosso exemplo, a média amostral foi de 230,00. É possível que a população tenha média 220,00 e, ainda sim, seja extraída uma amostra com média 230,00? Estatí stica – Aula conjunta Contatos: filipe.rosa@ufrgs.br e filipegabrielpoa@gmail.com 7 Sim, é possível. Mas é um caso raro. Na grande maioria das vezes, a média amostral estará entre 216,08 e 223,92. Nós não aceitamos casos raros. Neste caso, concluímos que a amostra não foi retirada de uma população com média 220,00. Por isso, rejeitamos a hipótese nula. RESUMINDO: - Calculamos os valores críticos (que separam os casos raros daqueles que ocorrem frequentemente) - Analisamos se a estatística teste é um caso raro ou não. Se for raro, rejeitamos a hipótese nula. 3. P VALOR Um fabricante de lanternas operadas com gás butano anuncia que o reservatório de gás de seu produto tem duração esperada µ de pelo menos 40 horas. Face à reclamação de alguns consumidores, uma agência independente resolve verificar a veracidade da afirmação do fabricante por meio do teste estatístico da hipótese H0: µ≥40 contra a alternativa HA: µ < 40 com controle do erro do tipo I em 5%. Uma amostra aleatória de 49 reservatórios produziu o valor médio X de 38 horas. Suponha que a distribuição dos tempos de duração do gás seja aproximadamente normal com desvio padrão de 7 horas. A tabela abaixo dá os valores da função de distribuição F(Z) da normal padrão para alguns valores selecionados de Z. Assinale a opção que dá o valor probabilístico (p-valor) do teste constituído com base na estatística X – 40 a) 5% b) 2,3% c) 3% d) 4% e) 2,5% Resolução. Pede-se o p-valor. Esta questão está aí justamente para falarmos do p-valor (ou probabilidade de significância; ou ainda, nível descritivo). É um termo que vez ou outra aparece em testes de hipóteses. Uma definição do p-valor seria: a probabilidade de a variável reduzida assumir valores iguais ou mais extremos do que a estatística teste observada, dado que a hipótese nula é verdadeira. Estatí stica – Aula conjunta Contatos: filipe.rosa@ufrgs.br e filipegabrielpoa@gmail.com 8 Entendeu? Pois é, a definição pode não ser muito clara à primeira vista. Uma forma mais fácil de entender é pensarmos em áreas. A área delimitada pelo valor crítico é igual ao nível de significância. Sendo assim, se o nível de significância é de 5%, o valor crítico delimita uma área de 5%. De forma semelhante, o p-valor é a área delimitada pela estatística teste. Se o p-valor é de 4%, então a estatística teste delimita uma área de 4%. Vamos fazer o teste de hipóteses indicado na questão. Notem que se trata de um teste unilateral. Só há uma região crítica. Primeiro passo: calcular o valor crítico de Z. É o valor tal que a região de aceitação seja de 95% e a região crítica seja de 5%. O exercício não forneceu informações para calcular este valor. É porque não precisa. Mas fica a informação de que este valor é igual a -1,645. Zc = -1,645 Segundo passo: calcular a estatística teste. O exercício disse que X =38. Disse também que σ = 7. Podemos calcular o desvio padrão da média amostral. Terceiro passo: comparar a estatística teste com o valor crítico. A estatística teste é menor que o valor crítico. Ela cai na área amarela (área crítica). Rejeitamos a hipótese nula. Estatí stica – Aula conjunta Contatos: filipe.rosa@ufrgs.br e filipegabrielpoa@gmail.com 9 Por que rejeitamos a hipótese nula? Porque a estatística teste caiu na área crítica. Aceitaríamos a hipótese nula para valores até -1,645. Este valor é considerado crítico. Valores além dele (ou seja, mais extremos que ele) nos fazem rejeitar a hipótese nula. E foi exatamente isto que aconteceu. O valor -2 está além de -1,645. É um valor significativamente menor que zero. Supondo que a hipótese nula seja verdadeira, qual a probabilidade de obtermos valores, para a variável reduzida, menores ou iguais a -2? Queremos saber a área abaixo da curva à esquerda de -2. Queremos a área vermelha da figura abaixo: Esta probabilidade é justamente o p-valor. Supondo que a hipótese nula seja verdadeira, é a probabilidade de Z assumir valores iguais ou mais extremos que a estatística teste (=-2). Neste caso, é a probabilidade de Z assumir valores menores ou iguais a −2 . Em outras palavras: é a área delimitada pela estatística teste. Agora utilizando-se a tabela fornecida no exercício. Fomos informados que a função distribuição para Z igual a 2 é 0,977. Ou seja, a probabilidade de Z assumir valores menores ou iguais a 2 é de 97,7%. Portanto, a probabilidade de Z assumir valores maiores que 2 é de 2,3%. Como a função densidade de probabilidade da variável normal é simétrica, a probabilidade de Z assumir valores menores que -2 também é de 2,3%. Portanto o p-valor é de 2,3%. Gabarito: B.
Compartilhar