Baixe o app para aproveitar ainda mais
Prévia do material em texto
Muitas vezes temos alguma ideia sobre o comportamento de uma variável (afirmações sobre uma população ou sobre um parâmetro desta). Estas ideias são chamadas de HIPÓTESES e podem ser verificadas através dos dados de uma amostra. o O Teste de Hipóteses consiste em uma regra de decisão elaborada para rejeitar (ou não) uma afirmação (hipótese) feita a respeito de um parâmetro populacional desconhecido, com base em informações colhidas de uma amostra aleatória. o Verificar se o salário médio de certa categoria profissional no Brasil é de R$1.500,00 o Testar se o percentual de aceitação de um determinado produto é de 40% ou mais. TESTE DE HIPÓTESES CONCEITOS FUNDAMENTAIS Hipótese Nula (H0): É a hipótese a ser testada, em geral representa o contrário do que queremos provar e é formulada em termos de igualdade. Hipótese Alternativa (H1): É a hipótese a ser confrontada com H0, em geral, corresponde ao que se quer provar. • Quando os dados mostram evidências suficientes de que H0 é falsa, devemos rejeitá-la e aceitar em seu lugar H1. • O teste será feito de tal forma que deverá sempre concluir na rejeição (ou não) de H0. EXEMPLOS: Formule as seguintes hipóteses. 1. A proporção de peças defeituosas é 3%. 2. Aumentando a dosagem de cimento aumenta-se a resistência média do concreto. 3. O tempo médio para execução de uma etapa em um processo produtivo é de 20 minutos. 4. Um programa de melhoria de qualidade de uma empresa melhora a satisfação de seus clientes. o Como estamos tomando uma decisão com base em informações de uma amostra, estaremos sujeitos a cometer dois tipos de erros: Erro do tipo I (αααα): Rejeitar H0 quando H0 é verdadeira. A probabilidade de cometer esse erro é chamada nível de significância do teste e é representada por αααα. αααα = P(erro do tipo I) = P(rejeitar H0 / H0 é verdadeira) Erro do tipo II (ββββ): Não rejeitar H0 quando H0 é falsa. A probabilidade de cometer esse erro é representada por ββββ. ββββ = P(erro do tipo II) = P(não rejeitar H0 / H0 é falsa) IMPORTANTE: 1. α é um valor arbitrário e quanto menor, o resultado da amostra é mais significante para rejeitar H0. 2. β é uma função que depende dos valores do parâmetro sob H1 e 1-β é denominado poder do teste. Poder do Teste( 1 −−−− ββββ) ou Potência do Teste 1 −−−− ββββ = 1 − P(não rejeitar H0 / H0 é falsa) = P(rejeitar H0 / H0 é falsa) Nossas decisões em um teste de hipóteses podem ser resumidas na seguinte tabela População Amostra Realidade (desconhecida) H0 é verdadeira H0 é falsa d e c i s ã o Rejeitar H0 Não rejeitar H0 Erro do tipo I Decisão correta Decisão correta Erro do tipo II o PROBLEMA: Ao minimizar α, aumentamos β e vice-versa. o SOLUÇÃO: Fixar α bem pequeno e diminuir β aumentando o tamanho da amostra. o IMPORTANTE: 1. Fixamos o α porque nos preocupamos mais com a possibilidade de rejeitar uma hipótese sendo ela verdadeira. 2. Rejeitar H0 em favor de H1 significa que podemos afirmar que H1 é verdadeira pois conhecemos o risco de errar (α). 3. Aceitar H0 não significa que H0 seja a hipótese verdadeira, mas que os dados não nos mostram evidências suficientes para rejeitá-la. Não temos muito controle do risco de tomarmos a decisão errada pois não conhecemos β. 4. Devemos sempre estabelecer como hipótese nula aquela que pretendemos rejeitar. 5. Para manter a uniformidade o resultado final deve ser enunciado em termos de H0. 6. Os testes de hipóteses também são baseados nas distribuições amostrais dos estimadores. OUTRAS DEFINIÇÕES IMPORTANTES o Estatística do teste: É a estatística utilizada para testar H0. É baseada nos dados amostrais e construída sob H0. o Região crítica do teste (RC): É formada pelo conjunto de valores que levam à rejeição de H0. Ela depende do tipo de hipótese alternativa, do nível de significância (α) adotado, e da distribuição de probabilidade da estatística do teste. o Região de aceitação do teste (RA): É formada pelo conjunto de valores que levam à aceitação de H0. ETAPAS NA ELABORAÇÃO DE UM TESTE DE HIPÓTESES 1- Definir as hipóteses nula(H0) e alternativa(H1); 2- Fixar o nível de significância (α); 3- Determinar a estatística do teste ; 4- Determinar a região crítica do teste; 5- Calcular o valor da estatística do teste, sob H0 e baseada nos dados amostrais; 6- Se o valor calculado da estatística ∈ a RC, rejeitamos H0, caso contrário, não rejeitamos H0; 7- Conclusão do teste. TESTE DE HIPÓTESES PARA MÉDIA POPULACIONAL Caso 1: 2σ conhecida 1. Definição das hipóteses: H0: µ = µ0 H1: µ ≠ µ0 2. Fixar o nível de significância α 3. Definir a estatística do teste Z = nσ µX − ~ N(0,1) 4. Definir a região crítica do teste (RC) ou H0: µ ≥ µ0 H1: µ < µ0 ou H0: µ ≤ µ0 H1: µ > µ0 a) H0: µ = µ0 H1: µ ≠ µ0 b) H0: µ ≥ µ0 H1: µ < µ0 c) H0: µ ≤ µ0 H1: µ > µ0 5. Com base nos valores observados da amostra, calcular o valor da Estatística do Teste Z Zc = nσ µX 0− 6. Se Zc ∈ RC ⇒ rejeitar H0 (conseqüentemente aceitar H1). Se Zc ∉ RC ⇒ Não rejeitar H0 (conseq. não aceitar H1) 7. Concluir sobre a decisão tomada no passo 6. Exemplo 1) Os Brasileiros que deram entrada na declaração do imposto de renda de 2010 antes de 31 de março de 2011 têm uma restituição média de R$ 1.056,00. Considere a população de entregadores de “última hora” que despacharam suas declarações durante os últimos cinco dias do período de entrega do imposto de renda (26 até 30 de abril). Sabe-se que o desvio padrão é de R$ 800,00. Um pesquisador sugere que uma das razões para que os indivíduos esperem até os últimos dias para entregar suas declarações é que em média eles têm uma restituição mais baixa do que os primeiros entregadores. Para uma amostra de 100 indivíduos que entregaram a declaração nos últimos 5 dias, a restituição média da amostra foi de R$ 950,00. Qual é a sua conclusão? Considere um nível de significância de 5%. 2) Uma fábrica de automóveis anuncia que seus carros consomem em média 9,4 km/l, com desvio padrão de 0,79 litros. Uma revista com base em resultados preliminares desconfia da afirmação acima do fabricante e resolve testar tal hipótese analisando 32 automóveis dessa marca, obtendo 9 km/l como consumo médio. O que a revista pode concluir sobre o anúncio da fábrica ao nível de significância de 5%? 3) Uma amostra aleatória de 49 doentes revelou uma taxa média de 47 mg/l de uma substância tóxica na urina. Se a população é suposta normal, com desvio padrão de 16 mg/l, verifique se podemos aceitar que a taxa média da substância tóxica na urina é de 43 mg/l, aos níveis de significância de: a) 5% ; b) 10%. Caso 2: 2σ desconhecida 1. Definição das hipóteses: H0: µ = µ0 H1: µ ≠ µ0 2. Fixar o nível de significância α 3. Definir a estatística do teste T = nS µX − ~ t(n-1) (distr. t-Student com n-1 graus de liberdade) 4. Definir a região crítica do teste (RC) ou H0: µ ≥ µ0 H1: µ < µ0 ou H0: µ ≤ µ0 H1: µ > µ0 a)H0: µ = µ0 H1: µ ≠ µ0 b) H0: µ ≥ µ0 H1: µ < µ0c) H0: µ ≤ µ0 H1: µ > µ0 5. Com base nos valores observados da amostra, calcular o valor da Estatística do Teste T Tc = nS µX 0− 6. Se Tc ∈ RC ⇒ rejeitar H0 (conseqüentemente aceitar H1). Se Tc ∉ RC ⇒ Não rejeitar H0 (conseq. não aceitar H1) 7. Concluir sobre a decisão tomada no passo 6. Observação: o Quando n > 30, podemos ter dificuldades de achar o valor tabelado na tabela t-student que define os limites entre a região crítica e a região de aceitação do teste. Nesses casos, alguns autores sugerem definir a região crítica através da distribuição Normal padrão. o No entanto, em nossa disciplina iremos sempre usar o valor tabelado obtido da tabela t-student. o Justificativa: Os softwares computacionais (Excel, por exemplo) calculam os valores da distribuição t-student. Exemplo 1) Um fabricante afirma que seus cigarros contêm não mais que 30 mg de nicotina. Uma amostra de 31 cigarros fornecem média de 31,5mg e desvio padrão de 3mg. Ao nível de significância de 5%, os dados refutam ou não a afirmação do fabricante? 2) Uma empresa paga atualmente aos seus operários um salário médio de R$ 15,00 a hora. A empresa está planejando construir uma nova fábrica e está considerando diversos locais. A disponibilidade de mão de obra a uma taxa menor que R$ 15,00 a hora é um grande fator na decisão do local. Uma amostra de 40 trabalhadores forneceu um salário horário médio atual de R$ 14,00 e um desvio padrão de R$ 2,40. Com um nível de confiança de 0,99, os dados da amostra indicam que o local tem uma taxa de salário médio significativamente abaixo da taxa de R$ 15,00 por hora? 3) Foi admitido que o preço médio de livros em Química industrial e Ciências Atuariais é de R$ 18,00. Descobriu-se que o preço médio de uma amostra aleatória de 16 livros, adquiridos em um ano, é de R$ 21,60, com um desvio padrão de R$ 2,70. Baseado nos dados amostrais e, admitindo distribuição normal para a população, podemos aceitar a afirmação admitida? Use um nível de significância de 5%. TESTE DE HIPÓTESES PARA PROPORÇÃO POPULACIONAL 1. Definição das hipóteses: H0: p = p0 H1: p ≠ p0 2. Fixar o nível de significância α 3. Definir a estatística do teste Z = n p)-p(1 ppˆ − ~ N(0,1) 4. Definir a região crítica do teste (RC) ou H0: p ≥ p0 H1: p < p0 ou H0: p ≤ p0 H1: p > p0 a) H0: p = p0 H1: p ≠ p0 b) H0: p ≥ p0 H1: p < p0 b) H0: p ≤ p0 H1: p > p0 5. Com base nos valores observados da amostra, calcular o valor da Estatística do Teste Z Zc = n p )1(p ppˆ 00 0 − − 6. Se Zc ∈ RC ⇒ rejeitar H0 (conseqüentemente aceitar H1). Se Zc ∉ RC ⇒ Não rejeitar H0 (conseq. não aceitar H1) 7. Concluir sobre a decisão tomada no passo 6. Exemplo 1) Uma estação de televisão afirma que 60% dos televisores estavam ligados no seu programa especial da última segunda-feira. Uma rede competidora deseja contestar essa afirmação, e decide, para isso, usar uma amostra aleatória de 200 famílias, das quais 104 responderam afirmativamente. Qual deve ser o procedimento adotado para julgar a afirmação da estação? Utilize um nível de significância de 5%. 2) Até o ano passado, apenas 40% dos estudantes de uma certa cantina universitária aprovaram a qualidade das refeições servidas no seu refeitório. Após uma série de medidas corretivas, 40 estudantes foram escolhidos ao acaso, entrevistados, e o número daqueles que aprovaram a qualidade das refeições foram usados para verificar se as medidas corretivas surtiram efeito. O número dos que ficaram satisfeitos foi 22. Realize o teste de hipóteses apropriado usando o nível de significância de 5%. Podemos afirmar que as medidas corretivas surtiram efeito? E se adotarmos um nível de confiança de 99%?
Compartilhar