Baixe o app para aproveitar ainda mais
Prévia do material em texto
Profa. Débora Spenassato E-mail: dspenassato@furg.br TESTES DE HIPÓTESES: Fundamentos O método científico engloba: - a observação de um fato; - elaboração de uma “pergunta” acerca desse fato, com base em uma teoria que precisa ser explicada; - formulação de uma hipótese, consistindo em possíveis respostas testáveis para esta pergunta. http://brasilescola.uol.com.br/biologia/a-metodologia-cientifica.htm Um dos problemas a serem resolvidos pela inferência estatística é o de testar uma hipótese. Objetivo: fornecer uma metodologia que nos permita verificar se os dados amostrais trazem evidências que apoiem ou não uma hipótese formulada sobre o parâmetro populacional. Testes de Hipóteses Este procedimento supõem verdadeira a hipótese em questão e verifica se a amostra é “verossímel” nessas condições. A partir da amostra da população, deve-se estabelecer uma regra de decisão sobre a qual rejeitamos ou não a hipótese testada. A Regra do Evento Raro para a Inferência estatística Se, sob certa suposição/hipótese (ex. a hipótese de que meninos e meninas têm a mesma chance de nascer, p=0,5), a probabilidade de um evento particular observado (ex. 879 meninas em 945 nascimentos) é extremamente pequena, concluímos que a hipótese provavelmente não é correta. Triola (2017) Busca-se, com base na amostra, distinguir entre resultados que podem facilmente ocorrer por acaso e resultados que são altamente improváveis de ocorrer por acaso. Explicação: ou o evento raro realmente ocorreu ou a suposição não é verdadeira. Exemplos de Hipóteses a) A implementação de um programa de melhoria da qualidade em uma empresa prestadora de serviços melhora a satisfação de seus clientes. b) Uma certa campanha publicitária produz efeito positivo nas vendas. c) Aumentando a dosagem de cimento, aumenta-se a resistência do concreto. Como verificar estatisticamente a veracidade de uma hipótese? Avaliar a porcentagem de reclamações antes e depois do programa de melhoria da qualidade. Formulação de Hipóteses em termos de Parâmetros a) A proporção de reclamações após a realização do programa de melhoria da qualidade é menor do que antes da realização do programa. b) A média das vendas depois da campanha publicitária é maior do que a média das vendas antes da campanha publicitária. Essas formulações dependem do problema e do planejamento do experimento. Para o estudo dos testes de hipóteses, precisamos entender seus componentes: 1. Hipótese nula e alternativa; 2. Tipos de erro; 3. Nível de significância (α); 4. Testes de hipóteses unilaterais ou bilaterais; 5. Valor crítico, região crítica e p-valor; 6. Estatística de teste. 1. Hipóteses Uma hipótese estatística é uma afirmação sobre os parâmetros de uma ou mais populações. Normalmente são formuladas duas hipóteses: H0 e H1 H0: (hipótese nula) • Hipótese considerada verdadeira até que se prove o contrário; • Geralmente representa o contrário do que queremos provar; • Geralmente é formulada em termos de igualdade entre parâmetros (ex.: µ1 = µ2) ou entre um parâmetro e uma constante (ex.: µ = 3). Em alguns casos ≤ ou ≥ . Exemplos: H0: p = 0,5 H0: µ = 100 H0: σ = 15 Em um teste estatístico, o teste é planejado para avaliar a força da evidência contra a hipótese nula. Logo, esta é a afirmativa testada e a decisão do teste será em relação à essa hipótese. Ex.: Rejeita H0 ou Não rejeita H0 H0: pode ser determinada a partir de experiência passada ou de conhecimento do processo, ou mesmo de testes ou experimentos prévios. H1: (ou Ha hipótese alternativa) • Hipótese aceita se há evidências suficientes para rejeitar H0; • Geralmente é formulada em termos de desigualdade (≠, < ou >); • Geralmente corresponde ao que se quer provar. Exemplos: H1: p > 0,5 H1: µ ≠ 100 H1: σ < 15 H1 NÃO INCLUIRÁ O SINAL DE IGUALDADE! Exemplo 1 – igualdade entre um parâmetro e uma constante: (afirmação) A pesquisa Survey of Studies and Attitudes (SSHA) é um teste psicológico que mede os hábitos de estudo dos alunos e suas reações à escola. Os escores variam de 0 a 200. O escore médio para estudantes universitários é de aproximadamente 115 e o desvio padrão em torno de 30. Uma professora suspeita que a média para alunos mais velhos seja superior a 115. Ela aplica o teste a uma amostra aleatória simples de 25 estudantes com idades acima de 30 anos. Suponha que os escores para essa população seja normalmente distribuída com desvio padrão de 30. H0: μ = 115 H1: μ > 115 Um grupo de pesquisadores da área de saúde afirma que o medicamento formulado por eles consegue curar uma determinada doença em mais de 80 % dos pacientes testados. Esta alegação será representada pela hipótese alternativa, pois é uma afirmativa de desigualdade. H0 :p ≤ 0,8 H1 :p > 0,8 Exemplo 2: (afirmação) ou só = Exemplos 3 - igualdade entre parâmetros: a) H0: p1 = p2 e H1: p1 > p2 onde: •p1 é a proporção de reclamações antes do programa de melhoria da qualidade; e •p2 é a proporção de reclamações depois do programa de melhoria da qualidade. b) H0: μ1 = μ2 e H1: μ1 < μ2 onde: •μ1 é o valor médio das vendas antes da campanha publicitária; •μ2 é o valor médio das vendas depois da campanha publicitária. A decisão de rejeitar H0, ou não, é feita a partir de amostras extraídas adequadamente das populações envolvidas. A aplicação de um teste estatístico (ou teste de significância) serve para verificar se os dados fornecem evidência suficiente para que possamos aceitar como verdadeira a hipótese alternativa (H1), precavendo-nos, com certa segurança, de que as diferenças observadas nos dados não são meramente casuais. Como verificar estatisticamente a veracidade de uma hipótese? Quando realizamos um teste de hipótese podemos estar cometendo dois tipos de erro: 2. Tipos de Erros Realidade (desconhecida) Decisão do teste Não rejeita H0 Rejeita H0 H0 é verdadeira Decisão correta (probab = 1 – α ) Erro tipo I (probab = α ) H0 é falsa Erro tipo II (probab = β ) Decisão correta (probab = 1 – β ) Poder do teste OU sensibilidade de um teste Iremos trabalhar com o erro do tipo I em que a probabilidade de ocorrência é dada pelo nível de significância . P(erro tipo I) = P(rejeitar H0 | H0 é verdadeira) = α P(erro tipo II) = P(não rejeitar H0 | H0 é falsa) = β controlado Geralmente é desconhecido Relação entre α, β e n Para qualquer α fixo, o aumento no tamanho amostral n causará um decréscimo em β. Para qualquer n fixo, o aumento em α causará um decréscimo em β. Para diminuir α e β, aumente o tamanho de n. Exemplo1: A meteorologia esta marcando a possibilidade de chuva, portanto, antes de sairmos de casa precisamos tomar uma decisão, levar ou não o guarda- chuva. A tabela abaixo apresenta as duas decisões corretas que podemos tomar e os dois tipos de erro que podemos estar cometendo: ◦ 3 Se levarmos o guarda-chuva e chover significa que tomamos a decisão correta, se não chover, estaremos cometendo um erro do tipo II, o que implica carregarmos o guarda-chuva que não iremos usar. Se não levarmos o guarda-chuva e não chover, também estaremos tomando uma decisãocorreta, no entanto, se chover estaremos cometendo um erro do tipo I, o que implicaria em um banho de chuva. Exemplo 2: Ho: produto A é cancerígeno; H1: produto A não é cancerígeno; P(erro tipo I) = (rejeitar Ho | dado que Ho é verdadeira) P(erro tipo II) = (não rejeitar Ho| dado que é Ho falsa) Erro tipo I é o mais importante a ser evitado. Uma pessoa é inocente até prova do contrário H0: A pessoa é inocente H1: A pessoa é culpada Erro I: A pessoa é condenada, mas ela é inocente. Erro II: A pessoa é absolvida, mas ela é culpada. A justiça procura reduzir a possibilidade de ocorrer o erro Tipo I, pois entende-se que é mais grave condenar inocentes do que absolver criminosos. Para certos sistemas judiciais um = 0,1 é elevado, optando por =0,01, por exemplo. Exemplo 3: 3. Nível de Significância (α ) O nível de significância () é a probabilidade de ocorrer um erro do tipo I. Antes de iniciar o teste, o pesquisador determina o nível de risco () que pode ser tolerado. Logo, o erro do tipo I está sob o controle do pesquisador. Um teste com um nível de significância de 5% significa que temos cerca de 5 chances em 100 de rejeitarmos a hipótese nula e ela ser verdadeira. Os valores mais comuns para o nível de significância são 5%, 10% e 1%. 4. Testes Unilaterais e Bilaterais Unilateral à direita: Ho: = 0 H1: > 0 Unilateral à esquerda: Ho: = 0 H1: < 0 Bilateral: Ho: = 0 H1: 0 0 é um valor da média Hipótese alternativa unilateral: afirma-se que um parâmetro é maior do que ou menor do que o valor de Ho. Hipótese alternativa bilateral: afirma-se que o parâmetro é diferente do valor de Ho (pode ser menor ou maior). Exemplo 1 (retomando): (afirmação) A pesquisa Survey of Studies and Attitudes (SSHA) é um teste psicológico que mede os hábitos de estudo dos alunos e suas reações à escola. Os escores variam de 0 a 200. O escore médio para estudantes universitários é de aproximadamente 115 e o desvio padrão em torno de 30. Uma professora suspeita que a média para alunos mais velhos seja superior a 115. Ela aplica o teste a uma amostra aleatória simples de 25 estudantes com idades acima de 30 anos. Suponha que os escores para essa população seja normalmente distribuída com desvio padrão de 30. Supondo que a , teste a hipótese a um nível de 5% de significância. H0: μ = 115 H1: μ > 115 6,118X 5. Região crítica e valor crítico O valor de α e a distribuição de probabilidade da estatística do teste vão ser utilizados para definir a chamada região crítica ou região de rejeição. Nível de significância (α) 0,10 ou 10% 0,05 ou 5% 0,01 ou 1% 0,005 ou 0,5% 0,002 ou 0,2% Valores de Zc para testes unilaterais -1,28 ou 1,28 -1,64 ou 1,64 -2,33 ou 2,33 -2,58 ou 2,58 -2,88 ou 2,88 Valores de Zc para testes bilaterais -1,64 e 1,64 -1,96 e 1,96 -2,58 e 2,58 -2,81 e 2,81 -3,08 e 3,08 Valores críticos (Zc) em testes de hipótese É o valor calculado a partir da amostra, que será usado na tomada de decisão. Uma maneira de tomar uma decisão é comparar o valor tabelado (Zc) com a estatística do teste (Zcal). Por exemplo: teste de hipótese para a média (μ) e a proporção (p). xx cal sou )X( Z σ μ Estatística de teste 6. Estatística de Teste Zteste Exemplo 1 (retomando): (afirmação) A pesquisa Survey of Studies and Attitudes (SSHA) é um teste psicológico que mede os hábitos de estudo dos alunos e suas reações à escola. Os escores variam de 0 a 200. O escore médio para estudantes universitários é de aproximadamente 115 e o desvio padrão em torno de 30. Uma professora suspeita que a média para alunos mais velhos seja superior a 115. Ela aplica o teste a uma amostra aleatória simples de 25 estudantes com idades acima de 30 anos. Suponha que os escores para essa população seja normalmente distribuída com desvio padrão de 30. Supondo que a , teste a hipótese a um nível de 5% de significância. H0: μ = 115 H1: μ > 115 6,118X 58,0 25 30 )1156,118( calZ Se o valor da estatística de teste “cair” na região de rejeição, decidimos rejeitar H0; caso contrário, decidimos não rejeitar H0. Exemplo: Decisão com base na estatística de teste e Região Crítica Exemplo 1 (retomando) – teste que mede os hábitos de estudo dos alunos e suas reações à escola. Decisão: não rejeitar H0 x cal X Z )( Com base na definição de α, podemos encontrar a regra de decisão na amostra, ou seja, achar . Isto é, para quais valores de deve-se rejeitar Ho? CX 84,124 6 )115( 64,1 C X Teste unilateral e α=5% X Rejeita-se H0 para qualquer valor acima de 124,84. P é a probabilidade, calculada supondo H0 verdadeira, da estatística de teste acusar um resultado tão (ou mais) distante do esperado quanto o resultado ocorrido na amostra. É usada para avaliar a probabilidade de o resultado obtido ter ocorrido por acaso. Portanto, estabelecido o nível de significância (α), temos a seguinte regra de decisão de um teste estatístico: Valor de P ≤ α → rejeitar H0 Valor de P > α → não rejeitar H0 Os dados não mostram evidência para afirmar H1 Regra de decisão com base em P-valor Os dados são estatisticamente significantes no nível α Se o teste não rejeita H0 (P > α), não temos muito controle do erro tipo II, pois a probabilidade β, em geral não é conhecida. Isso não implica que H0 seja realmente a hipótese verdadeira, mas que os dados não estão mostrando evidência suficiente para rejeitá-la. Exemplo 1 (retomando) – teste que mede os hábitos de estudo dos alunos e suas reações à escola. H0: μ = 115 H1: μ > 115 P-valor: é a probabilidade da estatística de teste acusar um resultado tão (ou mais) distante do esperado quanto o resultado ocorrido na amostra. 25 6,118 n X 58,0calZ P=0,5-0,219=0,281 P ≤ α → rejeitar H0 P > α → não rejeitar H0 Decisão: Como P = 0,281 > α=0,05 não rejeitar H0 (Triola, 2012) Procedimento para a determinação de valores P Em resumo, o processo geral consiste no seguinte: 1. Formular a hipótese nula (H0) e a hipótese alternativa (H1); 2. Escolher a estatística a ser utilizada (Ex. μ, p, correlação...) e encontrar a sua distribuição amostral de probabilidade (Dist. Normal, t de Student, Qui-quadrado) sob o pressuposto de H0 ser verdadeira; 3. Especificar um nível de significância (α); 4. Determinar a região de rejeição com base no passo 3; 5. Calcular o valor da estatística de teste com base na amostra; 6. Decisão: rejeitar H0 ou não rejeitar H0. 7. Interpretar o resultado. (Triola, 2012) Interpretação Exemplo 1 (retomando) – teste que mede os hábitos de estudo dos alunos e suas reações à escola. H0: μ = 115 H1: μ > 115 (afirmação) 25 6,118 n X 58,0calZDecisão: não rejeitar H0 Interpretação: Não há evidência suficiente para apoiar a afirmativa de que o escore médio no teste é maior do que 115 para alunos mais velhos. Tipos de testes paramétricos Os testes paramétricos podemser divididos em testes para: Uma amostra Duas amostras independentes Duas amostras emparelhadas (dependentes) Várias amostras (Análise de Variância) Referências: TRIOLA, Mario F. Introdução a estatística. 12. ed. Rio de Janeiro: LTC, 2012. BARBETTA, Pedro Alberto; REIS, Marcelo Menezes; BORNIA, Antonio Cezar. Estatística Para Cursos de Engenharia e Informática. 3 ed. São Paulo: Atlas, 2010. BRUNI, Adriano L. Estatística Aplicada à Gestão Empresarial. 2.ed. São Paulo: Atlas, 2010. PINTO, S.S.; SILVA, C. S. Estatística vol. 2. Porto Alegre: a autora, 2013. MOORE, D., NOTZ, I., FLINGER, A. A Estatística Básica e sua Prática, 7ª edição. LTC, 2017.
Compartilhar