Prévia do material em texto
Teste de Hipóteses Teste de Hipóteses Em estatística, uma hipótese é uma alegação, ou afirmação, sobre uma característica de uma população: Pesquisadores médicos afirmam que a temperatura média do corpo humano não é igual a 37 ºC. Um novo fertilizante utilizado no cultivo de hortaliças aumenta a produtividade. Teste de Hipóteses A dificuldade nestes casos é que a característica de interesse varia em cada amostra. Daí a necessidade de métodos estatísticos. A temperatura média do corpo humano varia de pessoa para pessoa; A produtividade varia de planta para planta. Estudo de Caso (temperatura do corpo humano) Estudos prévios indicam que a temperatura do corpo humano é 37ºC. Pesquisadores médicos coletaram dados amostrais e encontraram uma média = 36,8ºC e distribuição aproximadamente normal. Estes dados amostrais constituem evidência suficiente para rejeitar a crença comum de que μ = 37 ºC ??? X Estudo de Caso (temperatura do corpo humano) O primeiro passo consiste em formular duas hipóteses sobre a afirmação. As hipóteses são explicações potenciais que procuram levar em conta fatos observados em situações onde existem algumas incógnitas. A incógnita em nosso caso é a verdadeira temperatura do corpo humano. Hipótese Nula e Alternativa A hipótese nula H0 é uma afirmação que diz que o parâmetro populacional é tal como especificado (isto é, a afirmação é correta). H0 : μ = 37 A hipótese alternativa H1 é uma afirmação que oferece uma alternativa à alegação (isto é, o parâmetro é maior/menor/diferente que o valor alegado). H1 : μ ≠ 37 Hipótese Nula e Alternativa A hipótese nula H0 representa o status quo, ou seja, a circunstância que está sendo testada, e o objetivo dos testes de hipóteses é sempre tentar rejeitar a hipótese nula. A hipótese alternativa H1 representa o que se deseja provar ou estabelecer, sendo formulada para contradizer a hipótese nula. A hipótese nula pode ou não ser impugnada pelos resultados de um experimento. Ela nunca pode ser provada, mas pode ser desaprovada no curso da experimentação. R. A. Fisher Teste Unilateral e Bilateral Unilateral direito: H0: ≤ 50 H1: > 50 Unilateral esquerdo: H0: ≥ 50 H1: <50 Bilateral: H0: = 50 H1: 50 Tipos de Erro Repare que, ao testarmos uma hipótese nula, chegamos a uma conclusão: rejeitá-la, ou não rejeitá-la Entretanto, devemos lembrar que tais conclusões ora são corretas, ora são incorretas (mesmo quando fazemos tudo corretamente!). Este é o preço a ser pago por estarmos trabalhando em uma situação onde a variabilidade é inerente !!! Erro do tipo I: Um erro do tipo I ocorre quando a hipótese nula é rejeitada, apesar de ser verdadeira. A probabilidade de cometer o erro tipo I é denominada “nível de significância” e é denotada por α. Erro do Tipo II: Um Erro de tipo II ocorre quando a hipótese nula não é rejeitada, apesar de ser falsa. A probabilidade de cometer o erro tipo II é denotada por β. Tipos de Erro Conceito de aceitar e rejeitar a hipótese H0 ACEITAR OU REJEITAR A HIPÓTESE H0? O estudo parte do princípio que a hipótese H0 é verdadeira até que se tenha prova estatística em contrário ACEITAR H0 = não há provas suficientes para rejeitá-la REJEITAR H0 = há evidências suficientes de que as diferenças obtidas (entre o que era esperado e o que foi observado na amostra) não ocorreram por acaso. Analogia com o direito Aceitar = não há provas suficientes para condenar o réu (não culpado) Rejeitar = as provas reunidas são suficientes para culpar o réu. A eficácia de certa vacina após um ano é de 25% (isto é, o efeito imunológico se prolonga por mais de um ano em apenas 25% das pessoas que a tomam). Desenvolve-se uma nova vacina, mais cara, e deseja-se saber se esta é, de fato, melhor. Sendo “p”a proporção de imunizados por mais de um ano com a nova vacina... Quais hipóteses devem ser formuladas? Que erros poderemos cometer? Exemplo Exemplo Hipótese nula: H0 : p ≤ 0,25 Hipótese alternativa: H1 : p > 0,25 Erro tipo I: aprovar a vacina quando, na realidade, ela não tem nenhum efeito superior ao da vacina em uso. Erro tipo II: rejeitar a nova vacina quando ela é, de fato, melhor que a vacina em uso. Passos para realizar um teste de hipóteses 1. Formular as hipóteses nula e alternativa; 2. Escolher a distribuição amostral adequada; 3. Fixar o nível de significância α do teste; 4. Estabeleça a região de rejeição usando o nível de significância (esboçar um gráfico é SEMPRE uma boa opção); 5. Calcular a estatística de teste; 6. Comparar a estatística de teste com os valores críticos: •Rejeitar a hipótese nula se a estatística de teste excede o valor crítico, ou seja, está na região crítica •Aceitar a hipótese nula, caso contrário. Exemplo 1 Uma máquina automática enche pacotes de café segundo uma distribuição normal com média μ e desvio-padrão 20g A máquina foi regulada para μ = 500g De meia em meia hora tiramos uma amostra de 16 pacotes para verificar se o empacotamento está sob controle, isto é, se μ = 500g Se uma dessas amostras apresentasse = 492g, você pararia ou não o empacotamento para verificar se o ajuste da máquina está correto? x Exemplo 1... Passo 1: Indicamos por X o peso de cada pacote, então X é uma normal com média μ e σ = 20. As hipóteses que nos interessam são: Hipótese nula: H0 : μ = 500g Hipótese alternativa: H1 : μ ≠ 500g Bilateral pois a máquina pode desregular para mais ou para menos Exemplo 1... Passo 2: Escolher a distribuição amostral. Se o desvio padrão populacional é conhecido: Distribuição NORMAL (Zteste) Se o desvio é desconhecido e a amostra é pequena (n < 30): Distribuição de STUDENT(tteste) Passo 3: Escolher o nível de significância Pela situação descrita no problema, podemos fazer α = 0,01 Exemplo 1... Passo 4: Estabeleça a região de rejeição usando o nível de significância Exemplo 1... Passo 4: Estabeleça a região de rejeição usando o nível de significância α = 1% Z = -2,57 Z = 2,57μ = 500 Área = 0,5 – 0,005 = 0,495 Área = 0,5 – 0,005 = 0,495 %5,0 2 %5,0 2 Exemplo 1... Passo 5: Calcular a estatística de teste; n x Zcalc 0 6,1 5 8 16 20 500492 calcZ Exemplo 1... Passo 6: Comparar a estatística de teste com os valores críticos. -2,57 2,57500-1,6 Não houve evidência amostral significativa no sentido de rejeitar H0. Comparação de Médias Variância conhecida Suponha que X é uma variável aleatória com média desconhecida e variância σ2 conhecida. E queremos testar a hipótese de que a média é igual a um certo valor especificado 0. O teste de hipótese pode ser formulado como segue: Para testar a hipótese, toma-se uma amostra aleatória de n observações e se calcula a estatística 01 0o :H :H n X Z ocalc / Cálculo da Região Crítica A região crítica é a região onde H0 é rejeitada. A área da região crítica é igual ao nível de significância (), que estabelece a probabilidade de rejeitar H0 quando ela é verdadeira. Regra de Decisão Se o valor da estatística do teste cair na região crítica, rejeita-se H0. Ao rejeitar a hipótese nula (H0) existe uma forte evidência de sua falsidade. Comparação de Média Variância conhecida A resistência à tração do aço inoxidável produzido numa usina permanecia estável, com uma resistência média de 72 kg/mm2 e um desvio padrão de 2,0 kg/mm2. Recentemente,a máquina foi ajustada. A fim de determinar o efeito do ajuste, 10 amostras foram testadas. 76,2 78,3 76,4 74,7 72,6 78,4 75,7 70,2 73,3 74,2 Presuma que o desvio padrão seja o mesmo que antes do ajuste. Podemos concluir que o ajuste mudou a resistência à tração de aço? (Adote um nível de significância de 5%). Exemplo 2 Passo 1: Formular hipótese nula e alternativa Ho: = 72 kg/mm2 H1: ≠ 72 kg/mm 2 σ = 2kg/mm2 Passo 2: Escolher a distribuição amostral adequada. O desvio padrão da população é conhecido (Zteste) Passo 3: Fixar o nível de significância α do teste. α = 5% Passo 4: Estabeleça a região de rejeição usando o nível de significância. Área = 0,50 – (0,05/2) = 0,4750 Ztab = ±1,96 Exemplo 2... Passo 5: Calcular a estatística de teste 75 10 2,742,707,754,786,727,744,763,782,76 X X 74,4 6325,0 3 10 2 7275 calcZ Sendo = 75 e σ = 2 kg/mm², temos: n x Zcalc X Exemplo 2... Passo 6: Comparar a estatística de teste com os valores críticos. H0 é rejeitada e concluímos que a resistência à tração do aço mudou. Comparação de Média Variância desconhecida Suponha que X é uma variável aleatória Normal com média e variância σ2 DESCONHECIDA. Para testar a hipótese de que a média é igual a um valor especificado o , formulamos: o1 0o :H :H Como σ2 não é conhecido, usa-se a distribuição de Student para construir a estatística do teste. nS X t ocalc / Exemplo 3 Um trecho de uma rodovia estadual, quando é utilizado o radar, são verificadas em média 7 infrações diárias por excesso de velocidade. O chefe de polícia acredita que este número pode ter aumentado. Para verificar isso, o radar foi mantido por 10 dias consecutivos. Os resultados foram: 8, 9, 5, 7, 8, 12, 6, 9, 6, 10 Os dados trazem evidência de aumento nas infrações? Passo 1: Formular as hipóteses nula e alternativa. H0: μ = 7 H1: μ > 7 Exemplo 3... Passo 2: Escolher a distribuição amostral adequada. O desvio padrão da população é desconhecido (tteste) Passo 3: Fixar o nível de significância do teste. α = 5% Passo 4: Estabeleça a região de rejeição usando o nível de significância. Grau de liberdade gl = n -1 gl = 9 ttab = 1,833 Exemplo 3... Passo 5: Calcular a estatística do Teste Temos = 8. Não conhecendo σ, estimamos por S (desvio-padrão da amostra), logo, S = 2,10. Desvio-padrão foi estimado a partir de uma pequena amostra) deve-se usar a estatística t-student. x 5,1 666,0 1 1010,2 78 nS X t ocalc Exemplo 3... Passo 6: Comparar a estatística de teste com os valores críticos Como aceitamos H0, a conclusão é que não houve um aumento significativo no número de infrações. Veja que, apesar de 8 ser maior que 7, a diferença não foi significativa para concluir que o número de infrações aumentou. Um empresário desconfia que o tempo médio de espera para atendimento de seus clientes é superior a 20 minutos. Para testar essa hipótese ele entrevistou 20 pessoas e questionou quanto tempo demorou para ser atendido. O resultado dessa pesquisa aparece a seguir: 22 20 21 23 22 20 23 22 20 24 21 20 21 24 22 22 23 22 20 24 Exemplo de um Teste de Hipótese Para Média H0 : μ ≤ 20 H1 : μ > 20 40,1 8,21 S X 75,5 20 40,1 208,21 n S X tcalc gl 19 %5 729,1 etcrítico Rejeita-se H0 Como decidir qual teste devo utilizar? Teste t Teste Z n ≥ 30? Teste Z Início σ é conhecido? Não Não Sim Sim Um fabricante de pneu alega que seus pneus suportam uma quilometragem de 40.000 milhas no mínimo. Suponhamos que os resultados de um teste tenham sido: amostra n = 49, média amostral 38.000 milhas. Sabe-se que quilometragem de todos os pneus têm desvio-padrão de 3.500 milhas (duração). Realize o teste de hipótese para testar a afirmação do fabricante. 000.40:1 H 000.40:0 H 0,4 49 3500 000.40000.38 0 calc calc Z n x Z Há evidências suficientes para garantir a rejeição da afirmação que a média é maior ou igual à 40 mil Milhas 40000 Adotando: ( = 0,05), temos que Zcrítico = - 1,65 Zcrítico = -1,65 Região de rejeição Zcalc = -4,0 38000 Exemplo de um Teste de Hipótese Para Média Exemplo de um Teste de Hipótese Para Média Um fabricante de fio de arame alega que seu produto tem uma resistência média à ruptura igual ou superior a 10 Kg/cm2, com desvio padrão de 0,5 kg/cm2. O INMETRO resolve testar essa afirmativa, extraindo uma amostra de 50 peças de arame, a qual acusou resistência média de 10,4 kg/cm2. Que conclusão o INMETRO pode chegar? 10:1 H 10: oH 66,5 50 5,0 104,100 n x Zcalc -1,645 +5,66 • Adotando: (=0,05) temos: Zcrítico = -1,645 Há evidências suficientes para garantir que a média é igual ou superior a 10kg/cm². Teste de Hipótese Comparação de duas Médias Passo 1: Definição da Hipótese; Quando há duas populações normais com médias e variâncias desconhecidas, as hipóteses para testar se as médias são iguais são as seguintes: Passo 2: Definição do Nível de Significância; 211 21 : : H Ho Passo 3: Calcular a estatística do Teste O procedimento do teste irá depender de que . Se essa suposição for razoável, então calcula-se a variância combinada. E a seguir calcula-se a estatística do teste: 2 2 2 1 21 21 11 nn S xx t p cal 2 11 21 2 22 2 112 nn S)n(S)n( S p Teste de Hipótese Comparação de duas Médias Passo 4: Região Crítica O valor tabelado de t depende do nível de significância e dos graus de liberdade, que são função do tamanho da amostra. gl = n1 + n2 – 2 Passo 5: Regra de Decisão Comparar o valor da estatística do teste tcal com o valor tabelado ttab com n1+ n2 – 2 graus de liberdade. Ho será rejeitada se: 2,2/ 21 nncalc tt Teste de Hipótese Comparação de duas Médias Comparação de duas Médias O teste t para duas amostras. Passo a passo Passo 1: Estabelecer as hipóteses H0 e H1; Passo 2: Decidir o nível de significância do teste(α); Passo 3: Determinação do valor crítico do teste; Passo 4: Calcular a média de cada grupo; média do grupo 1 média do grupo 2 n x x i 1 n x x i 2 1 )( 2 2 1 n xx s i variância do grupo 1 1 )( 2 2 2 n xx s i variância do grupo 2 Passo 5: Calcular a variância de cada grupo; Passo 6: Calcule a variância ponderada; n1 é o número de elementos do grupo 1 n2 é o número de elementos do grupo 2 2 )1()1( 21 2 22 2 112 nn snsn sp Passo a passo... Passo 7: Calculo da estatística t; Passo 8: Conclusão do teste: Feito os cálculos, é preciso comparar o valor calculado de t com o valor da tabela, ao nível de significância estabelecido e com (n1 + n2 – 2) graus de liberdade ) 11 ( 21 2 21 nn s xx t p Passo a passo... Exemplos de comparação de duas médias • Um químico alega ter descoberto um aditivo para gasolina que revolucionará o rendimento dos automóveis. Para avaliar a afirmação testaram-se 18 carros, com e sem aditivo. • Doze pneus de duas marcas foram postos à prova quanto à duração, objetivando avaliar se existe diferenças nas vidas médias das duasmarcas . • Técnicos de uma indústria que opera com duas linhas de produção desejam avaliar a similaridade de produção das linhas a fim de identificar possíveis pontos de melhoria em uma delas; “Exemplo da aplicação do teste de hipótese para comparação de duas média” Foi desenvolvida uma pesquisa com o objetivo de verificar se os filtros de cigarros realmente fazem diferença ou são apenas truques de venda sem qualquer efeito real. Para isso foram selecionadas aleatoriamente amostras de cigarros com e sem filtro e medida a quantidade (em miligramas) de alcatrão presente. Verifique se os filtros são eficazes na eliminação do alcatrão dos cigarros. Cigarros com filtro Cigarros sem filtro n1 = 21 n2 = 8 S1 = 1,9 S2 = 1,7 Alcatrão (em mg) 3,131 x 0,242 x Teste t para amostras independentes Hipóteses estatísticas: H0: μ1 = μ2 vs. H1: μ1 ≠ μ2 42,3 27 23,202,72 2821 7,1)18(9,1)121( 222 ps 9,13 77,0 7,10 8 1 21 1 42,3 3,1324 calct α = 5% gl = 27 tcrítico = 2,052 Conclusão: Como a estatística de teste (13,9) é maior do que o tcrítico (2,052), podemos concluir de que há indícios que existe diferença estatisticamente significante no conteúdo de alcatrão entre os cigarros com e sem filtro. “Exemplo da aplicação do teste de hipótese para comparação de duas média no setor de serviços” Um Hospital vem recebendo diversas reclamações de seus clientes quanto ao elevado tempo de espera para a realização de exames em seus guichês. Uma ação corretiva para melhoria dos serviços foi desenvolvida e o hospital utilizou-se de duas amostras aleatórias antes e depois da implementação dos resultados para verificar se a ação corretiva teve sucesso, uma vez que o número de reclamações havia reduzido. Adote nível de significância igual =1% = 0,01. 16,3 21 14,5 14,6 25,9 12,1 11,1 14,6 12,6 12,9 6,3 20,8 10,5 15,4 28,5 13,8 17,3 19,9 13,5 8,6 13,9 12,4 14,2 21,7 18 12,1 14,2 6,2 21,3 11,4 29,1 21 18,2 17,2 21,3 10,2 10,7 7,3 6,6 13,8 16,7 17 14,9 14 10,1 4,8 16 17,1 7,9 20,1 Antes da ação Depois da ação Medida do tempo (em minutos) de espera dos pacientes do hospital, antes e depois da ação corretiva 1- Estabelecer as Hipóteses nula e alternativa: 21: oH 211 : H O hospital quer provar que o tempo médio para atendimento era maior antes da ação corretiva. 2- Determinar a região crítica de teste pela Tabela de distribuição t de student: 45,248;01,02; 21 tt nn A hipótese nula deve ser rejeitada se, tcalc > 2,45 211 : H Teste unilateral direito tcrítico μ1 Tempo médio de espera dos clientes antes da ação corretiva μ2 Tempo médio de espera dos clientes depois da ação corretiva 3- Fazer os cálculos necessários a partir dos dados amostrais: 35,3 25 1 25 1 ).60,24( 64,1234,17 11 . 21 2 21 nn s XX t p calc 3.1- Média amostral antes da ação = 17,34 minutos 3.2- Média amostral depois da ação = 12,64 minutos 60,24 2 )1()1( 21 2 22 2 112 nn snsn sp 3.3- 4- Determinar a estatística de teste apropriada: 5- Decidir se a hipótese nula deve ser rejeitada ou não: Como tcalc = 3,35 é maior do que 2,45, a hipótese nula foi rejeitada ao nível de significância de 1%. A equipe técnica tem forte evidência para concluir que o tempo médio de espera antes da ação corretiva é superior ao tempo médio depois da ação. Isto é. A ação corretiva foi eficaz; Região Crítica 0,01 tα tcrítico=2,45 1 - α região de rejeiçãoregião de aceitação Tcalc =3,35 • Para estudar o efeito de um tratamento muitas vezes comparam-se pares de indivíduos. Outra vezes, comparam- se os dois lados dos mesmos indivíduos. • Por exemplo, para estudar o efeito de um tratamento para prevenção de cáries. O dentista pode aplicar o tratamento em um lado da arcada dentária de cada paciente, e deixar o outro lado sem o tratamento. • Também são feitos experimentos em que se observam os mesmo indivíduos duas vezes, isto é, uma vez antes outra vez depois de administrar o tratamento. Por exemplo, para verificar o efeito de um tratamento sobre a pressão arterial, o médico pode obter a pressão arterial de seus pacientes, antes e depois de administrar o tratamento. Teste t para amostras pareadas Teste t para amostras pareadas Todos os exemplo anteriores são de observação pareadas (pares de gêmeos, dois lados de um indivíduo, duas observações no mesmo indivíduo). Procedimentos: 1. Estabeleça as hipóteses; 2. Estabeleça α (alfa); 3. Calcule a estatística do teste 3. 1 Calcule a diferença e as diferenças ao quadrado entre as unidades de cada um dos n pares; d = x2 – x1 d 2 = (x2 – x1) 2 Teste t para amostras pareadas 1 )( 2 2 2 n n d d sd Procedimentos: 3.2 Calcule a média das diferenças; n d d 3.3 Calcule a variância das diferenças; 5. Conclusão Teste t para amostras pareadas Procedimentos: n s d t d 2 3. 4 Calcule a estatística de teste; 4. Estabelecimento do tcrítico; Exemplo de aplicação Na tabela abaixo são dados os pesos de 9 pessoas, antes e depois da dieta para emagrecimento. Pesos em kg de 9 pessoas antes e depois da dieta de emagrecimento Dieta Antes 77 62 61 80 90 72 86 59 88 Depois 80 58 61 76 79 69 90 51 81 1– Definição das Hipóteses H0: μd = 0 vs. H1: μd ≠ 0 2– Estabelecimento de α = 5% Exemplo de aplicação... 3.1– Calculo das diferenças e diferenças ao quadrado Antes Depois d d2 77 80 -3 9 62 58 4 16 61 61 0 0 80 76 4 16 90 79 11 121 72 69 3 9 86 90 -4 16 59 51 8 64 88 81 7 49 Σ 30 300 Exemplo de aplicação... 3.2– Calculo da média das diferenças n d d 33,39 30 d 3.3– Calculo da variância das diferenças 1 )( 2 2 2 n n d d sd 25 8 9 30 300 2 2 ds 3.4– Calculo da estatística de teste Exemplo de aplicação... n s d t d 2 0,2 9 25 33,3 t 4– Estabelecer o tcrítico Ao nível de significância de 1% e com 8 graus de liberdade, o valor de tcrítico é 3,36. 5– Conclusão Com o valor do t calculado (2,0) é menor do que o valor do tcrítico (3,36), conclui-se que o tratamento não tem efeito significante, ao nível de 1%. Em termos práticos, o experimento não provou que a dieta emagrece.