Prévia do material em texto
MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE FEDERAL RURAL DA AMAZONIA DISCIPLINA DE ESTATÍSTICA TESTES DE HIPÓTESES Prof. Dr. Gledson Luiz S. de Castro gledson.castro@ufra.edu.br Belém - PA REFERÊNCIAS MORETTIN, Pedro Alberto; BUSSAB, WILTON OLIVEIRA. Estatística básica. Saraiva Educação SA, 2017. DE ANDRADE, Dalton Francisco; OGLIARI, Paulo José. Estatística para as ciências agrárias e biológicas: com noções de experimentação. Editora da UFSC, 2017. MAGALHÃES, Marcos Nascimento; DE LIMA, Antônio Carlos Pedroso. Noções de probabilidade e estatística. Editora da Universidade de São Paulo, 2002. CONTEÚDO TESTES DE HIPÓTESES 1. Construção de testes de hipóteses 2. Teste para proporções populacionais 2.1. Teste para uma proporção populacional 2.2. Teste de qui-quadrado para duas ou mais proporções 3. Teste para médias populacionais 3.1. Teste para uma média populacional 3.2. Teste para duas médias populacionais 3.3. Teste F para comparações de variâncias populacionais Testes de hipóteses Procedimentos que verificam a veracidade de uma afirmação sobre um ou mais parâmetros populacionais. Hipóteses estatísticas: ✓ A produtividade média de milho em Paragominas é de 2.300 kg/ha; ✓ A produção média de duas cultivares de feijão é a mesma; ✓ A sobrevivência de mudas não depende da época de plantio. Objetivo: Fornecer ferramentas que nos permitam rejeitar ou não uma hipótese estatística através dos resultados de uma amostra. Construção de testes de hipóteses 1. Construção de testes de hipóteses Especificam duas hipóteses: ✓ Hipótese nula (H0); ✓ Hipótese alternativa (H1); Suas formulação seguem: Hipótese nula (H0): é a hipótese que sugere um valor para o parâmetro populacional ou a igualdade dos parâmetros em teste. ✓ Ex. Para germinação de sementes: H0: 𝜋 = 0,94. ✓ Ex. Para produção média de duas cultivares de feijão: H0: 𝜇1 = 𝜇2 Hipótese alternativa (H1): é a hipótese que sugere que a afirmação que estamos fazendo na hipótese nula é falsa. ✓ Ex. Para germinação de sementes: H1: 𝜋 < 0,94. ✓ Ex. Para produção média de duas cultivares de feijão: H1: 𝜇1 ≠ 𝜇2 1. Construção de testes de hipóteses Erros que podem ocorrer: Na tomada de decisão de rejeitar ou não a hipótese nula podem ocorrer os erros: ✓ Erro tipo I: rejeitar H0 quando deveria aceitá-la; ✓ Erro tipo II: aceitar H0 quando deveria rejeitá-la. Os testes devem garantir pequenas probabilidade de cometer esses erros. Erros tipo I e II em testes de hipóteses Ação baseada no teste de hipótese Se H0 é: Verdadeira Falsa não rejeitar H0 decisão correta erro tipo II rejeitar H0 erro tipo I decisão correta Probabilidade dos erros: ✓ Erro tipo I = nível de significância (𝛼), sendo aceitável até 5%; ✓ Erro tipo II é representa por 𝛽 , sendo aceitável até 20%; ✓ Poder do teste = 1 − 𝛽 Teste para proporções populacionais 2. Teste para proporções populacionais Avalia afirmações feitas sobre proporções ou % populacionais, nas seguintes situações: 1) Teste para uma proporção populacional; 2) Teste para duas ou mais proporções. 2.1. Teste para uma proporção populacional ✓ Rejeitar ou não o parâmetro populacional (𝜋) com base na amostra aleatória simples; ✓ Usa critério baseado na proporção amostral (P), que segue distribuição normal; ✓ Para amostras grandes, com 𝜋 e desvio padrão, segue: 𝜎𝑃 = 𝜋(1 − 𝜋) 𝑛 onde n é tamanho da amostra. 2. Teste para proporções populacionais 2.1. Teste para uma proporção populacional Exemplo do poder germinativo de sementes, temos: 𝑃𝑟𝑜𝑏 𝑃 < 0,94 𝜋 = 0,94 = 𝑃𝑟𝑜𝑏 𝑍 < 0,94 − 0,94 0,94(1 − 0,94) 100 Esse valor (0,50) é probabilidade de cometer o erro tipo I (acima do aceitável 𝜶 = 𝟎, 𝟎𝟓) 𝐻0: 𝜋 = 0,94 vs 𝐻1: 𝜋 < 0,94 Qual a probabilidade de rejeitar 𝐻0 quando for verdadeira (P < 0,94)? Baseado na proporção amostral P em uma amostra de n = 100, será: = 𝑃𝑟𝑜𝑏 𝑍 < 0 0,02375 = 𝟎, 𝟓𝟎 Qual o valor de P para diminuir o erro tipo I ? (𝜶 = 𝟎, 𝟎𝟓) 2. Teste para proporções populacionais 2.1. Teste para uma proporção populacional Exemplo do poder germinativo de sementes, temos: 𝑝𝑐 − 0,94 0,94(1 − 0,94) 100 = −1,65 ⇒ 𝑝𝑐 = 0,90 Considerações: Região de rejeição do teste = todos valores de P menores que 0,90. Região de aceitação do teste = todos valores de P maiores ou igual a 0,90. 𝐻0: 𝜋 = 0,94 vs 𝐻1: 𝜋 < 0,94 Para 𝛼 = 0,05 o valor de Z deve ser igual a -1,65 (distribuição normal padrão); O valor de P será: 2. Teste para proporções populacionais 2.1. Teste para uma proporção populacional Exemplo do poder germinativo de sementes, temos: 𝐻0: 𝜋 = 0,94 vs 𝐻1: 𝜋 < 0,94 Para 𝛼 = 0,05 o valor de Z deve ser igual a -1,65, para P = 0,90: 𝒛−1,65 0,90 0,00 0,94 5% 45% Região de aceitação de 𝐻0 Região de rejeição de 𝐻0 Para 𝜶 = 𝟎, 𝟎𝟓: ✓ 𝑃 = 0,90 é ponto crítico ou linha divisória entre diferença casual e diferença real; ✓ Se 0,90 ≤ 𝑃 ≤ 0,94 , 𝐻0 será aceita; ✓ Se 𝑃 ≤ 0,90, 𝐻0 será rejeitada; 2. Teste para proporções populacionais 2.1. Teste para uma proporção populacional Possibilidades para a hipótese alternativa: 𝐻1: π ≠ 𝜋0 𝑡𝑒𝑠𝑡𝑒 𝑏𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 𝐻1: π > 𝜋0 𝑡𝑒𝑠𝑡𝑒 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑖𝑎𝑙 à 𝑑𝑖𝑟𝑒𝑖𝑡𝑎 𝐻1: π < 𝜋0 𝑡𝑒𝑠𝑡𝑒 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑖𝑎𝑙 à 𝑒𝑠𝑞𝑢𝑒𝑟𝑑𝑎 𝑷 Ponto crítico (𝑃𝑐) 𝛼 1 − 𝛼 Região de aceitaçãoRegião de rejeição 𝑻𝒆𝒔𝒕𝒆 𝒖𝒏𝒊𝒍𝒂𝒕𝒆𝒓𝒂𝒍 à 𝒆𝒔𝒒𝒖𝒆𝒓𝒅𝒂 𝑷 Ponto crítico(𝑃𝑐) 𝛼1 − 𝛼 Região de aceitação Região de rejeição 𝑻𝒆𝒔𝒕𝒆 𝒖𝒏𝒊𝒍𝒂𝒕𝒆𝒓𝒂𝒍 à 𝒅𝒊𝒓𝒆𝒊𝒕𝒂 𝑷 Ponto crítico (𝑃𝑐1) 𝛼/2 1 − 𝛼 Região de aceitaçãoRegião de rejeição 𝛼/2 Ponto crítico (𝑃𝑐2) Região de rejeição 𝑻𝒆𝒔𝒕𝒆 𝒃𝒊𝒍𝒂𝒕𝒆𝒓𝒂𝒍 2. Teste para proporções populacionais 2.1. Teste para uma proporção populacional Exemplo: Um biólogo, com base em conhecimentos, afirma que a proporção (𝜋) de forófitos sem bromélias, no estado arbóreo pioneiro de uma floresta, é igual a 0,47. Em uma amostra de 35 forófitos, 24 não apresentaram bromélias ( ො𝑝 = 24/35 = 0,686). Teste a afirmativa do biólogo ao nível de significância de 5%. ✓ Para 𝜋0 = 0,47 e uma hipótese alternativa bilateral, as hipóteses são: 𝐻0: 𝜋 = 0,47 vs 𝐻1: 𝜋 ≠ 0,47 ✓ Como 𝐻1 bilateral, a região de rejeição de 𝐻0 determina dois valores críticos: 𝑝𝑐1 e 𝑝𝑐2. −1,96 = 𝑝𝑐1 − 0,47 0,47(1 − 0,47) 35 ⇒ 𝑝𝑐1 = 0,305 +1,96 = 𝑝𝑐2 − 0,47 0,47(1 − 0,47) 35 ⇒ 𝑝𝑐1 = 0,635 Decisão: ✓ Se 0,305 < 𝑃 < 0,635, 𝐻0 será aceita; ✓ Se 𝑃 < 0,305 𝑜𝑢 𝑃 > 0,635, 𝐻0 será rejeitada; Logo, rejeita-se 𝐻0 com 𝛼 = 0,05 2. Teste para proporções populacionais 2.1. Teste para uma proporção populacional Exemplo: Um biólogo, com base em conhecimentos, afirma que a proporção (𝜋) de forófitos sem bromélias, no estado arbóreo pioneiro de uma floresta, é igual a 0,47. Em uma amostra de 35 farófitos, 24 não apresentaram bromélias ( ො𝑝 = 24/35 = 0,686). Teste a afirmativa do biólogo ao nível de significância de 5%. 𝒛−1,65 0,305 0,00 0,635 2,5% 95% Região de aceitação de 𝐻0 Região de rejeição de 𝐻0 2,5% +1,65 Região de rejeição de 𝐻0 𝟎, 𝟔𝟖𝟔 Decisão: Rejeitamos a afirmação do biólogo sobre a verdadeira proporção de forófitos sem bromélias, ao nível de significância de 5% Teste de hipótese através do valor p Teste de hipótese através do valor p ✓ Forma mais direta para realizar o teste de hipótese; ✓ Calcula a Probabilidade de obter um valor igual ou mais extremo (±) que o obtido pelo pesquisador, sabendo que 𝐻0 é verdadeira. Decisão com valor p: ✓ Rejeita-se 𝐻0 quando o valor p é menor que o nível de significância (𝛼); ✓ Nível de significância é fixado pelo pesquisador; Representa a probabilidade de rejeição indevida da 𝐻0 Teste de hipótese através do valor p Exemplo: Para o caso dos forófitos sem bromélias, o valor p representa a probabilidade de obtermos um valor de proporção de forófitos sem bramélias igual ou extremo (±) do que o valor encontrado pelo pesquisador, quer será maior ou menor do que 0,47 (𝐻1é bilateral). Numa amostra de 35 forófitos: ✓ O valor encontrado ො𝑝 = 0,686 estar acima de 0,47; ✓ O valor extremo abaixo é 0,254 = 0,47 - 0,216, onde 0,216 = 0,686 - 0,47; ✓ Assim, o valor p é dado por: 𝑣𝑎𝑙𝑜𝑟 𝑝 = 𝑃𝑟𝑜𝑏 𝑃 ≥ 0,686 𝜋 = 0,47 + 𝑃𝑟𝑜𝑏 𝑃 ≤ 0,254 𝜋 = 0,47 = 𝑃𝑟𝑜𝑏 𝑍 ≥ 0,686 − 0,47 0,0844 + 𝑃𝑟𝑜𝑏 𝑍 ≤ 0,254 − 0,47 0,0844 = 𝑃𝑟𝑜𝑏(𝑍 ≥ 2,56) + 𝑃𝑟𝑜𝑏(𝑍 ≤ −2,56) = 2 𝑥 [0,5 − 𝑃𝑟𝑜𝑏 0 ≤ 𝑍 ≤ 2,56 ] = 2 𝑥 0,5 − 0,4948 = 2 𝑥 0,0052 = 𝟎, 𝟎𝟏𝟎𝟒. ⇒ Rejeita-se 𝐻0, pois valor p < 𝛼. 1) Para o caso da germinação de sementes, qual o valor p para obter uma proporção de germinação menor ou igual a 0,93? tendo em vista que a 𝐻1 é unilateral à esquerda, de uma amostra de 100 sementes, extraídas de um lote (população) com proporção de germinação 𝜋 = 0,94. (PAREI AQUI - FOI FEITO) Resp. valor p = 0,3372 EXERCÍCIO PARA FIXAÇÃO 2. Teste para proporções populacionais Teste de qui-quadrado (𝑿𝟐) para duas ou mais proporções Utilizado para frequências (contagem) de ocorrências: ✓ Classificadas em categorias de variáveis qualitativas (associação); ✓ Representada por tabelas de contingência; ✓ Testa hipóteses de homogeneidade e independência. Exemplo: Distribuição conjunta das frequências das variáveis época de plantio e sobrevivência de enxertos de ameixeiras. Época Raízes TOTAL Sobreviventes Mortas Fora da primavera 263 217 480 Na primavera 115 365 480 TOTAL 378 582 960 As proporções de sobrevivência são as mesmas nas duas épocas de plantio? 2. Teste para proporções populacionais 2.1. Teste de qui-quadrado para duas ou mais proporções 2.1. Teste de qui-quadrado para duas ou mais proporções Exemplo: A tabela abaixo representa a distribuição conjunta das frequências das variáveis época de plantio e sobrevivência de enxertos de ameixeiras. Podemos afirmar, como 5% de significância, que as proporções de sobrevivência são as mesmas nas duas épocas de plantio? Época Raízes TOTAL Sobreviventes Mortas Fora da primavera 263 217 480 Na primavera 115 365 480 TOTAL 378 582 960 Para duas proporções): 𝜋1 = Proporção de sobreviventes fora na primavera; 𝜋2 = Proporção de sobreviventes na primavera. Hipóteses: 𝐻0: 𝜋1 = 𝜋2 vs 𝐻1: 𝜋1 ≠ 𝜋2 Estatística do teste (𝑿𝟐): 𝑋2 = 𝑖=1 𝑠 𝑗=1 𝑟 (𝑛𝑖𝑗 − 𝑒𝑖𝑗) 2 𝑒𝑖𝑗 , 𝑒𝑖𝑗 = (𝑛𝑖.𝑛.𝑗) 𝑛.. onde 𝑛𝑖𝑗 é a frequência observada, e 𝑒𝑖𝑗 é frequência esperada. 𝑛𝑖., 𝑛.𝑗, 𝑛.. representam as frequências marginais e total da tabela Decisão do teste: ✓ 𝐻0 será rejeitada se 𝑋 2 > 𝑋𝑐 2, ✓ 𝑋𝑐 2 é valor crítico da tabela (distribuição qui-quadrado) 2.1. Teste de qui-quadrado para duas ou mais proporções Exemplo: A tabela abaixo representa a distribuição conjunta das frequências das variáveis época de plantio e sobrevivência de enxertos de ameixeiras. Podemos afirmar, como 5% de significância, que as proporções de sobrevivência são as mesmas nas duas épocas de plantio? Época Raízes TOTAL Sobreviventes Mortas Fora da primavera 263 217 480 Na primavera 115 365 480 TOTAL 378 582 960 𝑋2 = 𝑖=1 𝑠 𝑗=1 𝑟 (𝑛𝑖𝑗 − 𝑒𝑖𝑗) 2 𝑒𝑖𝑗 , 𝑒𝑖𝑗 = (𝑛𝑖.𝑛.𝑗) 𝑛.. Frequências observadas (𝑛𝑖𝑗): 𝑛11 = 263, 𝑛12= 217, 𝑛21= 115, 𝑛22= 365 Frequências marginais e total: 𝑛1. = 263 + 217 = 480, 𝑛2.= 115 + 365 = 480, 𝑛.1 = 263 + 115 = 378, 𝑛.2= 217 + 365 = 582. 𝑛.. = 263 + 217 + 115 + 365 = 960 Frequências esperadas (𝑒𝑖𝑗): 𝑒11 = 480 𝑥 378 960 = 189, 𝑒12 = 480 𝑥 582 960 = 291, 𝑒21 = 480 𝑥 378 960 = 189, 𝑒22 = 480 𝑥 582 960 = 291 2.1. Teste de qui-quadrado para duas ou mais proporções Exemplo: A tabela abaixo representa a distribuição conjunta das frequências das variáveis época de plantio e sobrevivência de enxertos de ameixeiras. Podemos afirmar, como 5% de significância, que as proporções de sobrevivência são as mesmas nas duas épocas de plantio? Frequências observadas (𝑛𝑖𝑗): 𝑛11 = 263, 𝑛12= 217, 𝑛21= 115, 𝑛22= 365 O valor da estatística 𝑋2 será: 𝑋2 = 𝑖=1 𝑠 𝑗=1 𝑟 (𝑛𝑖𝑗 − 𝑒𝑖𝑗) 2 𝑒𝑖𝑗 = (263 − 189)2 189 + (217 − 291)2 291 + (115 − 189)2 189 + (365 − 291)2 291 Frequências esperadas (𝑒𝑖𝑗): 𝑒11 = 480 𝑥 378 960 = 189, 𝑒12 = 480 𝑥 582 960 = 291, 𝑒21 = 480 𝑥 378 960 = 189, 𝑒22 = 480 𝑥 582 960 = 291 = (74)2 189 + (−74)2 291 + (−74)2 189 + (74)2 291 = 95,593 Portanto, como 𝑋2 = 95,593 > 𝑋𝑐 2 = 3,841, rejeita-se 𝐻0. Podemos afirmar que existe diferença significativa entre proporções de raízes sobreviventes nas duas épocas de plantio, com 𝛼 = 0,05. Valor crítico 𝑿𝒄 𝟐 : Nível de significância (𝛼) Grau de liberdade: (s – 1) x (r - 1) Exemplo para: 𝛼 = 0,05 gl: (2 – 1) x (2 - 1) = 1 𝑿𝒄 𝟐 = 𝟑, 𝟖𝟒𝟏 2.1. Teste de qui-quadrado para duas ou mais proporções Obs.: Para o exemplo anterior a correção de continuidade não produz uma alteração muito grande no valor de 𝑋2 , pois o tamanho da amostra é grande n = 960 𝑋2 = 𝑖=1 𝑠 𝑗=1 𝑟 ( 𝑛𝑖𝑗 − 𝑒𝑖𝑗 − 0,5) 2 𝑒𝑖𝑗 𝑋2 = (74 − 0,5)2 189 + (74 − 0,5)2 291 + (74 − 0,5)2 189 + (74 − 05)2 291 = 94,296 Correção de continuidade ou correção de Yates ✓ Utilizado para amostras pequenas (erros de aproximações); ✓ Consiste em subtrair 0,5 das diferenças entre |𝑛𝑖𝑗 − 𝑒𝑖𝑗|; ✓ A estatística apropriada de 𝑋2 será: Obs.: Quando o nº de categorias, em pelo menos uma das variáveis, é maior que 2, não se faz necessário a correção de continuidade. 2) Foi conduzido um experimento com o objetivo de avaliar o poder germinativo de duas cultivares de cebola: a) Bola precoce e b) Norte 14. Foram utilizadas para o teste de germinação, quatro repetições de 100 sementes, totalizando 400 sementes para cada cultivar. A variável de estudo é o número de sementes que germinam (tabela abaixo). Teste a hipótese de que não há diferença entre as duas cultivares quanto à germinação, ao nível de significância de 5%. Resp. Como 𝑋𝑜𝑏𝑠 2 = 3,834 < 𝑋𝑐 2 = 3,841 aceita-se 𝐻0 com nível de significância de 5%. Portanto, as cultivares são semelhantes quanto a germinação. EXERCÍCIO PARA FIXAÇÃO 2. Teste para proporções populacionais Cultivares Germinação TOTAL Germinam Não germinam Bola Precoce 392 8 400 Norte 14 381 19 400 TOTAL 773 27 800 Teste para médias populacionais 3. Teste para médias populacionais Testa hipóteses (afirmações) sobre médias: ✓ Pressupõem que a média amostral tem (≅) distribuição normal; ✓ Serão considerados testes com uma e duas médias. 3.1. Teste para uma média populacional ✓ A hipótese nula é dada por: 𝐻0: 𝜇 = 𝜇0 (onde 𝜇0 é um valor conhecido) ✓ As hipóteses alternativas podem ser: ✓ Depende da variância populacional ser conhecida ou não. 𝐻1: 𝜇 ≠ 𝜇0(teste bilateral) 𝐻1: 𝜇 > 𝜇0 (teste unilateral à direita) 𝐻1: 𝜇 < 𝜇0 (teste unilateral à esquerda) 3. Teste para médias populacionais 3.1. Teste para uma média populacional Com variância conhecida (𝝈𝟐) ✓ Estatística do teste: ✓ Decisão do teste com base no valor p: • valor p = Prob(Z < 𝑧𝑜𝑏𝑠) para 𝐻1: 𝜇 < 𝜇0; • valor p = Prob(Z > 𝑧𝑜𝑏𝑠) para 𝐻1: 𝜇 > 𝜇0; • valor p = 2 x Prob(Z > |𝑧𝑜𝑏𝑠|) para 𝐻1: 𝜇 ≠ 𝜇0, 𝑍 = ത𝑋 − 𝜇0 𝜎 𝑛 𝐻0 será rejeitada quando o valor p for menor do que 𝛼 TABELA DA DISTRIBUIÇÃO NORMAL PADRÃO 3. Teste para médias populacionais 3.1. Teste para uma média populacional Com variância conhecida (𝝈𝟐) Exemplo: Uma balança para encher pacotes de sementes automaticamente está programada para produzir pacotes com peso médio de 20 kg e desvio padrão de 0,20 kg. Periodicamente é feita uma inspeção para verificar se o peso médio está sob controle. Para este fim, foi selecionada uma amostra de oito pacotes de sementes, cujos resultados foram: Teste a hipótese de que a balança se desregulou e está produzindo um peso médio inferior a 20 kg (𝛼 = 0,05). ✓ As hipóteses são dadas por: 𝐻0: 𝜇 = 20 𝑣𝑠 𝐻1: 𝜇 < 20 20,3 19,8 20,3 19,7 19,8 19,7 19,8 19,8 𝑧𝑜𝑏𝑠 = 19,9 − 20 0,20 8 = −1,14 ⇒ 𝑣𝑎𝑙𝑜𝑟 𝑝 = 𝑃𝑟𝑜𝑏 𝑍 < −1,41 =0,5000 − 0,4207 = 0,0793 ✓ Para a amostra, temos: ҧ𝑥 = 19,9 kg. Logo: Portanto, como p valor > 𝛼 , não rejeita-se 𝐻0. Ou seja, a balança não desregulou. 3. Teste para médias populacionais 3.1. Teste para uma média populacional Com variância desconhecida (𝝈𝟐) ✓ O 𝜎 é substituído por S (desvio padrão amostral); ✓ Segue distribuição t de Student (n - 1); ✓ Estatística do teste: ✓ Decisão do teste com base no valor p: • valor p = Prob(𝑡𝑛−1 < 𝑡𝑜𝑏𝑠)/2 para 𝐻1: 𝜇 < 𝜇0; • valor p = Prob(𝑡𝑛−1 > 𝑡𝑜𝑏𝑠)/2 para 𝐻1: 𝜇 > 𝜇0; • valor p = 2 x Prob(𝑡𝑛−1 > |𝑡𝑜𝑏𝑠|) para 𝐻1: 𝜇 ≠ 𝜇0, 𝑡 = ത𝑋 − 𝜇0 𝑆 𝑛 𝐻0 será rejeitada quando o valor p for menor do que 𝛼 Exige uso de software estatístico Decisão com base no 𝒕𝒄 ✓ 𝐻0 será aceita se |𝑡𝑜𝑏𝑠| < 𝑡𝑐 ✓ 𝐻0 será rejeitada se |𝑡𝑜𝑏𝑠| > 𝑡𝑐 TABELA DA DISTRIBUIÇÃO T DE STUDENT Observações: ✓ Grau liberdade (n - 1) ✓ Nível de significância 𝛼 Valor de p adotado ✓ Para bilateral: 𝑝 = 𝛼 ✓ Para unilateral: 𝑝 = 2𝛼 3. Teste para médias populacionais 3.1. Teste para uma média populacional Com variância desconhecida (𝝈𝟐) Exemplo: Um agrônomo afirma que a produtividade média do feijão da safra das lavouras de agricultores familiares é de 800 kg/ha. Para investigar a veracidade dessa afirmação selecionou- se uma amostra de nove lavouras onde obteve-se valores de produtividade: Qual a conclusão ao nível de significância de 5%? 𝑡 = ത𝑋 − 𝜇0 𝑆 𝑛 ⇒ 𝑡𝑜𝑏𝑠 = 740,11 − 800 24,07 9 = −59,89 8,02 = −7,468 Lavoura 1 2 3 4 5 6 7 8 9 Produtividade 767,8 764,1 716,8 750,2 756,0 692,5 736,1 746,1 731,4 Hipóteses: 𝐻0: 𝜇 = 800 𝑘𝑔 𝑣𝑠 𝐻1: 𝜇 ≠ 800 𝑘𝑔/ℎ𝑎 Dados da amostra: ҧ𝑥 = 740,11 𝑘𝑔/ℎ𝑎 𝑒 𝑠 = 24,07𝑘𝑔/ℎ𝑎 : Decisão: Como 𝑡𝑜𝑏𝑠 = 7,468 > 𝑡(8; 5%) = 2,306 rejeita-se 𝐻0, com 5% de significância. Teste para duas médias populacionais 3. Teste para médias populacionais 3.2. Teste para duas médias populacionais: ✓ Testa afirmações (hipóteses) sobre duas médias (𝐻0: 𝜇1 = 𝜇2): ✓ Fundamentação - média amostral próxima a distribuição normal; ✓ Serão considerados dois casos: • Dados pareados ou amostras dependentes: Os dados das duas amostras estão relacionados dois a dois, pois são retirados da mesma população em tempos diferentes. • Dados NÃO pareados ou amostras independentes: Os dados das duas amostras Não estão relacionados dois a dois, pois são retirados de populações diferentes. 3. Teste para médias populacionais 3.2. Teste para duas médias populacionais: Teste para dados pareados ✓ Hipóteses testadas: 𝐻0: 𝜇𝐴 = 𝜇𝐵 𝑣𝑠 𝐻1: 𝜇𝐴 > 𝜇𝐵 𝐻1: 𝜇𝐴 < 𝜇𝐵 𝐻1: 𝜇𝐴 ≠ 𝜇𝐵 ✓ Mesmas hipóteses com diferenças (D): 𝐻0: 𝜇𝐷 = 0 𝐻1: 𝜇𝐷 > 0 𝑡 = ഥ𝐷 − 0 𝑆𝐷 𝑛 = ഥ𝐷 𝑆𝐷 𝑛 ✓ Estatística do teste: Onde, ഥ𝐷 é a média amostral das diferenças entre A e B, 𝑆𝐷 é o desvio padrão das diferenças Considere 𝑛1 − 1 grau de liberdade para 𝑡𝑐 3. Teste para médias populacionais Teste para dados pareados Exemplo: Foi conduzido um experimento para estudar o conteúdo de hemoglobina no sangue de suínos com deficiência de niacina. Aplicaram-se 20 mg de niacina em oito suínos. Podemos afirmar que o conteúdo de hemoglobinas no sangue diminui com a aplicação de niacina, ao nível de significância de 5%? A tabela abaixo mostra os níveis de hemoglobina antes e depois da aplicação de niacina. Suínos Antes (A) Depois (B) Diferenças (D = A - B) 1 13,6 11,4 2,2 2 13,6 12,5 1,1 3 14,7 14,6 0,1 4 12,1 13,0 -0,9 5 12,3 11,7 0,6 6 13,2 10,3 2,9 7 11,0 9,8 1,2 8 12,4 10,4 2,0 Hipóteses são: 𝐻0: 𝜇𝐴 = 𝜇𝐵 𝑣𝑠 𝐻1: 𝜇𝐴 > 𝜇𝐵 Média das diferenças: ҧ𝑑 = (2,2+1,1+0,1+⋯+2,0) 8 = 1,15 mg Desvio padrão das diferenças: 𝑠 ത𝑑 = (2,2−1,15)2 +(1,1−1,15)2+⋯+(2,0−1,15)2) 8−1 = 1,23 mg Estatística do teste: 𝑡 = ഥ𝐷 𝑆𝐷 𝑛 ⇒ 𝑡𝑜𝑏𝑠 = 1,15 1,23 8 = 2,655. Decisão: Como 𝑡𝑜𝑏𝑠 > 𝑡𝑐, rejeita-se 𝐻0 com 𝛼 = 0,05 3. Teste para médias populacionais Teste para dados pareados Exemplo: Foi conduzido um experimento para estudar o conteúdo de hemoglobina no sangue de suínos com deficiência de niacina. Aplicaram-se 20 mg de niacina em oito suínos. Podemos afirmar que o conteúdo de hemoglobinas no sangue diminui com a aplicação de niacina, ao nível de significância de 5%? A tabela abaixo mostra os níveis de hemoglobina antes e depois da aplicação de niacina. Decisão: Como 𝑡𝑜𝑏𝑠 = 2,655 > 𝑡𝑐 = 1,895, rejeita-se 𝐻0 com 𝛼 = 0,05 𝑷 1,895 𝛼 1 − 𝛼 Região de aceitação Região de rejeição 𝑻𝒆𝒔𝒕𝒆 𝒖𝒏𝒊𝒍𝒂𝒕𝒆𝒓𝒂𝒍 à 𝒅𝒊𝒓𝒆𝒊𝒕𝒂 2,655 Concluímos, ao nível de significância de 5%, que o conteúdo de hemoglobina diminui com a aplicação de 20 mg de niacina. 3. Teste para médias populacionais 3.2. Teste para duas médias populacionais: Teste para dados NÃO pareados (variâncias iguais) ✓ Hipóteses testadas: 𝐻0: 𝜇1 = 𝜇2 𝑣𝑠 𝐻1: 𝜇1 > 𝜇2 𝐻1: 𝜇1 < 𝜇2 𝐻1: 𝜇1 ≠ 𝜇2 ✓ Estatística do teste: 𝑡 = ( ത𝑋1 − ത𝑋2) 𝑆( ത𝑋1− ത𝑋2) Onde 𝑆( ത𝑋1− ത𝑋2) = 𝑛1−1 𝑆1 2+(𝑛2−1)𝑆2 2 𝑛1 + 𝑛2 − 2 1 𝑛1 + 1 𝑛2 é o estimador do desvio padrão da diferença entre as médias amostrais Distribuição t de Student com 𝑛1 + 𝑛2 − 2 grau de liberdade 3. Teste para médias populacionais Teste para dados NÃO pareados (variâncias iguais) Exemplo: Com o objetivo de comparar as produções médias, em toneladas por hectare, de duas variedades de milho (Variedade A e Variedade B), foram observadas cinco unidades experimentais para cada uma e os resultados obtidos estão na tabela abaixo (𝛼 = 0,05) Hipóteses são: 𝐻0: 𝜇𝐴 = 𝜇𝐵 𝑣𝑠 𝐻1: 𝜇𝐴 ≠ 𝜇𝐵 Estimador Desvio padrão: 𝑆( ത𝑋1− ത𝑋2) = 𝑛1−1 𝑆𝐴 2+(𝑛2−1)𝑆𝐵 2 𝑛1 + 𝑛2 − 2 1 𝑛1 + 1 𝑛2 = 5−1 0,0231+ 5−1 0,0150 5 + 5 − 2 1 5 + 1 5 = 0,087 Estatística do teste: 𝑡 = ( ത𝑋1− ത𝑋2) 𝑆(ഥ𝑋1−ഥ𝑋2) ⇒ 𝑡𝑜𝑏𝑠 = (1,34 − 1,80) 0,087 = −0,46 0,087 = −5,263 Decisão: Como 𝑡𝑜𝑏𝑠 = 5,263 > 𝑡𝑐 = 2,306, rejeita-se 𝐻0 com 𝛼 = 0,05. Concluímos que as produções médias das duas variedades de milho são diferentes. Variedade A 1,3 1,4 1,1 1,4 1,5 Variedade B 1,8 1,6 1,9 1,9 1,8 Dos dados das amostras obtemos: ҧ𝑥𝐴 = 1,34; ҧ𝑥𝐵 = 1,80; 𝑠𝐴 2 = 0,0231; 𝑠𝐵 2 = 0,0150 3. Teste para médias populacionais Teste para dados NÃO pareados (variâncias iguais) Exemplo: Com o objetivo de comparar as produções médias, em toneladas por hectare, de duas variedades de milho (Variedade A e Variedade B), foram observadas cinco unidades experimentais para cada uma e os resultados obtidos estão na tabela abaixo (𝛼 = 0,05) 𝒛-2,306 0,00 2,5% 95% Região de aceitação de 𝐻0 Região de rejeição de 𝐻0 2,5% 2,306 Região de rejeição de 𝐻0 -5,263 Decisão: Como 𝑡𝑜𝑏𝑠 = 5,263 > 𝑡𝑐 = 2,306, rejeita-se 𝐻0 com 𝛼 = 0,05. Concluímos que as produções médias das duas variedades de milho são diferentes. 3. Teste para médias populacionais 3.2. Teste para duas médias populacionais: Teste para dados NÃO pareados (variâncias desiguais) ✓ Hipóteses testadas: 𝐻0: 𝜇1 = 𝜇2 𝑣𝑠 𝐻1: 𝜇1 > 𝜇2 𝐻1: 𝜇1 < 𝜇2 𝐻1: 𝜇1 ≠ 𝜇2 ✓ Estatística do teste: 𝑡 = ( ത𝑋1 − ത𝑋2) 𝑆1 2 𝑛1 + 𝑆2 2 𝑛2 ✓ t de Student com grau de liberdade: 𝑔𝑙 = 𝑆1 2 𝑛1 + 𝑆2 2 𝑛2 2 𝑆1 2 𝑛1 2 / 𝑛1−1 + 𝑆2 2 𝑛2 2 / 𝑛2−1 , Obs.: utiliza número inteiro arredondado para menos. 3. Teste para médias populacionais 3.2. Teste para duas médias populacionais Teste para dados NÃO pareados (variâncias desiguais) Exemplo: As seguintes medidas de Cytochrome oxidase foram determinadas em machos de peixes Periplaneta em mm3 por 10 min por mg, em um estudo para comparar dois tratamentos, quais sejam: 1) 24 horas após injeção de Methoxyclor e 2) controle, sem injeção de methoxyclor. Verifique se existe efeito significativo da aplicação de Methoxyclor quanto às médias de Cytochrome oxidase (𝛼 = 0,05). Tratamentos Tamanho da amostra Média Variância 24 horas após injeção 5 24,8 0,81 Controle 3 19,7 7,84 Hipóteses são: 𝐻0: 𝜇𝑇 = 𝜇𝐶 𝑣𝑠 𝐻1: 𝜇𝑇 ≠ 𝜇𝐶 Estatística: 𝑡 = ( ത𝑋1− ത𝑋2)𝑆1 2 𝑛1 + 𝑆2 2 𝑛1 ⇒ 𝑡𝑜𝑏𝑠 = (24,8 − 19,7) 0,81 5 + 7,84 3 = 3,06 Decisão: Como 𝑡𝑜𝑏𝑠 = 3,06 < 𝑡𝑐 = 4,303, aceita-se 𝐻0 com 𝛼 = 0,05. Concluímos que o uso de aplicação de Methoxyclor não forneceu resultado diferente do controle. 𝑔𝑙 = (0,81/5 + 7,84/3)2 (0,81/5)2/4 + 7,84/3 2/2 = 2,25 ≈ 2 Teste F para comparações de variâncias populacionais 3. Teste para médias populacionais 3.3. Teste F para duas variâncias populacionais: ✓ Testa afirmações sobre igualdade ou não de variância (𝜎2); ✓ Hipóteses testadas: 𝐻0: 𝜎1 2 = 𝜎2 2 𝑣𝑠 𝐻0: 𝜎1 2 > 𝜎2 2 ✓ Estatística F (amostras independentes): ✓ Deve-se considerar 𝑆1 2 como a maior variância; ✓ Segue distribuição F com 𝑛1 − 1 𝑒 𝑛2 − 1 graus de liberdade. 𝐹 = 𝑆1 2 𝑆2 2 ✓ Decisão do teste F: Se 𝐹𝑜𝑏𝑠 > 𝐹𝑛1−1,𝑛2−1,𝛼 rejeita-se 𝐻0 3. Teste para médias populacionais 3.3. Teste F para duas variâncias populacionais: Exemplo: Dos dados do exemplo para comparações de duas variedades de milho, A e B, obtemos, 𝑆𝐴 2 = 0,0231 com quatro graus de liberdade e 𝑆𝐵 2 = 0,0150 também com quatro graus de liberdade. Assim a estatística F é: 𝐹𝑜𝑏𝑠 = 𝑆1 2 𝑆2 2 = 0,0231 0,0150 = 1,54 ✓ Obtenção do F crítico, sendo 𝐹𝑛1−1,𝑛2−1,𝛼 = 𝐹4−1, 4 −1, 5% = 𝐹3, 3, 5% = 9,28 Se 𝐹𝑜𝑏𝑠 > 𝐹𝑛1−1,𝑛2−1,𝛼 rejeita-se 𝐻0 ✓ Decisão do teste F: Como 𝐹𝑜𝑏𝑠 > 𝐹𝑛1−1,𝑛2−1,𝛼 rejeita-se 𝐻0 Tabela da distribuição F Tabela da distribuição F, continuação...