Baixe o app para aproveitar ainda mais
Prévia do material em texto
Análise de Variância Análise de Variância ANOVA ANOVA -- Um fator Um fator 1 Exemplo 3: Tempo de reação Um psicólogo está investigando a relação entre o tempo que um indivíduo leva a reagir a um estímulo visual (Y) e alguns fatores, como sexo e idade. Na tabela temos os tempos para 20 indivíduos. Indivíduo Y Sexo Idade 1 96 H 20 2 92 M 20 3 106 H 20 4 100 M 20 5 98 M 25 6 104 H 25 7 110 H 25 ⇒ O tempo médio de reação é 7 110 H 25 8 101 M 25 9 116 M 30 10 106 H 30 11 109 H 30 12 100 M 30 13 112 M 35 14 105 M 35 15 118 H 35 16 108 H 35 17 113 M 40 18 112 M 40 19 127 H 40 20 117 H 40 2 ⇒ O tempo médio de reação é influenciado pelo sexo do indivíduo? E pela idade? YH: tempo de reação ao estímulo dos homens YM: tempo de reação ao estímulo das mulheres Suposição: YH ~ N(µH, σ2) e YM ~ N(µM, σ2). Hipóteses: H : µµµµ = µµµµ Exemplo 3: Tempo de reação x Sexo 3 H0: µµµµH = µµµµM H1: µµµµH ≠≠≠≠ µµµµM ⇒ Como podemos testar essas hipóteses? Duas soluções possíveis: 1.Utilizando o teste t de comparação de médias para duas amostras independentes. 2. ANOVA com 1 fator. 1. teste t de comparação de médias (variâncias iguais) Estatística de teste ) MH p MH nn S YYT 11( )( 2 + − = ⇒ Sob H0, T ~ t nH+nM -2. −+− 1)(1)( 22 snsn Exemplo 3: Tempo de reação x Sexo 4 = −+ −+− = 2 1)(1)( 222 MH MMHH p nn snsn s Sexo n Média Variância Homem 10 110,1 74,54 Mulher 10 104,9 62,99 2. ANOVA Modelo estatístico: , i = 1, 2 e j = 1, ..., 10 , com y1j: tempo de reação do j-ésimo homem, y2j: tempo de reação da j-ésima mulher, µ1 = µH : tempo médio de reação dos homens, µ2 = µM : tempo médio de reação das mulheres, ijiij ey += µ Exemplo 3: Tempo de reação x Sexo 5 µ2 = µM : tempo médio de reação das mulheres, eij : efeito aleatório do j-ésimo indivíduo do i-ésimo sexo. =−+−=−=∑∑ = = 2 22 2 11 2 2 1 10 1 . )1()1( )( snsnyySQD i j iij =−=∑ = 2 .. 4 1 . )( yynSQE i ii )( 2 2 1 10 1 .. =−=∑∑ = =i j ij yySQT Fonte de Variação g.l. Soma de Quadrados Quadrado Médio Teste F Entre grupos k - 1 SQE QME = SQE/( k - 1) QME/QMD Dentro de grupos n - k SQD QMD = SQD/( n - k) Total n - 1 SQT Tabela de ANOVATabela de ANOVA Exemplo 3: Tempo de reação x Sexo 6 Fonte de Variação g.l. Soma de Quadrados Quadrado Médio Teste F Entre grupos Dentro de grupos Total ⇒ Quais são as hipóteses testadas pela estatística F da ANOVA? Modelo estatístico: , i = 1, ..., 5 e j = 1, ..., 4 , com yij: tempo de reação do j-ésimo indivíduo do i-ésimo grupo etário, µi : tempo médio de reação para indivíduos do i-ésimo grupo etário, eij : efeito aleatório do j-ésimo indivíduo do i-ésimo grupo etário. ijiij ey += µ Exemplo 3: Tempo de reação x Idade 7 Hipóteses: H0: µ1 = µ2 = µ3 = µ4 = µ5 H1 : pelo menos uma média é diferente. Suposição da ANOVA: yij~ N(µi, σ2 ), independentes. Resultados: Grupo etário n Média Variância 20 4 98,5 35,67 25 4 103,25 26,25 30 4 107,75 44,25 35 4 110,75 31,58 40 4 117,25 46,92 Exemplo 3: Tempo de reação x Idade 8 ⇒⇒ Hipóteses: H0: σ12= σ22 = σ32 = σ42 = σ52 H1: pelo menos uma variância é diferente. Teste de homocedasticidade: Estatística: M Exemplo 3: Tempo de reação x Idade 9 ( ) ( )2 1 2 ln)1(ln)( i k i ie SnSknM ∑ = −−−= − − −− += ∑ = knnk C k i i 1 1 1 )1(3 11 1 H.kC M sob),1(~ 2 −χ Tabela de ANOVATabela de ANOVA Fonte de Variação g.l. Soma de Quadrados Quadrado Médio Teste F Entre grupos Dentro de grupos Total Exemplo 3: Tempo de reação x Idade 10 Exemplo 3: Tempo de reação x Idade 11 Os intervalos de confiança para as diferenças de médias ficam dados por t(n-k) é obtido da tabela da distribuição t de Student com (n-k) graus de liberdade e coeficiente de confiança corrigido. ji eknji nn styy 11)( )( +±− − Exemplo 3: Tempo de reação x Idade 12 ⇒ Correção de Bonferroni: 5 grupos � m= 10 intervalos Coeficiente de confiança global: 90% IC individuais: γ = 1- 0,10/10 = 0,99. Médias comparadas L.I. L.S. µ1 - µ2 -17,41 7,91 0 ∈ IC µ1 - µ3 -21,91 3,41 0 ∈ IC µ1 - µ4 -24,91 0,41 0 ∈ IC µ1 - µ5 -31,41 -6,09 0 ∉ IC Intervalos com de Bonferroni, com confiança global 90%: Exemplo 3: Tempo de reação x idade µ1 - µ5 -31,41 -6,09 0 ∉ IC µ2 - µ3 -17,16 8,16 0 ∈ IC µ2 - µ4 -20,16 5,16 0 ∈ IC µ2 - µ5 -26,66 -1,34 0 ∉ IC µ3 - µ4 -15,66 9,66 0 ∈ IC µ3 - µ5 -22,16 3,16 0 ∈ IC µ4 - µ5 -19,16 6,16 0 ∈ IC 13 ⇐⇐ Como analisar pelo R? Pelo R Estatísticas →→→→ médias →→→→ ANOVA (1 fator): selecionar variável resposta e fator Observação: o fator precisa ser variável qualitativa. Se não for, precisa transformá-lo: 14 transformá-lo: Dados →→→→ Modificação de variáveis →→→→ converter variável numérica para fator. Análise de Variância Análise de Variância ANOVA ANOVA -- Dois fatores Dois fatores 15 ANOVA ANOVA -- Dois fatores Dois fatores → Variável resposta: número de horas de alívio dos sintomas. Exemplo 4: Um laboratório desenvolveu um novo componente para alívio dos sintomas em casos agudos de alergia. Num experimento com 36 voluntários, as quantidades de dois ingredientes ativos do componente variaram em três níveis cada um (pouco, médio e muito). 16 sintomas. Fator : Ingrediente 1 3 níveis pouco médio muito tratamentos 17 Fator: Ingrediente 2 3 níveis pouco médio muito 9 tratamentos Ingrediente 2 Ingrediente 1 Pouco Médio Muito Pouco 2,4 4,6 4,8 2,7 4,2 4,5 2,3 4,9 4,4 2,5 4,7 4,6 5,8 8,9 9,1 Dados: número de horas de alívio dos sintomas de 36 pacientes voluntários 18 Médio 5,8 8,9 9,1 5,2 9,1 9,3 5,5 8,7 8,7 5,3 9,0 9,4 Muito 6,1 9,9 13,5 5,7 10,5 13,0 5,9 10,6 13,3 6,2 10,1 13,2 Exemplo 3: Tempo de reação (cont.) Um psicólogo está investigando a relação entre o tempo que um indivíduo leva a reagir a um estímulo visual (Y) e alguns fatores, como sexo e idade. Na tabela temos os tempos para 20 indivíduos. Indivíduo Y Sexo Idade 1 96 H 20 2 92 M 20 3 106 H 20 4 100 M 20 5 98 M 25 6 104 H 25 7 110 H 25 ⇒ O tempo médio de reação é 7 110 H 25 8 101 M 25 9 116 M 30 10 106 H 30 11 109 H 30 12 100 M 30 13 112 M 35 14 105 M 35 15 118 H 35 16 108 H 35 17 113 M 40 18 112 M 40 19 127 H 40 20 117 H 40 19 ⇒ O tempo médio de reação é influenciado pelo sexo do indivíduo? E pela idade? Exemplo 3: Tempo de reação Podemos estudar a relação entre o tempo de reação ao estímulo e os fatores sexo e idade conjuntamente. Sexo Idade 20 25 30 35 40 20 Homem 96 104 106 118 127 106 110 109 108 117 Mulher 92 98 116 112 113 100 101 100 105 112 Nível 1 Nível 2 . . . Nível a . . . y211 y212 . . . y21r Nível 1 Fator ANo geral: ya11 ya12 . . . ya1r y111 y112 . . . y11r . 21 y21r . . . Nível b Fator B ya1ry11r y1b1 y1b2 . . . y1br y2b1 y2b2 . . . y2br yab1 yab2 . . . yabr . . . . . . . . . . . . Temos agora amostras de tamanho r de a×b populações (grupos ou tratamentos) → n = r×a×b observações. No Exemplo 4 (Horas de alivio): a = b = 3 e r = 4 ⇒ n = 4×3×3 = 36 observações No Exemplo 3 (Tempo de reação): 22 a=5, b=2 e r=2 ⇒ n = 20 observações As hipóteses nulas de interesse são: H1: As médias da variável resposta são iguais nos diferentesníveis do fator A. H2: As médias da variável resposta são iguais nos diferentes níveis do fator B. 23 ? H3: Não existe interação entre A e B. Nível 1Nível 1 Nível 2Nível 2 Nível 3Nível 3 Fator A Fator B Ilustração de não existência de interação � Representação das médias das observações, em cada combinação de níveis dos 2 fatores (Gráfico de perfis) 24 Nível 1Nível 1 Nível 2Nível 2 Nível 1Nível 1 Nível 2Nível 2 Nível 3Nível 3 Nível 1Nível 1 Fator A Fator B Ilustração de existência de interação 25 Nível 1Nível 1 Nível 2Nível 2 Nível 1Nível 1 Nível 2Nível 2 Nível 3Nível 3 Fator A Fator B Ilustração de existência de interação 26 Nível 1Nível 1 Nível 2Nível 2 Fonte de Variação g.l. Soma de Quadrados (SQ) Quadrado Médio (QM) Teste F Fator A a - 1 SQA QMA= SQA/( a - 1) QMA/QMEr Fator B b - 1 SQA QMB= SQB/( b - 1) QMB/QMEr Interação AxB (a – 1) x (b – 1) SQAB QMAB= SQAB/(a – 1) x (b – 1) QMAB/QMEr Erro n – a b SQ QM = SQ /(n – a b) - ⇒ Quando há mais de um fator sendo avaliado, a análise de variância também é bastante útil, porém a forma de calcular sua tabela muda. ANOVA – 2 fatores (A com a níveis e B com b níveis) 27 Erro n – a b SQEr QMEr = SQEr/(n – a b) - Total n - 1 SQT sendo as Somas de Quadrados calculadas convenientemente e as estatísticas F são construídas em relação ao Quadrado Médio do Erro. Suposição da ANOVA: A variável resposta tem distribuição Normal, com a mesma variância, em cada tratamento. Exemplo 4: Horas de alívio ANOVA – 2 fatores 28 Tabela de ANOVA Fonte de Variação g.l. Soma de Quadrados Quadrado Médio Teste F Valor P Ingrediente 1 2 220,020 110,010 1827,86 0,0000 Ingrediente 2 2 123,660 61,83 1027,33 0,0000 Interação 4 29,425 7,35625 122,23 0,0000 Exemplo 4: Horas de alívio ANOVA – 2 fatores 29 Interação 4 29,425 7,35625 122,23 0,0000 Erro 27 1,625 0,06019 Total 35 374,730 Conclusão: Existe efeito de interação entre os ingredientes 1 e 2. Exemplo 4: Horas de alívio ANOVA – 2 fatores 30 Exemplo 3: Tempo de reação ANOVA – 2 fatores 31 Tabela de ANOVA Fonte de Variação g.l. Soma de Quadrados Quadrado Médio Teste F Valor P Sexo 1 135,2 135,20 3,7348 0,08209 Idade 4 819,0 204,75 5,6561 0,01209 Interação 4 56,8 14,20 0,3923 0,80972 Exemplo 3: Tempo de reação ANOVA – 2 fatores 32 Interação 4 56,8 14,20 0,3923 0,80972 Erro 10 362,0 36,20 Total 19 1373,0 Conclusão: não existe efeito de interação entre sexo e idade no tempo de reação; não existe efeito de sexo e existe efeito de idade, ao nível de significância de 5 %. ANOVA – 2 fatoresExemplo 3: Tempo de reação 33 Fator: Grupo 2 níveis Esquisofrênicos (1) Depressivos (2) Tratamentos Exemplo 5: Transtornos Mentais Variável Resposta: melhora (nota) = diferença entre os graus obtidos em uma escala de ajuste emocional, antes e após o tratamento. 34 2 níveis Fator: Droga 3 níveis Droga 1 Droga 2 Droga 3 Tratamentos 6 tratamentos Exemplo 5: Pacientes com transtornos mentais (cont.) Analysis of Variance for Nota Source DF SS MS F P Grupo 1 18,00 18,00 2,04 0,179 Droga 2 48,00 24,00 2,72 0,106 MINITAB 35 Droga 2 48,00 24,00 2,72 0,106 Interaction 2 144,00 72,00 8,15 0,006 Error 12 106,00 8,83 Total 17 316,00 Existe Interação entre Droga e Grupo. Interação O padrão de diferença entre as notas médias nas 3 Drogas não é o mesmo nos dois Grupos 36 mesmo nos dois Grupos Gráfico com as médias amostrais 1 2 12 7 Grupo M e a n Interaction Plot - Data Means for Nota 37 321 2 Droga Para detectar as diferenças existentes entre as médias, métodos de comparações múltiplas devem ser aplicados às médias das caselas. Exercício: Um experimento aleatório com um fator (3 níveis: A1, A2, A3) foi realizado em dois laboratórios de modo independente. Os resultados estão no quadro a seguir. Laboratório 1 Laboratório 2 A1 A2 A3 A1 A2 A3 8 4 3 4 6 5 3 8 2 5 7 4 1 10 8 3 7 6 38 1 10 8 3 7 6 4 6 7 4 8 5 Total 16 28 20 Total 16 28 20 (a) O que se pode comentar sobre as médias amostrais em cada nível do fator, para os dois laboratórios? (b) Sem nenhum cálculo (apenas olhando os dados), qual dos 2 laboratórios produzirá um maior valor da estatística F, para o teste de igualdade das médias? Justifique. 39 voltavolta 40 volta 41 ⇒⇒
Compartilhar