Baixe o app para aproveitar ainda mais
Prévia do material em texto
Análise de Variância Análise de Variância ANOVA ANOVA -- Um fator Um fator 1 Exemplo1: Objetivo do estudo: Estudar diabetes gestacional através do comportamento da hemoglobina glicosilada (HbA), em três tipos de gestantes Estudo experimental: Foram escolhidas 10 gestantes de cada tipo, com mesmo tempo de gestação, normais (N), com tolerância diminuída 2 (TD) e diabéticas (D) e mediu-se suas HbA. Tipos de gestante • normal • tolerância diminuída • diabética Variável resposta Y : Hemoglobina glicosilada (HbA) Tipo de gestante N TD D 7,86 6,20 9,67 6,38 7,82 8,08 6,90 8,50 9,25 7,78 6,50 8,20 8,17 8,09 8,64 Dados: 3 8,17 8,09 8,64 6,26 6,90 9,67 6,30 7,82 9,23 7,86 7,45 10,43 7,42 7,75 9,97 8,63 7,43 9,59 → 1º. Passo: Fazer análise descritiva Tipo de gestante n Média (HbA) Desvio padrão (HbA) 1. Normal 10 7,356 0,847 1. Tolerância diminuída 10 7,446 0,718 1. Diabética 10 9,273 0,761 4 COMPARAÇÃO SIMULTÂNEA DE VÁRIAS MÉDIAS Pergunta: como testar as hipóteses H0: µ1 = µ2 = µ3 H1: Alguma média é diferente. ou ainda, num caso geral, H0 : µ1 = ... = µk H1: Alguma média é diferente. 5 Análise de Variância 6 Comparação de duas ou mais médias Suponha que se tenha k grupos ou populações: Grupo 1 Grupo 2 . . . Grupo k y11 y21 yk1 y12 y22 yk2 . . . . . . . . . y1n1 y2n2 yknk COMPARAÇÃO SIMULTÂNEA DE VÁRIAS MÉDIAS 7 No exemplo: fator � tipo de gestante, com 3 níveis Terminologia →→→→ fator: critério de classificação (tratamentos); →→→→ nível: cada classificação (grupo). Supomos que as observações de cada grupo têm distribuição normal: yij ~ N (µµµµi, σσσσ2), i =1, ..., k e j = 1, 2, ..., ni. Nível 1 Nível 2 . . . Nível k y11 y y21 y yk1 y k amostras independentes Em cada nível do fator: uma amostra de observações 8 . . . y12 M y1n1 y22 M y2n2 yk2 M yknk médias: y1. yk.y2. n = n1 + n2 + ... + nk . . . variâncias: s12 s22 sk2 Modelo Estatístico: OBSERVAÇÃO = SISTEMÁTICA + ALEATÓRIA COMPARAÇÃO SIMULTÂNEA DE VÁRIAS MÉDIAS Componente sistemática (previsível): incorpora o Componente sistemática (previsível): incorpora o conhecimento que o pesquisador tem sobre o fenômeno. Componente aleatória: representa variações individuais e fatores que não são explicados pela parte sistemática. Em geral, denominada resíduo ou erro aleatório. 9 Modelo estatístico (1): com µµµµi : média de Y no nível i (efeito do nível i), eij : efeito aleatório do j-ésimo indivíduo do nível i, Yij : variável resposta do j-ésimo indivíduo do nível i. Yij = µµµµi + eij , i =1,..., k, j = 1,..., ni, Suposição: 10 Se a hipótese H0 for verdadeira, o modelo pode ser reescrito: Modelo estatístico (0): Yij = µµµµ + e*ij , i =1,..., k, j =1,..., ni . Suposição: eij ~ normais, independentes com média 0 e variância σ2. Informação que não é explicada pela parte sistemática: Modelo 1: 2 1 11 1 2 )(∑∑∑∑ = == = −= k i n j iij k i n j ij ii ye µ MÉTODO DE MÍNIMOS QUADRADOS 11 Modelo 0: 2 1 1 2 1 1 * )()( ∑∑∑∑ = == = −= k i n j ij k i n j ij ii ye µ Método de MQ: encontra valor do parâmetro que minimiza as somas de quadrados. Modelo 1 (médias diferentes): . 1 1 ˆ i n i ij i i yy n i == ∑ = µ Modelo 0 (mesma média): 1 ˆ yy k ni == ∑∑µ ⇒ Estimador de mínimos quadrados (EMQ) de µi ⇒ Estimador de mínimos MÉTODO DE MÍNIMOS QUADRADOS 12 .. 1 1 ˆ yy n i j ij == ∑∑ = = µ 2 1 1 . )(∑∑ = = −= k i n j iij i yySQD 2 1 1 .. )(∑∑ = = −= k i n j ij i yySQT Substituindo temos: ⇒ Estimador de mínimos quadrados (EMQ) de µ SQT = SQE + SQD ⇒⇒⇒⇒ SQE = SQT - SQD 2 .. 1 )( yynSQE k i ii −=⇒ ∑ = Variabilidade Total = Variabilidade entre grupos + Variabilidade dentro dos grupos 13 SQT = SQE + SQD Obs.: SQD é também denominada de soma de quadrados residual (ou dos erros) e também denotada por SQR. É uma medida da homogeneidade interna dos tratamentos. Observe que essas somas de quadrado dependem do número de observações: • Quanto maior o número de observações, maior serão as somas de quadrado. • SQT: obtida com base em um modelo com 1 parâmetro apenas. • SQD: obtida com base em um modelo com k parâmetros. 14 Quadrado médio Dentro grupos: QMD = SQD/(n - k), em que k é o número de grupos, nn é o número total de observações. Quadrado médio Total: QMT = SQT/(n - 1) Quadrado médio Entre grupos: QME = SQE/(k - 1). CRITÉRIO PARA COMPARAÇÃO: Se QME for muito grande, há evidências para a rejeição da hipótese nula H0. ESTATÍSTICA DE TESTE: )1( )( SQD k SQDSQT QMD QME F − − == 15 )( kn SQDQMD F − == Se QME for grande comparado ao QMD, parte sistemática do modelo 1 está captando grande parte da informação. ⇒ Quanto maior for o valor de F, maiores as evidências contra H0. Se as suposições estiverem satisfeitas, sob a hipótese H0 temos que a estatística do teste, F = QME/QMD, tem distribuição F-Snedecor com (k-1) e (n-k) graus de liberdade. knkFQMD QMEF −− = 1,~ 16 QMD ⇒ Rejeitamos H0 para valores grandes de F, ou seja, RC = {F ≥ Fc}, sendo Fc obtido da distribuição F(k-1;n-k) para nível de significância α. Voltando ao Exemplo 1: )()()( )( 2 10 2 10 2 10 2 3 10 −+−+−=−= ∑∑∑∑∑ yyyyyyyySQD Média geral: 8,025 /3075,402 .. ==y Tipo de gestante n Média (HbA) Desvio padrão (HbA) 1. Normal 10 7,356 0,847 2. Tolerância diminuída 10 7,446 0,718 3. Diabética 10 9,273 0,761 316,16580,09516,09717,09 )1()1()1( )()()( )( 2 33 2 22 2 11 2 1 .33 2 1 .22 2 1 .11 2 1 1 . =×+×+×= −+−+−= −+−+−=−= ∑∑∑∑∑ ==== = snsnsn yyyyyyyySQD j j j j j j i j iij 403,23558,110335,010448,010 )025,8273,9(10)025,8446,7(10)025,8356,7(10 )( 222 2 .. 3 1 =×+×+×= −×+−×+−×= −=∑ = yynSQE i ii 17 Continuação Exemplo 1: 7015,11)13/(403,23)1/( 286,0)330/(316,16)/( =−=−= =−=−= kSQEQME knSQDQMD 91,437015,11 === QMEF Estatística do teste: . , ))330();13((~ 0HFQMD QMEF sob−−= Nível de significância: 5% Cálculos necessários: 91,43 286,0 7015,11 === QMD QMEFobs Região Crítica: Cálculos necessários: RC = {F ≥ Fc} = {F ≥ 3,35} Nível descritivo: P = P(F(2; 27) ≥ 43,91) = 0,00000. Conclusão: Rejeita-se H0, ou seja, existe pelo menos uma média diferente. 18 ⇒ Fonte de Variação g.l. Soma de Quadrados Quadrado Médio Teste F Entre grupos k - 1 SQE QME = SQE/( k - 1) F= QME/QMD Dentro de grupos n - k SQD QMD = SQD/( n - k) ANOVA Os resultados são, em geral, apresentados em uma TABELA DE ANOVA (Analysis of variance): 19 Total n - 1 SQT ∑ = −= k i ii yynSQE 1 2)( ∑∑ = = −= k i n j iij i yySQD 1 1 2)( ∑∑ = = −= k i n j ij i yySQT 1 1 2)( OBS.: SQT = SQE + SQD ⇒ com F ~ F(k-1, n-k) Da tabela da ANOVA, temos knnn SnSnSnQMDS k kk e −+++ −++−+− == )( )1()1()1( 21 22 22 2 112 L L ANOVA QMD é um estimador para a variância populacional σσσσ2 20 Combinação das variâncias amostrais dentro de cada grupo. Só tem sentido se a suposição de igualdade das variâncias populacionais é verdadeira. ∑ = − − = k i ii snkn QMD 1 2)1(1 Definimos ainda o coeficiente de explicação domodelo: SQT SQD SQT SQDSQT SQT SQER −=−== 12 Observações: ANOVA - R2 representa a proporção de variabilidade total dos dados explicada pelo modelo; - 0 ≤ R2 ≤ 1. - um valor alto de R2 indica que o modelo utilizado está bem ajustado. 21 ⇐ Fonte de Variação g.l. Soma de Quadrados Quadrado Médio Teste F Valor P Entre grupos 2 23,403 11,7015 43,91 <0,0001 Dentro de grupos 27 16,316 0,286 Total 29 39,719 ANOVA no Exemplo 1 22 P < α⇒ H0 é rejeitada, ou seja, os níveis médios de hemoglobina glicosilada (HbA) nos três tipos de gestantes não são todos iguais. R2 = 23,403 / 39,719 = 0,589 (ou 58,90 %) Exemplo 2: depósito de cargas aéreas A gerência de um depósito que armazena cargas aéreas deseja estudar o peso das cargas que chegam ao terminal, no interior de São Paulo. São 4 tipos de cargas: • Doméstica (D); • Administrativa (A); 23 • Equipamentos industriais (E); e • Outros tipos (O). Pergunta: existe diferença entre os 4 tipos de cargas? Para investigar essa questão, uma amostra de 7 cargas de cada um dos tipos foi obtida e o peso das cargas anotado. • Dados: Tipo de Carga D A E O 24,9 27,9 38,4 23,8 20,4 28,1 38,6 25,3 24,2 28,4 41,2 23,5 22,3 25,3 43,9 27,6 20,3 29,3 40,2 25,5 24,0 28,5 40,2 23,9 23,5 27,9 37,3 22,6 Exemplo 2: cargas aéreas 24 23,5 27,9 37,3 22,6 Tipo de Carga n Média Desvio padrão D 7 22,8 1,9 A 7 27,9 1,2 E 7 40,1 2,2 O 7 24,6 1,6 • Medidas descritivas: Modelo estatístico: , , i = 1, ..., 4 e j = 1, ..., 10 , com yij: peso da j-ésima carga observada no grupo i, µi: média do peso das cargas no grupo i, eij: efeito aleatório da j-ésima carga observada no grupo i. ijiij ey += µ � Suposições do Modelo: os erros eij são variáveis aleatórias independentes e identicamente distribuídas ( ) com σσσσ Exemplo 2: Cargas aéreas ij independentes e identicamente distribuídas (iid ) com N(0, σσσσ2), implicando que E(Yij) = µi e Var(Yij) = σ2 e Yij tem distribuição Normal, 25 ou seja, as amostras são independentes, dentro de cada amostra as observações são independentes e as observações da variável resposta, em cada sub-população, têm distribuição Normal com mesma variância (homoscedasticidade)(homoscedasticidade).. Hipóteses: H0: µD = µA = µE = µO H1: Alguma média diferente. µ1 = µD: média do peso da carga doméstica; µ2 = µA: média do peso da carga administrativa; Exemplo 2: Cargas aéreas 26 µ2 = µA: média do peso da carga administrativa; µ3 = µE: média do peso da carga de equipamentos industriais; µ4 = µO: média do peso da carga de outros tipos. Da distribuição F com 3 g.l. no numerador e 24 g.l. no denominador, Fonte de Variação g.l. Soma de Quadrados Quadrado Médio Teste F Valor P Entre grupos 3 1275,41 452,14 134,54 <0,0001 Dentro de grupos 24 75,82 3,16 Total 27 1351,23 ANOVA no Exemplo 2 27 Da distribuição F com 3 g.l. no numerador e 24 g.l. no denominador, com α = 5 %, obtemos Fc= 3,009. Como Fobs > Fc, há evidências para a rejeição da hipótese nula. R2 = 0,9439 = 94,39% PERGUNTA: Quais grupos são diferentes? COMPARAÇÕES ENTRE MÉDIAS • Quando a hipótese nula no teste de igualdade de médias é rejeitada, em geral deseja-se saber quais médias são diferentes. • Idéia: fazer testes ou construir intervalos de confiança para as médias 2 a 2 (Comparações Múltiplas). Problema: considerando-se todas as comparações simultaneamente, o nível de significância global é superior ao nível desejado α (lembre- se que α é a probabilidade de erro tipo I). 28 Uma alternativa é utilizar a correção de Bonferroni: Se serão feitas m comparações, utiliza-se um nível de significância α/m para cada uma das comparações; com esse procedimento, fica garantido que o nível de significância global é menor ou igual a α. Para intervalos de confiança, é preciso corrigir o coeficiente de confiança para cada comparação. Se forem construídos m intervalos, cada intervalo deve ter coeficiente de confiança (1- α/m); dessa forma, fica garantido que o coeficiente de confiança global é maior igual a γ = (1- α). COMPARAÇÕES ENTRE MÉDIAS • Os intervalos de confiança para as diferenças de médias (contrastes) ficam dados por �se 2 é a estimativa de σ2, que é dada por ji eknji nn styy 11)( )( +±− − e se 2 = QMD (Quadrado Médio Dentro na ANOVA). � t(n-k) é obtido da tabela da distribuição t-Student com (n-k) graus de liberdade e coeficiente de confiança corrigido. 29 ⇒ Se o intervalo não contém o “zero”, podemos obter conclusões sobre a razão da rejeição. Exemplo 2: Cargas Aéreas • INTERVALOS DE CONFIANÇA UTILIZANDO-SE MÉTODO DE BONFERRONI: �Nível de confiança global: 94% = (1- 0,06)x100%; �Como serão feitas 6 comparações, utilizamos coeficiente de confiança igual a 99%= (1- 0,06/6)x100% para cada intervalo. �A estimativa intervalar é dada por em que Se2 é a estimativa de σ2, que é dada por Se2 = QMD (quadrado médio Dentro). ji eknji nn styy 11)( )( +±− − 30 • Resultados: se2 = 3,16 t24;99% = 2,8. Comparação Diferenças das médias Lim. Inf. Lim. Sup. D – A -5,1 2,658 -7,76 -2,44 D – E -17,3 2,658 -19,96 -14,64 D – O -1,8 2,658 -4,46 0,86 0∉IC 0∉IC 0∈IC 2/72/72/72/724242424 est × Exemplo 2: Cargas Aéreas 22,8 D 24,6 O 27,9 A 40,1 E 31 D – O -1,8 2,658 -4,46 0,86 A – E -12,2 2,658 -14,86 -9,54 A – O 3,3 2,658 0,64 5,96 E – O 15,5 2,658 12,84 18,16 0∈IC 0∉IC 0∉IC 0∉IC Outros métodos de comparações múltiplas: Tukey e Scheffé Comparação entre os métodos de comparações múltiplas a) Tukey deve ser adotado quando tivermos interesse em todas as possíveis comparações de médias duas a duas. Quando o no. de comparações for pequeno em relação a k(k-1)/2, Bonferroni é mais preciso que o Tukey. b) Scheffé deve ser adotado quando temos interesse em comparações envolvendo mais de duas médias. Se o no. de 32 comparações envolvendo mais de duas médias. Se o no. de comparações for pequeno, o método de Bonferroni é preferível ao de Scheffé. c) Quando há interesse em comparações envolvendo apenas duas médias, o método de Tukey fornece intervalos de menor amplitude do que os de Scheffé e deve, nesse caso, ser adotado. diferença entre médias diferença estimada Intervalo de confiança Tukey Scheffé Bonferroni µN - µT -0,09 [-0,96; 0,78] [-0,99; 0,81] [-1,10; 0,92] µN - µD -1,91 [-2,78; -1,04] [-2,81; -1,01] [-2,93; -0,90] Ex. 1 gestantes: Estimativas pontuais e intervalos de confiança (γ = 0,95) para comparações entre as médias, duas a duas. 33 µN - µD -1,91 [-2,78; -1,04] [-2,81; -1,01] [-2,93; -0,90] µTD- µD -1,82 [-2,69; -0,95] [-2,72; -0,92] [-2,84; -0,81] Adotando qualquer um dos métodos, concluímos que: • média de HbA das gestantes normais é igual à das gestantes com tolerância diminuída; • gestantes diabéticas apresentam comportamento diferente dos outros grupos, quanto à média de HbA. • Para cada observação, podemos calcular os resíduos, dados por • Os resíduos podem ser úteis para verificar as suposições do modelo (normalidade e variância constante) e detectar pontos atípicos. • Podemos calcular os resíduos padronizados: iijiijij yyye −=−= µˆˆ µˆ iijiij yyyt − = − = RESÍDUOS • Construímos um gráfico dos resíduos em função dos valores ajustados, obtidos por (valor usado para “estimar” uma observação yij se o seu valor não fosse conhecido): – Valores maiores que 2 e menores que -2 são considerados discrepantes (ou mal ajustados). – Se os pontos estão distribuídos de forma aleatória, é sinal de que a variância é constante. σσ µ ˆˆ ˆ iijiij ij yyy t − = − = iijy µˆˆ = 34 Exemplo2: Cargas aéreas 35 Comentários: - A maioria dos resíduos está entre -2 e 2; - A variabilidade dos resíduos nos 4 grupos é semelhante. TESTE DE HOMOCEDASTICIDADE (igualdade de variâncias) • Quando construímos uma tabela de ANOVA, fazemos a suposição de que as variâncias dos grupos são as mesmas. (HOMOCEDASTICIDADE) • Para verificar se essa suposição é verdadeira, podemos fazer um teste de homocedasticidade.um teste de homocedasticidade. • Temos o modelo estatístico (modelo de médias) • Assumimos que ijiij ey += µ );0(~ 2iij Ne σ 36 TESTE DE HOMOCEDASTICIDADE • Queremos testar as hipóteses: H0: σ12 = σ22 = ... = σk2 H1: Pelo menos uma das variâncias é diferente das demais O teste é construído da seguinte maneira:O teste é construído da seguinte maneira: 1. Calcule a variância comum: QMD kn SQD kn Sn S K i ii e = − = − − = ∑ =1 2 2 )1( 37 TESTE DE HOMOCEDASTICIDADE 2. Calcule 3. Calcule, também, 4. Construa a estatística de teste, dada por: ( ) ( )2 1 2 ln)1(ln)( i k i ie SnSknM ∑ = −−−= − − −− += ∑ = knnk C k i i 1 1 1 )1(3 11 1 4. Construa a estatística de teste, dada por: 5. Para amostras grandes, essa estatística tem distribuição de Qui-quadrado com (k-1) graus de liberdade: 4. Rejeita-se a hipótese nula para valores grandes de M/C. C M ).1(~ 2 −kCM χ 38 TESTE DE HOMOCEDASTICIDADE . ,~ 0 2 1 HC M k sob−χ Exemplo 2: Cargas aéreas Estatística do teste: Hipóteses: H0: σD2= σA2= σE2= σO2 H1: Pelo menos uma das variâncias é diferente das demais − − −− += ∑ = knnk C k i i 1 1 1 )1(3 11 1 . ,~ 01 HC M k sob−χ 39 Estatística do teste: ( ) ( )2 1 2 ln)1(ln)( i k i ie SnSknM ∑ = −−−= Nível de significância: 5% TESTE DE HOMOCEDASTICIDADE Medidas necessárias: M = (28-4)ln3,16 – 6 ln1,92 – 6 ln1,22 – 6 ln2,22 – 6 ln1,62 = 2,622. 453,2=C M 069,1 428 1 6 1 6 1 6 1 6 1 )14(3 11 = − −+++ − +=C Região crítica: RC = {M/C ≥ qtab} Da tabela χ2 com 3 g.l. e α = 5%, qtab = 7,81 2,453 ∉ RC, então H0 não é rejeitada. Nível descritivo: P = P(M/C ≥ 2,453 | H0 verdadeira) = 0,48 > 0,05, então H0 não é rejeitada (ou seja, as variâncias são iguais). 40 41voltavolta 42 volta
Compartilhar