Buscar

ANOVA I

Prévia do material em texto

Análise de Variância Análise de Variância 
ANOVA ANOVA -- Um fator Um fator 
1
Exemplo1:
Objetivo do estudo: Estudar diabetes gestacional através
do comportamento da hemoglobina glicosilada (HbA), em
três tipos de gestantes
Estudo experimental:
Foram escolhidas 10 gestantes de cada tipo, com mesmo
tempo de gestação, normais (N), com tolerância diminuída
2
(TD) e diabéticas (D) e mediu-se suas HbA.
Tipos de gestante
• normal
• tolerância diminuída
• diabética
Variável resposta Y : Hemoglobina glicosilada (HbA)
Tipo de gestante 
N TD D 
7,86 6,20 9,67 
6,38 7,82 8,08 
6,90 8,50 9,25 
7,78 6,50 8,20 
8,17 8,09 8,64 
Dados:
3
8,17 8,09 8,64 
6,26 6,90 9,67 
6,30 7,82 9,23 
7,86 7,45 10,43 
7,42 7,75 9,97 
8,63 7,43 9,59 
 
→ 1º. Passo: Fazer análise descritiva
Tipo de gestante n Média (HbA) Desvio padrão (HbA)
1. Normal 10 7,356 0,847
1. Tolerância diminuída 10 7,446 0,718
1. Diabética 10 9,273 0,761
4
COMPARAÇÃO SIMULTÂNEA DE VÁRIAS MÉDIAS
Pergunta: como testar as hipóteses
H0: µ1 = µ2 = µ3
H1: Alguma média é diferente.
ou ainda, num caso geral,
H0 : µ1 = ... = µk
H1: Alguma média é diferente.
5
Análise de Variância
6
Comparação de duas ou mais médias 
Suponha que se tenha k grupos ou populações:
Grupo 1 Grupo 2 . . . Grupo k
y11 y21 yk1
y12 y22 yk2
.
.
.
.
.
.
.
.
.
y1n1 y2n2 yknk
COMPARAÇÃO SIMULTÂNEA DE VÁRIAS MÉDIAS
7
No exemplo: fator � tipo de gestante, com 3 níveis
Terminologia
→→→→ fator: critério de classificação (tratamentos);
→→→→ nível: cada classificação (grupo).
Supomos que as observações de cada grupo têm distribuição 
normal:
yij ~ N (µµµµi, σσσσ2), i =1, ..., k e j = 1, 2, ..., ni.
Nível 1 Nível 2
. . .
Nível k
y11
y
y21
y
yk1
y
k amostras independentes
Em cada nível do fator: uma amostra de observações
8
. . .
y12
 M
y1n1
y22
M
y2n2
yk2
M
yknk
médias: y1. yk.y2.
n = n1 + n2 + ... + nk
. . .
variâncias: s12 s22 sk2
Modelo Estatístico:
OBSERVAÇÃO = SISTEMÁTICA + ALEATÓRIA
COMPARAÇÃO SIMULTÂNEA DE VÁRIAS MÉDIAS
Componente sistemática (previsível): incorpora o Componente sistemática (previsível): incorpora o 
conhecimento que o pesquisador tem sobre o fenômeno.
Componente aleatória: representa variações individuais e 
fatores que não são explicados pela parte sistemática. Em 
geral, denominada resíduo ou erro aleatório.
9
Modelo estatístico (1):
com µµµµi : média de Y no nível i (efeito do nível i), 
eij : efeito aleatório do j-ésimo indivíduo do nível i,
Yij : variável resposta do j-ésimo indivíduo do nível i.
Yij = µµµµi + eij , i =1,..., k, j = 1,..., ni,
Suposição:
10
Se a hipótese H0 for verdadeira, o modelo pode ser reescrito:
Modelo estatístico (0):
Yij = µµµµ + e*ij , i =1,..., k, j =1,..., ni .
Suposição:
eij ~ normais, independentes com média 0 e variância σ2.
Informação que não é explicada pela parte sistemática:
Modelo 1:
2
1 11 1
2 )(∑∑∑∑
= == =
−=
k
i
n
j
iij
k
i
n
j
ij
ii
ye µ
MÉTODO DE MÍNIMOS QUADRADOS
11
Modelo 0:
2
1 1
2
1 1
* )()( ∑∑∑∑
= == =
−=
k
i
n
j
ij
k
i
n
j
ij
ii
ye µ
Método de MQ: encontra valor do parâmetro que minimiza 
as somas de quadrados.
Modelo 1 (médias diferentes):
.
1
1
ˆ i
n
i
ij
i
i yy
n
i
== ∑
=
µ
Modelo 0 (mesma média):
1
ˆ yy
k ni
== ∑∑µ
⇒ Estimador de mínimos 
quadrados (EMQ) de µi
⇒ Estimador de mínimos 
MÉTODO DE MÍNIMOS QUADRADOS
12
..
1 1
ˆ yy
n i j
ij == ∑∑
= =
µ
2
1 1
.
)(∑∑
= =
−=
k
i
n
j
iij
i
yySQD
2
1 1
..
)(∑∑
= =
−=
k
i
n
j
ij
i
yySQT
Substituindo temos:
⇒ Estimador de mínimos 
quadrados (EMQ) de µ
SQT = SQE + SQD ⇒⇒⇒⇒ SQE = SQT - SQD
2
..
1
)( yynSQE
k
i
ii −=⇒ ∑
=
 
Variabilidade 
Total =
Variabilidade 
entre
grupos
+
Variabilidade 
dentro dos 
grupos
13
SQT = SQE + SQD
Obs.: SQD é também denominada de soma de quadrados 
residual (ou dos erros) e também denotada por SQR. É 
uma medida da homogeneidade interna dos tratamentos.
Observe que essas somas de quadrado dependem do
número de observações:
• Quanto maior o número de observações, maior serão as
somas de quadrado.
• SQT: obtida com base em um modelo com 1 parâmetro
apenas.
• SQD: obtida com base em um modelo com k parâmetros.
14
Quadrado médio Dentro grupos: QMD = SQD/(n - k),
em que k é o número de grupos, nn é o número total de 
observações.
Quadrado médio Total: QMT = SQT/(n - 1)
Quadrado médio Entre grupos: QME = SQE/(k - 1).
CRITÉRIO PARA COMPARAÇÃO: 
Se QME for muito grande, há evidências para a rejeição da 
hipótese nula H0.
ESTATÍSTICA DE TESTE:
)1(
)(
SQD
k
SQDSQT
QMD
QME
F
−
−
==
15
)( kn
SQDQMD
F
−
==
Se QME for grande comparado ao QMD, parte sistemática 
do modelo 1 está captando grande parte da informação. 
⇒ Quanto maior for o valor de F, maiores as evidências 
contra H0.
Se as suposições estiverem satisfeitas, sob a hipótese H0
temos que a estatística do teste, 
F = QME/QMD, tem distribuição F-Snedecor com (k-1) e (n-k) 
graus de liberdade.
knkFQMD
QMEF
−−
=
 1,~
16
QMD
⇒ Rejeitamos H0 para valores grandes de F, ou seja, 
RC = {F ≥ Fc},
sendo Fc obtido da distribuição F(k-1;n-k) para nível de 
significância α.
Voltando ao Exemplo 1:
)()()( )( 2
10
2
10
2
10
2
3 10
−+−+−=−= ∑∑∑∑∑ yyyyyyyySQD
Média geral: 8,025 /3075,402
..
==y
Tipo de gestante n Média (HbA) Desvio padrão (HbA)
1. Normal 10 7,356 0,847
2. Tolerância diminuída 10 7,446 0,718
3. Diabética 10 9,273 0,761
316,16580,09516,09717,09 
)1()1()1( 
)()()( )(
2
33
2
22
2
11
2
1
.33
2
1
.22
2
1
.11
2
1 1
.
=×+×+×=
−+−+−=
−+−+−=−= ∑∑∑∑∑
==== =
snsnsn
yyyyyyyySQD
j
j
j
j
j
j
i j
iij
403,23558,110335,010448,010 
)025,8273,9(10)025,8446,7(10)025,8356,7(10 
)(
222
2
..
3
1
=×+×+×=
−×+−×+−×=
−=∑
=
yynSQE
i
ii
17
Continuação Exemplo 1:
7015,11)13/(403,23)1/(
286,0)330/(316,16)/(
=−=−=
=−=−=
kSQEQME
knSQDQMD
91,437015,11 === QMEF
Estatística do teste: . , ))330();13((~ 0HFQMD
QMEF sob−−=
Nível de significância: 5%
Cálculos necessários: 91,43
286,0
7015,11
=== QMD
QMEFobs
Região Crítica:
Cálculos necessários:
RC = {F ≥ Fc} = {F ≥ 3,35}
Nível descritivo: P = P(F(2; 27) ≥ 43,91) = 0,00000.
Conclusão: Rejeita-se H0, ou seja, existe pelo menos uma 
média diferente.
18
⇒
Fonte de Variação g.l. Soma de Quadrados Quadrado Médio Teste F
Entre grupos k - 1 SQE QME = SQE/( k - 1) F= QME/QMD
Dentro de grupos n - k SQD QMD = SQD/( n - k)
ANOVA
Os resultados são, em geral, apresentados em uma 
TABELA DE ANOVA (Analysis of variance):
19
Total n - 1 SQT
 
∑
=
−=
k
i
ii yynSQE
1
2)(
 
∑∑
= =
−=
k
i
n
j
iij
i
yySQD
1 1
2)(
 
∑∑
= =
−=
k
i
n
j
ij
i
yySQT
1 1
2)(
OBS.: SQT = SQE + SQD
⇒
com F ~ F(k-1, n-k)
Da tabela da ANOVA, temos
knnn
SnSnSnQMDS
k
kk
e
−+++
−++−+−
== )(
)1()1()1(
21
22
22
2
112
L
L
ANOVA
QMD é um estimador para a variância populacional σσσσ2
20
Combinação das 
variâncias amostrais 
dentro de cada grupo.
Só tem sentido se a suposição 
de igualdade das variâncias 
populacionais é verdadeira.
∑
=
−
−
=
k
i
ii snkn
QMD
1
2)1(1
Definimos ainda o coeficiente de explicação domodelo:
SQT
SQD
SQT
SQDSQT
SQT
SQER −=−== 12
Observações:
ANOVA
- R2 representa a proporção de variabilidade total dos 
dados explicada pelo modelo;
- 0 ≤ R2 ≤ 1.
- um valor alto de R2 indica que o modelo utilizado está 
bem ajustado.
21
⇐
Fonte de Variação g.l. Soma de Quadrados Quadrado Médio Teste F Valor P
Entre grupos 2 23,403 11,7015 43,91 <0,0001
Dentro de grupos 27 16,316 0,286
Total 29 39,719
ANOVA no Exemplo 1 
22
P < α⇒ H0 é rejeitada, ou seja, os níveis médios de hemoglobina 
glicosilada (HbA) nos três tipos de gestantes não são todos iguais.
R2 = 23,403 / 39,719 = 0,589 (ou 58,90 %)
Exemplo 2: depósito de cargas aéreas
A gerência de um depósito que armazena cargas aéreas 
deseja estudar o peso das cargas que chegam ao terminal, 
no interior de São Paulo.
São 4 tipos de cargas:
• Doméstica (D);
• Administrativa (A);
23
• Equipamentos industriais (E); e
• Outros tipos (O).
Pergunta: existe diferença entre os 4 tipos de cargas?
Para investigar essa questão, uma amostra de 7 cargas de 
cada um dos tipos foi obtida e o peso das cargas anotado.
• Dados:
Tipo de Carga 
D A E O 
24,9 27,9 38,4 23,8 
20,4 28,1 38,6 25,3 
24,2 28,4 41,2 23,5 
22,3 25,3 43,9 27,6 
20,3 29,3 40,2 25,5 
24,0 28,5 40,2 23,9 
23,5 27,9 37,3 22,6 
Exemplo 2: cargas aéreas
24
23,5 27,9 37,3 22,6 
 
Tipo de 
Carga 
n Média Desvio padrão 
D 7 22,8 1,9 
A 7 27,9 1,2 
E 7 40,1 2,2 
O 7 24,6 1,6 
 
• Medidas descritivas:
Modelo estatístico: , , i = 1, ..., 4 e j = 1, ..., 10 ,
com yij: peso da j-ésima carga observada no grupo i,
µi: média do peso das cargas no grupo i,
eij: efeito aleatório da j-ésima carga observada no grupo i.
 
ijiij ey += µ
� Suposições do Modelo: os erros eij são variáveis aleatórias 
independentes e identicamente distribuídas ( ) com σσσσ
Exemplo 2: Cargas aéreas
ij
independentes e identicamente distribuídas (iid ) com N(0, σσσσ2), 
implicando que 
E(Yij) = µi e Var(Yij) = σ2 e Yij tem distribuição Normal,
25
ou seja, as amostras são independentes, dentro de cada
amostra as observações são independentes e as observações
da variável resposta, em cada sub-população, têm distribuição
Normal com mesma variância (homoscedasticidade)(homoscedasticidade)..
Hipóteses:
H0: µD = µA = µE = µO
H1: Alguma média diferente.
µ1 = µD: média do peso da carga doméstica; 
µ2 = µA: média do peso da carga administrativa;
Exemplo 2: Cargas aéreas
26
µ2 = µA: média do peso da carga administrativa;
µ3 = µE: média do peso da carga de equipamentos industriais;
µ4 = µO: média do peso da carga de outros tipos.
Da distribuição F com 3 g.l. no numerador e 24 g.l. no denominador, 
Fonte de Variação g.l. Soma de Quadrados Quadrado Médio Teste F Valor P
Entre grupos 3 1275,41 452,14 134,54 <0,0001
Dentro de grupos 24 75,82 3,16
Total 27 1351,23
ANOVA no Exemplo 2
27
Da distribuição F com 3 g.l. no numerador e 24 g.l. no denominador, 
com α = 5 %, obtemos
Fc= 3,009.
Como Fobs > Fc, há evidências para a rejeição da hipótese nula.
R2 = 0,9439 = 94,39%
PERGUNTA: Quais grupos são diferentes?
COMPARAÇÕES ENTRE MÉDIAS
• Quando a hipótese nula no teste de igualdade de médias é rejeitada,
em geral deseja-se saber quais médias são diferentes.
• Idéia: fazer testes ou construir intervalos de confiança para as
médias 2 a 2 (Comparações Múltiplas).
Problema: considerando-se todas as comparações simultaneamente, o
nível de significância global é superior ao nível desejado α (lembre-
se que α é a probabilidade de erro tipo I).
28
Uma alternativa é utilizar a correção de Bonferroni:
Se serão feitas m comparações, utiliza-se um nível de significância
α/m para cada uma das comparações; com esse procedimento, fica
garantido que o nível de significância global é menor ou igual a α.
Para intervalos de confiança, é preciso corrigir o coeficiente de
confiança para cada comparação. Se forem construídos m
intervalos, cada intervalo deve ter coeficiente de confiança (1- α/m);
dessa forma, fica garantido que o coeficiente de confiança global é
maior igual a γ = (1- α).
COMPARAÇÕES ENTRE MÉDIAS
• Os intervalos de confiança para as diferenças de médias 
(contrastes) ficam dados por
�se
2 é a estimativa de σ2, que é dada por
 
ji
eknji
nn
styy 11)( )( +±− −
e
se
2 
= QMD (Quadrado Médio Dentro na ANOVA).
� t(n-k) é obtido da tabela da distribuição t-Student com (n-k) 
graus de liberdade e coeficiente de confiança corrigido.
29
⇒ Se o intervalo não contém o “zero”, podemos obter 
conclusões sobre a razão da rejeição. 
Exemplo 2: Cargas Aéreas 
• INTERVALOS DE CONFIANÇA UTILIZANDO-SE MÉTODO 
DE BONFERRONI:
�Nível de confiança global: 94% = (1- 0,06)x100%;
�Como serão feitas 6 comparações, utilizamos coeficiente 
de confiança igual a 99%= (1- 0,06/6)x100% para cada 
intervalo.
�A estimativa intervalar é dada por
em que Se2 é a estimativa de σ2, que é dada por
Se2 = QMD (quadrado médio Dentro).
 
ji
eknji
nn
styy 11)( )( +±− −
30
• Resultados: se2 = 3,16
t24;99% = 2,8.
Comparação Diferenças das médias Lim. Inf. Lim. Sup.
D – A -5,1 2,658 -7,76 -2,44
D – E -17,3 2,658 -19,96 -14,64
D – O -1,8 2,658 -4,46 0,86
0∉IC
0∉IC
0∈IC
 2/72/72/72/724242424 est ×
Exemplo 2: Cargas Aéreas 
22,8
D
24,6
O
27,9
A
40,1
E
31
D – O -1,8 2,658 -4,46 0,86
A – E -12,2 2,658 -14,86 -9,54
A – O 3,3 2,658 0,64 5,96
E – O 15,5 2,658 12,84 18,16
0∈IC
0∉IC
0∉IC
0∉IC
Outros métodos de comparações múltiplas:
Tukey e Scheffé
Comparação entre os métodos de comparações múltiplas
a) Tukey deve ser adotado quando tivermos interesse em
todas as possíveis comparações de médias duas a duas. Quando
o no. de comparações for pequeno em relação a k(k-1)/2,
Bonferroni é mais preciso que o Tukey.
b) Scheffé deve ser adotado quando temos interesse em
comparações envolvendo mais de duas médias. Se o no. de
32
comparações envolvendo mais de duas médias. Se o no. de
comparações for pequeno, o método de Bonferroni é
preferível ao de Scheffé.
c) Quando há interesse em comparações envolvendo
apenas duas médias, o método de Tukey fornece intervalos
de menor amplitude do que os de Scheffé e deve, nesse
caso, ser adotado.
diferença 
entre 
médias
diferença
estimada
Intervalo de confiança
Tukey Scheffé Bonferroni
µN - µT -0,09 [-0,96; 0,78] [-0,99; 0,81] [-1,10; 0,92]
µN - µD -1,91 [-2,78; -1,04] [-2,81; -1,01] [-2,93; -0,90]
Ex. 1 gestantes: Estimativas pontuais e intervalos de confiança 
(γ = 0,95) para comparações entre as médias, duas a duas.
33
µN - µD -1,91 [-2,78; -1,04] [-2,81; -1,01] [-2,93; -0,90]
µTD- µD -1,82 [-2,69; -0,95] [-2,72; -0,92] [-2,84; -0,81]
Adotando qualquer um dos métodos, concluímos que:
• média de HbA das gestantes normais é igual à das gestantes
com tolerância diminuída;
• gestantes diabéticas apresentam comportamento diferente dos
outros grupos, quanto à média de HbA.
• Para cada observação, podemos calcular os resíduos, dados por
• Os resíduos podem ser úteis para verificar as suposições do 
modelo (normalidade e variância constante) e detectar pontos 
atípicos.
• Podemos calcular os resíduos padronizados:
 iijiijij yyye −=−= µˆˆ
 µˆ iijiij yyyt
−
=
−
=
RESÍDUOS
• Construímos um gráfico dos resíduos em função dos valores 
ajustados, obtidos por (valor usado para “estimar” uma 
observação yij se o seu valor não fosse conhecido):
– Valores maiores que 2 e menores que -2 são considerados 
discrepantes (ou mal ajustados).
– Se os pontos estão distribuídos de forma aleatória, é sinal de 
que a variância é constante.
 
σσ
µ
ˆˆ
ˆ iijiij
ij
yyy
t
−
=
−
=
 iijy µˆˆ =
34
Exemplo2: Cargas aéreas
35
Comentários:
- A maioria dos resíduos está 
entre -2 e 2;
- A variabilidade dos resíduos 
nos 4 grupos é semelhante.
TESTE DE HOMOCEDASTICIDADE
(igualdade de variâncias)
• Quando construímos uma tabela de ANOVA, fazemos a 
suposição de que as variâncias dos grupos são as mesmas. 
(HOMOCEDASTICIDADE)
• Para verificar se essa suposição é verdadeira, podemos fazer 
um teste de homocedasticidade.um teste de homocedasticidade.
• Temos o modelo estatístico
(modelo de médias)
• Assumimos que 
 
ijiij ey += µ
);0(~ 2iij Ne σ
36
TESTE DE HOMOCEDASTICIDADE
• Queremos testar as hipóteses:
H0: σ12 = σ22 = ... = σk2
H1: Pelo menos uma das variâncias é diferente das demais 
O teste é construído da seguinte maneira:O teste é construído da seguinte maneira:
1. Calcule a variância comum:
QMD
kn
SQD
kn
Sn
S
K
i
ii
e =
−
=
−
−
=
∑
=1
2
2
)1(
37
TESTE DE HOMOCEDASTICIDADE
2. Calcule
3. Calcule, também,
4. Construa a estatística de teste, dada por:
( ) ( )2
1
2 ln)1(ln)( i
k
i
ie SnSknM ∑
=
−−−=






−
−





−−
+= ∑
=
knnk
C
k
i i
1
1
1
)1(3
11
1
4. Construa a estatística de teste, dada por:
5. Para amostras grandes, essa estatística tem distribuição 
de Qui-quadrado com (k-1) graus de liberdade:
4. Rejeita-se a hipótese nula para valores grandes de M/C.
 C
M
).1(~ 2 −kCM χ
38
TESTE DE HOMOCEDASTICIDADE
. ,~ 0
2
1 HC
M
k sob−χ
Exemplo 2: Cargas aéreas
Estatística do teste:
Hipóteses:
H0: σD2= σA2= σE2= σO2
H1: Pelo menos uma das variâncias é diferente das demais






−
−





−−
+= ∑
=
knnk
C
k
i i
1
1
1
)1(3
11
1
. ,~ 01 HC
M
k sob−χ
39
Estatística do teste:
( ) ( )2
1
2 ln)1(ln)( i
k
i
ie SnSknM ∑
=
−−−=
Nível de significância: 5%
TESTE DE HOMOCEDASTICIDADE
Medidas necessárias:
M = (28-4)ln3,16 – 6 ln1,92 – 6 ln1,22 – 6 ln2,22 – 6 ln1,62
= 2,622.
453,2=C
M
069,1
428
1
6
1
6
1
6
1
6
1
)14(3
11 =



−
−+++
−
+=C
Região crítica: RC = {M/C ≥ qtab}
Da tabela χ2 com 3 g.l. e α = 5%, qtab = 7,81
2,453 ∉ RC, então H0 não é rejeitada.
Nível descritivo: 
P = P(M/C ≥ 2,453 | H0 verdadeira) = 0,48 > 0,05, então H0
não é rejeitada (ou seja, as variâncias são iguais).
40
41voltavolta
42 volta

Outros materiais