Buscar

Anova, Análise de variância

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1 
 
Análise de variância – ANOVA 
Analysis of variance 
 
Conceito: é um teste estatístico que visa fundamentalmente verificar se existe uma diferença 
significante entre as médias e se os fatores exercem influência nesta diferença. 
Experimento ou Ensaio 
É um trabalho previamente planejado, que segue determinados princípios básicos e no qual se 
faz a comparação dos efeitos dos tratamentos. 
Tratamento 
É o método, elemento ou material cujo efeito deseja-se medir ou comparar, em um experimento; 
Unidade experimental ou parcela 
É a unidade que vai receber o tratamento e fornecer os dados que refletirão ou não os seus 
efeitos. 
Tamanho e forma ótimos de parcela são aqueles que resultam em menor variação entre parcelas 
dentro do mesmo bloco. 
Delineamento experimental é o plano que será utilizado na experimentação; implica no modo de 
como os tratamentos serão designados às unidades experimentais. Ex: DIC, DBC, DQL; 
Princípios básicos da experimentação 
Princípio da repetição: consiste na reprodução do experimento básico e tem por finalidade 
propiciar a obtenção de uma estimativa do erro experimental. 
Trat. A 
Trat. B 
Fig. 1 - Experimento básico 
A A A A A A 
B B B B B B 
Fig. 2 - Princípio da repetição
 
Princípio da casualização: tem a finalidade de propiciar a todos os tratamentos a mesma 
probabilidade de ser designado a qualquer uma das unidades experimentais. 
Trat. A 
Trat. B 
Fig. 3 - Experimento básico 
B A A B A B 
A B A B B A 
Fig. 4 - Princípio da repetição + casualização 
 
Princípio do controle local: consiste na homogeneização das condições experimentais visando a 
redução do erro experimental. Ex: dividindo um ambiente heterogêneo em subambientes 
homogêneos. Cada par de parcelas que deve ser homogêneo (tratamentos A e B) é denominado 
de bloco. Pode haver variação entre blocos. 
Trat. A 
Trat. B 
Fig. 5 - Experimento básico 
B A A B A B 
A B A B B A 
Fig. 6 - Princípio da repetição + casualização + controle local
♦ Quando se tem diversos tratamentos a comparar, cada bloco será constituído por um grupo de 
parcelas que será múltiplo do número de tratamentos. 
 
 
2 
 
2. Delineamento inteiramente ao acaso ou ensaio randômico (DIC) 
É aquele que o pesquisador dispõe de unidades similares para conduzir seu experimento. 
Deve designar os tratamentos às unidades por puro e simples sorteio, ou seja, sem qualquer tipo 
de restrição. 
É importante que as unidades experimentais sejam similares, ou seja, que respondam aos 
tratamentos de forma similar. 
É recomendável que todos os tratamentos tenham igual número de repetições. 
 
Exemplo 1: Um experimento com quatro medicamentos, designados 1, 2, 3 e 4, foi executado em 
um DIC. Os medicamentos foram testados para avaliar sua eficácia na redução da PAS. Seis 
pacientes escolhidos aleatoriamente foram avaliados por medicamento, e a pressão arterial foi 
medida nos mesmos. A partir dos dados apresentados na tabela abaixo, testar a hipótese da não 
existência de diferenças entre os efeitos dos medicamentos para o nível de significância 5%. 
 
Medicamento 1 
(mmHg) 
Medicamento 2 
(mmHg) 
Medicamento 3 
(mmHg) 
Medicamento 4 
(mmHg) 
 100 120 98 130 
 115 125 99 128 
 98 110 103 140 
 110 106 105 125 
 95 105 100 124 
 100 103 105 120 
Soma 618 669 610 767 
Média 103,0 111,5 101,7 127,8 
 
Hipóteses 
𝐻0: 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 
𝐻1: 𝑎𝑠 𝑚é𝑑𝑖𝑎𝑠 𝑛ã𝑜 𝑠ã𝑜 𝑡𝑜𝑑𝑎𝑠 𝑖𝑔𝑢𝑎𝑖𝑠 
Especificações 
𝑛 = 24 (Unidades experimentais) 
Graus de liberdade no numerador (entre colunas), 𝑘 − 1 = 4 − 1 = 3 
Graus de liberdade no denominador (dentro), 𝑘(𝑟 − 1) = 4(6 − 1) = 20 
Graus de liberdade total = 𝑛 − 1 = 23 
Nível de significância: 𝛼 = 0,05 
Valor crítico de 𝐹0,05;(3 , 20) = 3,10 
Regras de decisão 
Rejeitar 𝐻0 se 𝐹 ≥ 3,10 
Não rejeitar 𝐻0 se 𝐹 < 3,10 
Cálculos: 
Fator de correção: 
𝐹𝐶 =
(∑ 𝑥)2
𝑛
=
(100 + 115 + ⋯ + 124 + 120)2
24
= 295.704 
Soma de quadrados total 
𝑆𝑄𝑡𝑜𝑡 = ∑ 𝑥
2 − 𝐹𝐶 = (1002 + 1152 + ⋯ + 1242 + 1202) − 295.704 = 3.594 
Soma de quadrados entre os tratamentos 
𝑆𝑄𝑡𝑟𝑎𝑡 =
∑ 𝑇2
𝑟
− 𝐹𝐶 =
6182 + 6692 + 6102 + 7672
6
− 𝐹𝐶 = 298.312,33 − 295.704
= 2.608,33 
Soma de quadrados de erros 
𝑆𝑄𝑒 = 𝑆𝑄𝑡𝑜𝑡 − 𝑆𝑄𝑡𝑟𝑎𝑡 = 3.594 − 2.608,33 = 985,67 
Quadrado médio dos tratamentos 
3 
 
𝑄𝑀𝑡 =
𝑆𝑄𝑡
𝑘 − 1
=
𝑆𝑄𝑡
𝑘 − 1
=
2.608,33
3
= 869,44 
Quadrado médio do erro experimental 
𝑄𝑀𝑒 =
𝑆𝑄𝑒
𝑘(𝑟 − 1)
=
𝑆𝑄𝑒
𝑘(𝑟 − 1)
=
985,67
20
= 49,28 
Razão 𝐹 
𝐹 =
𝑄𝑀𝑡
𝑄𝑀𝑒
=
896,44
49,28
= 17,64 
Conclusão 
Rejeita-se 𝐻0, porque 17,64 > 3,10. A diferença entre as médias dos tratamentos é significativa, 
ou seja, pelo menos dois medicamentos diferem entre si quanto à sua eficácia na redução da PAS. 
 
3. Um experimento para comparar o efeito de cinco drogas na diminuição da pressão arterial. 
Para fazer esse experimento o médico tomou 30 pacientes e os dividiu ao acaso em seis 
grupos: o grupo controle recebeu um placebo e os outros grupos receberam, cada um, uma 
das drogas. Os valores apresentados na tabela abaixo são referentes a diminuição da pressão 
arterial, dada pela diferença entre a pressão arterial no início e no final do experimento. As 
diferenças de médias de diminuição da pressão arterial são significantes? 
Tratamento 
A B C D E Controle 
25 10 18 23 11 8 
17 -2 8 29 23 -6 
27 12 4 25 5 6 
21 4 14 35 17 0 
15 16 6 33 9 2 
 
4. Delineamento inteiramente ao acaso com número diferente de repetições (DIC) 
É aquele que o número de unidades de que o pesquisador dispõe não seja múltiplo do 
número de tratamentos que pretende comparar. 
Do ponto de vista da Estatística, é melhor que todos os tratamentos tenham igual número de 
repetições: a análise é mais exata. No entanto, esse tipo de experimento é indicado na 
experimentação com seres humanos, quando o uso de grupo de controle tem restrições de 
natureza ética. Nesse caso, recomenda-se que o grupo controle tenha menor número de 
repetições do que os grupos tratados. 
Exemplo 2: Verificando os índices de produção segundo os postos de trabalho, durante certo 
período, analisar se as diferenças se devem aos postos de trabalho, isto é, se os postos de 
trabalho diferem quanto à produtividade. 
 Posto A Posto B Posto C 
 90,8 85,5 65,5 
 100,0 83,0 77,1 
 81,1 73,7 
Soma T 271,9 242,2 142,6 
Média 90,6 80,7 71,3 
Hipóteses 
𝐻0: 𝜇1 = 𝜇2 = 𝜇3 
𝐻1: 𝑎𝑠 𝑚é𝑑𝑖𝑎𝑠 𝑛ã𝑜 𝑠ã𝑜 𝑡𝑜𝑑𝑎𝑠 𝑖𝑔𝑢𝑎𝑖𝑠 
Especificações 
𝑛 = 8 (Unidades experimentais) 
Graus de liberdade: 
De tratamentos: k - 1 = 3 – 1 = 2 
4 
 
Do resíduo: n – k = 8 – 3 = 5 
Do total: (k - 1) + (n - k) = 7 
Nível de significância: 𝛼 = 0,05 
Valor crítico de 𝐹0,05;(2 , 5) = 5,79 
Regras de decisão 
Rejeitar 𝐻0 se 𝐹 ≥ 5,79 
Não rejeitar 𝐻0 se 𝐹 < 5,79 
Cálculos: 
Fator de correção: 
𝐹𝐶 =
(∑ 𝑥)2
𝑛
=
(271,9 + 242,2 + 142,6)2
8
=
431.254,9
8
= 53906,9 
Soma de quadrados total 
𝑆𝑄𝑡𝑜𝑡 = ∑ 𝑥
2 − 𝐹𝐶 = (90,82 + 1002 + ⋯ + 65,52 + 77,12) − 53906,9 = 780,6 
Soma de quadrados entre os tratamentos 
𝑆𝑄𝑡𝑟𝑎𝑡 =
∑ 𝑇2
𝑟
− 𝐹𝐶 =
271,92
3
+
242,22
3
+
142,62
2
− 𝐹𝐶 = 54364,2 − 53906,9 = 457,3 
Soma de quadrados de erros 
𝑆𝑄𝑒 = 𝑆𝑄 − 𝑆𝑄𝑡 = 780,6 − 457,3 = 323,3 
Quadrado médio dos tratamentos 
𝑄𝑀𝑡 =
𝑆𝑄𝑡
𝑘 − 1
=
𝑆𝑄𝑡
𝑘 − 1
=
457,3
2
= 228,7 
Quadrado médio do erro experimental 
𝑄𝑀𝑒 =
𝑆𝑄𝑒
𝑘(𝑛 − 1)
=
𝑆𝑄𝑒
𝑘(𝑛 − 1)
=
323,3
5
= 64,6 
Razão 𝐹 
𝐹 =
𝑄𝑀𝑡
𝑄𝑀𝑒
=
228,7
64,6
= 3,54 
Conclusão 
Aceita-se 𝐻0, porque 3,54 < 5,79. A diferença entre as médias dos tratamentos NÃO é 
significativa,ou seja, as médias dos postos de trabalho não diferem quanto à produtividade. 
 
 
5 
 
5. Delineamento em blocos casualizados (DBC) 
É aquele em que o pesquisador dispõe de pequenos grupos de unidades similares, mas nenhum 
deles com número suficiente de unidades para fazer um experimento inteiramente ao acaso. 
 
Exemplo 3: Um agrônomo deseja verificar se quatro variedades de milho têm, em média, a mesma 
produtividade. A área do teste possui nítida variação de fertilidade. Portanto, antes de sortear as 
variedades (tratamentos) às parcelas (unidades experimentais), precisam ser demarcadas, ou 
seja, formar blocos com a mesma fertilidade. Realizado isso, o agrônomo deve fixar quatro 
parcelas em cada bloco e sortear uma variedade para cada parcela. Diante disso, é razoável 
concluir, observando as médias, que os tratamentos A, B, C e D conduzem a médias 
estatisticamente diferentes? 
Bloco 
Tratamentos 
B B2 B2/k 
A B C D 
I 32 24 35 21 112 12544 3136 
II 24 35 43 26 128 16384 4096 
III 33 42 39 30 144 20736 5184 
IV 38 36 43 39 156 24336 6084 
V 33 38 55 34 160 25600 6400 
Médias 32 35 43 30 24900 
T 160 175 215 150 
T2 25600 30625 46225 22500 
T2/r 5120 6125 9245 4500 24990 
Hipóteses 
𝐻0: 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 
𝐻1: 𝑎𝑠 𝑚é𝑑𝑖𝑎𝑠 𝑛ã𝑜 𝑠ã𝑜 𝑡𝑜𝑑𝑎𝑠 𝑖𝑔𝑢𝑎𝑖𝑠 
Especificações 
𝑛 = 20 (Unidades experimentais) 
Graus de liberdade: 
De tratamentos: k - 1 = 4 – 1 = 3 
Do Bloco: r - 1 = 5 - 1 = 4 
Do resíduo: (kr - 1) –(k-1)-(r-1) = 19 – 3 - 4 = 12 
Do total: (kr - 1) = 20-1=19 
Nível de significância: 𝛼 = 0,05 
Valor crítico de 𝐹0,05;(3,5) = 5,79 
Regras de decisão 
Rejeitar 𝐻0 se 𝐹 ≥ 5,79 
Não rejeitar 𝐻0 se 𝐹 < 5,79 
Cálculos: 
Fator de correção: 
𝐹𝐶 =
(∑ 𝑥)2
𝑛
=
(700)2
20
= 24500 
Soma de quadrados total 
𝑆𝑄 = ∑ 𝑥2 − 𝐹𝐶 = (322 + 242 + ⋯ + 342) − 24500 = 1190 
Soma de quadrados entre os tratamentos 
𝑆𝑄𝑡 =
∑ 𝑇2
𝑟
− 𝐹𝐶 =
1602
5
+
1752
5
+
2152
5
+
1502
5
− 𝐹𝐶 = 490 
Soma de quadrados de blocos 
𝑆𝑄𝐵 =
∑ 𝐵2
𝑘
− 𝐹𝐶 =
1122
4
+
1282
4
+
1442
4
+
1562
4
+
1602
4
− 𝐹𝐶 = 400 
Soma de quadrados de erros 
6 
 
𝑆𝑄𝑒 = 𝑆𝑄 − 𝑆𝑄𝑡 − 𝑆𝑄𝐵 = 1190 − 490 − 400 = 300 
Quadrado médio dos tratamentos 
𝑄𝑀𝑡 =
𝑆𝑄𝑡
𝑘 − 1
=
𝑆𝑄𝑡
𝑘 − 1
=
490
3
= 163,3 
Quadrado médio de blocos 
𝑄𝑀𝐵 =
𝑆𝑄𝐵
𝑟 − 1
=
400
4
= 100 
Quadrado médio dos experimental 
𝑄𝑀𝑒 =
𝑆𝑄𝑟
(𝑘 − 1)(𝑟 − 1)
=
300
3 × 4
= 25 
Razão 𝐹 
𝐹 =
𝑄𝑀𝑡
𝑄𝑀𝑒
=
163,3
25
= 6,53 
Conclusão 
Rejeita-se 𝐻0, porque 6,53 > 3,49. Podemos, portanto, concluir que, em média, os tratamentos 
levam a valores estatisticamente diferentes. 
Definições e termos utilizados na ANOVA - DIC 
Fórmula Definição 
𝐹𝐶 =
(∑ 𝑥)2
𝑛
 
Fator de correção – constante empregada em várias fórmulas. 
𝑆𝑄 = ∑ 𝑥2 − 𝐹𝐶 Soma de quadrados total – representa a soma dos quadrados dos desvios em 
relação à média. 
𝑆𝑄𝑡 =
∑ 𝑇2
𝑟
− 𝐹𝐶 
Soma de quadrados de tratamentos – representa a soma dos quadrados dos 
desvios em relação à média amostral com relação à média total ou a variação entre 
os tratamentos. 
𝑆𝑄𝑒 = 𝑆𝑄 − 𝑆𝑄𝑡 Soma de quadrados de erro experimental (dentro dos grupos) – representa a 
variação dentro dos tratamentos, isto é, a variação entre as unidades 
experimentais com o mesmo tratamento. 
𝑄𝑀𝑡 =
𝑆𝑄𝑡
𝑘 − 1
 
Quadrado médio entre tratamentos também denominado variância entre 
tratamentos – representa a variação entre os tratamentos. 
𝑄𝑀𝑒 =
𝑆𝑄𝑒
𝑘(𝑛 − 1)
 
Quadrado médio do erro experimental também denominado variância dentro dos 
grupos – representa a variabilidade dentro do mesmo tratamento. 
𝐺𝑙𝑡 = 𝑘 − 1 Graus de liberdade da soma dos quadrados dos tratamentos. 
𝐺𝑙𝑒 = 𝑘(𝑛 − 1) Graus de liberdade da soma dos quadrados do erro experimental. 
𝐹 =
𝑄𝑀𝑡
𝑄𝑀𝑒
 
Razão entre a variância entre os tratamentos e variância média dentro dos 
tratamentos. 
Definições e termos utilizados na ANOVA - DBC 
Fórmula Definição 
𝐹𝐶 =
(∑ 𝑥)2
𝑛
 Fator de correção – constante empregada em várias fórmulas. 
𝑆𝑄 = ∑ 𝑥2 − 𝐹𝐶 
Soma de quadrados total – representa a soma dos quadrados dos desvios 
em relação à média. 
𝑆𝑄𝑡 =
∑ 𝑇2
𝑟
− 𝐹𝐶 
Soma de quadrados de tratamentos – representa a soma dos quadrados 
dos desvios em relação à média amostral com relação à média total ou a 
variação entre os tratamentos. 
𝑆𝑄𝐵 =
∑ 𝐵2
𝑘
− 𝐹𝐶 
Soma de quadrados dos blocos – representa a variabilidade devida a 
heterogeneidade do material. 
𝑆𝑄𝑒
= 𝑆𝑄 − 𝑆𝑄𝑡 − 𝑆𝑄𝐵 
Soma de quadrados de erro experimental (dentro dos grupos) – representa 
a variação dentro dos tratamentos, isto é, a variação entre as unidades 
experimentais com o mesmo tratamento. 
𝑄𝑀𝑡 =
𝑆𝑄𝑡
𝑘 − 1
 
Quadrado médio entre tratamentos também denominado variância entre 
tratamentos – representa a variação entre os tratamentos. 
7 
 
𝑄𝑀𝑒 =
𝑆𝑄𝑒
𝑘(𝑛 − 1)
 
Quadrado médio do erro experimental também denominado variância 
dentro dos grupos – representa a variabilidade dentro do mesmo 
tratamento. 
𝐺𝑙𝑇 = 𝑘 − 1 Graus de liberdade da soma dos quadrados dos tratamentos. 
𝐺𝑙𝐵 = 𝑟 − 1 
𝐺𝑙𝑒 = (𝑘 − 1)(𝑟 − 1) Graus de liberdade da soma dos quadrados do erro experimental. 
𝐹 =
𝑄𝑀𝑡
𝑄𝑀𝑒
 
Razão entre a variância entre os tratamentos e variância média dentro dos 
tratamentos. 
Exercícios 
1) O resultado das vendas efetuadas por 3 vendedores de uma indústria durante certo período é dado 
a seguir. Deseja-se saber, ao nível de 5%, se há diferença de eficiência entre os vendedores. 
A B C 
29 27 30 
27 27 30 
31 30 31 
29 28 27 
32 29 
30 
2) Um ensaio de tração mede a quantidade de uma solda a ponto de um material revestido de alumínio. 
A fim de determinar se há “efeito de máquina” quando se solda um material de bitola especificada, 
obtém-se as seguintes amostras de 3 máquinas. Realize a análise da variância conveniente. 
Máquina A: 3,2; 4,1; 3,5; 3,0; 3,1 
Máquina B: 4,9; 4,5; 4,5; 4,0; 4,2 
Máquina C: 3,0; 2,9; 3,7; 3,5; 4,2 
3) Os dados da tabela seguinte referem-se às quantidades produzidas de um produto por determinado 
método em diferentes postos de trabalho. Os quatro níveis do fator A representam postos de 
trabalho. Os dois níveis do fator B representam os servidores de trabalho. Os resultados fornecidos 
correspondem à produção de um dia para cada posto e supervisor. Pede-se: 
a. É a quantidade afetada significativamente por diferenças nos postos de trabalho para (𝛼 = 0,01)? 
b. É indiferente que se use o supervisor 1 ou supervisor 2, com (𝛼 = 0,05)? 
Nível do fator B Nível fator Total 
A B C D 
Supervisor 1 31 27 33 30 121 
Supervisor 2 47 35 39 46 157 
Total 78 62 72 66 78 
4) Uma máquina para ensaio de desgaste consta de 4 escovas, sob as quais se fixam amostras do 
material, a fim de medir suas resistências à abrasão. A perda de peso do material, depois de um dado 
número de ciclos, é usada como medida de resistência ao desgaste. Os dados da tabela a seguir 
indicam a perda de peso de 4 materiais ensaiados. Realize a análise da variância conveniente. 
Material 
Posição da escova 
1 2 3 4 
A 1,93 2,38 2,20 2,25 
B 2,55 2,72 2,75 2,70 
C 2,40 2,68 2,31 2,28 
D 2,33 2,40 2,28 2,25 
 
8 
 
6. Delineamento em quadrado latino (DQL) 
É aquele que exige a construção de blocos em duas direções: em linhas e em colunas (dupla 
blocagem). 
Os fatores propostos podem ser de origem qualitativa ou quantitativa, mas a variável dependente 
necessariamente deverá ser contínua. 
Exemplo 4 – Um engenheiro de produção quer saber se o númerode itens produzidos por dia 
varia com o operador da máquina. O engenheiro já sabe que a quantidade produzida depende 
do dia da semana e da máquina. Planeja, então, um experimento em quadrado latino para 
comparar a produção de cinco operadores (A, B, C, D, E) em cinco máquinas (1, 2, 3, 4, 5) em 
cinco dias da semana (2ª, 3ª, 4ª, 5ª, 6ª). 
 2ª 3ª 4ª 5ª 6ª 
Máquina 1 D A B C E 
Máquina 2 C E A B B 
Máquina 3 E B C D A 
Máquina 4 B D E A C 
Máquina 5 A C D E B 
 
 
Uma análise de variância só pode ser feita se forem satisfeitas algumas suposições básicas: 
 
 
 
9 
 
Validação das pressuposições básicas 
 A ANOVA exige que sejam feitas a validação das pressuposições sobre os erros, sem as 
quais os resultados da análise não são válidos. 
Os pressupostos básicos da análise da variância são: 
 Ausência de dados (erros) discrepantes; 
 Os erros são variáveis aleatórias independentes (não auto correlacionados); 
 A variação é constante (homocedasticidade); 
 A distribuição dos erros é normal. 
1. Análise dos resíduos 
Ninguém conhece as médias populacionais dos tratamentos (𝜇1, 𝜇2, … , 𝜇𝑛) nem os erros 𝑒𝑖. 
No entanto, o pesquisador faz um estudo estatístico para obter as estimativas dessas médias. 
Ninguém conhece os erros 𝑒𝑖, porque eles são definidos em função das médias verdadeiras 
(𝜇1, 𝜇2, … , 𝜇𝑛). Mas temos as estimativas dessas médias, pelas médias amostrais. Podemos 
estimar os erros fazendo a diferença entre cada dado e a média do tratamento a que ele 
pertence: 
𝑒𝑖𝑗 = 𝑦𝑖𝑗 − �̅� 
 As estimativas dos erros recebem o nome de resíduos. É o estudo dessas estimativas, ou 
seja, é a análise dos resíduos que ajuda verificar se a análise da variância feita é aceitável. 
Exemplo: 
Os dados abaixo se referem às vendas de um artigo (em mil itens) em quatro filiais de uma loja 
de departamento (1, 2, 3 e 4). 
 Tratamento 1 Tratamento2 Tratamento 3 Tratamento 4 
 25 31 22 33 
 26 25 26 29 
 20 28 28 31 
 23 27 25 34 
 21 24 29 28 
Média 23 27 26 31 
 
Tratamento 1 Tratamento2 Tratamento 3 Tratamento 4 
25-23=2 31-27=4 22-26=-4 33-31=2 
26-23=3 25-27=-2 26-26=0 29-31=-2 
20-23=-3 28-27=1 28-26=2 31-31=0 
23-23=0 27-27=0 25-26=-1 34-31=3 
21-23=-2 24-27=-3 29-26=3 28-31=-3 
 
10 
 
No gráfico abaixo, os tratamentos estão no eixo das abscissas e os resíduos (valores 
calculados na tabela acima) estão no eixo das ordenadas. O gráfico dos resíduos é básico: quando 
o modelo é adequado, os resíduos exibem um padrão aleatório. Não apresentam tendência. 
 
 
 
 
 
Dados discrepantes (outliers) 
Dado discrepantes (outliers) é um valor muito maior ou muito menor do que o valor 
esperado. Podem-se verificar outliers no próprio gráfico de resíduos. 
O valor discrepante fica mais visível se for desenhado um gráfico com resíduos 
padronizados em um lugar dos resíduos propriamente ditos. 
Para obter os resíduos padronizados (𝑒𝑝𝑖), basta dividir os resíduos pela raiz quadrada do 
quadrado médio dos resíduos (QME) da análise da variância. 
A expressão dos resíduos padronizados fica então: 
𝑒𝑝𝑖 = 𝑒𝑖 √𝑄𝑀𝐸⁄ 
Realizada a análise da variância do exemplo referente às vendas de um artigo (em mil itens) em 
quatro filiais de uma loja de departamento (1,2,3 e 4), o valor do QMR é 7: 
Anova 
Fonte da variação SQ gl MQ F valor-P F crítico 
Entre grupos 163,75 3 54,58333 7,797619 0,001976 3,238872 
Dentro dos grupos 112 16 7 
Total 275,75 19 
Então, o resíduo padronizado para a primeira observação do tratamento 1 será: 
𝑒𝑝𝑖 = 𝟐/ √𝟕 = 𝟎, 𝟕𝟓𝟔 
Os demais resíduos estão apresentados na tabela seguinte: 
O gráfico dos resíduos padronizados é o que segue: 
1 2 3 4 
0,8 1,5 1,5 0,8 
1,1 -0,8 0,0 -0,8 
-1,1 0,4 0,8 0,0 
0,0 0,0 -0,4 1,1 
0,8 1,1 1,1 -1,1 
 
Valores fora do intervalo de -3 e +3 devem ser considerados suspeitos. Como todos os 
valores estão dentro do intervalo de -3 e +3, logo não existe outliers neste estudo. 
11 
 
INDEPENDÊNCIA OU AUTOCORRELAÇÃO RESIDUAL 
Para fazer uma análise da variância, é preciso pressupor que os erros são variáveis 
aleatórias independentes. Mas o que significa pressupor que os erros são variáveis aleatórios 
independentes? 
 
Exemplo 
Considere um experimento com voluntários. Se for obtido um dado de cada voluntário, 
é razoável admitir que passe valores - e, consequentemente, os erros - são independentes. 
No entanto, se o pesquisador obtiver vários dados do mesmo voluntário, é razoável 
considerar que tais dados - e os erros - sejam dependentes. Isto porque qualquer medida obtida 
em uma pessoa em determinado momento deve estar correlacionada com a medida obtida em 
momento anterior. 
Unidades experimentais observadas em sequência - no tempo ou no espaço - geralmente 
têm correlação. Medidas feitas na mesma unidade experimental estão, muito frequentemente 
correlacionadas, A correlação entre observações seriadas ou tomadas em sequência é chamada 
de correlação serial. Se isso acontecer não é razoável pressupor Independência. 
Se os erros forem dependentes - porque foram tomadas observações na mesma unidade 
ou em unidades agrupadas ou em séries temporais - o resultado da análise da variância fica 
totalmente comprometido. Aliás a não independência é o mais grave problema para análise 
porque o nível de significância se torna muito maior do que o informado. Mais ainda, a 
dependência é difícil de ser corrigida. 
Então diante de qualquer suspeita de não Independência, é essencial proceder à análise 
dos resíduos. Desenha-se um gráfico dos resíduos padronizados contra a ordem em que as 
observações foram coletadas (no tempo e no espaço). Se a pressuposição de independência 
estiver satisfeita, os resíduos devem ficar dispersos em torno de zero, sem um padrão definido 
(aleatoriamente), como acontece no gráfico A apresentado abaixo. 
 
A análise de resíduos é extremamente útil, mas é gráfica. Isso significa que não se pode 
associar um nível de probabilidade à conclusão de que os erros não são independentes. Mas a 
pressuposição de independência pode ser transformada em hipótese e essa hipótese pode ser 
-10
-5
0
5
10
0 5 10 15 20 25
12 
 
colocada em teste. Quando existe forte suspeita de não independência pode se aplicar o Teste 
de Durbin-Watson, que veremos a seguir: 
 
Teste de Durbin-Watson 
Usando um gráfico residual, as violações dos pressupostos do modelo não são sempre 
fáceis de detectar e podem apesar de os gráficos parecerem bem-comportados. A análise de 
resíduos, usando gráficos residuais, é um método subjetivo. Nesse sentido, a verificação da 
independência é usualmente feita através do Teste de Durbin-Watson à correlação entre resíduos 
sucessivos. 
Se houver independência, a magnitude de um resíduo não influencia a magnitude do 
resíduo seguinte. Neste caso, a correlação entre resíduos sucessivos é nula (autocorrelação = 0). 
As hipóteses do teste, para aferir se a relação entre dois resíduos consecutivos é estatisticamente 
significativa, são então: 
𝑯𝟎: Auto correlação igual a zero, portanto existe independência 
𝑯𝟏: Auto correlação diferente de zero, portanto existe dependência 
 Esse teste serve para detectar se há presença significativa de auto correlação entre os 
resíduos em um modelo de análise da variância. O coeficiente de Durbin-Watson mede a 
correlação entre cada resíduo e o resíduo da observação imediatamente anterior. A equação é a 
seguinte: 
𝐷 =
∑ (𝑒𝑖 − 𝑒𝑖−1)
2𝑛
𝑖=1
∑ 𝑒𝑖2
𝑛
𝑖=1
 
Onde 𝑒𝑖 é o resíduo para o tempo i. 
 Os valores da estatística 𝐷 são interpretados da seguinte forma: 
𝐷 ≈ 0 ⟶ 𝑟𝑒𝑠í𝑑𝑢𝑜𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑎𝑚𝑒𝑛𝑡𝑒 𝑎𝑢𝑡𝑜 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑑𝑜 
𝐷 ≈ 2 ⟶ 𝑟𝑒𝑠í𝑑𝑢𝑜 𝑛ã𝑜 𝑠ã𝑜 𝑎𝑢𝑡𝑜 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑑𝑜 
𝐷 ≈ 4 ⟶ 𝑟𝑒𝑠í𝑑𝑢𝑜 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑎𝑚𝑒𝑛𝑡𝑒 𝑎𝑢𝑡𝑜 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑑𝑜 
 Com a tabela de Durbin-Watson para o nível de significância 𝛼, tamanho da amostra n e 
𝑁𝑉𝐼 (número de variáveis independentes do modelo), obtém-se 𝑑𝑈, que é o limite superior de 
variação, e 𝑑𝐿, o limite inferior. Os valores 𝑑𝑈 e 𝑑𝐿 encontram-se tabelados para os níveis de 
significância de 1% e 5% e tamanhos de amostras fixas estão anexas ao livro. 
Regra de decisão para o teste de Durbin-Watson 
Valor de D Interpretação 
0 ≤ 𝐷 < 𝑑𝐿 Evidência de auto correlação positiva 
𝑑𝐿 ≤ 𝐷 < 𝑑𝑈 Zona de indecisão 
13 
 
𝑑𝑈 ≤ 𝐷 < 4 − 𝑑𝑈 Ausência de auto correlação 
4 − 𝑑𝑈 ≤ 𝐷 < 4 − 𝑑𝐿 Zona de indecisão 
4 − 𝑑𝐿 ≤ 𝐷 ≤ 4 Evidência de auto correlação negativa 
 
Exemplo 
Sequência de Tempo 𝑒𝑖 𝑒𝑖
2 𝑒𝑖−1 𝑒𝑖 − 𝑒𝑖−1 (𝑒𝑖 − 𝑒𝑖−1)
2 
1 2 4 0 2 4 
2 3 9 2 1 1 
3 -3 9 3 -6 36 
4 0 0 -3 3 9 
5 -2 4 0 -2 4 
6 4 16 -2 6 36 
7 -2 4 4 -6 36 
8 1 1 -2 3 9 
9 0 0 1 -1 1 
10 -3 9 0 -3 9 
11 -4 16 -3 -1 1 
12 0 0 -4 4 16 
13 2 4 0 2 4 
14 -1 1 2 -3 9 
15 3 9 -1 4 16 
16 2 4 3 -1 1 
17 -2 4 2 -4 16 
18 0 0 -2 2 4 
19 3 9 0 3 9 
20 -3 9 3 -6 36 
 112 257 
𝐷 =
∑ (𝑒𝑖 − 𝑒𝑖−1)
2𝑛
𝑖=1
∑ 𝑒𝑖2
𝑛
𝑖=1
=
257
112
≈ 2,29 
Interpretação: Consultando a tabela de Durbin-Watson para 5%, n=20 e 𝑁𝑉𝐼 = 1 (Em a=ANOVA 
de um fator só temos uma variável independente que são os tratamentos), temos que 𝑑𝐿 = 1,20 
e 𝑑𝑈 = 1,41. 
Assim, 
𝑑𝑈 < 𝐷 < 4 − 𝑑𝑈 
1,41 ≤ 2,29 < 2,59 
Decisão: 
Ausência de auto correlação. 
14 
 
 
Variância constante (homocedasticidade) 
Se for razoável admitir que os erros são independentes, o passo seguinte consiste em verificar se 
as variâncias são constantes, ou como preferem dizer os estatísticos, se existe 
homocedasticidade. No caso do modelo de análise da variância de um único fator, convém 
verificar se as variâncias dos tratamentos são iguais. A violação do pressuposto da 
homocedasticidade compromete a credibilidade do Teste F. 
Uma regra prática defendida por quem estudou o assunto sugere pressupor que os resultados de 
uma análise da variância sejam considerados válidos desde que a maior variância não exceda em 
três vezes a menor. 
7,5
6,5
= 1,15 < 3 
Interpretação: 
Pelo exposto, é razoável pressupor variâncias iguais. 
Teste de Levene: 
A lógica do teste de Levene é simples: quanto maiores são as variâncias, maiores serão os 
resíduos. Podemos, então, pensar num modelo de regressão em que o resíduo é a variável 
dependente e a variância, a independente, e testar a existência da associação através do Teste F 
(F= variação explicada pelas variâncias/ variação explicada por fatores aleatórios ou alheios ao 
modelo). Se as variâncias são homogêneas, o resultado do Teste F para comparar as médias dos 
valores absolutos dos resíduos será não significante, isto é, os resíduos são mais fortemente 
15 
 
explicados por fatores aleatórios do que pelas variâncias tidas como variáveis explicativas. No 
gráfico, isso resultará em erros dispersos de forma aleatória com compacidade constante. 
 
Interpretação: A credibilidade da hipótese nula de que as médias são iguais é altíssima, ou melhor, 
absoluta. As diferenças de médias são não significantes, são fruto de erro amostral. Portanto, as 
variâncias podem ser consideradas homogêneas. 
 
Normalidade 
Em linhas gerais, o pesquisador não precisa se preocupar com a não normalidade, a não 
ser que os dados não transgridam fortemente a forma gaussiana. A distribuição de erros foge 
completamente da normalidade quando: 
 É assimétrica forte; 
 É leptocúrtica ou cume. 
 
16 
 
Exercícios. 
1) Uma companhia deseja testar 4 diferentes tipos de pneus, A, B, C e D. As vidas médias dos 
pneus (em milhares de milhas) constam na tabela abaixo, onde cada tipo foi testado 
aleatoriamente em 6 automóveis idênticos. Determine: 
A 33 38 36 40 31 35 
B 32 40 42 38 30 34 
C 31 37 35 33 34 30 
D 28 34 32 30 33 31 
a) As hipóteses: nula e alternativa. 
b) Vida média dos diferentes pneus. 
c) Variação total. 
d) Variação entre os grupos. 
e) Variação dentro dos grupos. 
f) O valor de F crítico e de F observado. 
g) Emitir uma conclusão estatística e uma conclusão prática com base no teste F ao nível de 
significância de 5%. 
 
2) Em um experimento onde pretendia-se testar 4 tipos de rações para camarão da Malásia 
obteve resultados em kg de camarão por tanque de engorda. 
 
a. Realizar: 
b. A análise de variância (ANOVA); 
c. Aplicar o teste F (𝛼 = 0,05 e 𝛼 = 0,01); 
d. Emitir uma conclusão estatística e uma conclusão prática com base no teste F; 
e. Calcular o CV (Coeficiente de variação) e emitir conclusão.

Continue navegando