Buscar

Planejamento de Experimento

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 149 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 149 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 149 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Universidade Federal de Ouro Preto
Instituto de Cieˆncias Exatas e Biolo´gicas
Departamento de Estat´ıstica
Apostila: Planejamento de
Experimento I
Docente:
Eduardo Bearzoti
Turma:
EST015
Este material e´ uma adaptac¸a˜o da Apos-
tila Estat´ıstica Experimental, do Prof.
Luiz Henrique de Aquino, da Universidade
Federal de Lavras
Primeiro Semestre – 2018
Suma´rio
1 Noc¸o˜es Preliminares 1
1.1 Objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Conceitos Importantes em Experimentac¸a˜o . . . . . . . . . . . . . . . . . . 1
1.3 Princ´ıpios Ba´sicos da Experimentac¸a˜o . . . . . . . . . . . . . . . . . . . . . 2
1.3.1 Repetic¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3.2 Casualizac¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3.3 Controle Local . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4 Variac¸a˜o Entre, Dentro e Total . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4.1 Exemplo Nume´rico . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2 Delineamento Inteiramente Casualizado (DIC) 9
2.1 Introduc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2 Modelo Estat´ıstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2.1 Efeitos Fixos e Aleato´rios . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.2 Tipos de Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.3 Pressuposic¸o˜es do Modelo . . . . . . . . . . . . . . . . . . . . . . . 11
2.3 DIC Desbalanceado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.4 Casualizac¸a˜o em um DIC . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.5 Estimac¸a˜o dos Paraˆmetros . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.6 Partic¸a˜o da Variac¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.7 Ana´lise de Variaˆncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.8 Exemplo Nume´rico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.9 Exerc´ıcio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.10 Componentes de Variaˆncia . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.11 Coeficiente de Variac¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.12 ANOVA de DIC’s Desbalanceados . . . . . . . . . . . . . . . . . . . . . . . 24
3 Indo Ale´m da ANOVA 26
3.1 Introduc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.2 Contrastes Ortogonais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.2.1 Um Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.2.2 Correc¸a˜o de Bonferroni . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.3 Comparac¸o˜es Mu´ltiplas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.3.1 Teste de Tukey . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.3.2 Teste de Student–Newman–Keuls (SNK) . . . . . . . . . . . . . . . 35
3.3.3 Teste de Duncan . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.3.4 Outros Testes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.4 Agrupamento de Me´dias (Me´todo de Scott-Knott) . . . . . . . . . . . . . . 38
2
SUMA´RIO 3
4 Delineamentos em Blocos Casualizados 43
4.1 Introduc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.2 Casualizac¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.3 Modelo Estat´ıstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.4 Partic¸a˜o da Variac¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.5 Esquema da ANOVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.6 Estimac¸a˜o dos Paraˆmetros . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.7 Indo Ale´m da ANOVA (Modelo Fixo) . . . . . . . . . . . . . . . . . . . . . 48
4.8 Exemplo Nume´rico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
5 Delineamento em Quadrado Latino 52
5.1 Introduc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
5.2 Modelo Estat´ıstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
5.3 Casualizac¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
5.4 Somas de Quadrados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.5 Esquema da ANOVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
5.6 Um Exemplo Nume´rico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
6 Teoria de Modelos Lineares: uma introduc¸a˜o 60
6.1 Introduc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
6.2 Estimac¸a˜o por Quadrados Mı´nimos . . . . . . . . . . . . . . . . . . . . . . 62
6.3 Inversas Generalizadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
6.4 Partic¸a˜o da Variac¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
6.5 Submodelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
6.6 Me´dias de Quadrados Mı´nimos . . . . . . . . . . . . . . . . . . . . . . . . 83
6.7 Func¸o˜es Estima´veis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
6.8 Algoritmos de Inversas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
7 Regressa˜o em Delineamentos Experimentais 89
7.1 Introduc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
7.2 Decomposic¸a˜o da Variac¸a˜o Entre Tratamentos . . . . . . . . . . . . . . . . 89
8 Ensaios Fatoriais 96
8.1 Introduc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
8.2 Modelo Estat´ıstico e Partic¸a˜o da Variac¸ao . . . . . . . . . . . . . . . . . . 97
8.3 Estimac¸a˜o de Me´dias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
8.4 Interac¸a˜o A × B . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
8.5 Exemplo 1 (dois fatores, interac¸a˜o na˜o significativa) . . . . . . . . . . . . . 101
8.6 Exemplo 2 (dois fatores, interac¸a˜o significativa) . . . . . . . . . . . . . . . 105
8.7 Treˆs Fatores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
8.7.1 ANOVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
8.7.2 Um Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
8.8 Superf´ıcies de Resposta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
8.9 Considerac¸o˜es Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
9 Ensaios em Parcelas Subdivididas e em Faixas 120
9.1 Introduc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
9.2 Parcelas Subdivididas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
9.2.1 Modelo Estat´ıstico . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
9.2.2 ANOVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
9.2.3 Variaˆncias das Diferenc¸as entre Me´dias . . . . . . . . . . . . . . . . 124
9.2.4 Um Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
9.3 Experimentos em Faixas (Split Block Design) . . . . . . . . . . . . . . . . 128
9.3.1 Variaˆncias das Diferenc¸as entre Me´dias . . . . . . . . . . . . . . . . 129
9.3.2 Considerac¸o˜es Finais . . . . . . . . . . . . . . . . . . . . . . . . . . 131
A Tabelas
Cap´ıtulo 1
Noc¸o˜es Preliminares
1.1 Objetivo
Este material corresponde a um estudo introduto´rio ao planejamento, execuc¸a˜o, ana´lise
e interpretac¸a˜o de experimentos.
1.2 Conceitos Importantes em Experimentac¸a˜o
Experimento ou Ensaio
E´ uma atividade cient´ıfica planejada e organizada com o objetivo de responder a
perguntas e/ou resolver problemasde interesse em um dado campo de estudo.
Tratamento
E´ o processo (ou um dos processos, pois em geral ha´ mais de um) cujo efeito se
deseja medir ou comparar em um experimento. Como exemplo de tratamentos pode-se
citar: diferentes receitas de um biscoito, diferentes marcas de um componente mecaˆnico,
diferentes n´ıveis de um adubo agr´ıcola etc.
Parcela (ou Unidade Experimental)
E´ a porc¸a˜o do material experimental a que se aplica um tratamento num experimento.
Por exemplo, em experimentos de alimentac¸a˜o de su´ınos, a parcela pode corresponder a
um leita˜o, ou ainda, um pequeno grupo de leito˜es. Em experimentos conduzidos em um
laborato´rio, a unidade experimental pode corresponder a uma Placa de Petri (vidraria
para cultivo de bacte´rias) ou a um conjunto de alguns tubos de ensaio. Na Engenharia
Civil, em um experimento avaliando diferentes “receitas” de fabricac¸a˜o de blocos de con-
creto, a parcela pode ser um bloco, ou um conjunto de blocos. Perceba assim que existe
flexibilidade na definic¸a˜o do que vem a ser a parcela, estando esta definic¸a˜o atrelada ao
campo de estudo em questa˜o, e ao que o pesquisador considera que representa aquilo ao
qual o tratamento possa vir a ser aplicado.
1
2 CAPI´TULO 1. NOC¸O˜ES PRELIMINARES
O conjunto das infinitas poss´ıveis parcelas a`s quais poderia ser aplicado um trata-
mento define o que em Estat´ıstica e´ comumente chamado de Populac¸a˜o. Em cursos
introduto´rios de Estat´ıstica em geral aprendemos como comparar as me´dias de duas po-
pulac¸o˜es. Pode-se dizer que no Planejamento de Experimento veremos como comparar
duas ou mais “populac¸o˜es” (tratamentos).
Variac¸o˜es de Acaso
Sa˜o variac¸o˜es que ocorrem nos experimentos, atribu´ıdas a efeitos de fatores na˜o con-
trolados, conhecidos ou na˜o, que afetam os resultados experimentais.
Como exemplos, temos:
• num ensaio biome´dico, diferenc¸as gene´ticas entre cobaias
• pequenas diferenc¸as na fertilidade de solo, em um experimento agr´ıcola
• pequenas variac¸o˜es nas condic¸o˜es ambientais
• em um ensaio cl´ınico, variac¸o˜es gene´ticas entre pessoas
• pequenas variac¸o˜es (na˜o controladas) nas quantidades dos ingredientes de uma re-
ceita de um biscoito ou de um bloco de concreto
• pequenos erros de pesagem ou na avaliac¸a˜o das parcelas experimentais
Delineamento Experimental
E´ a maneira, ou a estrate´gia escolhida, de se distribuir os tratamentos dentre as par-
celas, em um experimento. Como exemplo de delineamentos pode-se citar: delineamento
inteiramente ao acaso (que abreviaremos por DIC), delineamento em blocos casualizados
(DBC) e delineamento em quadrado latino (DQL).
1.3 Princ´ıpios Ba´sicos da Experimentac¸a˜o
A experimentac¸a˜o, ou o Planejamento de Experimentos, assenta-se nos seguintes
princ´ıpios:
1.3.1 Repetic¸a˜o
E´ o nu´mero de vezes que um tratamento ocorre no experimento.
Para entender sua importaˆncia, imagine que se deseja comparar duas variedades de
milho (A e B), quanto a` quantidade de gra˜os produzida. Cada variedade e´ plantada em
uma parcela de 20 plantas cada. Apenas o fato (digamos) de a variedade A ter apresentado
uma maior produc¸a˜o que a variedade B na˜o e´ suficiente para concluir que a variedade A e´
mais produtiva que a B, pois esse seu melhor desempenho podera´ ter ocorrido por simples
1.3. PRINCI´PIOS BA´SICOS DA EXPERIMENTAC¸A˜O 3
acaso, ou ter sido influenciado por fatores exteriores. Por outro lado, se as duas variedades
tivessem sido plantadas em va´rias parcelas e, ainda assim, verificarmos que a variedade A
apresentou um melhor rendimento, enta˜o agora passa a existir um indicativo de que ela
de fato seja mais produtiva.
Visualmente, temos:
• Sem repetic¸a˜o:
A
Parcela 1
B
Parcela 2
.
• Com repetic¸a˜o:
A
Parcela 1
A
Parcela 2
B
Parcela 3
B
Parcela 4
.
As principais func¸o˜es da repetic¸a˜o sa˜o duas:
1. Permitir a estimac¸a˜o do erro experimental
O erro experimental e´ uma medida da variac¸a˜o que existe entre observac¸o˜es de
parcelas com mesmo tratamento. Esta variac¸a˜o, que e´ conhecida como variac¸a˜o
casual ou variac¸a˜o de acaso, e´ oriunda de duas fontes principais: a variabilidade
inerente do material e aquela resultante da falta de uniformidade na conduc¸a˜o f´ısica
do experimento (incluindo os pequenos erros de medic¸a˜o que porventura ocorram).
O erro experimental e´ indispensa´vel na determinac¸a˜o de erros padro˜es de estimado-
res, no dimensionamento da amostra, e na construc¸a˜o de testes de hipo´teses.
Atrave´s da repetic¸a˜o e´ que nos e´ poss´ıvel estimar o erro experimental. Num expe-
rimento sem repetic¸a˜o, na˜o sabemos dizer se uma diferenc¸a constatada entre trata-
mentos pode ser explicada como uma diferenc¸a entre tratamentos ou entre parcelas
experimentais.
Obs.: em alguns casos e´ poss´ıvel estimar o erro experimental mesmo na˜o havendo
repetic¸o˜es (por exemplo, usando alguma te´cnica geoestat´ıstica), mas isso na˜o sera´
abordado aqui.
2. Controlar a precisa˜o do experimento
Quanto maior o nu´mero de repetic¸o˜es, menores sera˜o os erros padro˜es dos estima-
dores de interesse.
4 CAPI´TULO 1. NOC¸O˜ES PRELIMINARES
1.3.2 Casualizac¸a˜o
No exemplo anterior, apesar de se ter usado repetic¸a˜o, pode ser que a variedade A
produza mais por ter sido beneficiada por algum fator; por exemplo, pode ser que a
fertilidade do solo decresc¸a da esquerda para a direita.
Para evitar que uma das variedades seja sistematicamente favorecida por qualquer fa-
tor externo, procedemos a casualizac¸a˜o das variedades a`s parcelas. Pela casualizac¸a˜o cada
tratamento tem a mesma probabilidade de ser destinado a qualquer parcela experimental,
seja ela favora´vel ou na˜o.
A casualizac¸a˜o tem por objetivo nos assegurar uma estimac¸a˜o na˜o tendenciosa do erro
experimental, das me´dias dos tratamentos, e das diferenc¸as entre me´dias.
Visualmente, em um exemplo com 10 parcelas, temos:
• Com repetic¸a˜o, sem casualizac¸a˜o:
A
Parcela 1
A
Parcela 2
A
Parcela 3
A
Parcela 4
A
Parcela 5
.
B
Parcela 6
B
Parcela 7
B
Parcela 8
B
Parcela 9
B
Parcela 10
.
• Com repetic¸a˜o, com casualizac¸a˜o
A
Parcela 1
B
Parcela 2
A
Parcela 3
B
Parcela 4
B
Parcela 5
.
B
Parcela 6
A
Parcela 7
A
Parcela 8
B
Parcela 9
A
Parcela 10
.
Se, apo´s a repetic¸a˜o e casualizac¸a˜o a variedade A apresentar maior produc¸a˜o de gra˜os,
e´ de se esperar que esta conclusa˜o seja realmente va´lida.
1.3. PRINCI´PIOS BA´SICOS DA EXPERIMENTAC¸A˜O 5
1.3.3 Controle Local
Este e´ um princ´ıpio muito utilizado, mas na˜o obrigato´rio. Mas o planejador de expe-
rimentos deve estar sempre atento a` sua possibilidade de utilizac¸a˜o, pois pode melhorar
a precisa˜o de seu experimento.
O controle local consiste em distribuir os tratamentos, formando grupos de parcelas
de condic¸o˜es ambientais semelhantes. Isto procura garantir que os tratamentos sejam
submetidos a`s diferentes condic¸o˜es ambientais, sem benef´ıcio de nenhum. Estes grupos
de parcelas, ou a´reas, sa˜o chamados BLOCOS.
Um bloco pode corresponder a pequenas a´reas, nas quais variedades de milho sa˜o
dispostas. Outro exemplo poderia ser em um estudo comparando duas receitas de biscoito.
Cada parcela seria uma forma. Imaginando que no forno caibam duas formas, cada bloco
corresponderia a uma fornada, com duas parcelas. A ideia central que o planejador deve
guardar e´: um bloco e´ um grupo de parcelas com tratamentos diferentes.
Obs.: podem haver planejamentos em que tratamentos se repetem dentro de cada
bloco; em outros, pode-se planejar o experimento de maneira que cada bloco na˜o contem
todos os tratamentos (blocos incompletos), mas estas situac¸o˜es na˜o sera˜o estudadas aqui.
Visualmente, novamente considerando um experimento com 10 parcelase dois trata-
mentos, ter´ıamos:
• Com repetic¸a˜o, com casualizac¸a˜o, e com controle local:
A B B A B A
Bloco 1 Bloco 2 Bloco 3
.
B A A B
Bloco 4 Bloco 5
.
Obs.: Os Blocos sa˜o o controle local mais comum, sendo um controle unidimensional;
no Delineamento em Quadrado Latino, que veremos mais adiante, o controle local e´ feito
em duas dimenso˜es, e assim, ao inve´s de “blocos”, sera´ feita menc¸a˜o a Linhas e Colunas.
Fundamentalmente, o controle local corresponde a restric¸o˜es impostas a` casualizac¸a˜o,
e e´ feito quando ha´ conhecimento sobre a natureza de (algumas) variac¸o˜es de acaso na
condic¸a˜o experimental, as quais podemos controlar (por exemplo, e´ razoa´vel admitir que
haja variac¸o˜es ambientais de fornada para fornada).
Considerando o controle local temos os seguintes principais delineamentos experimen-
tais:
• Delineamento Inteiramente Casualizado (que abreviaremos DIC): sem controle local.
6 CAPI´TULO 1. NOC¸O˜ES PRELIMINARES
• Delineamento em Blocos Casualizados (DBC): controle local em uma u´nica “di-
mensa˜o”.
• Delineamento em Quadrado Latino (DQL): controle local em duas dimenso˜es, por
exemplo utilizando blocos espaciais horizontais e verticais, chamados linhas e colu-
nas.
A finalidade do controle local e´ dividir um ambiente heterogeˆneo em sub-ambientes
de maior homogeneidade de condic¸o˜es. Este procedimento torna o experimento mais
eficiente, pois em geral reduz o erro experimental.
Finalizando, o planejador de experimentos deve sempre se lembrar dos treˆs princ´ıpios
ba´sicos da experimentac¸a˜o:
• Repetic¸a˜o
• Casualizac¸a˜o
• Controle Local
1.4 Variac¸a˜o Entre, Dentro e Total
A ferramenta fundamental de ana´lise de experimentos que estaremos vendo neste Curso
e´ a chamada Ana´lise de Variaˆncia (em geral abreviada pela sigla inglesa ANOVA, ou
aportuguesada ANAVA).
Para entendermos os rudimentos desta te´cnica, vamos considerar que um certo nu´mero
t de tratamentos sera˜o comparados em um experimento. Cada tratamento e´ avaliado um
certo nu´mero r de repetic¸o˜es (parcelas). Na˜o vamos considerar que haja controle local,
neste momento. Ou seja, no fundo estamos considerando o delineamento mais simples,
que e´ o DIC, o qual sera´ melhor formalizado no cap´ıtulo seguinte.
Vamos imaginar que em cada parcela observamos uma certa varia´vel de resposta,
cont´ınua (mais adiante, iremos pressupor distribuic¸a˜o normal), como produc¸a˜o de gra˜os,
em quilogramas, no exemplo das variedades de milho. Se esta varia´vel e´ representada por
Y , enta˜o em cada parcela precisamos de dois ı´ndices: um para indicar o tratamento e
outro para identificar a repetic¸a˜o. Assim, vamos identificar y
ij
como o valor observado na
parcela que recebeu o tratamento i na repetic¸a˜o j.
No Planejamento de Experimentos, usaremos o termo Variac¸a˜o para designar somas
de quadrados (numeradores de variaˆncia). Ou seja, uma variaˆncia nada mais e´ do que
uma “variac¸a˜o” dividida por um certo nu´mero de graus de liberdade.
Em um DIC, a variac¸a˜o total entre parcelas pode ser decomposta em duas fontes
de variac¸a˜o: Entre tratamentos (que e´ consequeˆncia da variabilidade entre as me´dias
de tratamento), e Dentro de tratamentos, que tem a ver com a variac¸a˜o devida ao erro
experimental. A variac¸a˜o Total, por sua vez, corresponde a` soma dessas duas.
Antes de apresentar suas fo´rmulas, vamos padronizar nossa notac¸a˜o:
• Como dito acima, y
ij
representa o valor da varia´vel resposta observado na parcela
que recebeu o tratamento i, em sua repetic¸a˜o j
1.4. VARIAC¸A˜O ENTRE, DENTRO E TOTAL 7
• A notac¸a˜o y¯
i� corresponde me´dia do tratamento i, ou seja:
y¯
i� =
1
r
r∑
j=1
y
ij
• A notac¸a˜o y¯�� corresponde me´dia geral do experimento, ou seja:
y¯�� =
1
tr
t∑
i=1
r∑
j=1
y
ij
Muito bem, com esta notac¸a˜o podemos apresentar as fo´rmulas das variac¸o˜es Entre,
Dentro e Total. A variac¸a˜o total e´ a variac¸a˜o entre parcelas, em relac¸a˜o a` me´dia geral
do experimento. E´ a variac¸a˜o devida a todas as fontes que causam variabilidade entre as
observac¸o˜es. Engloba a variabilidade entre tratamentos e a variabilidade devida a fatores
na˜o controlados. E´ dada por:
SQTotal =
t∑
i=1
r∑
j=1
(
y
ij
− y¯��
)2
A variac¸a˜o dentro de tratamentos e´ aquela devida a` variac¸a˜o das parcelas em relac¸a˜o
a` me´dia do tratamento a qual pertencem. E´ a variac¸a˜o devida a todas as outras fontes
na˜o controladas de variac¸a˜o. Por isso corresponde a` variac¸a˜o do erro experimental. Aqui
sera´ representada por SQErro (Soma dos Quadrados dos Erros, ou Soma dos Quadrados
dos Res´ıduos:
SQDentro = SQErro =
t∑
i=1
r∑
j=1
(
y
ij
− y¯
i�
)2
Finalmente, variac¸a˜o entre tratamentos, ou soma de quadrados de tratamentos (abre-
viada SQTrat) e´ dada por:
SQEntre = SQTrat = r
t∑
i=1
(y¯
i� − y¯��)2
Pode-se demonstrar algebricamente que:
t∑
i=1
r∑
j=1
(
y
ij
− y¯��
)2
= r
t∑
i=1
(y¯
i� − y¯��)2 +
t∑
i=1
r∑
j=1
(
y
ij
− y¯
i�
)2
ou seja:
SQTotal = SQEntre + SQDentro
No pro´ximo cap´ıtulo veremos fo´rmulas ligeiramente diferentes para as somas de qua-
drados, mais pra´ticas, cujo formato geral estaremos usando ao longo do Curso.
8 CAPI´TULO 1. NOC¸O˜ES PRELIMINARES
1.4.1 Exemplo Nume´rico
Um experimento foi conduzido utilizando um delineamento inteiramente casualizado
(DIC), para avaliar treˆs espe´cies de eucalipto quanto a` sua altura, em metros, aos 7 anos
de idade. Estes dados esta˜o apresentados a seguir:
Espe´cie
Repetic¸a˜o A B C
1 16 12 20
2 20 11 18
3 22 12 14
4 17 13 16
5 18 10 19
1. Calcule a altura me´dia de cada uma das treˆs espe´cies de eucalipto, e em seguida a
me´dia geral.
2. Calcule a variac¸a˜o “Entre” espe´cies de eucalipto.
3. Calcule a variac¸a˜o “Dentro” de espe´cies de eucalipto.
4. Calcule a variac¸a˜o “Total”. Em seguida, verifique que corresponde a` soma das
outras duas.
Cap´ıtulo 2
Delineamento Inteiramente
Casualizado (DIC)
2.1 Introduc¸a˜o
O delineamento inteiramente casualizado (na literatura inglesa: compeletely random
design, ou one-way classification) e´ o mais simples dos delineamentos, sendo recomen-
dado quando as condic¸o˜es experimentais sa˜o homogeˆneas, na˜o se identificando fatores de
agrupamento que serviriam como blocos. Sa˜o relativamente comuns em experimentos de
laborato´rio, quando ha´ considera´vel controle das condic¸o˜es ambientais.
2.2 Modelo Estat´ıstico
Os dados observados nos delineamentos estudados neste curso sera˜o expressos por
modelos estat´ısticos lineares (relac¸a˜o linear entre os paraˆmetros do modelo). No DIC o
modelo e´:
yij = µ+ τi + e(i)j, i = 1, 2, . . . t
j = 1, 2, . . . r
(2.1)
onde:
yij: valor da parcela que recebeu o tratamento i na repetic¸a˜o j ;
µ: constante comum a todas as observac¸o˜es (intercepto);
τi: efeito do tratamento i;
e(i)j: res´ıduo, ou erro, associado a` parcela que recebeu o tratamento i na repetic¸a˜o j.
Estes paraˆmetros sa˜o todos desconhecidos, e precisara˜o ser estimados. Conforme esta-
remos discutindo em sec¸a˜o adiante, o me´todo de estimac¸a˜o empregado sera´ o de quadrados
mı´nimos. Alguns comenta´rios sobre este modelo estat´ıstico:
• A constante µ e´ o intercepto do modelo. Conforme ficara´ claro ao longo do curso,
aqui ocorre uma diferenc¸a em relac¸a˜o ao intercepto que estamos acostumados nos
modelos de regressa˜o. Quando o modelo tem apenas varia´veis catego´ricas (a` excec¸a˜o
9
10 CAPI´TULO 2. DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)
dos res´ıduos), como no modelo 2.1, na˜o existira´ um valor u´nico como estimativa
de quadrados mı´nimos de µ. Para o momento, contudo, estaremos impondo uma
restric¸a˜o ao modelo de maneira que os efeitos τi somem zero, e assim a estimativa
de µ correspondera´ a` me´dia geraldo experimento y¯�� . Por isso e´ que empregamos a
notac¸a˜o µ, comumente usada para uma me´dia populacional.
• A raza˜o de usarmos um pareˆnteses em e(i)j e´ devida ao fato de a repetic¸a˜o j estar
hierarquizada ao tratamento i. Ou seja, a repetic¸a˜o “1” do tratamento 1 na˜o tem
relac¸a˜o nenhuma com a repetic¸a˜o “1” do tratamento 2. No delineamento em blocos
casualizados, que veremos posteriormente, isto na˜o acontece, pois a repetic¸a˜o “1”
correspondera´ ao bloco 1 (que contem ambos os tratamentos), e o pareˆnteses na˜o
sera´ necessa´rio, pois j = 1 indicara´ bloco (ou, equivalentemente, repetic¸a˜o) 1 para
ambos (para todos) os tratamentos.
Quando um fator esta´ hierarquizado dentro de outro, e´ comum usar justamente esta
palavra, dentro, para indicar esta hierarquia. Assim, o termo e(i)j poderia ter sido
definido assim:
e(i)j: efeito da repetic¸a˜o j dentro do tratamento i
• Neste material, estara˜o sendo usadas letras gregas para paraˆmetros de efeito fixo, e
letras latinas para paraˆmetros de efeito aleato´rio.
2.2.1 Efeitos Fixos e Aleato´rios
Um paraˆmetro e´ dito de efeito fixo quando na˜o prove´m de uma populac¸a˜o de refereˆncia.
Neste caso, a infereˆncia estat´ıstica a ser feita ira´ se referir apenas aos n´ıveis que foram
levados em conta no experimento. Por exemplo, se queremos estudar e comparar cinco
marcas espec´ıficas de correias de transmissa˜o, a infereˆncia se referira´ apenas a estas cinco
marcas.
Por outro lado, um paraˆmetro, ou efeito, e´ dito de natureza aleato´ria quando os n´ıveis
estudados no experimento provieram aleatoriamente de uma populac¸a˜o de refereˆncia. Por
exemplo, suponha que existam no mercado va´rias marcas de correia de transmissa˜o, e que
queiramos estudar a variabilidade entre marcas. Imaginando que na˜o tenhamos condic¸a˜o
de avaliar todas as marcas do mercado, poder´ıamos sortear ou tomar aleatoriamente (di-
gamos) cinco destas marcas. A infereˆncia a ser feita, neste caso, ira´ se referir a` populac¸a˜o
de marcas, da qual esta amostra de cinco marcas e´ um subconjunto aleato´rio da populac¸a˜o
de refereˆncia.
A constante µ e´ sempre de natureza fixa, enquanto que os res´ıduos sa˜o sempre de
natureza aleato´ria. No modelo 2.1 considerou-se que os tratamentos τi sa˜o fixos (situac¸a˜o
talvez mais comum em va´rias a´reas do conhecimento), mas poderiam muito bem ser de
natureza aleato´ria (situac¸a˜o comum, por exemplo, em estudos de Gene´tica). Neste caso
usar´ıamos uma letra latina, como ti, ao inve´s de τi.
2.2.2 Tipos de Modelo
Conforme o tipo dos efeitos, os modelos podem ser classificados em treˆs categorias:
2.2. MODELO ESTATI´STICO 11
1. Modelo Fixo
Nos chamados modelos fixos, todos os efeitos sa˜o de natureza fixa, a` excec¸a˜o dos
res´ıduos. O me´todo de estimac¸a˜o tradicionalmente empregado e´ o dos quadrados
mı´nimos. Neste curso, a eˆnfase maior sera´ dada a modelos dessa categoria.
2. Modelo Aleato´rio
Nesta categoria de modelo, todos os efeitos sa˜o de natureza aleato´ria, a` excec¸a˜o da
constante µ.
3. Modelo Misto
Um modelo e´ dito misto quando apresenta (ale´m da constante e dos res´ıduos) efeitos
tanto fixos como aleato´rios. Tanto nos modelos aleato´rios como nos modelos mistos,
o me´todo de estimac¸a˜o mais empregado e´ o da ma´xima verossimilhanc¸a restrita.
2.2.3 Pressuposic¸o˜es do Modelo
Vamos considerar inicialmente o modelo fixo para um DIC. Este modelo apresenta
algumas pressuposic¸o˜es:
1. Aditividade
Como estamos utilizando um modelo linear, estamos pressupondo uma relac¸a˜o linear
entre os paraˆmetros, e na˜o, por exemplo, uma relac¸a˜o multiplicativa entre eles.
As outras pressuposic¸o˜es, listadas a seguir, poderiam se resumir nas seguintes afirma-
c¸o˜es, em notac¸a˜o matema´tica:
e(i)j ∼ N
(
0, σ2
)
Cov
(
e(i)j, e(i)j′
)
= Cov
(
e(i)j, e(i′)j
)
= 0, ∀ j 6= j′, ∀ i 6= i′ (2.2)
em que Cov denota covariaˆncia.
2. Normalidade
Conforme visto na primeira relac¸a˜o em 2.2, admite-se que os res´ıduos e(i)j tenham
distribuic¸a˜o normal. Esta pressuposic¸a˜o e´ importante por alguns aspectos. Dentre
eles, isto fara´ com que o me´todo dos quadrados mı´nimos coincida com o me´todo da
ma´xima verossimilhanc¸a. Ale´m disso, esta pressuposic¸a˜o fornece a base para o uso
do teste F da ANOVA, a ser vista adiante.
Uma consequeˆncia desta pressuposic¸a˜o e´ a de que os dados yij tambe´m tenham
distribuic¸a˜o normal. Pore´m, atenc¸a˜o. Enquanto que todos os res´ıduos proveˆm de
uma mesma distribuic¸a˜o normal (com mesma me´dia 0, e mesma variaˆncia σ2, os
dados tera˜o a seguinte distribuic¸a˜o normal:
yij ∼ N
(
µ+ τi, σ
2
)
ou seja, os dados pertencentes a um tratamento i tera˜o me´dia diferente da de um
outro tratamento i′. Um erro muito comum consiste em fazer um teste para verificar
se ha´ normalidade, utilizando os dados brutos. Isto e´ errado, devido a estas me´dias
12 CAPI´TULO 2. DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)
diferentes. O correto e´ fazer um teste de normalidade utilizando os res´ıduos (a ser
visto em cap´ıtulo futuro).
A violac¸a˜o da pressuposic¸a˜o de normalidade implica na necessidade de me´todos
de estimac¸a˜o mais apropriados, como ma´xima verossimilhanc¸a baseada em outras
distribuic¸o˜es (conforme estudado na teoria de modelos lineares generalizados).
As variaˆncias, por outro lado, sa˜o tidas como iguais, o que leva a` pro´xima pressu-
posic¸a˜o:
3. Homogeneidade de Variaˆncias (Homocedasticidade)
Em geral admite-se que as variaˆncias sa˜o homogeˆneas, ou seja, que a variabilidade
dentro de cada tratamento e´ de mesma ordem de magnitude. A violac¸a˜o desta
pressuposic¸a˜o implica na necessidade de me´todos de estimac¸a˜o mais apropriados,
como quadrados mı´nimos ponderados.
4. Independeˆncia
Quando se admite que os res´ıduos teˆm distribuic¸a˜o normal, com covariaˆncias nulas
(segunda relac¸a˜o em 2.2), isto implica em independeˆncia entre observac¸o˜es. Isto
porque, sob normalidade, covariaˆncia nula implica em independeˆncia. Assim, duas
observac¸o˜es provenientes de duas parcelas diferentes correspondem a realizac¸o˜es de
duas varia´veis aleato´rias independentes.
A violac¸a˜o desta pressuposic¸a˜o implica na necessidade de me´todos de estimac¸a˜o mais
apropriados, como quadrados mı´nimos generalizados (na˜o confundir com modelos
lineares generalizados).
2.3 DIC Desbalanceado
Se por acaso o nu´mero de repetic¸o˜es varia de tratamento para tratamento, isto na˜o
acarreta grandes complicac¸o˜es para a ana´lise, em um delineamento inteiramente casuali-
zado. No entanto, as me´dias de cada tratamento sera˜o estimadas com preciso˜es diferentes,
o que em geral na˜o e´ deseja´vel.
Em outros delineamentos, o desbalanceamento provoca algumas dificuldades de ana´lise,
a serem discutidas posteriormente.
Se um DIC e´ desbalanceado, enta˜o podemos escrever o modelo estat´ıstico como:
yij = µ+ τi + e(i)j, i = 1, 2, . . . t
j = 1, 2, . . . ri
(2.3)
aqui, a u´nica diferenc¸a em relac¸a˜o a 2.1 e´ a da notac¸a˜o ri, indicando que o nu´mero de
repetic¸o˜es do tratamento i e´ ri, sugerindo que este nu´mero de repetic¸o˜es possa variar de
tratamento para tratamento.
2.4 Casualizac¸a˜o em um DIC
Na˜o existe uma maneira u´nica de se fazer a casualizac¸a˜o dos tratamentos dentre as
parcelas de um DIC. Em geral utilizam-se nu´meros aleato´rios. Um procedimento e´ suge-
2.4. CASUALIZAC¸A˜O EM UM DIC 13
rido a seguir, utilizando nu´meros aleato´rios de uma calculadora, em um DIC balanceado
com 4 tratamentos (A, B, C e D) e 4 repetic¸o˜es cada (16 parcelas).
1. Identifique cada parcela com um nu´mero de 1 a 16;
2. Gere 16 nu´meros aleato´rios;
3. Atribua os nu´meros de 1 a 16 aos nu´meros aleato´rios, seguindo a ordem crescente
ou decrescente destes.
Suponha que os nu´meros aleato´rios (entre 0 e 1, como e´ comum nas calculadoras),
sejam os seguintes:
0,520 (9)0,805 (14) 0,152 (3) 0,685 (12)
0,591 (11) 0,181 (4) 0,124 (2) 0,350 (6)
0,916 (16) 0,893 (15) 0,499 (8) 0,386 (7)
0,104 (1) 0,550 (10) 0,696 (13) 0,198 (5)
sendo que os nu´meros entre pareˆnteses se referem a` ordem ocupada por cada nu´mero
aleato´rio.
Os primeiros 4 nu´meros sa˜o os nu´meros das parcelas que recebera˜o o tratamento A, os
4 seguintes o tratamento B, e assim por diante. As parcelas identificadas com os nu´meros
9, 14, 3 e 12 recebera˜o o tratamento A.
O esquema de campo seria algo como o da figura abaixo.
D
Parcela 1
B
Parcela 2
A
Parcela 3
B
Parcela 4
.
D
Parcela 5
B
Parcela 6
C
Parcela 7
C
Parcela 8
.
A
Parcela 9
D
Parcela 10
B
Parcela 11
A
Parcela 12
.
D
Parcela 13
A
Parcela 14
C
Parcela 15
C
Parcela 16
.
14 CAPI´TULO 2. DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)
2.5 Estimac¸a˜o dos Paraˆmetros
A estimac¸a˜o dos paraˆmetros do modelo em geral e´ feita pelo me´todo dos quadrados
mı´nimos, o qual coincide com o me´todo da ma´xima verossimilhanc¸a, sob normalidade.
Pelo me´todo dos quadrados mı´nimos, propomo-nos a encontrar valores µˆ e τˆi que
minimizam a soma dos quadrados dos res´ıduos. A soma de quadrados dos res´ıduos ou
erros (SQDentro, ou SQE), para um modelo de um DIC balanceado, com t tratamentos
e r repetic¸o˜es, e´:
SQE =
t∑
i=1
r∑
j=1
e2(i)j =
t∑
i=1
r∑
j=1
(yij − µ− τi)2
Diferenciando SQE em relac¸a˜o a µ, τ1, τ2, . . . , τt, e igualando cada derivada a zero,
temos: 
∂SQE
∂µ
= −2
t∑
i=1
r∑
j=1
(yij − µˆ− τˆi) = 0
∂SQE
∂τ1
= −2
r∑
j=1
(y1j − µˆ− τˆ1) = 0
∂SQE
∂τ2
= −2
r∑
j=1
(y2j − µˆ− τˆ2) = 0
...
∂SQE
∂τt
= −2
r∑
j=1
(ytj − µˆ− τˆt) = 0
ou seja:

t∑
i=1
r∑
j=1
yij − rtµˆ− r
t∑
i=1
τˆi = 0 ⇒ rtµˆ+ r
t∑
i=1
τˆi =
t∑
i=1
r∑
j=1
yij = y��
r∑
j=1
y1j − rµˆ− rτˆ1 = 0 ⇒ rµˆ+ rτˆ1 =
r∑
j=1
y1j = y1�
r∑
j=1
y2j − rµˆ− rτˆ2 = 0 ⇒ rµˆ+ rτˆ2 =
r∑
j=1
y2j = y2�
...
r∑
j=1
ytj − rµˆ− rτˆt = 0 ⇒ rµˆ+ rτˆt =
r∑
j=1
ytj = yt�
O sistema: 
rtµˆ+ r
t∑
i=1
τˆi = y��
rµˆ+ rτˆ1 = y1�
rµˆ+ rτˆ2 = y2�
...
rµˆ+ rτˆt = yt�
(2.4)
e´ chamado de sistema de equac¸o˜es normais.
2.6. PARTIC¸A˜O DA VARIAC¸A˜O 15
Observe que a primeira equac¸a˜o de 2.4 e´ a soma das demais. Logo, existe uma in-
determinac¸a˜o que pode ser eliminada usando-se a restric¸a˜o
∑t
i=1 τˆi = 0. Desta forma,
obte´m-se os estimadores. O estimador de µ sera´ dado por:
rtµˆ+ r × 0 = y�� ⇒ µˆ =
y��
rt
= y¯��
que corresponde a` me´dia geral do experimento. O estimador de cada τˆi e´ obtido via:
rµˆ+ rτˆi = yi� ⇒ rτˆi = yi� − rµˆ
ou seja:
τˆi =
y
i�
r
− µˆ = y¯
i� − y¯��
o que corresponde ao desvio da me´dia do tratamento i em relac¸a˜o a` me´dia geral.
OBS.: rigorosamente, na˜o poder´ıamos falar de estimadores de µ e de τi, uma vez que
a restric¸a˜o
∑t
i=1 τˆi = 0 e´, de certa forma, arbitra´ria (diferentes restric¸o˜es levariam a
diferentes “estimadores”). Ou seja, rigorosamente falando, µ e τi na˜o sa˜o estima´veis, mas
vamos ignorar este aspecto por enquanto, e voltaremos e comenta´-lo mais adiante. O que
importa para o momento e´ que a restric¸a˜o utilizada leva a “estimadores” de interpretac¸a˜o
fa´cil e intuitiva.
2.6 Partic¸a˜o da Variac¸a˜o
Conforme especificado no Cap´ıtulo 1, o termo variac¸a˜o aqui se refere a somas de
quadrados, ou seja, numeradores de variaˆncia. Tambe´m vimos no Cap´ıtulo 1 que, em
um DIC a variac¸a˜o total entre parcelas pode ser decomposta em um componente entre
tratamentos e outro componente dentro de tratamentos:
t∑
i=1
r∑
j=1
(
y
ij
− y¯��
)2
= r
t∑
i=1
(y¯
i� − y¯��)2 +
t∑
i=1
r∑
j=1
(
y
ij
− y¯
i�
)2
ou seja:
SQTotal = SQEntre + SQDentro
A partic¸a˜o da variac¸a˜o em componentes e´ a base da Ana´lise de Variaˆncia (ANOVA),
que sera´ apresentada no pro´ximo item, para o DIC.
Existe uma maneira alternativa de expressar a SQTotal. E´ fa´cil verificar que:
SQTotal =
t∑
i=1
r∑
j=1
(
y
ij
− y¯��
)2
=
t∑
i=1
r∑
j=1
y2
ij
− y
2
��
rt
bastando desenvolver o quadrado da diferenc¸a e aplicar os somato´rios. O ca´´lculo da
SQTotal, se feito manualmente, e´ mais pra´tico pela expressa˜o acima. O segundo termo
desta expressa˜o, que representaremos por “C”:
C =
y2��
rt
16 CAPI´TULO 2. DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)
aparecera´ frequentemente em outras expresso˜es de somas de quadrados. E´ comumente
designada como correc¸a˜o, e, ao ser subtra´ıda, corresponde a` remoc¸a˜o do efeito da constante
(intercepto) da variac¸a˜o total.
A variac¸a˜o entre tratamentos, por sua vez, pode ser expressa alternativamente como:
SQEntre = r
t∑
i=1
(y¯
i� − y¯��)2 =
t∑
i=1
y2
i�
r
− y
2
��
rt
ou seja:
SQEntre =
t∑
i=1
y2
i�
r
− C
Calculadas as variac¸o˜es Total e Entre, a variac¸a˜o Dentro pode ser calculada por dife-
renc¸a:
SQDentro = SQTotal− SQEntre
Estas expresso˜es sa˜o gerais para o ca´lculo de variac¸a˜o total, entre e dentro de grupos,
independente do que sejam estes grupos. No contexto espec´ıfico do DIC, vamos chamar
a SQEntre de SQTrat (pois os “grupos” sa˜o tratamentos), e a SQDentro sera´ chamada
SQErro. A SQTotal continuara´ sendo chamada como tal. Assim, resumindo:
• SQEntre ≡ SQTrat
• SQDentro ≡ SQErro
2.7 Ana´lise de Variaˆncia
A decomposic¸a˜o da variac¸a˜o permite realizar a chamada Ana´lise de Variaˆncia (sendo
comum o uso da abreviac¸a˜o inglesa ANOVA). Trata-se de uma te´cnica desenvolvida por
um dos estat´ısticos mais influentes do se´culo XX, Ronald A. Fisher, que permite testar
hipo´teses referentes a` igualdade entre me´dias de tratamentos, bem como sobre a existeˆncia
de interac¸a˜o entre fatores (a ser visto em cap´ıtulo futuro). Ale´m disso, quando se tem
um modelo misto ou aleato´rio, sendo os dados balanceados, a ANOVA permite obter,
rapidamente, estimativas dos chamados componentes de variaˆncia (ou seja, as variaˆncias
associadas a`s populac¸o˜es de refereˆncia de cada fator de natureza aleato´ria).
Cada soma de quadrados (SQ) tem um respectivo nu´mero de graus de liberdade.
Dividindo uma SQ pelo nu´mero de graus de liberdade, obte´m-se uma variaˆncia. No
contexto da ANOVA esta variaˆncia e´ chamada quadrado me´dio (pois, no fundo, toda
variaˆncia pode ser interpretada como uma “me´dia” de quadrados), que abreviaremos de
QM.
Assim, da mesma forma que temos SQTotal, SQTrat e SQErro, pode-se ter igualmente:
QMTotal, QMTrat e QMErro. O nu´mero de graus de liberdade associados a` SQTotal e´
simplesmente o nu´mero de dados menos um, ou seja, tr − 1, em um DIC. No caso da
SQTrat, como esta se refere a` variac¸a˜o entre t me´dias, o nu´mero de graus de liberdade
associado a SQTrat sera´ t − 1. Finalmente, o nu´mero de graus de liberdade associado a`
SQErro pode ser obtido por diferenc¸a:
(tr − 1)− (t− 1) = tr − t = t(r − 1)
2.7. ANA´LISE DE VARIAˆNCIA 17
Com tais graus de liberdade, podemos calcular quadrados me´dios. Assim:
QMTrat =
SQTrat
t− 1 QMErro =
SQErro
t(r − 1)
Em geral na˜o ha´ muito interesse pra´tico em se calcular QMTotal.
Muito bem, iremos entender agora a importaˆncia de se calcular estas grandezas e
compor uma ANOVA. Em um DIC, em geral existe grande interesse em realizar o seguinte
teste de hipo´teses (modelo fixo):{
H0 : τ1 = τ2 = . . . = τt
H1 : τi 6= τj, ao menos para um par (i, j)
Se os dados obedecem a` pressuposic¸a˜o de normalidade, conforme discutido anterior-
mente, e se a hipo´tese H0 e´ verdadeira, enta˜o a estat´ıstica:
F =
QMTrat
QMErro
(2.5)
tera´ distribuic¸a˜o F com (t− 1) e t(r − 1) graus de liberdade.
Isto fornece um crite´rio para julgamentoda hipo´tese nula. Este teste e´ sempre unila-
teral porque se τi 6= τj, para ao menos algum par (i, j), espera-se que QMTrat seja maior
que QMErro. Assim, para um certo n´ıvel de significaˆncia α, podemos formalizar o crite´rio
de decisa˜o como sendo:
• rejeitar H0 se F > Fα(ν1, ν2),
onde ν1 e´ o nu´mero de graus de liberdade de tratamento, e ν2 e´ o nu´mero de graus
de liberdade do erro experimental.
Todos estes ca´lculos, de SQ’s, QM’s, graus de liberdade (abreviados como GL), e o
teste F compo˜em a ANOVA, a qual pode ser organizada em uma Tabela:
Tabela 2.1: Ana´lise de variaˆncia de um experimento inteiramente casualizado (balance-
ado) com t tratamentos e r repetic¸o˜es.
Causas de Variac¸a˜o GL SQ QM F
Tratamentos t− 1 SQT QMT=SQT
t−1
QMTrat
QMErro
Erro t(r − 1) SQE QME= SQE
t(r−1)
Total tr − 1 SQTo —
Se o modelo for do tipo aleato´rio, ou seja, se os tratamentos proveˆm de uma populac¸a˜o
de refereˆncia, com distribuic¸a˜o normal de me´dia zero e variaˆncia σ2t , ou seja:
yij = µ+ ti + e(i)j, i = 1, 2, . . . t
j = 1, 2, . . . r
e(i)j ∼ N
(
0, σ2
)
ti ∼ N
(
0, σ2t
)
18 CAPI´TULO 2. DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)
enta˜o o teste F continuara´ va´lido, sendo que neste caso, as hipo´teses do teste sera˜o:{
H0 : σ
2
t = 0
H1 : σ
2
t > 0
As Tabelas A.2, A.3, A.4 e A.5 do Apeˆndice apresentam os quantis da distribuic¸a˜o
F com uma a´rea acima igual a 5% e 1%, com diferentes de graus de liberdade para o
numerador e o denominador.
2.8 Exemplo Nume´rico
Uma caracter´ıstica importante de gra˜os de feija˜o e´ a capacidade de absorc¸a˜o de a´gua.
Quanto mais ra´pida a absorc¸a˜o, melhores as propriedades culina´rias. Para avaliar a
rapidez da absorc¸a˜o de a´gua por gra˜os de feija˜o, utiliza-se o procedimento a seguir.
Coloca-se gra˜os de feija˜o, com peso conhecido (peso inicial), em um frasco. Adiciona-
se a´gua. Apo´s certo per´ıodo de tempo, torna-se a pesar os gra˜os de feija˜o (peso final). A
diferenc¸a entre o peso final e o peso inicial, corresponde a` quantidade de a´gua absorvida.
Um experimento1 foi feito na Universidade Federal de Lavras para comparar 10 vari-
edades de feija˜o quanto a` absorc¸a˜o de a´gua. O delineamento utilizado foi o inteiramente
casualizado (DIC). Cada parcela correspondeu a um frasco com gra˜os de feija˜o. A varia´vel
resposta Y correspondeu a` porcentagem de a´gua absorvida, dada por:
Y =
Peso Final− Peso Inicial
Peso Inicial
× 100
Os resultados esta˜o apresentados na Tabela 2.2.
Tabela 2.2: Porcentagem de absorc¸a˜o de a´gua em 10 variedades de feija˜o.
Variedade de Feija˜o
Rep. A B C D E F G H I J
1 92,3 86,8 72,4 26,4 108,9 92,2 101,3 50,3 89,0 101,7
2 96,7 88,8 70,1 24,0 107,5 90,7 98,7 47,4 90,4 100,4
3 97,4 87,8 68,6 28,4 108,3 87,4 104,0 51,9 89,9 99,5
y
i� 286,4 263,4 211,1 78,8 324,7 270,3 304,0 149,6 269,3 301,6
y¯
i� 95,5 87,8 70,4 26,3 108,2 90,1 101,3 49,9 89,8 100,5
Assim, e´ interessante realizar uma ANOVA para verificar se ha´ diferenc¸a entre as
variedades de feija˜o quanto a` absorc¸a˜o de a´gua. O total geral do experimento e´:
y�� = 286, 4 + 263, 4 + . . .+ 301, 6 = 2459, 2
1exemplo extra´ıdo de: Ramalho, M.A,P.; Ferreira, D.F. & Oliveira, A.C. Experimentac¸a˜o em
Gene´tica e Melhoramento de Plantas. Lavras: Editora UFLA, 2000. 326p.
2.9. EXERCI´CIO 19
A Correc¸a˜o devida ao intercepto e´:
C =
y2��
rt
=
2459, 22
30
= 201588, 82
A Soma de Quadrados Total e´:
SQTotal = 92, 32 + 86, 82 + . . .+ 99, 52 − C = 18136, 64
A Soma de Quadrados de Tratamentos:
SQTrat =
286, 42 + 263, 42 + . . .+ 301, 62
3
− C = 18061, 37
E, finalmente, a Some de Quadrados de Erros pode ser obtida por diferenc¸a:
SQErro = SQTotal− SQTrat = 18136, 64− 18061, 37 = 75, 27
Com isto e´ poss´ıvel construir a tabela da ANOVA:
Tabela 2.3: Ana´lise de variaˆncia de um experimento comparando 10 variedades de feija˜o
(tratamentos) quanto a` absorc¸a˜o de a´gua.
Causas de Variac¸a˜o GL SQ QM F
Tratamentos 9 18061,37 2006,82 533,21**
Erro 20 75,27 3,76
Total 29 18136,64 —
** significativo a 1% de probabilidade.
Consultando a Tabela de F com 9 e 20 graus de liberdade, ao n´ıvel de 1% de proba-
bilidade, verifica-se que este valor e´ igual a 3,46. Como 533, 21 > 3, 46, rejeita-se H0 com
um n´ıvel de significaˆncia igual a 0,01.
E´ relativamente comum utilizar a notac¸a˜o de um asterisco (*) para designar signi-
ficaˆncia ao n´ıvel de 5% de probabilidade, e dois asteriscos (**) para designar significaˆncia
ao n´ıvel de 1% de probabilidade.
2.9 Exerc´ıcio
Um experimento foi executado com o objetivo de estudar a influeˆncia do tipo de
recipiente no desenvolvimento de mudas de eucalipto. Optou-se por um delineamento
inteiramente casualizado com 5 tratamentos (5 tipos de recipiente) e 6 repetic¸o˜es. Cada
parcela correspondeu a uma muda. A varia´vel resposta correspondeu a` altura de cada
muda, apo´s determinado per´ıodo de tempo.
Os cinco tipos de recipiente foram:
20 CAPI´TULO 2. DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)
• A: laminado de madeira
• B: torra˜o paulista
• C: saco pla´stico
• D: tubo de papel
• E: fe´rtil pote
Os resultados esta˜o apresentados na Tabela 2.4.
Tabela 2.4: Alturas (metro) de mudas de eucalipto cultivadas em cinco tipos de recepiente.
Tipo de Recipiente
Rep. A B C D E
1 1,5 1,4 1,0 1,1 1,4
2 1,4 1,4 1,1 1,3 1,3
3 1,6 1,3 0,9 1,1 1,3
4 1,7 1,2 1,0 1,2 1,2
5 1,8 1,3 1,0 1,1 1,0
6 1,9 1,2 1,0 1,1 1,0
y
i� 9,9 7,8 6,0 6,9 7,2
y¯
i� 1,65 1,30 1,00 1,15 1,20
1. Calcule a Correc¸a˜o devida a` constante do modelo.
2. Calcule a soma de quadrados total.
3. Calcule a soma de quadrados de tratamentos.
4. Calcule a soma de quadrados de erros, pela diferenc¸a entre as duas anteriores.
5. Componha a tabela da ANOVA. Consulte as tabelas de F com 5% e 1% de proba-
bilidade. Existem diferenc¸as significativas entre os tipos de recipiente?
6. Obtenha a estimativa de µ:
µˆ = y¯��
7. Obtenha a estimativa de cada efeito de tratamento:
τˆi = y¯i� − y¯��
2.10. COMPONENTES DE VARIAˆNCIA 21
8. Os res´ıduos (ou erros) estimados do modelo sa˜o dados por:
eˆ(i)j = yij − µˆ− τˆi
Por exemplo, o res´ıduo associado a` primeira parcela e´:
eˆ(1)1 = y11 − µˆ− τˆ1 = 1, 5− 1, 26− 0, 39 = −0, 15
Assim, termine de preencher a tabela abaixo, contendo todos os res´ıduos:
Tipo de Recipiente
Rep. A B C D E
1 -0,15
2
3
4
5
6
9. Verifique que a soma desses 30 res´ıduos e´ igual a zero (isto sempre acontece, quando
o modelo linear contem uma constante, um intercepto).
10. Finalmente, calcule a soma dos quadrados de cada um desses 30 res´ıduos, e verifique
que o valor e´ igual ao obtido no item 4 acima.
2.10 Componentes de Variaˆncia
Os estimadores que obtivemos pelas equac¸o˜es normais (2.4) se referem a paraˆmetros
que poder´ıamos chamar de componentes de me´dia, porque de fato o sa˜o. Considere,
digamos, o tratamento de nu´mero 3. Se representarmos a sua me´dia por µ3, tem-se que
ela pode ser decomposta em:
µ3 = µ+ τ3
ou seja, µ e τ3 sa˜o componentes da me´dia do tratamento 3. Ao obtermos estimativas suas,
podemos estimar a me´dia do tratamento 3:
µˆ3 = µˆ+ τˆ3 = y¯�� + (y¯3� − y¯��) = y¯3�
Assim, a me´dia do tratamento 3 e´ estimada pela me´dia observada do tratamento 3 no
experimento.
Da mesma forma que estimamos componentes de me´dia, tambe´m podemos (e quase
sempre o desejamos) estimar componentes de variaˆncia.
Se o modelo e´ do tipo fixo, as u´nicas varia´veis aleato´rias presentes correspondem aos
erros (res´ıduos), os quais pressupo˜e-se que tenham distribuic¸a˜o normal, com mesma me´dia
22 CAPI´TULO 2. DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)
(igual a zero), e mesma variaˆncia (igual a σ2). Assim, no caso do modelo fixo, o u´nico
componente de variaˆncia a ser estimado e´ justamenteeste paraˆmetro, σ2.
Como estimar σ2? Poder´ıamos utilizar o me´todo da ma´xima verossimilhanc¸a, con-
siderando que os dados tenham distribuic¸a˜o normal. No entanto, este me´todo produz
um estimador tendencioso, que subestima σ2. Por esta raza˜o, tradicionalmente, e´ mais
utilizado o me´todo dos momentos, pelo qual uma estat´ıstica e´ igualada a` sua esperanc¸a,
gerando forc¸osamente estimadores na˜o-tendenciosos.
Ao se realizar uma ANOVA, no caso do DIC (mas em muitos outros modelos, tambe´m),
pode-se demonstrar que a esperanc¸a do quadrado me´dio dos res´ıduos e´ igual a σ2:
E(QMErro) = σ2
Ou seja, se repet´ıssemos o experimento infinitas vezes, o valor me´dio de QMErro seria
igual a σ2. Dessa forma, podemos estimar σ2 usando o me´todo dos momentos, bastando
fazer:
σˆ2 = QMErro
e este e´ o estimador de σ2 comumente utilizado.
No caso de um DIC com modelo aleato´rio, ou seja, se os tratamentos estudados proveˆm
aleatoriamente de uma populac¸a˜o de refereˆncia:
yij = µ+ ti + e(i)j, i = 1, 2, . . . t
j = 1, 2, . . . r
e(i)j ∼ N
(
0, σ2
)
ti ∼ N
(
0, σ2t
)
enta˜o neste caso, ale´m de σ2, temos um outro componente de variaˆncia a estimar, ou seja,
σ2t , que e´ a variaˆncia na populac¸a˜o de refereˆncia, de onde os tratamentos do experimento
foram aleatoriamente tomados.
Tambe´m neste caso pode ser utilizado o me´todo dos momentos, usando esperanc¸as de
quadrados me´dios. As esperanc¸as dos quadrados me´dios QM’s de um DIC com modelo
aleato´rio esta˜o apresentadas na Tabela 2.5.
Tabela 2.5: Ana´lise de variaˆncia de um experimento inteiramente casualizado (DIC) com
modelo aleato´rio, destacando as esperanc¸as dos quadrados me´dios.
Causas de Variac¸a˜o GL SQ QM E(QM)
Tratamentos t− 1 SQTrat QMTrat σ2 + rσ2t
Erro t(r − 1) SQErro QMErro σ2
Total tr − 1 SQTotal —
Igualando os QM’s a`s suas esperanc¸as:
2.10. COMPONENTES DE VARIAˆNCIA 23
QMTrat = σˆ2 + rσˆ2t
QMErro = σˆ2
temos que os estimadores dos componentes de variaˆncia, pelo me´todo dos momentos, sa˜o:
σˆ2 = QMErro
σˆ2t =
QMTrat−QMErro
r
(2.6)
No exemplo anterior, se o pesquisador tivesse tomado aleatoriamente 10 variedades
de feija˜o de uma populac¸a˜o de variedades, faria sentido estimar a variaˆncia σ2t dessa
populac¸a˜o de variedades, quanto a` absorc¸a˜o de a´gua. Ter´ıamos, assim:
σˆ2 = 3, 76
σˆ2t =
2006, 82− 3, 76
3
= 667, 69
Para entender melhor o porqueˆ do termo componente de variaˆncia, basta verificar,
que, no modelo aleato´rio:
yij = µ+ ti + e(i)j
tem-se que:
V (yij) = σ
2 + σ2t
admitindo, como e´ bastante razoa´vel, que a covariaˆncia entre ti e e(i)j seja nula. Assim,
percebe-se claramente que σ2 e σ2t sa˜o componentes da variaˆncia total de yij.
Os paraˆmetros σ2 e σ2t tambe´m sa˜o componentes da variaˆncia de uma me´dia observada
de tratamento. Se o experimento fosse repetido infinitas vezes, a variaˆncia entre as me´dias
de um tratamento i qualquer seria:
V (y¯
i�) =
σ2
r
+ σ2t
Esta variaˆncia V (y¯
i�) poderia ser enta˜o estimada por:
Vˆ (y¯
i�) =
σˆ2
r
+ σˆ2t
Se o modelo e´ fixo, enta˜o a variaˆncia de uma me´dia de tratamento sera´, simplesmente:
V (y¯
i�) =
σ2
r
podendo ser estimada por:
Vˆ (y¯
i�) =
σˆ2
r
=
QMErro
r
(2.7)
Perceba a semelhanc¸a da expressa˜o 2.7 com a expressa˜o comumente ensinada em cursos
introduto´rios de Estat´ıstica, para a variaˆncia de uma me´dia amostral x¯:
Vˆ (x¯) =
S2
n
24 CAPI´TULO 2. DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)
A diferenc¸a e´ que agora usamos QMErro no lugar de S2, e r no lugar de n. Alguns livros
de Planejamento de Experimentos, inclusive, usam justamente a notac¸a˜o S2 para se referir
a QMErro. Na˜o estranhe.
A expressa˜o 2.7 e´ u´til, por exemplo, para construir intervalos de confianc¸a. No exemplo
anterior, suponha que se queira construir um intervalo de confianc¸a de 95% para a me´dia
da variedade de feija˜o A (que e´ o tratamento 1), voltando a considerar modelo fixo. Os
limites desse intervalo sa˜o facilmente obtidos mediante:
P
(
y¯1� − t0,025
√
QMErro
r
< µ1 < y¯1� + t0,025
√
QMErro
r
)
= 0, 95
Com que nu´mero de graus de liberdade devemos consultar a tabela de t? O nu´mero de
graus de liberdade corresponde a`quele referente a QMErro, ou seja, t(r−1). Consultando
a tabela da ANOVA 2.3, vemos que o nu´mero de graus de liberdade e´ 20. Portanto,
consultando a tabela de t, temos que t9,025 = 2, 086. Assim, os limites do intervalo de
confianc¸a (abreviando, IC ) para µ1, com um ı´ndice de confianc¸a de 95%, sera˜o:
IC0,95(µ1) =
[
95, 5− 2, 086
√
3, 76
3
; 95, 5 + 2, 086
√
3, 76
3
]
ou seja:
IC0,95(µ1) = [93, 2; 97, 8]
2.11 Coeficiente de Variac¸a˜o
E´ relativamente comum, na ana´lise de experimentos, a apresentac¸a˜o do Coeficiente
de Variac¸a˜o (CV ), que e´ uma medida de variabilidade relativa, em relac¸a˜o a` me´dia geral
do experimento. Ele e´ definido como a raiz do QMErro, dividido pela me´dia geral, e
multiplicado por 100. No exemplo das variedades de feija˜o:
CV =
√
3, 76
81, 97
100 = 2, 37%
Um CV alto pode refletir condic¸o˜es experimentais heterogeˆneas, propiciando altas
variac¸o˜es residuais. Mas este julgamento deve ser feito com cautela, comparando com
resultados anteriores dispon´ıveis na literatura, referindo-se a` mesma varia´vel resposta.
Diferentes varia´veis resposta apresentam diferentes CV ’s t´ıpicos. Um valor de 20% pode
ser alto para uma dada caracter´ıstica, mas pode ser baixo para outra.
2.12 ANOVA de DIC’s Desbalanceados
Conforme dito anteriormente, se um DIC e´ desbalanceado (diferentes nu´meros de
repetic¸o˜es para cada tratamento), a ana´lise na˜o se complica, bastando levar em conta que
cada tratamento i tera´ um nu´mero ri de repetic¸o˜es. Neste caso a correc¸a˜o C sera´ dada
por:
C =
y2��
t∑
i=1
ri
2.12. ANOVA DE DIC’S DESBALANCEADOS 25
com a observac¸a˜o de que:
y�� =
t∑
i=1
ri∑
j=1
yij
A soma de quadrados de tratamento sera´:
SQEntre =
t∑
i=1
y2
i�
ri
− C
e a soma de quadrados de res´ıduos pode ser obtida por diferenc¸a.
Assim, o esquema da ANOVA de um DIC desbalanceado sera´ como o apresentado na
Tabela 2.6.
Tabela 2.6: Ana´lise de variaˆncia de um experimento inteiramente casualizado (desbalan-
ceado) com t tratamentos.
Causas de Variac¸a˜o GL SQ QM F
Tratamentos t− 1 SQT QMT=SQT
t−1
QMTrat
QMErro
Erro
t∑
i=1
(ri − 1) SQE QME= SQEt(r−1)
Total
(
t∑
i=1
ri
)
− 1 SQTo —
Cap´ıtulo 3
Indo Ale´m da ANOVA
3.1 Introduc¸a˜o
No cap´ıtulo anterior, o delineamento inteiramente casualizado (DIC) foi apresentado.
Vimos como estimar os componentes de me´dia e de variaˆncia, e apresentamos a Ana´lise
de Variaˆncia (ANOVA) como ferramenta fundamental de ana´lise, para verificar se ha´
diferenc¸as entre os tratamentos.
Se os resultados do teste F nos levam a concluir que as me´dias de tratamento sa˜o
iguais, entendemos que, sob as condic¸o˜es experimentais estudadas, na˜o existe relac¸a˜o
entre os diferentes tratamentos e a varia´vel que estamos medindo. O processo de estudo
das variac¸o˜es esta´ completo e na˜o temos nada mais a fazer.
Por outro lado, se o teste F nos leva a concluir que as me´dias de tratamento sa˜o
diferentes, e´ evidente que existe uma relac¸a˜o entre os tratamentos e a varia´vel de medida.
O nosso objetivo agora e´ procurar onde esta˜o estas diferenc¸as entre tratamentos, e propor
meios para compara´-los. Isto pode ser feito de diversas maneiras, segundo o interesse do
pesquisador e a estrutura dos tratamentos. Neste curso, iremos descrever treˆs abordagens,
em caso de o teste F da ANOVA ter sido significativo:
• Uso de contrastes ortogonais
• Comparac¸o˜es mu´ltiplas
• Agrupamento de me´dias (me´todo de Scott-Knott)
3.2 Contrastes Ortogonais
Da mesma forma que decompomos,no DIC, a variac¸a˜o SQTotal em SQTrat e SQErro,
tambe´m podemos decompor a variac¸a˜o SQTrat em variac¸o˜es devidas a contrastes ortogo-
nais entre tratamentos, em que cada contraste “gasta” um grau de liberdade.
Ignorando por enquanto o adjetivo “ortogonal”, o que e´ um contraste entre tratamen-
tos? Um contraste (estimado), para o qual usaremos a notac¸a˜o Γˆ, nada mais e´ do que
uma combinac¸a˜o linear de totais (ou me´dias) observados de tratamentos, cujos coefici-
entes, ponderados pelo nu´mero de repetic¸o˜es de cada tratamento, somam zero. No caso
26
3.2. CONTRASTES ORTOGONAIS 27
balanceado, o nu´mero de repetic¸o˜es e´ constante, e podemos ignora´-lo. Assim, no caso
balanceado, um contraste entre (totais de) tratamentos e´ definido como:
Γˆ =
t∑
i=1
ciyi� = c1y1� + c2y2� + . . .+ ctyt� (3.1)
onde
t∑
i=1
ci = c1 + c2 + . . .+ ct = 0
No caso desbalanceado, que na˜o estaremos detalhando aqui, a restric¸a˜o e´:
t∑
i=1
ciri = c1r1 + c2r2 + . . .+ ctrt = 0
Assim, por exemplo, se desejamos contrastar os tratamentos A e B, poder´ıamos compor
o contraste:
Γˆ = y1� − y2�
Por outro lado, se desejamos contrastar os tratamentos A e C com os tratamentos B e D,
compor´ıamos o contraste:
Γˆ = y1� + y3� − y2� − y4�
Perceba que em ambos os exemplos, a soma dos coeficientes e´ igual a zero.
E o que significa dizer que dois contrastes sa˜o ortogonais? Considere os dois contrastes
Γˆ1 e Γˆ2 a seguir:
Γˆ1 = c1y1� + c2y2� + . . .+ ctyt�
Γˆ2 = d1y1� + d2y2� + . . .+ dtyt�
Os contrastes Γˆ1 e Γˆ2 sa˜o ditos ortogonais se:
t∑
i=1
cidi = 0
A terminologia “ortogonais” vem da A´lgebra Linear, pois a estes contrastes correspondem
vetores perpendiculares entre si.
No caso desbalanceado (que na˜o estaremos detalhando aqui), a condic¸a˜o de ortogona-
lidade e´:
t∑
i=1
ricidi = 0
Como exemplo, em um DIC balanceado, considere os contrastes Γˆ1 e Γˆ2 a seguir:
Γˆ1 = y1� − y2�
Γˆ2 = y1� + y2� − 2y3�
Estes contrastes sa˜o ortogonais, pois:
1× 1 + 1× (−1) + (−2)× 0 = 1− 1 = 0
28 CAPI´TULO 3. INDO ALE´M DA ANOVA
Um conjunto de t − 1 contrastes Γˆ1, Γˆ2, . . . Γˆt−1 sa˜o mutuamente ortogonais se sa˜o
ortogonais 2 a 2. Por exemplo, para ensaios balanceados, os contrastes:
Γˆ1 = y1� − y2�
Γˆ2 = y1� + y2� − 2y3�
Γˆ3 = y4� − y5�
sa˜o mutuamente ortogonais, pois Γˆ1 e´ ortogonal a Γˆ2 e a Γˆ3, e Γˆ2 e´ ortogonal a Γˆ3.
A cada contraste podemos associar uma soma de quadrados correspondente. No caso
balanceado, a soma de quadrados associada a um contraste Γˆ e´ dada por:
SQ(Γˆ) =
(
t∑
i=1
ciyi�
)2
r
t∑
i=1
c2i
(3.2)
Existem va´rios meios para se formar um conjunto de contrastes mutuamente ortogo-
nais. Em geral, a pro´pria estrutura dos tratamentos direciona a formac¸a˜o de contrastes
de interesse. Por exemplo, sejam t = 3 tratamentos, correspondentes a treˆs formulac¸o˜es
de combust´ıvel, onde um deles e´ uma testemunha (controle, sem aditivo), e os outros dois
correspondem cada qual a um aditivo. Como sa˜o t − 1 = 2 graus de liberdade para os
tratamentos, podemos formar 2 contrastes ortogonais. Estes poderiam ser:
Coeficientes dos contrastes
Tratamentos Γˆ1 Γˆ2
A (controle, sem aditivo) -2 0
B (com aditivo 1) 1 -1
C (com aditivo 2) 1 1
O contraste Γˆ1 = −2y1� + y2� + y3� compara o efeito da aplicac¸a˜o de um aditivo ao
combust´ıvel. O contraste Γˆ2 = −y2� + y3� , por sua vez, compara o aditivo 1 com o aditivo
2.
Como cada contraste “consome” um u´nico grau de liberdade, sua SQ e´ igual ao QM.
3.2.1 Um Exemplo
Um tecno´logo de alimentos desenvolve uma nova farinha, a` base de centeio. Ele de-
seja estudar a capacidade de expansa˜o de massas feitas a` base dessa farinha, utilizando
diferentes tipos de fermento. Para isso, ela planeja um experimento, utilizando um de-
lineamento inteiramente casualizado (DIC). Cada parcela corresponde a uma porc¸a˜o de
100g de massa. A varia´vel resposta corresponde a` porcentagem de expansa˜o. Ele utiliza
6 repetic¸o˜es, e t = 6 tratamentos, que sa˜o:
3.2. CONTRASTES ORTOGONAIS 29
• A: controle (sem fermento)
• B: fermento biolo´gico seco
• C: fermento biolo´gico fresco
• D: fermento qu´ımico com a´cido c´ıtrico
• E: fermento qu´ımico com a´cido tarta´rico da marca I
• F: fermento qu´ımico com a´cido tarta´rico da marca II
Os dados observados foram os seguintes:
Tabela 3.1: Porcentagem de expansa˜o em amostras de massa de centeio, utilizando 6 tipos
de fermento.
Tratamentos
Rep. A B C D E F
1 8 8 7 16 10 12
2 7 8 6 19 11 19
3 1 9 6 24 12 9
4 1 7 6 22 8 11
5 3 7 4 19 7 9
6 2 5 4 19 3 5
y
i� 22 44 33 119 51 65
A ANOVA deste experimento esta´ apresentada na Tabela 3.2.
Tabela 3.2: Ana´lise de variaˆncia de um experimento comparando 6 tipos de fermento em
massas de centeio.
Causas de Variac¸a˜o GL SQ QM F
Tratamentos 5 983,89 196,78 22,25**
Erro 30 265,33 8,84
Total 35 1249,22 —
** significativo a 1% de probabilidade.
30 CAPI´TULO 3. INDO ALE´M DA ANOVA
A ANOVA revela que ha´ diferenc¸as entre os tratamentos. Pore´m, para o pesquisador,
isto na˜o e´ suficiente. Ele gostaria de saber onde esta˜o estas diferenc¸as. Neste estudo, a
maneira que os tratamentos foram concebidos sugerem uma partic¸a˜o da variac¸a˜o entre
tratamentos em variac¸o˜es devidas a cinco contrastes ortogonais (pois sa˜o cinco graus de
liberdade para tratamento). Estes contrastes seriam:
• Controle vs. demais
• Fermento biolo´gico vs. fermento qu´ımico
• Fermento biolo´gico seco vs. fermento biolo´gico fresco
• A´cido c´ıtrico vs. a´cido tarta´rico
• A´cido tarta´rico marca I vs. a´cido tarta´rico marca II
As estimativas destes contrastes, bem como seus coeficientes, esta˜o apresentados na
Tabela abaixo.
Tratamentos A B C D E F
y
i� 22 44 33 119 51 65
Contrastes: Γˆ
A vs. demais -5 1 1 1 1 1 202
BC vs. DEF 0 -3 -3 2 2 2 239
B vs. C 0 1 -1 0 0 0 11
D vs. EF 0 0 0 2 -1 -1 122
E vs. F 0 0 0 0 1 -1 -14
Cada contraste destes possui uma soma de quadrados, conforme equac¸a˜o 3.2. Por
exemplo, o primeiro contraste tem uma soma de quadrados associada, dada por:
SQ(Γˆ1) =
2022
6(25 + 1 + 1 + 1 + 1 + 1)
= 226, 6889
Dessa forma, podemos decompor a SQTrat na soma das SQ’s associadas aos cinco
contrastes. Esta decomposic¸a˜o esta´ apresentada na Tabela 3.3.
Perceba, antes de mais nada, que a soma das somas de quadrados dos contrastes
perfazem a SQTrat. Com base na significaˆncia dos testes F, podemos assim chegar a`s
seguintes concluso˜es:
• a adic¸a˜o de fermento provoca um aumento significativo na expansa˜o da massa de
centeio;
3.2. CONTRASTES ORTOGONAIS 31
Tabela 3.3: Ana´lise de variaˆncia de um experimento comparando 6 tipos de fermento em
massas de centeio.
Causas de Variac¸a˜o GL SQ QM F
Tratamentos (5) 983,8889 196,78 22,25**
A vs. BCDEF 1 226,6889 226,6889 25,63**
BC vs. DEF 1 317,3389 317,3389 35,88**
B vs. C 1 10,0833 10,0833 1,14
D vs. EF 1 413,4444 413,4444 46,75**
E vs. F 1 16,3333 16,3333 1,85
Erro 30 265,33 8,84
Total 35 1249,22 —
** significativo a 1% de probabilidade.
• o fermento qu´ımico provocou uma expansa˜o superior em relac¸a˜o a` expansa˜o do
fermento biolo´gico;
• na˜o ha´ diferenc¸a entre usar fermento biolo´gico fresco ou seco, nesta massa de centeio;
• o fermento qu´ımico com a´cido c´ıtrico provocou uma expansa˜o superior a`quela usando
a´cido tarta´rico;
• na˜o ha´ diferenc¸a entre usar o fermento qu´ımico com a´cido tarta´rico da marca I e da
marca II.
Percebe-se assim que o uso de contrastes ortogonais e´ uma estrate´gia adequada para
decompor a variac¸a˜o entre tratamentos e descobrir onde esta˜o as diferenc¸as entre eles. No
entanto, esta estrate´gia deve ser empregada apenas quando a estrutura e a concepc¸a˜o dos
tratamentos sugerem contrastes de interesse antes mesmo de os dados serem coletados.
Quando isso na˜oacontece, outras estrate´gias devem ser buscadas para identificar onde
esta˜o as diferenc¸as entre os tratamentos.
3.2.2 Correc¸a˜o de Bonferroni
Conforme visto anteriormente, em geral temos interesse em testar a significaˆncia de
mais de um contraste ortogonal ao mesmo tempo. Assim, se escolhemos um determinado
n´ıvel de significaˆncia α para cada teste, a probabilidade de que cometamos algum erro
tipo I (sob H0), em pelo menos um dos testes, sera´ maior do que α. A chamada correc¸a˜o
de Bonferroni, ou crite´rio de protec¸a˜o de Bonferroni, procura levar em conta este aspecto.
Embora nem sempre a correc¸a˜o de Bonferroni seja levada em conta no presente contexto
32 CAPI´TULO 3. INDO ALE´M DA ANOVA
(principalmente quando o nu´mero de contrastes na˜o e´ muito elevado), e´ importante que
o estat´ıstico a conhec¸a, pois pode ser utilizada em diversos outros contextos.
O princ´ıpio envolvido e´ simples; suponha que k testes sa˜o realizados, e que se deseja
controlar o n´ıvel de significaˆncia do conjunto dos testes. Ou seja, defina-se α como a pro-
babilidade de que pelo menos um dos testes seja significativo, sob H0 verdadeira. Enta˜o,
para cada teste individual, devemos utilizar um n´ıvel de significaˆncia correspondente a
α/k. Para verificar isso, sejam pi os p–valores de cada um dos k testes (Lembre que
p–valores sa˜o varia´veis aleato´rias). Enta˜o, com H0 verdadeira para todos os k testes, a
probabilidade de que pelo menos um dos testes seja significativo e´:
P
[
k⋃
i=1
(
pi <
α
k
)]
≤
k∑
i=1
P
[
pi <
α
k
]
= k
α
k
= α
Ou seja, o n´ıvel de significaˆncia global, considerando todos os testes sera´ no ma´ximo igual
a α. Perceba que a correc¸a˜o de Bonferroni na˜o exige que os testes sejam independentes.
O crite´rio de protec¸a˜o de Bonferroni e´ considerado, por vezes, muito conservador
(rigoroso). De qualquer maneira, embora nem sempre a correc¸a˜o de Bonferroni seja
levada em conta no presente contexto (testes envolvendo um conjunto de contrastes),
e´ importante que o estat´ıstico a conhec¸a, pois pode ser utilizada em diversos outros
contextos.
No exemplo anterior, t´ınhamos 5 contrastes. Se utilizarmos a correc¸a˜o de Bonferroni
com um n´ıvel de significaˆncia α = 0, 05 dever´ıamos considerar como crite´rio de rejeic¸a˜o
de H0, para cada contraste individual, a ocorreˆncia de um p-valor menor que 0, 05/5 =
0, 01. Conforme se observa na Tabela 3.3, nossas concluso˜es na˜o se alterariam com a
correc¸a˜o de Bonferroni, uma vez que os contrastes significativos o foram no n´ıvel de 1%
de probabilidade.
3.3 Comparac¸o˜es Mu´ltiplas
Nem sempre a natureza dos tratamentos sugere contrastes bem definidos, como no
estudo dos tipos de fermento. No exemplo das variedades de feija˜o, os 10 tratamen-
tos (variedades) na˜o sugerem a construc¸a˜o de contrastes. O pesquisador, apo´s a coleta
dos dados, poderia compor contrastes baseados nas ordens das me´dias dos tratamentos,
por exemplo, contrastando o tratamento com maior absorc¸a˜o de a´gua com o segundo, o
segundo com o terceiro etc.
Este procedimento consistiria na formulac¸a˜o de contrastes apo´s os dados terem sido
coletados, pois o pesquisador na˜o sabe de antema˜o qual tratamento sera´ o melhor, qual
tratamento sera´ o segundo melhor, e assim por diante. Em Experimentac¸a˜o, este proce-
dimento de formular formas de ana´lise apo´s os dados terem sido observados, baseando-se
3.3. COMPARAC¸O˜ES MU´LTIPLAS 33
no que eles sugerem, e´ chamado de procedimento post hoc, que e´ uma expressa˜o latina
que designa “apo´s isto”.
O problema desta estrate´gia post hoc e´ que, se o experimento fosse repetido va´rias
vezes, na˜o seria (provavelmente) o mesmo tratamento a ter o melhor desempenho, o mesmo
tratamento a ter o segundo melhor desempenho, e assim por diante. A consequeˆncia disto
e´ a de que a probabilidade de erros tipo I seriam maiores do que o especificado pelo n´ıvel
de significaˆncia, ao se fazer, por exemplo, os testes F dos contrastes.
Dessa maneira, foram desenvolvidas estrate´gias para contornar este aumento da proba-
bilidade do erro tipo I, reunidas no que se chama procedimentos de comparac¸o˜es mu´ltiplas,
que compreendem va´rios testes. Um desses procedimentos mais populares e utilizados e´
o Teste de Tukey, que promove um bom controle do erro tipo I.
3.3.1 Teste de Tukey
O teste de Tukey e´ o mais indicado quando se deseja comparar as me´dias de tratamento
duas a duas. O teste faz com que o n´ıvel de significaˆncia global (ou seja, considerando
todas as comparac¸o˜es) seja exatamente igual ao n´ıvel de significaˆncia especificado α,
quando as me´dias de tratamento teˆm o mesmo nu´mero de repetic¸o˜es (dados balanceados).
Quando os dados na˜o sa˜o balanceados, o n´ıvel de significaˆncia sera´ no ma´ximo igual a α.
O teste de Tukey pressupo˜e distribuic¸a˜o normal, e se baseia na chamada amplitude
estudentizada (padronizada). No caso balanceado, esta amplitude e´ definida por:
q =
y¯max − y¯min√
QMErro
r
em que y¯max e y¯min sa˜o a maior e a menor me´dia, em um grupo contendo t me´dias. A
distribuic¸a˜o dessa estat´ıstica, com a pressuposic¸a˜o de normalidade, na˜o permite o ca´lculo
anal´ıtico de a´reas, mas estas costumam ser tabeladas, para um certo α, para diferentes
valores de t e ν, sendo ν o nu´mero de graus de liberdade associado a QMErro. Va´rias
linguagens computacionais, como o R, tambe´m dispo˜em de func¸o˜es para o ca´lculo dessas
a´reas ou de quantis.
Desta maneira, duas me´dias de tratamento y¯
i� e y¯j� sa˜o declaradas diferentes se a dife-
renc¸a entre elas, em valor absoluto, ultrapassar a chamada diferenc¸a mı´nima significativa,
abreviada geralmente por DMS ou ∆:
DMS = ∆ = qα(t, ν)
√
QMErro
r
(3.3)
em que qα(t, ν) e´ o quantil (dispon´ıvel na chamada tabela de Tukey) da distribuic¸a˜o da
amplitude estudentizada, para um certo α, um certo t e um certo ν.
As Tabelas A.6, A.7, A.8 e A.9 (Apeˆndice) apresentam os quantis da amplitude es-
tudentizada, considerando 5% e 1% de probabilidade, diferentes nu´meros de me´dias e
diferentes nu´meros de graus de liberdade
Ou seja, duas me´dias de tratamentos y¯
i� e y¯j� sa˜o declaradas estatisticamente diferentes,
para um certo α, se:
|y¯
i� − y¯j�| > DMS
34 CAPI´TULO 3. INDO ALE´M DA ANOVA
Exemplo Nume´rico
No exerc´ıcio do item 2.9 foi apresentado um experimento para avaliac¸a˜o de 5 tipos
de recipiente no desenvolvimento de mudas de eucalipto. A ana´lise de variaˆncia deste
experimento esta´ apresentada na tabela 3.4.
Tabela 3.4: Ana´lise de variaˆncia de um experimento comparando e esutdando o efeito de
cinco recipientes no desenvolvimento de mudas de eucalipto.
Causas de Variac¸a˜o GL SQ QM F
Recipientes 4 1,422 0,3555 21,68**
Erro 25 0,410 0,0164
Total 29 1,832 —
** significativo a 1% de probabilidade.
As me´dias dos 5 tratamentos foram apresentadas na tabela 2.4. Estas me´dias, ja´
ordenadas, sa˜o as seguintes:
y¯1� = 1, 65 y¯2� = 1, 30 y¯5� = 1, 20 y¯4� = 1, 15 y¯3� = 1, 00
Consultando a tabela A.6 de Tukey, com um n´ıvel de significaˆncia de 5%, verificamos
que:
q0,05(5, 25) = 4, 15
e assim a diferenc¸a mı´nima significativa (DMS) para declarar duas me´dias de tratamento
como sendo diferentes, sera´:
DMS = 4, 15
√
0, 0164
6
= 0, 22
Assim, considerando todas as comparac¸o˜es duas a duas, temos:
y¯1� − y¯2� = 1, 65− 1, 30 = 0, 35∗
y¯1� − y¯5� = 1, 65− 1, 20 = 0, 45∗
y¯1� − y¯4� = 1, 65− 1, 15 = 0, 50∗
y¯1� − y¯3� = 1, 65− 1, 00 = 0, 65∗
y¯2� − y¯5� = 1, 30− 1, 20 = 0, 10
y¯2� − y¯4� = 1, 30− 1, 15 = 0, 15
y¯2� − y¯3� = 1, 30− 1, 00 = 0, 30∗
y¯5� − y¯4� = 1, 20− 1, 15 = 0, 05
y¯5� − y¯3� = 1, 20− 1, 00 = 0, 20
3.3. COMPARAC¸O˜ES MU´LTIPLAS 35
y¯4� − y¯3� = 1, 15− 1, 00 = 0, 15
em que * denota significaˆncia a 5% de probabilidade.
A apresentac¸a˜o de todas as comparac¸o˜es duasa duas na˜o e´ muito pra´tica, sendo usual
construir uma tabela contendo as me´dias seguidas de letras. Se duas me´dias apresentam a
mesma letra, sa˜o estatisticamente iguais conforme o teste de Tukey, Para o nosso exemplo,
esta apresentac¸a˜o e´ feita na tabela 3.5.
Tabela 3.5: Alturas me´dias de mudas de eucalipto cultivadas em 5 recipientes.
Recipientes Me´dias1
Laminado de madeira 1,65 a
Torra˜o paulista 1,30 b
Pote fe´rtil 1,20 bc
Tubo de papel 1,15 bc
Saco pla´stico 1,00 c
1 Me´dias seguidas de mesma letra sa˜o estatis-
ticamente iguais pelo teste de Tukey ao n´ıvel
de 5% de probabilidade.
Dados Desbalanceados
Quando o nu´mero de repetic¸o˜es varia de tratamento para tratamento, enta˜o a DMS
do teste de Tukey e´ dada por:
DMS =
qα(t, ν)√
2
√
QMErro
(
1
ri
+
1
rj
)
(3.4)
Nesta situac¸a˜o, quando as duas me´dias apresentam nu´meros de repetic¸o˜es diferentes ri e
rj, o teste de Tukey costuma ser referenciado como teste de Tukey-Kramer.
O teste de Tukey e´ extremamente popular, embora seja considerado muito conservador
(muito rigoroso) por alguns
Dois outros conhecidos testes de comparac¸o˜es mu´ltiplas que fazem uso da amplitude
estudentizada, e menos conservadores que o de Tukey, sa˜o os testes SNK e o de Duncan,
descritos a seguir.
3.3.2 Teste de Student–Newman–Keuls (SNK)
O teste de Student–Newman–Keuls, conhecido pela sigla SNK, ou simplesmente Newman–
Keuls, tambe´m faz uso da Tabela de Tukey (ou seja, da amplitude studentizada), com
36 CAPI´TULO 3. INDO ALE´M DA ANOVA
a diferenc¸a de que a coluna consultada corresponde ao nu´mero de me´dias abrangidas na
diferenc¸as entre os dois tratamentos em questa˜o. Ou seja, diferentes DMS’s sera˜o calcu-
ladas. Por exemplo, considere uma situac¸a˜o com 5 tratamentos. Ao contrastar, digamos,
o tratamento que ocupa a terceira posic¸a˜o com aquele que ocupa a quinta posic¸a˜o, sera´
consultada a tabela de Tukey para uma valor de 3 me´dias (e na˜o 5, como no teste de
Tukey), e assim por diante. Isto e´ que faz com que o teste seja menos rigoroso que o
de Tukey. Na mecaˆnica do teste, deve-se observar que, se uma dada diferenc¸a for na˜o
significativa, enta˜o na˜o se deve testar diferenc¸as entre me´dias intermedia´rias (elas sa˜o
automaticamente tidas tambe´m como na˜o significativas), abrangidas por esta diferenc¸a
na˜o significativa.
O exemplo dos recipientes continha justamente 5 tratamentos, e assim sa˜o necessa´rios
4 valores tabelados (envolvendo desde 2 ate´ 5 me´dias), com 25 graus de liberdade para o
erro. Estes valores, considerando um n´ıvel de significaˆncia de 5%, sa˜o:
q0,05(5, 25) = 4, 15 q0,05(4, 25) = 3, 89
q0,05(3, 25) = 3, 52 q0,05(2, 25) = 2, 91
Multiplicando estes valores por
√
0, 0164/6, temos quatro valores de DMS, iguais respec-
tivamente a 0,22, 0,20, 0,18 e 0,15. Lembrando que as me´dias ordenadas sa˜o:
y¯1� = 1, 65 y¯2� = 1, 30 y¯5� = 1, 20 y¯4� = 1, 15 y¯3� = 1, 00
compomos as diferenc¸as partindo da maior, em seguida considerando as diferenc¸as inter-
media´rias (internas), na˜o avanc¸ando em diferenc¸as internas a uma diferenc¸a na˜o signifi-
cativa. Assim, temos o seguinte teste envolvendo 5 me´dias:
y¯1� − y¯3� = 1, 65− 1, 00 = 0, 65∗ (maior que 0, 22)
Quatro me´dias:
y¯1� − y¯4� = 1, 65− 1, 15 = 0, 50∗ (maior que 0, 20)
y¯2� − y¯3� = 1, 30− 1, 00 = 0, 30∗ (maior que 0, 20)
Treˆs me´dias:
y¯1� − y¯5� = 1, 65− 1, 20 = 0, 45∗ (maior que 0, 18)
y¯2� − y¯4� = 1, 30− 1, 15 = 0, 15 (menor que 0, 18)
y¯5� − y¯3� = 1, 20− 1, 00 = 0, 20∗ (maior que 0, 18)
Duas me´dias:
y¯1� − y¯2� = 1, 65− 1, 30 = 0, 35∗ (maior que 0, 15)
y¯2� − y¯5� = 1, 30− 1, 20 = 0, 10 (menor que 0, 15)
y¯5� − y¯4� = 1, 20− 1, 15 = 0, 05 (menor que 0, 15)
y¯4� − y¯3� = 1, 15− 1, 00 = 0, 15 (menor que 0, 15)
O u´ltimo contraste foi na˜o significativo porque na realidade a DMS, com mais casas
decimais, e´ igual a 0,1521. Perceba tambe´m que na˜o houve necessidade de se contrastar
y¯2� com y¯5� , nem y¯5� com y¯4� . Os resultados do teste SNK esta˜o sumariados na Tabela 3.6.
3.3. COMPARAC¸O˜ES MU´LTIPLAS 37
Tabela 3.6: Alturas me´dias de mudas de eucalipto cultivadas em 5 recipientes.
Recipientes Me´dias1
Laminado de madeira 1,65 a
Torra˜o paulista 1,30 b
Pote fe´rtil 1,20 b
Tubo de papel 1,15 bc
Saco pla´stico 1,00 c
1 Me´dias seguidas de mesma letra sa˜o estatisti-
camente iguais pelo teste Student–Nwman–
Keuls ao n´ıvel de 5% de probabilidade.
3.3.3 Teste de Duncan
O teste de Duncan tambe´m faz uso da amplitude estudentizada, e tambe´m e´ bem
mais liberal que o teste de Tukey. Da mesma forma que o teste SNK, demanda o ca´lculo
de diferentes DMS’s para diferenc¸as entre me´dias ordenadas contendo diferentes nu´meros
de me´dias intermedia´rias. O princ´ıpio do teste e´ o de que, a` medida que duas me´dias
se distanciam, no conjunto de me´dias ordenadas, deve-se tornar maior a possibilidade de
que sejam diferentes, e um α maior deve ser empregado, para aumento de poder.
A mecaˆnica do teste pode ser descrita como segue. Deve-se estabelecer um n´ıvel de
significaˆncia apropriado para comparar duas me´dias adjacentes no conjunto de me´dias
ordenadas, por exemplo α = 0, 05. Se a comparac¸a˜o abrange treˆs me´dias ordenadas, o
autor recomenda que se use uma amplitude estudentizada que deixa uma a´rea acima igual
a 1 − (1 − α)2 = 0, 0975 (considerando α = 0, 05). Se abrange quatro me´dias, utilizar
1− (1−α)3 = 0, 1426, e se abrange t me´dias, 1− (1−α)t−1. Dessa forma, sa˜o necessa´rias
tabelas pro´prias para o teste de Duncan, devido a` necessidade dos quantis da amplitude
estudentizada considerando diferentes a´reas, partindo de um α inicial. As tabelas A.10,
A.11, A.12 e A.13 do Apeˆndice apresentam os valores para construir as DMS’s do teste
de Duncan, para α‘s iguais a 0,05 e 0,01, respectivamente. Uma observac¸a˜o importante
e´ a de que estas tabelas foram constru´ıdas utilizando a func¸a˜o qtukey da linguagem R
(RCore Team, 2017). Comparando alguns valores destas tabelas com algumas publicadas
em livros mais antigos, pode haver diferenc¸as dignas de menc¸a˜o, embora na˜o esteja clara a
raza˜o para tal. De qualquer forma, na pa´gina de ajuda da func¸a˜o qtukey, ha´ a observac¸a˜o
de que os resultados sa˜o acurados ate´ a quarta casa decimal.
No exemplo dos recipientes, temos, considerando um n´ıvel de significaˆncia de 5%
(tabela A.10):
q0,1855(5, 25) = 3, 22 q0,1426(4, 25) = 3, 15
q0,0975(3, 25) = 3, 06 q0,05(2, 25) = 2, 91
Multiplicando estes valores por
√
0, 0164/6, os quatro valores de DMS sa˜o 0,17, 0,16,
38 CAPI´TULO 3. INDO ALE´M DA ANOVA
0,16 e 0,15. Percebe-se que o teste foi mais liberal que o teste SNK, dados esses menores
valores de DMS.
O teste envolvendo 5 me´dias fica dado como:
y¯1� − y¯3� = 1, 65− 1, 00 = 0, 65∗ (maior que 0, 17)
Quatro me´dias:
y¯1� − y¯4� = 1, 65− 1, 15 = 0, 50∗ (maior que 0, 16)
y¯2� − y¯3� = 1, 30− 1, 00 = 0, 30∗ (maior que 0, 16)
Treˆs me´dias:
y¯1� − y¯5� = 1, 65− 1, 20 = 0, 45∗ (maior que 0, 16)
y¯2� − y¯4� = 1, 30− 1, 15 = 0, 15 (menor que 0, 16)
y¯5� − y¯3� = 1, 20− 1, 00 = 0, 20∗ (maior que 0, 16)
Duas me´dias:
y¯1� − y¯2� = 1, 65− 1, 30 = 0, 35∗ (maior que 0, 15)
y¯2� − y¯5� = 1, 30− 1, 20 = 0, 10 (menor que 0, 15)
y¯5� − y¯4� = 1, 20− 1, 15 = 0, 05 (menor que 0, 15)
y¯4� − y¯3� = 1, 15− 1, 00 = 0, 15 (menor que 0, 15)
Apesar de ter sido mais liberal que o teste SNK, o teste de Duncan na˜o apresentou
diferentes concluso˜es em relac¸a˜o a este.
3.3.4 Outros Testes
Existem va´rios outros procedimentos de comparac¸o˜es mu´ltiplas, aqui na˜o citados. O
leitor interessado podera´ buscar a literatura especializada para se familiarizar com outros
testes, como o teste de Scheffe´ ou o teste de Dunnett, este u´ltimo utilizado quando ha´ o
interesse em se comparar cada um tratamento–testemunha com cada um dos demais t−1
tratamentos.
3.4

Continue navegando