Buscar

Estat+¡stica Aplicada I TEXTO 5

Prévia do material em texto

UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – ESCOLA POLITÉCNICA 
 
 
DEPARTAMENTO DE ENGENHARIA INDUSTRIAL - ESTATÍSTICA APLICADA I 
TEXTO 5 - ANÁLISE DE VARIÂNCIA - Prof. André Salles 
 
 
49
 
5. ANÁLISE DE VARIÂNCIA 
 
 
5.1. OBJETIVO 
 
Testar a hipótese sobre a igualdade das médias de vários conjuntos de 
informações, por um ou mais critérios. 
 
 
5.2. INTRODUÇÃO 
 
Para o teste de igualdade de duas médias populacionais pode-se utilizar o 
teste paramétrico baseado na distribuição t de Student. No entanto quando se busca 
a diferença entre mais de dois conjuntos de informações não é mais possível a 
utilização do teste t, daí a necessidade de outras técnicas, tais como a análise de 
variância, que possibilitem testar a igualdade das médias populacionais, de mais de 
dois conjuntos de informações. 
 
Ronald Fisher, estatístico britânico com muitos trabalhos pioneiros para 
estatística clássica, desenvolveu um método para testar a igualdade de médias de 
mais de dois conjuntos de dados. O método de Fisher ficou denominado como 
análise de variância, e abreviadamente ANOVA (ANalysis Of VAriance ). 
 
O método é classificado de acordo com o número de fatores de interesse: 
modelo de fator único (modelo de classificação única) - somente um fator influencia 
a variável em estudo, dita variável dependente; modelo de dois fatores ou modelo de 
fator duplo (modelo de classificação dupla) - duas variáveis influenciam a variável 
dependente. 
 UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – ESCOLA POLITÉCNICA 
 
 
DEPARTAMENTO DE ENGENHARIA INDUSTRIAL - ESTATÍSTICA APLICADA I 
TEXTO 5 - ANÁLISE DE VARIÂNCIA - Prof. André Salles 
 
 
50
 
O modelo populacional da ANOVA: 
 
 valor da variável = estimativa do valor pelo modelo + erro 
 
Os pressupostos básicos sobre os erros: 
1. erros normalmente distribuídos; 
2. os erros têm variância constante; 
3. os erros são independentes entre si. 
 
Os pressupostos 2 e 3 são importantes para amostras pequenas ou de 
tamanhos diferentes. Para amostras grandes os testes de ANOVA são considerados 
robustos. 
 
TERMINOLOGIA 
Os termos utilizados na ANOVA vêm de estudos na área de agricultura, dado 
o grande número de trabalhos como, por exemplo, utilização de fertilizantes, 
irrigação e inseticidas e seus efeitos na safra agrícola de determinado produto. A 
safra obtida é a variável dependente em estudo, enquanto os fatores de interesse 
são: fertilizantes, irrigação e inseticidas. Os níveis de fertilizantes são os 
tratamentos, níveis de tratamento de um fator. A influencia de um fator na variável 
dependente é dito efeito principal. A análise de variância permite o estudo do efeito 
principal, ou dos efeitos principais, assim como a combinação entre os efeitos 
principais dito efeito interação. 
 
Análise de variância é o método para estimar quanto de variabilidade do 
conjunto de dados pode ser atribuído ao modelo e quanto pode ser atribuído aos 
efeitos aleatórios. A hipótese nula na ANOVA é a de que não se tem efeito principal 
e efeito interação, enquanto a hipótese alternativa é a de que esses efeitos existem. 
Fisher construiu o teste de para igualdade das médias observando a razão entre 
 UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – ESCOLA POLITÉCNICA 
 
 
DEPARTAMENTO DE ENGENHARIA INDUSTRIAL - ESTATÍSTICA APLICADA I 
TEXTO 5 - ANÁLISE DE VARIÂNCIA - Prof. André Salles 
 
 
51
estimativas da variância populacional que serão descritas a seguir, daí o nome da 
análise de variância. 
 
 nível 1 nível 2 nível 3 
 y11 y12 y13 
 y21 y22 y23 
 .... ... 
 ... ... 
 yn1 yn2 yn3 
 média 1 média 2 média 3 média 
geral 
 
 
Acima da representação de um modelo de fator único tem-se yij como observações 
da variável dependente, e a média geral é a estimativa da média populacional assim 
como as médias são estimativas das médias populacionais de cada nível ou 
tratamento. A estimativa da variância populacional pode ser feita através de 
qualquer uma das colunas e uma combinação das observações das três colunas. Ou 
de outra forma a variância pode ser estimada usando as médias dos tratamentos, e 
essa estimativa não será tendenciosa somente se não existir diferença entre os 
tratamentos. Quando existe diferença entre as médias populacionais dos 
tratamentos este estimador da variância populacional da variável dependente 
superestima a variância verdadeira. 
 
ANOVA no EXCEL 
Macro, ou suplemento, Análise de Dados 
- Fator Único 
- Fator Duplo com repetição 
- Fator Duplo sem repetição 
 
 (ver exemplos) 
 
 UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – ESCOLA POLITÉCNICA 
 
 
DEPARTAMENTO DE ENGENHARIA INDUSTRIAL - ESTATÍSTICA APLICADA I 
TEXTO 5 - ANÁLISE DE VARIÂNCIA - Prof. André Salles 
 
 
52
 
5.3. PROCEDIMENTO 
 
(i) 
 Hipótese a ser testada ..... Hipótese Nula ............. H0: µ µ µ1 2= = =....... n 
 Hipótese contrária .......... Hipótese Alternativa .... Ha: as médias diferem 
 
 (ii) 
Deve-se observar as médias amostrais dos m grupos e a média de cada uma das 
amostras. O cálculo da variância entre as amostras e dentro das amostras permitirá 
verificar se a hipótese nula é aceitável ou não. 
 
Designando-se: 
 
• número de informações em cada grupo ....... n 
 
• número total de informações .......... nm 
 
• média amostral dos m grupos ........ x
x x x
m
n
=
+ + +1 2 ....... 
• variância amostral entre 
 os m grupos ......... S
x x x x x x
mentre
n2 1
2
2
2 2
1
=
− + − + + −
−
( ) ( ) ............ ( )
 
 
• variância amostral dentro de cada grupo...... S
x x
ndentro
i i2
2
1
=
−
−
Σ( )
 
 
• média das m variâncias amostrais ....... S
S S S
m
dentro dentro dentron2 1
2
2
2 2
=
+ + +............
 
 UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – ESCOLA POLITÉCNICA 
 
 
DEPARTAMENTO DE ENGENHARIA INDUSTRIAL - ESTATÍSTICA APLICADA I 
TEXTO 5 - ANÁLISE DE VARIÂNCIA - Prof. André Salles 
 
 
53
 
(iii) 
Quanto maior for a média das variâncias dentro das amostras maior a possibilidade 
de se aceitar a hipótese nula. 
 
 Estatística Teste 
 
 razão de variâncias ........ F
nS
S
entre
=
2
2 
 
 
(iv) 
Se as médias populacionais dos grupos forem iguais a estatística teste deve estar 
próxima da unidade. 
Comparando-se a estatística F
nS
S
entre
=
2
2 com o valor crítico da distribuição F com 
m - 1 graus de liberdade no numerador e m ( n - 1) graus de liberdade no 
denominador. 
 
 
 
 
 
 
 não 
 rejeita-se H0 não 
 aceita-se H0 
 
 F tabelado 
 
Se valor da estatística teste for maior do o valor tabelado, ou valor crítico, não 
se aceita a hipótese nula. 
 
 
 UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – ESCOLA POLITÉCNICA 
 
 
DEPARTAMENTO DE ENGENHARIA INDUSTRIAL - ESTATÍSTICA APLICADA I 
TEXTO 5 - ANÁLISE DE VARIÂNCIA - Prof. André Salles 
 
 
54
 
5.4. UTILIZANDO SOMA DOS QUADRADOS DOS DESVIOS 
 
A abordagem da análise de variância pode ser melhor trabalhada utilizando-se a soma de quadrados dos desvios, ou simplesmente soma de quadrados. 
 
m grupos com n informações cada 
 
• cada observação será denotada por : xij , i-ésimo elemento do j-ésimo grupo. 
 
• soma de todas as informações: T xij
j
m
i
n
=
==
∑∑
11
 
 
• média amostral dos m grupos ou média geral ........ x
x x x
m
n
=
+ + +1 2 ....... 
 ou x
T
nm
= 
 
• variação total (VT) ou soma total dos quadrados ( STQ ou TSS ) 
 
 TSS VT STQ x xij
j
m
i
n
= = = −
==
∑∑ ( )2
11
 
 
Para se verificar se a hipótese nula é não é falsa, ou seja a média populacional é a 
mesma em cada grupo de onde foram retiradas amostras aleatórias simples, deve-
se estudar as variações entre os grupos de informações e dentro dos grupos de 
informações. Para proceder este estudo deve-se dividir a soma de quadrados acima 
em duas partes: uma referente a variação dentro de cada grupo, de forma a verificar 
a variação aleatória dentro dos grupos; e, em outra referente a variação entre os 
 UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – ESCOLA POLITÉCNICA 
 
 
DEPARTAMENTO DE ENGENHARIA INDUSTRIAL - ESTATÍSTICA APLICADA I 
TEXTO 5 - ANÁLISE DE VARIÂNCIA - Prof. André Salles 
 
 
55
grupos, de forma a verificar se a média de cada grupo de informações é diferente da 
média global. 
 
TSS VT STQ x x x x x xij
j
m
i
n
ij j j
j
m
i
n
= = = − = − + − =
== ==
∑∑ ∑∑( ) (( ) ( ))2
11
2
11
 
 
TSS VT STQ x x x x x x x xij j j
j
m
i
n
ij j
j
m
j
j
m
i
n
i
n
= = = − + − = − + − =
== = ===
∑∑ ∑ ∑∑∑[( ) ( ) ] ( ) ( )2 2
11
2
1
2
111
 
 
tem-se: TSS x x n x xij j
j
m
j
j
m
i
n
= − + −
= ==
∑ ∑∑ ( ) ( )2
1
2
11
 
 
 
 TSS RSS ESS= + ou STQ SQER SQTR= + ou VT VD VE= + 
 
 
 ou VT VAleatória VExplicada= + 
 
 
 
• soma dos quadrados dos erros (SQER ou RSS ) 
 variação dentro das amostras dos grupos (VD) ou variação aleatória 
 
Diferenças decorrentes de fatores aleatórios desconhecidos, variação residual ou 
erro estatístico. 
 
 SQER x xij j
j
m
i
n
= −
==
∑∑ ( )2
11
 
 
 
 
 UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – ESCOLA POLITÉCNICA 
 
 
DEPARTAMENTO DE ENGENHARIA INDUSTRIAL - ESTATÍSTICA APLICADA I 
TEXTO 5 - ANÁLISE DE VARIÂNCIA - Prof. André Salles 
 
 
56
• soma dos quadrados de tratamentos ( SQTR ou ESS ) 
 variação entre as amostras dos grupos ( VE ) ou variação explicada 
 
Diferenças decorrentes de tratamentos dados a cada grupo de informações. Quanto 
maior esta soma maior a possibilidade de não se aceitar a hipótese nula; ou seja 
maior a possibilidade de se rejeitar a hipótese de igualdade das médias 
populacionais dos diferentes grupos, ou dos resultados dos tratamentos dados a 
variável em estudo. 
 SQTR x xj
j
m
i
n
= −
==
∑∑ ( )2
11
 
 
• média da soma dos quadrados (MSQ) 
 
Quando a soma de quadrados é dividida pelo número de graus de liberdade, tem-se 
a variância quadrática média ou quadrado médio ( ou soma dos quadrados média -- 
“MSS” ). 
Média da soma dos quadrados entre as amostras: =
−
−
=
∑n x x
m
j
j
m
( )2
1
1
 
 
Média da soma dos quadrados dentro das amostras: =
−
−
==
∑∑ ( )
( )
x x
m n
ij j
j
m
i
n
2
11
1
 
 
• estatística teste 
 variação média entre os grupos 
 ou tratamentos 
 F = 
 variação média dentro dos grupos 
 ou variação aleatória -- erro 
 
 UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – ESCOLA POLITÉCNICA 
 
 
DEPARTAMENTO DE ENGENHARIA INDUSTRIAL - ESTATÍSTICA APLICADA I 
TEXTO 5 - ANÁLISE DE VARIÂNCIA - Prof. André Salles 
 
 
57
 
 
 F
n x x
m
x x
m n
calculado
j
j
m
ij j
j
m
i
n=
−
−
−
−
=
==
∑
∑∑
( )
( )
( )
2
1
2
11
1
1
 
 
 
 
• valor crítico do teste 
 
o valor crítico do teste (ou valor tabelado) é dado pela abscissa da variável aleatória 
distribuída de acordo com a distribuição F com (m – 1) graus de liberdade no 
numerador e com m (n - 1) graus de liberdade no denominador. 
 
 
• tomada de decisão 
 
 
 
 
 
 não 
 rejeita-se H0 não 
 aceita-se H0 
 
 F tabelado 
 
 
Se valor da estatística teste for maior do o valor tabelado, ou valor crítico, não 
se aceita a hipótese nula. 
 
 
 UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – ESCOLA POLITÉCNICA 
 
 
DEPARTAMENTO DE ENGENHARIA INDUSTRIAL - ESTATÍSTICA APLICADA I 
TEXTO 5 - ANÁLISE DE VARIÂNCIA - Prof. André Salles 
 
 
58
 
5.5. TABELA ANOVA 
 
QUADRO DE ANÁLISE DE VARIÂNCIA (QAV) 
 
 
FONTE de 
VARIAÇÃO 
 
 
 SOMA dos 
 QUADRADOS 
 
Graus 
de 
liberdade 
 
QUADRADO 
MÉDIO 
 
TESTE F 
(Fcalc) 
 
 
ENTRE 
AMOSTRAS 
 
 
 
 
 n x xj
j
m
( )−
=
∑ 2
1
 
 
 
 
 m - 1 
 
 
n x x
m
j
j
m
( )−
−
=
∑ 2
1
1
 
 (I) 
 
 
 (I) 
 
 (II) 
 
 
 
DENTRO 
AMOSTRAS 
 
 
 
 
 ( )x xij j
j
m
i
n
−
==
∑∑ 2
11
 
 
 
 
 m ( n - 1) 
 
 
( )
( )
x x
m n
ij j
j
m
i
n
−
−
==
∑∑ 2
11
1
 
 (II) 
 
 
 
TOTAL 
 
 
 
 
 
 ( )x xij
j
m
i
n
−
==
∑∑ 2
11
 
 
 
 mn - 1 
 
 
 
 
 UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – ESCOLA POLITÉCNICA 
 
 
DEPARTAMENTO DE ENGENHARIA INDUSTRIAL - ESTATÍSTICA APLICADA I 
TEXTO 5 - ANÁLISE DE VARIÂNCIA - Prof. André Salles 
 
 
59
5.6. PRESSUPOSTOS 
• Variâncias Populacionais iguais: σ12 = σ22 = σ32 = σ42 = ....... = σm2 = σ 2 
• Cada População é Normalmente Distribuída ∼ N (µ ; σ 2) 
• Cada amostra extraída de sua população de tratamento, representada por uma 
coluna, é independente e aleatória ( AASn). 
 
 
5.7. O MODELO 
 Xij = µ + α i + ε ij 
 
Para cada observação Xij têm-se: 
1. efeito médio devido a população a que pertence (µ ) 
2. efeito do i-ésimo tratamento, específico a coluna a que pertence ( αi ) 
3. efeito aleatórioou erro residual (ε ij ) 
4. efeito aleatório (ε ij ) ∼ N (µ ; σ 2) 
 
MODELO com CLASSIFICAÇÃO ÚNICA ou com UM CRITÉRIO 
 
 População 1 População 2 .................................................. População m 
 (tratamento 1) (tratamento 2) ...................................................(tratamento m) 
 
 µ1 µ2 µm 
 
 σ12 σ22 σm2 
 
 AASn1 AASn2 AASnm 
 
 AASn1 = ( x11 , x21 , x31 ,............., xn1 1 ), 
 
 AASn2 = ( x12 , x22 , x32 ,............., xn2 2 ), 
 
 .............................................................................. 
 .................................................................................. 
 
 AASnk = ( x1m , x2m , x3m ,............., xnn m ). 
 
 UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – ESCOLA POLITÉCNICA 
 
 
DEPARTAMENTO DE ENGENHARIA INDUSTRIAL - ESTATÍSTICA APLICADA I 
TEXTO 5 - ANÁLISE DE VARIÂNCIA - Prof. André Salles 
 
 
60
 
Em resumo: 
 
ANOVA – 
Estudo de variações, aleatórias (dentro) e explicadas (entre), 
para se testar a igualdade de médias populacionais. 
 
Algumas aplicações: 
• verificar se o índice médio de produção de três postos de trabalho diferem de 
forma significativa; 
• verificar se os escores em determinado teste diferem entre grupos de indivíduos. 
 
 
 
5.8. ANOVA - CASO DE AMOSTRAS COM TAMANHOS DIFERENTES 
 
m grupos com número de informações diferentes 
 
amostra 1 ....... n1 informações 
amostra 2 ....... n2 informações 
amostra 3 ....... n3 informações 
.................................................... 
.................................................... 
amostra m ....... nm informações 
 
 
• cada observação será denotada por : xij , i-ésimo elemento do j-ésimo grupo. 
 
• soma de todas as informações: N n n n n nm j
j
m
= + + + + =
=
∑1 2 3
1
......... 
 UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – ESCOLA POLITÉCNICA 
 
 
DEPARTAMENTO DE ENGENHARIA INDUSTRIAL - ESTATÍSTICA APLICADA I 
TEXTO 5 - ANÁLISE DE VARIÂNCIA - Prof. André Salles 
 
 
61
• média amostral dos m grupos ou média geral ........ x
n x n x n x
N
m m
=
+ + +1 1 2 2 ....... 
 ou x
x
N
ij
i
n
j
m j
=
==
∑∑
11 
 
 
• variação total (VT) ou soma total dos quadrados ( STQ ou TSS ) 
 
 TSS VT STQ x xij
i
n
j
m j
= = = −
==
∑∑ ( )2
11
 
 
tem-se: TSS x x n x xij j
i
n
j j
j
m
j
m j
= − + −
= ==
∑ ∑∑ ( ) ( )2
1
2
11
 
 
 
• soma dos quadrados dos erros ( SQER ou RSS ) 
 variação dentro das amostras dos grupos (VD) ou variação aleatória 
 
 
 SQER x xij j
i
n
j
m j
= −
==
∑∑ ( )2
11
 
 
 
• soma dos quadrados de tratamentos ( SQTR ou ESS ) 
 variação entre as amostras dos grupos ( VE ) ou variação explicada 
 
 
 SQTR n x xj j
j
m
= −
=
∑ ( )2
1
 
 UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – ESCOLA POLITÉCNICA 
 
 
DEPARTAMENTO DE ENGENHARIA INDUSTRIAL - ESTATÍSTICA APLICADA I 
TEXTO 5 - ANÁLISE DE VARIÂNCIA - Prof. André Salles 
 
 
62
 
• média da soma dos quadrados ( MSQ ) 
 
Quando a soma de quadrados é dividida pelo número de graus de liberdade, tem-se 
a variância quadrática média ou quadrado médio ( ou soma dos quadrados média -- 
“MSS” ). 
Média da soma dos quadrados entre as amostras: =
−
−
=
∑n x x
m
j j
j
m
( )2
1
1
 
 
Média da soma dos quadrados dentro das amostras: =
−
−
==
∑∑ ( )x x
N m
ij j
i
n
j
m j
2
11 
 
 
• estatística teste 
 
 variação média entre os grupos 
 ou tratamentos 
 F = 
 variação média dentro dos grupos 
 ou variação aleatória -- erro 
 
 
 
 F
n x x
m
x x
N m
calculado
j j
j
m
ij j
i
n
j
m j=
−
−
−
−
=
==
∑
∑∑
( )
( )
2
1
2
11
1 
 
 
 
 UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – ESCOLA POLITÉCNICA 
 
 
DEPARTAMENTO DE ENGENHARIA INDUSTRIAL - ESTATÍSTICA APLICADA I 
TEXTO 5 - ANÁLISE DE VARIÂNCIA - Prof. André Salles 
 
 
63
 
• valor crítico do teste 
o valor crítico do teste (ou valor tabelado) é dado pela abscissa da variável aleatória 
distribuída de acordo com a distribuição F com (m - 1) graus de liberdade no 
numerador e com (N - m) graus de liberdade no denominador. 
 
 
5.9. ANÁLISE DE VARIÂNCIA DE CLASSIFICAÇÃO DUPLA 
 ( ou DE DOIS CRITÉRIOS ) 
 
A análise de variância de dois critérios, ou de classificação dupla, permite 
testar a hipótese de igualdade das médias populacionais, através de informações 
amostrais, levando-se em consideração dois tratamentos. A análise de variância 
pode também ser utilizada levando-se em consideração mais de dois critérios, o que 
pode ser visto em textos mais avançados sobre o assunto. Cada informação 
denotada por xij indica a informação da i-ésima linha e da j-ésima coluna de uma 
tabela de dupla entrada com m níveis do primeiro tratamento ( m colunas ) e n níveis 
do segundo tratamento ( n linhas ). 
 
O MODELO 
 Xij = µ + α i + βj + ε ij 
 
Para cada observação Xij têm-se: 
1. efeito médio devido a população a que pertence (µ ) 
2. efeito do i-ésimo tratamento, específico a coluna a que pertence ( αi ) 
3. efeito do j-ésimo tratamento, específico a linha a que pertence (βj ) 
4. efeito aleatório ou erro residual (ε ij ) 
5. efeito aleatório (ε ij ) ∼ N (µ ; σ 2) 
 UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – ESCOLA POLITÉCNICA 
 
 
DEPARTAMENTO DE ENGENHARIA INDUSTRIAL - ESTATÍSTICA APLICADA I 
TEXTO 5 - ANÁLISE DE VARIÂNCIA - Prof. André Salles 
 
 
64
• soma de todas as informações: T xij
j
m
i
n
=
==
∑∑
11
 
 
• média amostral dos m grupos ou média geral ........ x
x x x
m
n
=
+ + +1 2 ....... 
 ou x
T
nm
= 
 
• variação total (VT) ou soma total dos quadrados ( STQ ou TSS) 
 
 TSS VT STQ x xij
j
m
i
n
= = = −
==
∑∑ ( )2
11
 
 
A soma total dos quadrados deve ser dividida, agora, em três parcelas, ou seja em 
três somas dequadrados de forma a se verificar as hipóteses: (i) não existe 
diferença significativa entre os níveis do primeiro tratamento, ou seja entre as 
colunas da tabela de dupla entrada; e, (ii) não existe diferença significativa entre os 
níveis do segundo tratamento, ou seja entre as linhas da tabela de dupla entrada. A 
divisão da soma total dos quadrados deve ser feita para se explicitar: a parte 
explicada pelos efeitos do primeiro tratamento, ou das colunas; a parte explicada 
pelos efeitos do segundo tratamento, ou das linhas; e a parte referente ao resíduo, 
ou erro. 
 
 SQT = SQTRlinha + SQTRcoluna + SQER 
 
 
• soma dos quadrados do primeiro tratamento -- coluna (SQTRcoluna ou ESScoluna) 
 
 SQTRcoluna n x xcolunaj
j
m
= −
=
∑( )2
1
 
 UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – ESCOLA POLITÉCNICA 
 
 
DEPARTAMENTO DE ENGENHARIA INDUSTRIAL - ESTATÍSTICA APLICADA I 
TEXTO 5 - ANÁLISE DE VARIÂNCIA - Prof. André Salles 
 
 
65
 
• soma dos quadrados do segundo tratamento -- linha (SQTRlinha ou ESSlinha) 
 
 SQTRlinha m x xlinhai
i
n
= −
=
∑( )2
1
 
 
• soma dos quadrados dos erros (SQER ou RSS) -- obtida por diferença 
 
 SQER x x x x x xij colunaj linhai
j
m
i
n
= − − − − −
==
∑∑ [( ) ( ) ( ) ]2 2 2
11
 
 
• média da soma dos quadrados (MSQ) 
 
Quando a soma de quadrados é dividida pelo número de graus de liberdade, tem-se 
a variância quadrática média ou quadrado médio ( ou soma dos quadrados média -- 
“MSS” ). 
Média da soma dos quadrados do primeiro tratamento (coluna): =
−
−
=
∑n x x
m
colunaj
j
m
( )2
1
1
 
 
Média da soma dos quadrados do segundo tratamento (linha): =
−
−
=
∑m x x
n
linhai
i
n
( )
( )
2
1
1
 
 
 
Média da soma dos quadrados dos erros : =
− −
SQER
m n( )( )1 1
 
 
 
 
 
 
 UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – ESCOLA POLITÉCNICA 
 
 
DEPARTAMENTO DE ENGENHARIA INDUSTRIAL - ESTATÍSTICA APLICADA I 
TEXTO 5 - ANÁLISE DE VARIÂNCIA - Prof. André Salles 
 
 
66
 
• estatística teste 
 
 para colunas 
 
 variação média entre os níveis do primeiro 
 tratamento ou das colunas 
 F = ou 
 variação média dentro dos grupos 
 ou variação aleatória -- erro 
 
 
 F
SQTRcoluna
m
SQER
m n
calculado =
−
− −
1
1 1( )( )
 
 
 
para linhas 
 
 variação média entre os níveis do segundo 
 tratamento ou das linhas 
 F = ou 
 variação média dentro dos grupos 
 ou variação aleatória -- erro 
 
 
 F
SQTRlinha
n
SQER
m n
calculado =
−
− −
1
1 1( )( )
 
 
 UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – ESCOLA POLITÉCNICA 
 
 
DEPARTAMENTO DE ENGENHARIA INDUSTRIAL - ESTATÍSTICA APLICADA I 
TEXTO 5 - ANÁLISE DE VARIÂNCIA - Prof. André Salles 
 
 
67
 
 
TABELA ANOVA 
 
QUADRO DE ANÁLISE DE VARIÂNCIA (QAV) 
 
 
FONTE de 
VARIAÇÃO 
 
 
 SOMA dos 
 QUADRADOS 
 
graus 
de 
liberdade 
 
QUADRADO 
MÉDIO 
 
TESTE F 
(Fcalc) 
 
 
ENTRE 
AMOSTRAS 
(COLUNAS) 
 
 
 
n x xcolunaj
j
m
( )−
=
∑ 2
1
 
 
 
 
m - 1 
 
 
n x x
m
colunaj
j
m
( )−
−
=
∑ 2
1
1
 
 (IC) 
 
 
 (IC) 
 
 (II) 
 
 
 
ENTRE 
AMOSTRAS 
(LINHAS) 
 
 
 m x xlinhai
i
n
( )−
=
∑ 2
1
 
 
 
 
n - 1 
 
 
m x x
n
linha i
i
n
( )−
−
=
∑ 2
1
1
 
 (IL) 
 
 
 (IL) 
 
 (II) 
 
 
 
DENTRO 
AMOSTRAS 
(ERRO) 
 
 
 
 SQER 
 
 
 
 (m - 1) (n - 1) 
 
 
SQER
m n( )( )− −1 1
 
 (II) 
 
 
 
TOTAL 
 
 
 
 
 
 ( )x xij
j
m
i
n
−
==
∑∑ 2
11
 
 
 
 mn - 1 
 
 
 
 
 
 
 
 UNIVERSIDADE FEDERAL DO RIO DE JANEIRO – ESCOLA POLITÉCNICA 
 
 
DEPARTAMENTO DE ENGENHARIA INDUSTRIAL - ESTATÍSTICA APLICADA I 
TEXTO 5 - ANÁLISE DE VARIÂNCIA - Prof. André Salles 
 
 
68
 
5.10. TESTE DE SCHEFFÉ 
 
Uma das limitações da ANOVA está no fato de que, não se aceitando a 
hipótese nula, não existe possibilidade de se afirmar quais colunas, no caso de 
classificação única, ou quais as linhas ou colunas, no caso de classificação dupla, 
diferem das demais. O teste desenvolvido por Scheffé pode ser utilizado para isto. 
 
No caso de classificação única se duas médias populacionais diferem tem-se 
que a distância entre suas médias amostrais deve ser maior ou igual a um 
determinado número delta dado por: 
 
 ))]1(();1[(11)1(
)1( 21
−−



+−
−
=∆ nmmFtabelado
nn
m
nm
SQER 
 
 No caso de classificação dupla: 
 
 entre colunas tem-se: 
 
 )]1)(1();1[()]1(2[
)1(
−−−
−
−
=∆ j
i
nmmFtabelado
n
m
nm
SQER 
 
 entre linhas tem-se: 
 
 ∆ =
−
−
− − −
SQER
m n
n
m
Ftabelado n m ni j j( )
[ ( )]
[( );( )( )]
1
2 1
1 1 1

Continue navegando