Análise de Variância
12 pág.

Análise de Variância

Pré-visualização1 página
1
Análise da Variância
ANOVA
Conceito
\u2022 Considere populações independentes com 
distribuição normal, nas quais precisamos 
demonstrar a significância das diferenças entre 
três ou mais médias amostrais, ou, na hipótese 
nula, que todas as médias amostrais são iguais.
\u2022 Podemos aplicar este teste também para duas 
populações.
\u2022 A comparação é feita por uma análise de 
variância acompanhada de um teste F que 
supõe que:
2
\u2013 as observações são independentes;
\u2013 as variâncias populacionais devem ser iguais 
nos g grupos;
\u2013 a distribuição das observações em cada 
grupo deve ser normal.
\u2022 Assim temos as hipóteses:
Experimento de um Fator
\u2022 As medições ou observações são obtidas 
para g grupos (tratamentos) 
independentes de amostras, onde n é o 
numero de repetições ou replicações.
\u2022 Considerando tamanhos de amostras 
iguais, n, podemos colocar as somas e as 
médias em uma tabela.
3
Experimento de um Fator
A média da amostra global, denotada por é a soma de todas as
observações divididas pelo número total de observações:
X
Para cada elemento xij podemos calcular a sua distancia à média global da forma: 
ij
x X\u2212
tomamos o quadrado da distância:
( )
2
ij
x X\u2212
somando os quadrados de todas as observações temos assim a variação total de
todas as observações:
( )
gn 2
Tot ij
i 1 j 1
SQ x X
= =
= \u2212\u2211\u2211
N
x
ng
x
g
nx
g
X
X
g
j
n
i
ij
g
j
n
i
ij
g
j
n
i
ij
g
j
j \u2211\u2211\u2211\u2211\u2211\u2211\u2211
= \u2212= \u2212= \u2212=
====
1 11 11 11
/
4
Vamos chamar de soma de quadrados dos tratamentos, SQTrat, a
variação entre tratamentos:
( ) ( )
g gn 2 2
Trat j j
j 1 i 1 j 1
SQ X X n X X
= = =
= \u2212 = \u2212\u2211\u2211 \u2211
que calcula ou mede as diferenças da média do tratamento com relação à 
média global, associada exclusivamente a um efeito dos grupos. 
E a soma de quadrados dos erros dada por:
( )
gn 2
erro ij j
i 1 j 1
SQ x X
= =
= \u2212\u2211\u2211
que calcula ou mede as variações dentro de cada grupo ou tratamento, que não é
mais do que a soma dos quadrados dos resíduos devidos exclusivamente ao erro
aleatório.
\u2211 = \u2212=
g
j jj
Sn
1
2
)1(
Quando uma soma de quadrados é dividia pelo número de seus graus de
liberdade, o resultado é chamado de variância quadrática média, assim a variância
quadrática média entre tratamentos é:
Trat
Trat
SQ
QM
g 1
=
\u2212
e a variância quadrática média dos erros, isto é dentro de cada tratamento, é:
gN
SQ
gng
SQ
QM ErroErroErro
\u2212
=
\u2212
=
5
Finalmente, definimos a estatística F como:
Trat
Erro
QM
F
QM
=
que segue uma distribuição F com g -1 graus de liberdade no numerador e N - g
graus de liberdade no denominador.
\u2022Se a hipótese nula H0 não é verdadeira (isto é, as médias dos
tratamentos não são iguais), podemos esperar que QMTrat seja maior pois
depende das médias, ao passo que QMErro não.
\u2022Assim, se esta estatística é significativamente grande, podemos concluir
que existe uma diferença significativa entre as médias dos tratamentos e
portanto, rejeitamos H0, caso contrário podemos aceitar H0.
\u2022Desta forma, com um nível de significância dado, obtemos o valor F\u3b1 com
g -1 graus de liberdade no numerador e N -g graus de liberdade no
denominador, o ponto crítico.
Região de aceitação Região de rejeição
A região crítica define-se por F > F\u3b1.
6
As somas de quadrados podem ser resumidas em uma tabela conhecida como 
tabela ANOVA:
OBS: Quando os tamanhos das amostras são diferentes, N = n1+n2+...+nj
\u2211 = \u2212=
g
j
jj
Sn1
2
)1(
\u2211 = \u2212
g
j jj
Sn
1
2
)1(
Exemplo 1: A National Computer Products, INC. (NCP) produz impressoras e
máquinas de fax em suas fábricas localizadas em Atlanta, Dallas e Seattle. Para
medir quanto os empregados dessas fábricas sabem sobre gerenciamento da
qualidade total, uma amostra aleatória de seis empregados de cada fábrica foi
selecionada e seus integrantes foram submetidos a um exame de seus
conhecimentos sobre qualidade. As notas de exame obtidas estão na tabela abaixo.
Os gerentes querem usar esses dados para testar a hipótese de que a média das
notas de exame é a mesma para todas as 3 fábricas.
Observação Fábrica 1
Atlanta
Fábrica 2
Dallas
Fábrica 3
Seattle
1 85 71 59
2 75 75 64
3 82 73 62
4 76 74 69
5 71 69 75
6 85 82 67
Solução:
H0 : µ1 = µ2 = µ3
H1 : Nem todas as médias populacionais são iguais
7
73
3
6674791
=
++
==
\u2211
=
g
X
X
g
j
j
Entre os Tratamentos
8
Dentro dos Tratamentos
Teste F calculado
9
Tabela ANOVA:
516
430
946
3-1=2
6x3-3=15
6x3-1=17
258
28,67
9
Como F>F\u3b1, rejeita-se H0.Ou seja, com 5% de significância, 
nem todas as médias nos exames são iguais.
10
Excel
11
Exemplo 2
\u2022 Um determinado departamento governamental 
está preocupado com os aumentos dos custos 
verificados no decurso de projetos de 
investigação e desenvolvimento encomendados 
aos institutos A, B, C e D. Assim, decidiu 
analisar os custos associados a diferentes 
projetos,calculando para cada um deles a razão 
entre o custo final incorrido e o custo 
inicialmente previsto.
\u2022 Os resultados apresentam-se na tabela 
seguinte:
\u2022 A questão que se coloca é a de saber se os 
quatro institutos têm um comportamento distinto 
em relação ao agravamento de custos.
\u2022 Considere \u3b1=0,05
12
\u2022 Como o F calculado é maior que o tabelado (F\u3b1=3,16) 
leva-nos à rejeição da hipótese da igualdade das médias 
(ao nível de significância 0.05), concluindo-se que os 
institutos têm comportamentos distintos no que diz 
respeito ao agravamento dos custos.