Buscar

ANOVA PARTE 1 - ESTATÍSTICA 2 - 2017/1 - PROF. RICARDO TAVARES

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 40 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 40 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 40 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Universidade Federal de Ouro PretoUniversidade Federal de Ouro Preto
Planejamento e Análise de Experimentos 
com um único fator (one-way): A 
Análise de Variância – ANOVA
Modificações realizadas em cima do material de apoio do livro do Pedro 
Alberto Barbetta / Marcelo Menezes Reis / Antonio Cezar Bornia. São 
Paulo: Atlas, 2004
Prof. Ricardo Tavares
Amostras independentesAmostras independentes
• Exemplo 1 – Considere o problema de comparar dois 
materiais (A e B), para sola de tênis, em termos do grau 
de desgaste após um certo período de uso. Seguem dois 
projetos de experimentos alternativos:
• Projeto I – Um grupo de indivíduos usa tênis com solas 
feitas com o material A; e outro grupo usa tênis com solas 
feitas com o material B. 
Amostras independentesAmostras independentes
Material BMaterial A divisão aleatória
Mensuração do grau de desgaste Mensuração do grau de desgaste
Amostras pareadas (se Amostras pareadas (se gg > 2, “em blocos”) > 2, “em blocos”)
• Exemplo 1:
• Projeto II – Fabricam-se, para a realização do experimento, pares 
de tênis com os dois tipos de sola, isto é, um dos pés com o material 
A e o outro pé com o material B. Em cada par, o material usado em 
cada pé (direito ou esquerdo) é decidido por sorteio 
Amostras pareadas (se Amostras pareadas (se gg > 2, “em blocos”) > 2, “em blocos”)
Mensuração do grau de desgaste
BA BA AB BAAB
alocação aleatória de A e B em cada par
Amostras pareadasAmostras pareadas
• Importância de considerar os pares na análise:
criança
1 2 3 4 5 ...
desgaste
material A
material B
desgaste
Amostra 3Amostra 2Amostra 1
12
10
8
6
4
2
D
ad
os
Boxplot 
Considere a comparação de três amostras
Ponto a ser discutido:Ponto a ser discutido:
• A diferença entre as três médias é apenas conseqüência 
da variação amostral? 
• A diferença entre as médias das amostras é conseqüência 
da variação amostral ou é uma evidência da diferença 
entre as médias das populações?
Comparação entre vários tratamentos.Comparação entre vários tratamentos.
Amostras independentesAmostras independentes
• Análise de variância (ANOVA), que supõe:
– as observações devem ser independentes;
– as variâncias populacionais devem ser iguais nos g grupos; e
– a distribuição das observações em cada grupo deve ser normal. 
Exemplo: Comparação de três tipos de rede.Exemplo: Comparação de três tipos de rede.
• Considere o problema de comparar 3 tipos de rede de 
computadores, C1, C2 e C3, em termos do tempo médio de 
transmissão de pacotes de dados entre duas máquinas.
• Experimento (projeto completamente aleatorizado com um 
fator): 8 replicações com cada tipo de rede, aleatorizando a ordem 
dos 24 ensaios e mantendo fixos os demais fatores controláveis.
Exemplo: Exemplo: Projeto do experimento. Projeto do experimento.
Seqüência número Uso da 
dos testes do ensaio rede
 1 16 C2
 2 14 C2
 3 24 C3
 4 6 C1
 ... ... ...
24 11 C3
ensaios de 1 a 8: C1
ensaios de 9 a 16: C2
ensaios de 17 a 24: C3
Exemplo. Dados do experimento:Exemplo. Dados do experimento:
Seqüência número Tempo de 
dos testes do ensaio Rede resposta (y)
1 16 C2 7,8
2 14 C2 8,2
3 24 C3 6,3
4 6 C1 7,2
... ... ... ...
24 11 C2 7,8
Exemplo: Perguntas a serem respondidas pela Exemplo: Perguntas a serem respondidas pela 
análise estatística.análise estatística.
• Existe diferença real (significativa) entre os 3 tipos de 
rede?
• Qual é a estimativa do tempo de resposta para cada tipo 
de rede?
Exemplo: Dados do experimentoExemplo: Dados do experimento
Tipo de rede
Replicação C1 C2 C3
1 7,2 7,8 6,3
2 9,3 8,2 6,0
3 8,7 7,1 5,3
4 8,9 8,6 5,1
5 7,6 8,7 6,2
6 7,2 8,2 5,2
7 8,8 7,1 7,2
8 8,0 7,8 6,8
Soma 65,7 63,5 48,1
Média 8,21 7,94 6,01
Modelo da ANOVAModelo da ANOVA
gg = 3 grupos = 3 grupos
tratamento
(1) (2) (3)
y11 y21 y31
y12 y22 y32
... ... ... 
y1n y2n y3n 
Média
global:
Média: .1y .2y .3y ..y
ijiij ey ++= τµ i = 1, 2, 3j = 1, 2, ..., n
observação
efeito do tratamento i
média
global
erro aleatório
= média do fator iii τµµ +=
HipótesesHipóteses
H0: τ1 = τ2 =...= τg = 0 ou µ1 = µ2 =...= µg
H1: τi ≠ 0 ou µi ≠ µj
para algum i para algum par (i, j)
 Obs.: µi= µ +τi 
ijiij ey ++= τµ ijij ey += µ
As observações
Sob H1: Sob H0:
Hipóteses e modelo subjacenteHipóteses e modelo subjacente
Sob H0: τ1 = τ2 =...= τg = 0
ijiij ey ++= τµ ijij ey += µ
Hipóteses e modelo subjacenteHipóteses e modelo subjacente
Sob H1: τi ≠ 0 para algum i
ijiij ey ++= τµ
Análise de variância (ANOVA) com um fatorAnálise de variância (ANOVA) com um fator
Tratamento
Replicação 1 2 ... g
1 y11 y21 ... yg1
2 y12 y22 ... yg2
... ... ... ... ...
n y1n y2n ... ygn
Soma y1. y2. ... yg.
Média ...
∑=
i
iyy ...
.1y .2y .gy ∑=
i
iyg
y .
1..
( )∑ ∑
= =
−=
g
i
n
j
ijTot yySQ
1 1
2
..
gl = N - 1
onde: N = ng
Soma de quadrados total: Graus de liberdade:
Análise de variância (ANOVA) com um fatorAnálise de variância (ANOVA) com um fator
Tratamento
Replicação 1 2 ... g
1 y11 y21 ... yg1
2 y12 y22 ... yg2
... ... ... ... ...
n y1n y2n ... ygn
Soma y1. y2. ... yg.
Média ...
∑=
i
iyy ...
.1y .2y .gy ∑=
i
iyg
y .
1..
gl = g - 1( ) ( )∑∑ ∑
== =
−=−=
g
i
i
g
i
n
j
iTrat yynyySQ
1
2
...
1 1
2
...
Soma de quadrados dos tratamentos: Graus de liberdade:
Análise de variância (ANOVA) com um fatorAnálise de variância (ANOVA) com um fator
Tratamento
Replicação 1 2 ... g
1 y11 y21 ... yg1
2 y12 y22 ... yg2
... ... ... ... ...
n y1n y2n ... ygn
Soma y1. y2. ... yg.
Média ...
∑=
i
iyy ...
.1y .2y .gy ∑=
i
iyg
y .
1..
gl = N - g( )∑ ∑
= =
−=
g
i
n
j
iijErro yySQ
1 1
2
.
Soma de quadrados do erro: Graus de liberdade:
Análise de variância (ANOVA) com um fatorAnálise de variância (ANOVA) com um fator
Erro
Trat
QM
QMf =Estatística do teste (possíveis valores da razão f):
Obs.: Na aula discutimos sobre os índices quase apagados!
Teste FTeste F
• Se H0: τ1 = τ2 =...= τg = 0 for verdadeira e considerando as suposições 
anteriormente enunciadas, a estatística f tem distribuição F com (g - 1) graus 
de liberdade no numerador e (N - g) graus de liberdade no denominador.
Densidade de probabilidade F
possíveis valores da estatística F, sob H 0
de
ns
id
ad
e 
de
 p
ro
ba
bi
lid
ad
e
0,00
0,25
0,50
0,75
0 1 2 3 4
f
valor p
Regra de decisão. Abordagem valor p
• p ≤ α
• p > α
rejeita H0 (prova-se 
estatisticamente H1)
aceita H0 (os dados não 
mostram evidência para afirmar 
H1)
α = nível de significância 
(probab. tolerável de se rejeitar Ho quando esta for verdadeira)
Usual: α = 0,05 = 5%
Verificação da Adequação do Modelo
• Um resíduo é definido como:
• Resíduo: A diferença entre uma observação e a média do 
tratamento correspondente.
iijij yye −=
As suposições associadas ao modelo, é feita através da analise dos resíduos:
1. Os erros tem média zero e a mesma variância sigma2;
2. Os erros são independentes, ou seja, um valor de um erro não depende 
de qualquer outro erro;
3. Os erros têm distribuição normal.
Logo, os erros são iid N(0, sigma2).
Verificação da Adequação do Modelo
• Suposição de Independência
Gráfico de Resíduos vs Ordem
• Suposição de Igualdade de Variância
Gráfico de Resíduos vs Médias dos Tratamentos
• Suposição de Normalidade 
Gráfico de Probabilidade Normal
Análise dos resíduosAnálisedos resíduos
Resíduos x fator 
C1 C2 C3
Rede
-1,5
-1,0
-0,5
0,0
0,5
1,0
1,5
R
es
íd
uo
s
Gráfico de probabilidade normal
-1 0 1
Resíduos
-3
-2
-1
0
1
2
3
V
al
or
 e
sp
er
ad
o 
pe
la
 n
or
m
al
0,01
0,05
0,15
0,35
0,55
0,75
0,95
0,99
Avaliação das suposições da ANOVA através de gráficos dos resíduos:
Suposições do Modelo
Residual
P
er
ce
nt
20100-10-20
99
90
50
10
1
Fitted Value
R
es
id
ua
l
9590858075
10
0
-10
Residual
Fr
eq
ue
nc
y
12840-4-8-12
4
3
2
1
0
Observation Order
R
es
id
ua
l
24222018161412108642
10
0
-10
Normal Probability Plot of the Residuals Residuals Versus the Fitted Values
Histogram of the Residuals Residuals Versus the Order of the Data
Residual Plots for resistencia
Estimação das médias Estimação das médias 
n
QMtyIC erroii γγµ ±= .),(
Intervalo de confiança para o valor esperado da resposta 
sob o i-ésimo tratamento (nível de conf. γ): 
C1 C2 C3
Rede
5,0
5,5
6,0
6,5
7,0
7,5
8,0
8,5
9,0
9,5
Te
m
po
 d
e 
tra
ns
m
is
sã
o
Teste F para amostras em blocosTeste F para amostras em blocos
∑∑ ==
j
j
i
i yyy ....
Tratamento
Bloco 1 2 ... g Soma
1 y11 y21 ... yg1 y.1
2 y12 y22 ... yg2 y.2
... ... ... ... ...
h y1h y2h ... ygh y.h
Soma y1. y2. ... yg.
Notação para os dados:
Teste F para amostras em blocos:Teste F para amostras em blocos:
quadro da ANOVAquadro da ANOVA
Exemplo 9.5Exemplo 9.5
• Seja o problema de comparar 3 algoritmos de busca em um banco de 
dados. Realiza-se um experimento com 6 buscas experimentais, 
sendo que em cada uma é sorteado um número aleatório que indica o 
registro do banco de dados a ser localizado. Em cada um dos 6 
processos de busca, são usados separadamente os três algoritmos em 
estudo, mas sob as mesmas condições, em termos dos fatores 
controláveis. São anotados os tempos de resposta ao usuário.
• Hipóteses:
– H0: em média, os três algoritmos são igualmente rápidos; e
– H1: em média, os três algoritmos não são igualmente rápidos 
Exemplo 9.5Exemplo 9.5
Ensaio Algoritmo de busca
(bloco) A1 A2 A3
1 8,3 8,1 9,2
2 9,4 8,9 9,8
3 9,1 9,3 9,9
4 9,9 9,6 10,3
5 8,2 8,1 8,9
6 10,9 11,2 13,1
Soma 55,8 55,2 61,2
Média 9,3 9,2 10,2
Exemplo 9.5Exemplo 9.5
Fonte da 
variação
SQ gl QM f
 Algoritmos 3,64 2 1,82 14,29
 Blocos 21,95 5 4,39
 Erro 1,27 10 0,13
Total 26,86 17
Qual é a conclusão?
ANOVA em projetos fatoriais com 2 fatoresANOVA em projetos fatoriais com 2 fatores
∑∑ ==
j
j
i
i yyy .......
Fator A
Fator B 1 2 ... g Soma
1 y111, ..., y11n y211, ..., y21n ... yg11, ..., yg1n y.1.
2 y121, ..., y12n y221, ..., y22n ... yg21, ..., yg2n y.2.
... ... ... ... ...
h y1h1, ..., y1hn y2h1, ..., y2hn ... ygh1, ..., yghn y.h.
Soma y1.. y2.. ... yg..
Notação para os dados:
ANOVA em projetos fatoriais com 2 fatoresANOVA em projetos fatoriais com 2 fatores
Exemplo 9.6Exemplo 9.6
• Considere o problema de comparar 3 topologias de rede de 
computadores (C1, C2 e C3) e 2 protocolos (L1 e L2), em termos do 
tempo de resposta ao usuário. Realizou-se um experimento com 4 
replicações em cada combinação de topologia e protocolo. Deseja-se 
verificar se há diferenças entre as topologias, entre os protocolos e 
eventual interação entre topologia e protocolo. Então, quer-se testar 
as seguintes hipóteses nulas:
– H0(A): os tempos esperados de resposta são iguais para as três topologias; 
– H0(B): os tempos esperados de resposta são iguais para os dois protocolos; 
– H0(AB): a mudança de protocolo não altera as diferenças médias do tempo 
de resposta nas três topologias (ausência de interação).
Exemplo 9.6Exemplo 9.6
Dados:
Exemplo 9.6Exemplo 9.6
ANOVA:
Quais as conclusões?
Exemplo 9.6Exemplo 9.6
C1 C2 C3
Topologia
5,0
5,5
6,0
6,5
7,0
7,5
8,0
8,5
9,0
9,5
10,0
Te
m
po
L1
L2
5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5
Valores preditos
-2,0
-1,5
-1,0
-0,5
0,0
0,5
1,0
1,5
2,0
2,5
R
es
íd
uo
s
(a) Perfil das médias (b) Análise dos resíduos
Quais as conclusões?
	Slide 1
	Slide 2
	Slide 3
	Slide 4
	Slide 5
	Slide 6
	Slide 7
	Slide 8
	Slide 9
	Slide 10
	Slide 11
	Slide 12
	Slide 13
	Slide 14
	Slide 15
	Slide 16
	Slide 17
	Slide 18
	Slide 19
	Slide 20
	Slide 21
	Slide 22
	Slide 23
	Slide 24
	Slide 25
	Slide 26
	Slide 27
	Slide 28
	Slide 29
	Slide 30
	Slide 31
	Slide 32
	Slide 33
	Slide 34
	Slide 35
	Slide 36
	Slide 37
	Slide 38
	Slide 39
	Slide 40

Outros materiais