anova2012
32 pág.

anova2012


DisciplinaEstatística Aplicada9.813 materiais83.724 seguidores
Pré-visualização2 páginas
Análise de Variância 
para um fator 
 
 
Aula: 
Análise de Médias 
Situação 1: Um estudo foi conduzido, no período de um ano, 
para acompanhar três grupos de alunos de Eng. Produção com 
excesso de peso. No primeiro grupo, aplicou-se dieta, com 
redução no consumo de calorias. No segundo, a prática de 
exercícios regularmente. No terceiro, mantiveram-se os hábitos 
alimentares e o nível de atividade física. A massa corpórea foi 
mensurada no início e no final do período. Como avaliar se há 
alguma evidência de que exista diferença na variação média da 
massa corpórea nessas três populações? 
Comparação de Vários Grupos!! 
Comparando Três Populações 
Grupo
A 
1 1,\uf06d \uf073
Grupo
B 
2 2,\uf06d \uf073
Grupo
C 
3 3,\uf06d \uf073
2
1 1,X s
2
2 2,X s
2
3 3,X s
Populações independentes e normalmente distribuídas. 
Como Comparar as 
Médias? 
Teste z ou t duas a duas: 
3 3!
3 
2 2!1!
testes
\uf0e6 \uf0f6
\uf03d \uf03d\uf0e7 \uf0f7
\uf0e8 \uf0f8
Para 3 amostras teremos: 
6 6!
15 
2 2!4!
testes
\uf0e6 \uf0f6
\uf03d \uf03d\uf0e7 \uf0f7
\uf0e8 \uf0f8
Para 6 amostras teremos: 
Problemas ... 
1) A quantidade de testes \u201cexplode\u201d, quando a quantidade de 
amostras aumenta. 
Suponha que e \uf061 = 0,05 em cada teste t. Então: 
p(conclusão correta em todos os testes) = (0,95)3 = 0,857 e 
p(rejeitar H0 em pelo menos um teste) = 1 - 0,857 = 0,143. 
Portanto, ao realizar múltiplos testes t, aumentamos a chance de 
cometer um Erro Tipo I !! 
1 2 3\uf06d \uf06d \uf06d\uf03d \uf03d
3) Uma vez que os testes são conduzidos com o mesmo 
conjunto de dados, eles não são mais todos independentes. 
2) A condução de múltiplos testes t para duas amostras, duas a 
duas, pode levar a uma conclusão incorreta! 
Deseja-se um teste para comparar as 
diversas médias, no qual a probabilidade 
de cometermos um Erro Tipo I seja igual a 
algum valor predeterminado \uf061. 
ANOVA 
Exemplo 
 Um experimento foi conduzido com a finalidade de 
verificar se existiam diferenças realmente significativas 
entre as médias destas quatro populações (A, B, C e D). 
Os dados abaixo referem-se ao valor da dureza da mola 
produzida com o aço do fornecedor ( A,B,C,D) medidas 
em HB. 
 Fornecedor de aço 
 A B C D 
 64 78 75 55 
 72 91 93 66 
 68 97 78 49 
 77 82 71 64 
 56 85 63 70 
 95 77 76 68 
Total 432 510 456 372 1770 
Média 72 85 76 62 73.75 
 
\u2022 Existe uma forte suspeita de 
que há diferença entre os 
quatro fornecedores. 
\u2022 Distribuições assimétricas. 
\u2022 Valor discrepante. 
Exemplo 
Desenho esquemático da medida de dureza das molas produzidas com o 
aço de cada fornecedor . 
ij
\u3bc
iijiij \u3b5\u3c4\u3bc\u3b5\u3bcy
i
\uf02b\uf02b\uf03d\uf02b\uf03d
\uf033\uf032\uf031
Para descrever situações como apresentado neste exemplo, adota-se um modelo do tipo: 
yij= é a j-ésima medida de dureza das molas produzidas com o aço do 
i-ésimo fornecedor. 
\uf06di é média do i-ésimo fornecedor. 
\uf06d é uma constante para todas as observações (média geral); 
\uf074i é o efeito do i-ésimo fornecedor; 
\uf065ij é o erro aleatório(erros de medida, fatores não controláveis, 
diferenças entre as unidades experimentais, etc.). 
i=1,2,...,4, 
j=1,2,...,6 
Objetivo: testar se existe diferenças entre as durezas médias do aço vendido 
pelos quatro fornecedores . 
1-1 Análise de Variância 
Hipóteses: H0: \uf06d1= \uf06d2=...= \uf06d4 = \uf06d 
 Ha: \uf06di \uf0b9 \uf06dv para pelo menos um par (i,v) sejam diferentes, (i\u2260v= 1, 2,..,4) 
10 
1-2 Análise de Variância 
Em geral 
Tabela 1-2 Dados gerais de um experimento com um único fator 
Tratamentos 
(níveis) 
Observações Totais Médias 
 
1 
 
y11 
 
y12 
 
. 
 
. 
 
. 
 
y1r 
 
y1. 
 
y1 
 
2 
 
y21 
 
y22 
 
. 
 
. 
 
. 
 
y2r 
 
y2. 
 
y2 
. 
. 
. 
. 
. 
. 
. 
. 
. 
. 
. 
. 
. 
. 
. 
. 
. 
. 
 
a 
 
ya1 
 
ya2 
 
. 
 
. 
 
. 
 
yar 
 
ya. 
 
ya 
 
 
11 
Modelo estatístico (one-way): 
ij
\u3bc
iijiij \u3b5\u3c4\u3bc\u3b5\u3bcy
i
\uf02b\uf02b\uf03d\uf02b\uf03d
\uf033\uf032\uf031
i=1,2,...,a, (tratamentos) 
j=1,2,...,r (observações) 
yij= é a j-ésima observação do i-ésimo tratamento; 
\uf06di é média do i-ésimo tratamento 
\uf06d é uma constante para todas as observações (média geral); 
\uf074i é o efeito do i-ésimo tratamento; 
\uf065ij é o erro aleatório(erros de medida, fatores não controláveis, 
diferenças entre as unidades experimentais, etc.). 
Pressuposições: 1) os erros aleatórios são independentes; 
 2) os erros aleatórios são normalmente distribuídos; 
 3) os erros aleatórios tem média 0 (zero) e variância \uf0732; 
tesindependen e );(~ 2iij Ny \uf073\uf074\uf06d \uf02b
Ou, então: 
12 
1-3 Análise de Variância 
Hipóteses: H0: \uf06d1= \uf06d2=...= \uf06da = \uf06d 
 Ha: \uf06di \uf0b9 \uf06dv para pelo menos um par (i,v) sejam diferentes 
Hipóteses: H0: \uf0741= \uf074 2=...= \uf074 a =0 
 Ha: \uf074 i \uf0b9 0 para pelo menos um i 
Equivalentemente 
13 
1-3.1 Decomposição da soma de quadrados total 
\uf028 \uf029 \uf028 \uf029 \uf028 \uf029
\uf034\uf034 \uf033\uf034\uf034 \uf032\uf031\uf034\uf034\uf033\uf034\uf034\uf032\uf031\uf034\uf034 \uf033\uf034\uf034 \uf032\uf031
ESQ
SQtratSQT
\uf0e5\uf0e5\uf0e5\uf0e5\uf0e5
\uf03d \uf03d\uf03d\uf03d \uf03d
\uf02d\uf02b\uf02d\uf03d\uf02d
a
1i
r
1j
2
i.ij
a
1i
2
..i.
a
1i
r
1j
2
..ij yyyynyy
\uf028 \uf029\uf0e5\uf0e5
\uf03d \uf03d
\uf02d\uf03d
a
1i
r
1j
2
..ij ,yySQT
A denominação de análise de variância resulta de decompor a variabilidade total dos 
dados em suas componentes. A soma de quadrado total (SQT) corrigido pela média 
global , 
usa-se como medida de variabilidade total dos dados. 
Pode-se mostrar que a soma de quadrados total pode ser expressa através da seguinte 
relação: 
14 
SQT = SQTrat + SQE 
Graus de liberdade: 
SQT tem ar-1 graus de liberdade; SQTrat tem a-1 g.l. e SQE tem a(r-1) g.l. 
Esperanças dos quadrados médios: 
E(QME) = \uf073
2 
1a
\u3c4r
\u3c3E(QMTrat)
a
1i
2
i
2
\uf02d
\uf02b\uf03d
\uf0e5
\uf03d
Teste de hipótese: 
Quadrados médios: 
1)-a(r
SQE
1
QME \uf03d\uf03d
\uf02da
SQTrat
QMTrat
QME
QMTrat
F \uf03d0
15 
1-3.2 Análise Estatística 
F0 = QMTrat / QME 
Critério para rejeição de H0: F0 > F\uf061,a-1,n-a . Pode-se usar o nível descritivo (em 
inglês: p-value: É o menor valor de \uf061 para o qual rejeitamos a hipótese nula. 
Exemplo: para \uf061=5%, assim, se o nível descritivo < do que 0,05 \uf0de rejeitar H0, 
caso contrário, \uf0de aceitar H0. 
Fórmulas para o cálculo das somas de quadrados: 
\uf0e5\uf0e5
\uf03d \uf03d
\uf02d\uf03d
a
1i
r
1j
2
..2
ij
y
ySQT
n
\uf0e5
\uf03d
\uf02d\uf03d
a
1i
2
..2
i.
y
y
1
SQTrat
nr
SQTratSQTSQE \uf02d\uf03d
16 
Tabela da análise de variância de um experimento com um fator. 
Causas de 
variação 
Soma de 
quadrados 
Graus de 
liberdade 
Quadrados 
médios 
F0 
Entre 
tratamentos 
SQTrat a-1 QMTrat QMTrat 
QME 
Erro (dentro 
tratamentos) 
SQE n-a QME 
Total SQT n-1 
 
 
n=ar 
Valor p 
 Tratamentos (fornecedores) 
 A B C D 
 64 78 75 55 a = 4 
 72 91 93 66 r = 6 
 68 97 78 49 ar = 24=n 
 77 82 71 64 
 56 85 63 70 
 95 77 76 68 
Total (yi. ) 432 510 456 372 1770 y.. 
Média 
\uf028 \uf029.iy
 72 85 76 62 73.75 
..y
 
\uf0e5
j
2
ijy
 31994 43652 35144 23402 134192 
\uf0e5
j,i
2
ijy
 
 
Exemplo: Considerando o exemplo temos: 
Exemplo 
1636130559132174
6
372456510432 2222
\uf03d\uf02d\uf03d\uf02d
\uf02b\uf02b\uf02b
\uf03d FCSQTrat
\uf028 \uf029
3654130558134192
24
1770
134192
2
\uf03d\uf02d\uf03d\uf02d\uf03d
\uf034\uf033\uf034\uf032\uf031
FC
SQT
201816363654 \uf03d\uf02d\uf03d\uf02d\uf03d SQTratSQTSQE
ou 
Análise de Variância 
Causas de Variação GL SQ QM F 
Fornecedores 
(entre fornecedores) 
3 1636 545.3 5.40
** 
Erro Experimental 
(dentro de 
fornecedores) 
20 2018 100.9 
Total 23 3654 
 
\uf028 \uf029 \uf028 \uf029 %6,13100x75,739,100100xyQMECV .. \uf03d\uf03d\uf03d
\uf028 \uf029 94,420;301. \uf03dF
**SIGNIFICATIVO A 1% 
Análise de Variância 
94.440.5
)20;3(;01.00
\uf03d\uf03e\uf03d FF
A diferença entre médias de tratamentos é significativa 
(P < 0.01) 
Rejeita-se H0 
Análise de Variância 
 CONCLUSÃO 
 
 Os fornecedores investigados se diferenciam 
em termos de medida de dureza do aço 
vendido. 
>dados=read.table(&quot;anovaplicada.txt&quot;,header=T) 
attach(dados) 
# Gráfico de boxplot 
>boxplot(dureza~fornecedor,xlab=\u201cFornecedor&quot;,ylab=\u201c Dureza&quot;) 
# Tabela de anova 
>fit= aov(dureza ~ fornecedor, dados) 
> anova(fit) 
Analysis of Variance Table 
 
Response: dureza