Buscar

Estatistica_aulas_35_36_ANOVA_Regressao

Prévia do material em texto

1EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino Prof. Paulo Renato A. Firmino -- AulasAulas 35 e 36 35 e 36 –– ANOVA ANOVA vsvs RegressãoRegressão
Estatística
Prof. Paulo Renato A. Firmino
praf62@gmail.com
Aulas 35 – 36
2EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino Prof. Paulo Renato A. Firmino -- AulasAulas 35 e 36 35 e 36 –– ANOVA ANOVA vsvs RegressãoRegressão
• Temos estudado como medir a associação entre duas variáveis 
a partir de modelos de regressão
ƒ Por exemplo, através do modelo ŷ = f(x) = a + b·x
• Os valores de a e b são provenientes de uma amostra
• Os parâmetros populacionais são α e β, onde E[Y|x]=α+β·x
• Estudamos as hipóteses H0: β=0 contra H1: β ≠ 0
– Se β=0 então não há associação linear entre X e Y
• Continuaremos neste sentido...
ƒ Reforçaremos alguns conceitos
• Como temos sempre feito ...
ƒ Introduziremos testes de hipóteses
Modelos de Regressão X Análise de Variância 
- ANOVA
2n
1i
i
n
1i
2
i
n
1i
i
n
1i
i
n
1i
ii
xxn
yxyxn
b
⎟⎟⎠
⎞⎜⎜⎝
⎛−⋅
⎟⎟⎠
⎞⎜⎜⎝
⎛⋅⎟⎟⎠
⎞⎜⎜⎝
⎛−⋅⋅
=
∑∑
∑∑∑
==
===
n
xby
xbya
n
1i
i
n
1i
i ∑∑
==
⋅−
=⋅−=
3EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino Prof. Paulo Renato A. Firmino -- AulasAulas 35 e 36 35 e 36 –– ANOVA ANOVA vsvs RegressãoRegressão
Modelos de Regressão X Análise de Variância 
- ANOVA
di=ei= mi=
A ANOVA se baseia 
nestas três diferenças 
para estudar a 
associação entre X e Y
4EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino Prof. Paulo Renato A. Firmino -- AulasAulas 35 e 36 35 e 36 –– ANOVA ANOVA vsvs RegressãoRegressão
• ... Ocorre que di = ei + mi:
• ... e que
Modelos de Regressão X Análise de Variância 
- ANOVA
)yyˆ()yˆy(yy iiii −+−=−
( ) ( ) ( )∑∑∑
===
−+−=−
n
1i
2
i
n
1i
2
ii
n
1i
2
i yyˆyˆyyy
Soma de Quadrados 
Total (SQT)
Soma de Quadrados 
dos Erros (SQE)
Soma de Quadrados 
da Regressão (SQR)
Veja que 
S2Y = SQT/ (n-1)
Veja que 
S2e = SQE/ (n-2)
5EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino Prof. Paulo Renato A. Firmino -- AulasAulas 35 e 36 35 e 36 –– ANOVA ANOVA vsvs RegressãoRegressão
• As medidas de dispersão SQT, SQE e SQR são denominadas 
fontes de variação da variável resposta Y
ƒ A questão central sobre o modelo ŷ = f(x) = a + b·x é
1. Quanto da variação de Y é explicada pelo modelo?
• Se o modelo é bom (erra “pouco”), SQE → 0 e SQT → SQR
• Se o modelo não é bom (erra “muito”), SQT → SQE
– Os erros aleatórios representam as variações de Y não captadas 
pelo modelo (yi = f(xi) + ei)
Modelos de Regressão X ANOVA
Fontes de variação
( )∑
=
−=
n
1i
2
i yySQT ( )∑
=
−=
n
1i
2
ii yˆySQE ( )∑
=
−=
n
1i
2
i yyˆSQR
SQT = SQE + SQR
6EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino Prof. Paulo Renato A. Firmino -- AulasAulas 35 e 36 35 e 36 –– ANOVA ANOVA vsvs RegressãoRegressão
• Coeficiente de explicação (determinação) do modelo
ƒ Mede quanto da variação de Y, o modelo ŷ = f(x) = a + b·x é
capaz de captar (explicar)
ƒ R2 = 1 – SQE/SQT = SQR/SQT
• 100·(R2)% da variação de Y é captada pelo modelo
Modelos de Regressão X ANOVA
Fontes de variação
( )∑
=
−=
n
1i
2
i yySQT ( )∑
=
−=
n
1i
2
ii yˆySQE ( )∑
=
−=
n
1i
2
i yyˆSQR
SQT = SQE + SQR
SQT = 1004.5
SQE
20%SQR
80%
7EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino Prof. Paulo Renato A. Firmino -- AulasAulas 35 e 36 35 e 36 –– ANOVA ANOVA vsvs RegressãoRegressão
• Outras formulações para SQT, SQE e SQR
Modelos de Regressão X ANOVA
Fontes de variação
( )
n
y
yyySQT
2n
1i
in
1i
2
i
n
1i
2
i
⎟⎟⎠
⎞⎜⎜⎝
⎛
−=−=
∑∑∑ =
==
( ) ∑∑∑∑
====
⋅⋅−⋅−=−=
n
1i
ii
n
1i
i
n
1i
2
i
n
1i
2
ii yxbyayyˆySQE
( ) SQESQTyyˆSQR n
1i
2
i −=−= ∑
=
2n
1i
i
n
1i
2
i
n
1i
i
n
1i
i
n
1i
ii
xxn
yxyxn
b
⎟⎟⎠
⎞⎜⎜⎝
⎛−⋅
⎟⎟⎠
⎞⎜⎜⎝
⎛⋅⎟⎟⎠
⎞⎜⎜⎝
⎛−⋅⋅
=
∑∑
∑∑∑
==
===
n
xby
xbya
n
1i
i
n
1i
i ∑∑
==
⋅−
=⋅−=
8EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino Prof. Paulo Renato A. Firmino -- AulasAulas 35 e 36 35 e 36 –– ANOVA ANOVA vsvs RegressãoRegressão
• Cada fonte de variação está associada a certo nº de graus de 
liberdade
ƒ Aqueles mesmos graus de liberdade (gl) relacionados com as 
distribuições t-Student e Qui-quadrado
ƒ Basicamente, tem-se n gl para SQT e SQE
• Contudo, perde-se 1 gl por parâmetro estimado
• Para , estima-se μY: tem-se (n-1) gl
• Para , estimam-se α e β: tem-se (n-2) gl
ƒ Como os gl da SQT são distribuídos na SQE e SQR,
• Para , tem-se (n-1)-(n-2) = 1 gl
Modelo de Regressão X ANOVA
Graus de Liberdade
( )∑
=
−=
n
1i
2
i yySQT
( )∑
=
−=
n
1i
2
ii yˆySQE
( )∑
=
−=
n
1i
2
i yyˆSQR
9EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino Prof. Paulo Renato A. Firmino -- AulasAulas 35 e 36 35 e 36 –– ANOVA ANOVA vsvs RegressãoRegressão
• Tabela ANOVA
• fobs provem de uma distribuição F-Snedecor com v1=1 gl e v2=(n-2) gl
ƒ A regra de decisão recorre, agora, à FS(1, n-2)
ƒ Rejeitar a hipótese nula significa considerar que o modelo de 
regressão é significativamente superior a uma simples média.
Modelo de Regressão X ANOVA
QMT = SQT/(n-1) = 
Sy2
n-1Total
QME = SQE/(n-2)n-2Erro
QMR = SQTr/11Regressão
fobsQuadrado médio
Soma de 
quadrados
Graus de 
liberdade
Fonte de 
variação
QME
QMR
( )∑
=
−=
n
1i
2
i yySQT
( )∑
=
−=
n
1i
2
ii yˆySQE
( )∑
=
−=
n
1i
2
i yyˆSQR
anova(lm)
10EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino Prof. Paulo Renato A. Firmino -- AulasAulas 35 e 36 35 e 36 –– ANOVA ANOVA vsvs RegressãoRegressão
1. A reta que melhor representa a 
associação entre a quantidade 
consumida de dado fruto em mg (X) e 
a incidência de abortos em vacas (Y), 
de acordo com os dados ao lado, é dada 
por ŷ = f(x) = 1 + 0.5·x. (a) Quanto da 
variação de Y, o modelo é capaz de 
captar? (b) O modelo é relevante, sob 
um nível de significância de 1%?
2. No problema acima, se para o 3º grupo, 
o nº de abortos fosse 2 (ao invés de 1):
a. Qual seria o modelo?
b. Quanto da variação de Y, o 
modelo seria capaz de captar?
Modelos de Regressão X ANOVA
Exercício 1
13151476Soma
999334
214123
241212
010101
xiyiyi2xi2
Nº de 
aborto (yi)
Exposição
em mg 
(xi)
Grupo
(i)
11EstatEstatíísticastica-- Prof. Paulo Renato A. Firmino Prof. Paulo Renato A. Firmino -- AulasAulas 35 e 36 35 e 36 –– ANOVA ANOVA vsvs RegressãoRegressão
Modelos de Regressão X ANOVA
Exercício 1
3. A seguir apresenta-se a série de precipitações de chuva de uma dada localidade, ao 
longo de algumas semanas, em unidades de 10 ml (xt). (a) Construa um modelo 
linear que permita estimar a precipitação na semana t (xt) a partir da precipitação 
observada na semana anterior (xt-1). Trata-se de um modelo auto-regressivo. (b) 
Interprete o coeficiente de determinação do seu modelo. (c) Verifique, via gráfico 
de pares e teste de ANOVA, se os resíduos são independentes das precipitações 
observadas.
17.713.210.69.56.66.76.63.66.34.1Precipitação em unidades de 10 ml (xt)
10987654321Dia (t)

Continue navegando