Buscar

Regressão II

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 56 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 56 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 56 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

ANÁLISE DE REGRESSÃO 
- Regressão Linear Múltipla - 
(II) 
1 
Exemplo 4: Insulina em coelhos 
Num experimento foram aplicadas doses diferentes de insulina 
em coelhos e foram observadas quedas na quantidade de açúcar 
no sangue (variável Y) depois de um determinado tempo. Nesse 
tipo de experimento, é usual estudar a relação entre a queda de 
açúcar e o logaritmo da dose de insulina (variável X). 
2 
3 
Exemplo 4: Insulina em coelhos 
Modelo Não-Linear 
• Um modelo que pode ser adequado é 
yi = e
 xii, i=1, ..., n. 
 
 yi*=* +  xi + i* 
• Observe que podemos tomar o logaritmo: 
ln(yi ) = ln ( e
 xii) 
 = ln () + xi + ln(i) 
• Considerando 
• yi*=ln(yi) 
• *=ln() 
• i*=ln(i) 
 
4 
Dados: 
n=32 
xi=15,27 
xi
2=8,80 
yi*=59,65 
yi*
2=117,56 
 xi yi*=31,55 
 
5 
Exemplo 4: Insulina em coelhos 
04,2
5133,1
0858,3
32
27,15
3280,8
32
65,59
32
27,15
3255,31
ˆ
2
2
1
2
1
**

















xnx
yxnyx
n
i
i
n
i
ii

89,0
32
27,15
04,2
32
65,59ˆˆ **  xy 
iii xxy 04,289,0
ˆˆˆ **  
369,6
32
65,59
3256,117)(
2
*
1
*
1
2** 22 





 

ynyyySQT
n
i
i
n
i
i
298,65133,104,2)(ˆ 2
n
1i
22  

xxSQReg i
As hipóteses de interesse são: 
 H0:  = 0 
H1:  ≠ 0 
6 
Exemplo 4: Insulina em coelhos 
99,0
369,6
298,62 
SQT
RegSQ
R
Fonte de variação gl SQ MQ F Valor P 
Regressão 1 6,298 6,298 3149,000 0,000 
Resíduo 30 0,071 0,002 
Total 31 6,369 
RC = {F > 4,17}, obtido da tabela F(1;30) com  = 5%. 
Conclusão: rejeitamos H0. 
7 
Exemplo 4: Insulina em coelhos 
ANOVA 
8 
Exemplo 4: Insulina em coelhos 
 Um pesquisador deseja avaliar resistência de containeres de 
plástico. Mais precisamente, deseja verificar se a pressão 
exercida sobre o plástico no processo de produção do plástico 
tem algum efeito na resistência do container. 
 Para avaliar isso, foi feito um estudo em que containeres foram 
produzidos sob diferentes pressões (em libras por polegadas ao 
quadrado). Foram produzidos n=1650 containeres. 
 Para cada container, a resistência foi medida de alguma 
maneira apropriada. 
 
 
 
 
 
 
Exemplo 5: Containeres 
9 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Item 
Resistência 
do plástico 
Pressão 
1 30,7 16 
2 24,7 18 
3 30,6 16 
4 32,8 10 
5 20,7 20 
6 34,5 16 
7 41,9 12 
8 36,4 12 
9 22,2 12 
10 20,7 14 
: : : 
: : : 
1640 28,6 18 
1641 30,1 16 
1642 46,5 12 
1643 34,6 18 
1644 38,6 12 
1645 28,6 14 
1646 32,5 20 
1647 38,6 14 
1648 39,7 12 
1649 14,6 20 
1650 19,8 20 
 
10 12 14 16 18 20
20
30
40
50
Diagrama de dispersão
Pressão
Re
sis
tê
nc
ia
Dados (n= 1650) 
10 
Exemplo 5: Containeres 
INTERPRETAÇÃO DOS PARÂMETROS: 
 
 0: resistência média do container quando a pressão é 0. 
 1: aumento/decréscimo médio resistência média, quando a 
pressão aumenta 1 unidade. 
 ei: erro aleatório. 
11 
SUPOSIÇÕES: 
 ei ~ N (0,
2), independentes. 
 Essa suposição é equivalente a supor yi ~N(0 + 1 xi , 
2), 
independentes; 
 
 
Exemplo 5: Containeres 
MODELO UTILIZADO: 
yi =0 + 1 xi + ei, i =1, ..., n. 
 
 yi: resistência do container de plástico 
 xi:pressão sobre o plástico 
R2= 0,2137 
 
 
12 
Fonte de variação gl SQ QM F Valor P 
Regressão 1 19250 19250 448,0069593 < 0,0001 
Resíduo 1648 70811,4 42,9681 
Total 1649 90061,4 
 
Coeficientes 
estimados 
Erro 
padrão 
Stat t valor-P 
95% 
inferiores 
95% 
superiores 
Intercepto 55,00 0,7268 61,9136 0,0000 53,5744 56,4256 
Pressão ( libras) -1,00 0,0472 -21,1662 0,0000 -1,0927 -0,9073 
ANOVA 
Exemplo 5: Containeres 
Podemos construir o diagrama de dispersão com a reta 
ajustada: 
 
 
 
 
 
 
 
 
 
 
 
10 12 14 16 18 20
20
30
40
50
Diagrama de dispersão
Pressão
Re
sis
tên
cia
13 
Exemplo 5: Containeres 
 
10 12 14 16 18 20
-2
-1
0
1
2
Resíduos estudentizados
Pressão
Re
síd
uo
s
26 28 30 32 34
-2
-1
0
1
2
Resíduos estudentizados
Valores previstos
Re
síd
uo
s
14 
Exemplo 5: Containeres 
 Suponha que agora o pesquisador deseja verificar a influência 
da temperatura durante o processo de fabricação na resistência 
do container. 
 
 
 
 
 
 
 
 
 
 
200 220 240 260 280 300
20
30
40
50
Diagrama de dispersão
Temperatura
Re
sis
tê
nc
ia
15 
Exemplo 5: Containeres 
 
 
 
 
 
 
 
 
 
 
 
 
 MODELO UTILIZADO: 
yi =0 + 1 xi + ei, i =1, ..., n. 
 
 yi: resistência do container de plástico 
 xi: temperatura do processo de fabricação 
Resultados: 
 
 
 
 
 
 
 
 
 16 
Fonte de variação gl SQ QM F Valor P 
Regressão 1 66000 66000 4520,435 0,0000 
Resíduo 1648 24061,4 14,60036 
Total 1649 90061,4 
 
Coeficientes 
estimados 
Erro 
padrão 
Stat t valor-P 
95% 
inferiores 
95% 
superiores 
Intercepto -20,00 0,7496 -26,6811 0,0000 -21,4703 -18,5297 
Temperatura (0 C) 0,20 0,0030 67,2342 0,0000 0,1942 0,2058 
ANOVA 
R2= 0,7328 
 
 
Exemplo 5: Containeres 
200 220 240 260 280 300
20
30
40
50
Diagrama de dispersão
Temperatura
Re
sis
tê
nc
ia
17 
Exemplo 5: Containeres 
 
 
 
 
 
 
 
 
 
 
 
 
200 220 240 260 280 300
-2
-1
0
1
2
Resíduos estudentizados
Temperatura
Re
síd
uo
s
20 25 30 35 40
-2
-1
0
1
2
Resíduos estudentizados
Valores previstos
Re
síd
uo
s
18 
Exemplo 5: Containeres 
 Será possível considerar um modelo contendo tanto a 
pressão quanto a temperatura? 
 O modelo de regressão linear pode ser escrito na forma: 
 yi =0 + 1 x1i + 2 x2i+ ei, i = 1, ..., n. 
 Observe que, para cada indivíduo ou unidade amostral, 
observamos (yi, x1i, x2i). 
No exemplo, x1: temperatura, x2: pressão 
 PARÂMETROS 
 0: INTERCEPTO 
 1: INCLINAÇÃO ASSOCIADA A X1 
 2: INCLINAÇÃO ASSOCIADA A X2 
 ERRO: ei . 
19 
REGRESSÃO LINEAR MÚLTIPLA 
INTERPRETAÇÃO DOS PARÂMETROS: 
 
 0: valor médio da variável resposta Y quando X1= 0 e X2 = 0. 
 1: aumento/decréscimo médio no valor de Y, quando X1 
aumenta de 1 unidade, mantendo-se X2 constante. 
 2: aumento/decréscimo médio no valor de Y, quando X2 
aumenta de 1 unidade, mantendo-se X1 constante. 
20 
 Sendo os coeficientes 0, 1 e 2 desconhecidos, é 
necessário estimá-los e testar hipóteses de interesse. 
REGRESSÃO LINEAR MÚLTIPLA 
SUPOSIÇÕES 
 ei ~ N(0, 
2) independentes. 
 Essa suposição é equivalente a supor 
 yi ~ N(0 + 1 x1i+ 2 x2i; 
2 ) independentes; 
 ESTIMAÇÃO DOS PARÂMETROS 
Utiliza-se o Método de Mínimos Quadrados. 
 Método de Mínimos Quadrados: encontra estimadores 
de 0, 1 e 2 que minimizam a soma do quadrado dos erros: 



n
i
iii
n
i
i xxye
1
2
22110
1
2 )( 
21 
REGRESSÃO LINEAR MÚLTIPLA 
OBS.: R2= 0,9465 
22 
Fonte de variação gl SQ QM F Valor P 
Regressão 2 85250 42625 14591,05 0,0000 
Resíduo 1647 4811,4 2,921311 
Total 1649 90061,4 
 
Coeficientes 
estimados 
Erro 
padrão 
Stat t valor-P 
95% 
inferiores 
95% 
superiores 
Intercepto -5,00 0,3828 -13,06010,0000 -5,7509 -4,2491 
Temperatura (0 C) 0,20 0,0013 150,3083 0,0000 0,1974 0,2026 
Pressão (libras) -1,00 0,0123 -81,1758 0,0000 -1,0242 -0,9758 
ANOVA 
Exemplo 5: Containeres 
Hipótese da ANOVA 
 O teste F da ANOVA, neste caso, testa as hipóteses 
 H0: 1 = 0 e 2 = 0 
 H1: 1 ≠ 0 ou 2 ≠ 0 
23 
Os testes t, neste caso, testam a hipótese nula de que 
cada parâmetro é igual a zero, individualmente. 
Análise de resíduos é também realizada. 
REGRESSÃO LINEAR MÚLTIPLA 
200 220 240 260 280 300
-2
-1
0
1
2
3
Resíduos
Temperatura
Re
síd
uo
s
10 12 14 16 18 20
-2
-1
0
1
2
3
Resíduos
Pressão
Re
síd
uo
s
200 220 240 260 280 300
-1
0
1
2
Resíduos estudentizados
Temperatura
Re
síd
uo
s
10 12 14 16 18 20
-1
0
1
2
Resíduos estudentizados
Pressão
Re
síd
uo
s
24 
Exemplo 5: Containeres 
Indivíduo Y X1 X2 . . . Xk 
1 Y1 X11 X21 . . . Xk1 
2 Y2 X12 X22 . . . Xk2 
3 Y3 X13 X23 . . . Xk3 
. . . . . . 
. . . . . . 
. . . . . . 
n Yn X1n X2n . . . Xkn 
Dados: 
Admitimos que X1, X2, ..., Xk são as variáveis independentes 
fixas (variáveis preditoras ou explicativas) e Y variável 
dependente, aleatória (variável resposta). 
O modelo de regressão linear múltipla será: 
 
yi = 0 + 1x1i + 2x2i + ... + kxki + i , 
 
i = 1, 2, ..., n, com n > k +1. 
25 
REGRESSÃO LINEAR MÚLTIPLA 
y1 = 0 + 1x11 + 2x21 + ... + kxk1 + 1, 
y2 = 0 + 1x12 + 2x22 + ... + kxk2 + 2, 
. 
. 
. 
yn = 0 + 1x1n + 2x2n + ... + kxkn + n. 
26 
Assim, 
. 
1
1
1
 ... 
 ... 
 ... 
2
1
21
22212
12111
2
1
110
21210
11110
2
1
1
0
 



















































































































































nknnn
k
k
nknkn
kk
kk
n
kxxx
xx
xx












x
x
xx
xx
xx
y
y
y
Matricialmente, escrevemos 
REGRESSÃO LINEAR MÚLTIPLA 
27 
.matrizdalinhaésimaaée XXε
βXY






































































































ixxx
xxx
xxx
xxx
y
y
y
kiii
k
í
n
n
k
k
knnn
k
k
kn
n
n
) ... 1( e 
 , , 
1
1
1
 , 
21
))1(1(
'
2
1
1)(
1
0
1)1)((
21
22212
12111
1))((
2
1
)1(






,   XY
Utilizando notação matricial, o modelo de regressão linear 
múltipla pode ser escrito por 
 A matriz X é denominada matriz de planejamento 
ou matriz desenho. 
REGRESSÃO LINEAR MÚLTIPLA 
28 
SUPOSIÇÃO 
i ~ N (0,
2), independentes, i = 1, ..., n. 
 
que é equivalente a supor 
yi ~ N (0 + 1x1i + 2x2i + ... + kxki , 
2 ), independentes. 
ESTIMAÇÃO DOS PARÂMETROS 
Utiliza-se método de mínimos quadrados para estimar os 
parâmetros de interesse. 
 
Método de Mínimos Quadrados: encontra estimadores de 0, 
1, 2, ... , k que minimizam a soma do quadrado dos erros: 
 
).()( 
)]...(-[ ∑∑
1
2
22110
1
2
Xβ-YXβ-Y' '




n
i
kikiii
n
i
i XXXy
REGRESSÃO LINEAR MÚLTIPLA 
Estimador de mínimos quadrados: 
29 
 
ˆ
ˆ
ˆ
)(ˆ 
1
0
1-






















k


YXXXβ ''
Os valores ajustados ficam dados por: 
.ˆ ... ˆˆˆ 110 kikii xxy  
Interpretação de : 
jˆ
Para cada aumento de uma unidade em Xj, temos um aumento 
médio (ou esperado) de unidades em Y, mantendo-se fixados 
os valores de X1, X2, ..., Xj-1, Xj+1, ..., Xk. 
jˆ
REGRESSÃO LINEAR MÚLTIPLA 
30 
REGRESSÃO LINEAR MÚLTIPLA 
TESTE CONJUNTO PARA 1, 2 , ..., k 
Em geral uma hipótese de interesse é 
 H0: 1 = 2 = . . . = k = 0 
 H1: Algum j , j = 1, ..., k, é diferente de zero. 
 
 
 
 
 
 
 
 
 
 
 A estatística de teste das hipóteses acima é obtida na tabela de 
análise de variância: 
Fonte de Variação g.l. 
Soma de 
Quadrados 
Quadrado Médio Teste F 
Regressão k SQReg QMReg = SQReg/ k QMReg/QMRes 
Resíduo n – (k +1) SQRes QMRes = SQRes/(n – (k +1)) = Se
2 
Total n -1 SQT 
 ANOVA 
31 
SQTot
SQRes
SQTot
SQReg
R  12
Definimos o coeficiente de explicação: 
• 0  R2 1. 
• Quanto menor o valor de R2, mais evidências há de que o 
modelo não é adequado. 
REGRESSÃO LINEAR MÚLTIPLA 
Desvantagem do R2: sempre aumenta quando acrescentamos 
variáveis no modelo, mesmo quando a variável não é importante. 
)1-/(
)]1(/[
12
nSQT
knSQRes
R


Alternativa: R2 ajustado 
INTERVALOS DE CONFIANÇA E TESTES DE HIPÓTESES PARA j 
32 
Resultado: 
 ,ˆ 2 jjjj a;N~





























kkkk
k
k
aaa
aaa
aaa
10
11110
00100
1-)( XX '
sendo ajj o elemento jj da matriz 
sQM
T
jj
jj
Re
-ˆ )0(
a


Pode-se ter interesse em testar 
Estatística de teste: 
 
 
 
 
 
 
 
 
Sob H0, T tem distribuição t de student com (n-(k+1)) graus de liberdade. 
A RC é dada por: RC = {T: T ≤ -tc ou T ≥ tc}. 
 
 
 
 
 
H0: j = j
(0) 
H1:  j ≠ j
(0) 
 jjjjjj aQMRestaQMRest ˆ; ˆ   
 Intervalo de confiança para j, com nível de confiança  = 1-: 
 
REGRESSÃO LINEAR MÚLTIPLA 
Definimos 
 RESÍDUO: 
RESÍDUOS 
33 
Os erros são dados por 
 ei = yi - 0 - 1 x1i - ... - k xki , i =1, ..., n. 
 
...., ,1 , ˆ ˆˆˆ 110 nixxye ikkiii   
e
i
i
S
e
z
ˆ
ˆ 
iie
i
i
S
e
r


1
ˆ
ˆ
em que ii é o elemento (i,i) da matriz H=X(X´X)
-1X´. 
 RESÍDUO PADRONIZADO: 
 RESÍDUO ESTUDENTIZADO: 
34 
RESÍDUOS 
Espera-se que em torno de 95% dos resíduos 
padronizados/estudentizados estejam entre os limites –2 e 2. 
 
Gráficos: 
 
 - Resíduos (padronizados ou estudentizados) versus valores 
ajustados; 
 
 - Resíduos (padronizados ou estudentizados) versus cada uma das 
variáveis Xj. 
 
 
 
Exemplo 6: Avaliação de residências 
Para fins de cálculo do valor de imposto territorial, o governo obteve 
uma amostra de 30 residências unifamiliares de um município 
localizado próximo à cidade de Nova York. As variáveis observadas 
foram: 
- Valor de avaliação, em 2002 (Y), em unidades monetárias; 
- Área do terreno , em acres (X1); 
- Espaço interno, em pés2 (X2); 
- Idade (tempo de construção), em anos (X3); 
- Número de cômodos (X4); 
- Número de banheiros (X5); 
- Número de automóveis que cabem na garagem (X6). 
 
O governo deseja criar um modelo para prever o valorde avaliação 
de imóveis com base em suas características. 
 
35 
Modelo completo: 
yi =0 + 1 x1i + 2 x2i + 3 x3i + 4 x4i + 5 x5i + 6 x6i + ei, i = 1, ..., 30. 
36 
Fonte de variação gl SQ QM F Valor P 
Regressão 6 357886,34 59647,72 21,97878 1,87862E-08 
Resíduo 23 62419,20 2713,878 
Total 29 420305,54 
Região Crítica: 
RC = {F: F ≥ fc}, em que fc é obtido da tabela F(6; 23). Com 5% de 
significância, fc = 2,528. 
Como Fobs > fc ,rejeita-se H0, ou seja, pelo menos um dos coeficientes 
não é nulo. 
 
Hipóteses: 
H0: 1 = 2 = . . . = 6 = 0 
H1: Algum j , j = 1, ..., 6, é diferente de zero. 
 
 
 
 
Exemplo 6: Avaliação de residências 
37 
R-quadrado 0,8515 
R-quadrado ajustado 0,8127 
Erro padrão 52,0949 
Observações 30 
 
Coeficientes 
estimados 
Erro 
padrão 
Stat t valor-P 
95% 
inferiores 
95% 
superiores 
Intercepto 71,99 65,393 1,101 0,2823 -63,28 207,27 
Tamanho da Propriedade 301,61 79,959 3,772 0,0010 136,20 467,02 
Tamanho da Casa 0,09 0,028 3,312 0,0030 0,04 0,15 
Idade -1,19 0,535 -2,224 0,0362 -2,30 -0,08 
Cômodos 11,02 7,447 1,480 0,1525 -4,38 26,43 
Banheiros 14,82 16,805 0,882 0,3871 -19,95 49,58 
Garagem 13,40 16,787 0,798 0,4330 -21,33 48,12 
Exemplo 6: Avaliação de residências 
38 
Excluindo-se a variável Garagem: 
Fonte de variação gl SQ MQ F Valor P 
Regressão 5 356158 71231,59 26,65 4,61298E-09 
Resíduo 24 64147,58 2672,816 
Total 29 420305,5 
 
Coeficientes 
estimados 
Erro 
padrão 
Stat t valor-P 
95% 
inferiores 
95% 
superiores 
Intercepto 74,57 64,817 1,151 0,2613 -59,20 208,35 
Tamanho da Propriedade 305,23 79,224 3,853 0,0008 141,72 468,74 
Tamanho da Casa 0,10 0,027 3,803 0,0009 0,05 0,16 
Idade -1,31 0,509 -2,577 0,0166 -2,36 -0,26 
Cômodos 9,89 7,255 1,363 0,1855 -5,09 24,86 
Banheiros 17,93 16,220 1,106 0,2799 -15,54 51,41 
R-quadrado 0,8474 
R-quadrado ajustado 0,8156 
Concl. ? 
Concl. ? 
Exemplo 6: Avaliação de residências 
39 
Excluindo-se a variável Banheiros: 
Fonte de variação gl SQ MQ F Valor P 
Regressão 4 352890,9 88222,72 32,72 1,33E-09 
Resíduo 25 67414,67 2696,59 
Total 29 420305,5 
 
Coeficientes 
estimados 
Erro 
padrão 
Stat t valor-P 
95% 
inferiores 
95% 
superiores 
Intercepto 102,96 59,780 1,722 0,0974 -20,16 226,08 
Tamanho da Propriedade 287,36 77,902 3,689 0,0011 126,92 447,80 
Tamanho da Casa 0,12 0,023 5,027 0,0000 0,07 0,16 
Idade -1,51 0,479 -3,151 0,0042 -2,49 -0,52 
Cômodos 9,03 7,246 1,247 0,2240 -5,89 23,96 
R-quadrado 0,8396 
R-quadrado ajustado 0,8139 
Exemplo 6: Avaliação de residências 
40 
Excluindo-se a variável Cômodos: 
Fonte de variação gl SQ MQ F Valor P 
Regressão 3 348699 116233 42,20 3,91E-10 
Resíduo 26 71606,53 2754,10 
Total 29 420305,5 
 
Coeficientes 
estimados 
Erro 
padrão 
Stat t valor-P 
95% 
inferiores 
95% 
superiores 
Intercepto 136,79 53,830 2,541 0,0174 26,15 247,44 
Tamanho da Propriedade 276,09 78,196 3,531 0,0016 115,35 436,82 
Tamanho da Casa 0,13 0,021 6,157 0,0000 0,09 0,17 
Idade -1,40 0,476 -2,942 0,0068 -2,38 -0,42 
R-quadrado 0,8296 
R-quadrado ajustado 0,8100 
 Todos coeficientes significantes a 5 %. 
Exemplo 6: Avaliação de residências 
41 
-2,5
-2
-1,5
-1
-0,5
0
0,5
1
1,5
2
2,5
0 100 200 300 400 500 600 700
Re
síd
uo
 p
ad
ro
ni
za
do
Valor Ajustado
Gráfico de resíduos padronizados 
-2,5
-2
-1,5
-1
-0,5
0
0,5
1
1,5
2
2,5
0,0000 0,1000 0,2000 0,3000 0,4000 0,5000 0,6000 0,7000
Re
síd
uo
 p
ad
ro
ni
za
do
Tamanho da propriedade
Gráfico de resíduos padronizados 
-2,5
-2
-1,5
-1
-0,5
0
0,5
1
1,5
2
2,5
0 500 1000 1500 2000 2500 3000 3500
Re
síd
uo
 p
ad
ro
ni
za
do
Tamanho da casa
Gráfico de resíduos padronizados 
-2,5
-2
-1,5
-1
-0,5
0
0,5
1
1,5
2
2,5
0 20 40 60 80 100 120
Re
síd
uo
 p
ad
ro
ni
za
do
Idade
Gráfico de resíduos padronizados 
Exemplo 6: Avaliação de residências 
42 
Exemplo 6: Avaliação de residências 
43 
Modelo final ajustado: 
 
321 40,113,0 09,27679,136ˆ xxxy 
Interpretação: 
- Para cada aumento de 1 acre no tamanho da propriedade, o 
valor de avaliação aumenta, em média, 276,09 u.m., mantendo-
se fixados os valores das demais variáveis. 
- Para cada aumento de 1 pé2 no espaço interno da casa, o 
valor de avaliação aumenta, em média, 0,13 u.m., mantendo-se 
fixados os valores das demais variáveis. 
- Para cada aumento de 1 ano na idade da casa, o valor de 
avaliação diminui, em média, 1,40 u.m., mantendo-se fixados os 
valores das demais variáveis. 
 
Nota: 1 acre = 4046,85 m2 
 1 pé2 = 0,09 m2 
Exemplo 6: Avaliação de residências 
Considere os dados relativos a 
preço (em dólar), comprimento 
(em metros) e capacidade do 
motor (em cv) de veículos 
vendidos no Brasil, classificados 
em duas categorias: 
N(nacionais) e I (importados). 
 
44 
Exemplo 7: Automóveis 
Veículo Preço Comprimento Motor N/I 
Asia Towner 9440 3,36 40 I 
Audi A3 38850 4,15 125 I 
Chevrolet Astra 10532 4,11 110 N 
Chevrolet Blazer 16346 4,6 106 N 
Chevrolet Corsa 6176 3,73 60 N 
Chevrolet Tigra 12890 3,92 100 I 
Chevrolet Vectra 13140 4,47 110 N 
Chrysler Neon 31640 4,36 115 I 
Dodge Dakota 11630 4,98 121 N 
Fiat Fiorino 6700 4,16 76 N 
Fiat Marea 12923 4,39 127 N 
Fiat Mille 5257 3,64 57 N 
Fiat Palio 6260 3,73 61 N 
Fiat Siena 7780 4,1 61 I 
Ford Fiesta 6316 3,83 52 N 
Ford Ka 5680 3,62 54 N 
Ford Mondeo 33718 4,56 130 I 
Honda Civic 14460 4,45 106 N 
Hyundai Accent 21500 4,12 91 I 
Peugeot 106 13840 3,68 50 I 
Renault Clio 13700 3,7 74 I 
Toyota Corolla 15520 4,39 116 N 
VW Gol 6340 3,81 54 N 
VW Golf 22200 4,15 100 I 
VW Parati 9300 4,08 69 N 
VW Polo 12018 4,14 99 I 
VW Santana 11386 4,57 101 N 
VW Saveiro 7742 4,38 88 N 
N/I 
0 
0 
1 
1 
1 
0 
1 
0 
1 
1 
1 
1 
1 
0 
1 
1 
0 
1 
0 
0 
0 
1 
1 
0 
1 
0 
1 
1 
45 
Corr (Preço, Compr.)= 0,374 
Corr (Preço, Compr.)= 0,671 (I) 
Corr (Preço, Compr.)= 0,795 (N) 
 
 
Corr (Preço, Motor)= 0,653 
Corr (Preço, Motor)= 0,810 (I) 
Corr (Preço, Motor)= 0,873 (N) 
 
Exemplo 7: Automóveis 
46 
Problema: Como incluir a variável Categoria (Nacional/Importado)? 
Hipótese da ANOVA: 
H0: 1 = 2 = 3 = 0 
H1: Algum j , j = 1, 2, 3, é diferente de zero. 
 
 
Modelo: 
yi =0 + 1 x1i + 2 x2i+ 3 x3i + ei, i = 1, ..., 30, 
em que 
 yi: preço do veículo i 
x1i: comprimento do veículo i 
x2i: motor do veículo i 
 0, se o veículo i é importado 
 1, se o veículo i é nacional. 
 
 
 
 
 
 x3i = 
 Obs.: Variável qualitativa que entra no modelo como variável 
quantitativa é usualmente denominada variável dummy. 
 
 
Exemplo 7: Automóveis 
47 
 
Coeficientes 
estimados 
Erro 
padrão 
Stat t valor-P 
95% 
inferiores 
95% 
superiores 
Intercepto 11210,04 15165,588 0,739 0,4670 -20090,20 42510,28 
Comprimento -2969,84 4931,408 -0,602 0,5527 -13147,77 7208,08 
Motor 229,09 65,775 3,483 0,0019 93,33 364,84 
Categoria (N/I) -8851,93 2102,531 -4,210 0,0003 -13191,34 -4512,52 
Fonte de variação gl SQ QM F Valor P 
Regressão 3 1466992089,66 488997363,22 20,61 0,000 
Resíduo 24 569483602,05 23728483,42 
Total 27 2036475691,71 
R-Quadrado 0,7204 
R-quadrado ajustado 0,6854 
Exemplo 7: Automóveis 
48 
Interpretação de 3: 
O preço de um carro nacional é, em média, 8851,93dólares menor do 
que um carro importado (Referência), com a mesma capacidade do 
motor e com mesmo comprimento. 
Modelo estimado: 
321 8851,93 -229,09 2969,84– 11210,04 ˆ xxxy 
implicando que, para 
21 229,09 2969,84– 11210,04 ˆ xxyI 
Carros importados (x3=0) 
Carros nacionais (x3=1) 
21
21
229,09 2969,84– 11,2358 
93,8851229,09 2969,84– 11210,04 ˆ
xx
xxyN


 sendo o coeficiente de Comprimento não significativo (1=0), 
retiramos esta variável do modelo e refazemos a análise. 
Exemplo 7: Automóveis 
49 
 
Coeficientes 
estimados 
Erro 
padrão 
Stat t valor-P 
95% 
inferiores 
95% 
superiores 
Intercepto 2305,53 3329,038 0,693 0,4950 -4550,75 9161,81 
Motor 195,14 33,466 5,831 0,0000 126,22 264,07 
Categoria (N/I) -9409,11 1863,805 -5,048 0,0000 -13247,69 -5570,53 
Fonte de variação gl SQ QM F Valor P 
Regressão 2 1458386218,12 729193109,06 31,53 0,0000 
Resíduo 25 578089473,60 23123578,94 
Total 27 2036475691,71 
R-Quadrado 0,7161 
R-quadrado ajustado 0,6934 
 Motor e Categoria significantes a 5%. 
Exemplo 7: Automóveis 
ANOVA 
50 
Modelo carros Importados: 
Modelo carros Nacionais: 
i
iii
x
xxy
1
22110
195,142305,53 
 ˆ ˆˆˆ

 
i
ii
x
xy
1
1
195,1478,7103 
11,9409195,142305,53ˆ


x1: motor (cv) 
x2: Importado (0); Nacional (1) 
 mesma inclinação 
Exemplo 7: Automóveis 
51 
Problema: Queremos retas que não sejam paralelas! 
Hipótese da ANOVA: 
H0: 1 = 2 = 3 = 0 
H1: Algum j , j = 1, 2, 3, é diferente de zero. 
 
Modelo: 
yi =0 + 1 x1i + 2 x2i+ 3 x3i + ei, i = 1, ..., 30, 
em que 
yi: preço do veículo i 
x1i: motor do veículo i 
 0, se o veículo i é importado 
 1, se o veículo i é nacional. 
 
x3i = x1i  x2i (“interação” entre x1 e x2) 
 x2i = 
Exemplo 7: Automóveis 
52 
Veículo Preço Comprimento Motor N/I 
Asia Towner 9440 3,36 40 I 
Audi A3 38850 4,15 125 I 
Chevrolet Astra 10532 4,11 110 N 
Chevrolet Blazer 16346 4,6 106 N 
Chevrolet Corsa 6176 3,73 60 N 
Chevrolet Tigra 12890 3,92 100 I 
Chevrolet Vectra 13140 4,47 110 N 
Chrysler Neon 31640 4,36 115 I 
Dodge Dakota 11630 4,98 121 N 
Fiat Fiorino 6700 4,16 76 N 
Fiat Marea 12923 4,39 127 N 
Fiat Mille 5257 3,64 57 N 
Fiat Palio 6260 3,73 61 N 
Fiat Siena 7780 4,1 61 I 
Ford Fiesta 6316 3,83 52 N 
Ford Ka 5680 3,62 54 N 
Ford Mondeo 33718 4,56 130 I 
Honda Civic 14460 4,45 106 N 
Hyundai Accent 21500 4,12 91 I 
Peugeot 106 13840 3,68 50 I 
Renault Clio 13700 3,7 74 I 
Toyota Corolla 15520 4,39 116 N 
VW Gol 6340 3,81 54 N 
VW Golf 22200 4,15 100 I 
VW Parati 9300 4,08 69 N 
VW Polo 12018 4,14 99 I 
VW Santana 11386 4,57 101 N 
VW Saveiro 7742 4,38 88 N 
N/I 
0 
0 
1 
1 
1 
0 
1 
0 
1 
1 
1 
1 
1 
0 
1 
1 
0 
1 
0 
0 
0 
1 
1 
0 
1 
0 
1 
1 
X3 
0 
0 
110 
106 
60 
0 
110 
0 
121 
76 
127 
57 
61 
0 
52 
54 
0 
106 
0 
0 
0 
116 
54 
0 
69 
0 
101 
88 
Exemplo 7: Automóveis 
53 
 
Coeficientes 
estimados 
Erro 
padrão 
Stat t valor-P 
95% 
inferiores 
95% 
superiores 
Intercepto -6386,75 4209,334 -1,517 0,1423 -15074,39 2300,88 
Motor 292,21 44,796 6,523 0,0000 199,76 384,67 
Categoria (N/I) 5667,81 5492,656 1,032 0,3124 -5668,47 17004,10 
Categoria Motor (X3) -171,01 59,456 -2,876 0,0083 -293,72 -48,30 
Fonte de variação gl SQ MQ F Valor P 
Regressão 3 1606569247,59 535523082,53 29,90 0,0000 
Resíduo 24 429906444,12 17912768,50 
Total 27 2036475691,71 
R-Quadrado 0,7889 
R-quadrado ajustado 0,7625 
Concl. ? 
Exemplo 7: Automóveis 
54 
Modelo carros Importados: 
Modelo carros Nacionais: 
i
iiii xxxy
(Motor)21,9226386,75- 
ˆ ˆ ˆˆˆ 3322110

 
i
iiii xxxy
(Motor) 20,21194,718 
01,17181,5667292,2175,6386ˆ 321


x1: motor (cv) 
x2: Importado (0)/Nacional (1) 
x3: x1  x2 
 Intercepto e inclinação diferentes. 
Exemplo 7: Automóveis 
55 
Exemplo 7: Resíduos por categoria de carro 
Nacionais 
56 
Interpretação dos parâmetros: 
A potência do motor influencia o preço de forma diferente nos carros 
nacionais e importados. 
 
Sugestão: interpretar os parâmetros das retas ajustadas para cada 
categoria 
iiy (Motor)21,9226386,75 ˆ 
iiy (Motor) 20,21194,718ˆ 
- Carros importados: 
- Carros nacionais: 
O aumento de 1cv na potência do motor: 
 - aumenta, em média, 292,21 dólares o preço de carros importados; 
 - aumenta, em média, 121,20 dólares o preço de carros nacionais. 
Portanto, carros importados têm o preço (em média) mais alterados 
com o aumento de 1 cv na potência do motor quando comparados 
com carros nacionais. 
 
Exemplo 7: Automóveis

Outros materiais