Baixe o app para aproveitar ainda mais
Prévia do material em texto
ANÁLISE DE REGRESSÃO - Regressão Linear Múltipla - (II) 1 Exemplo 4: Insulina em coelhos Num experimento foram aplicadas doses diferentes de insulina em coelhos e foram observadas quedas na quantidade de açúcar no sangue (variável Y) depois de um determinado tempo. Nesse tipo de experimento, é usual estudar a relação entre a queda de açúcar e o logaritmo da dose de insulina (variável X). 2 3 Exemplo 4: Insulina em coelhos Modelo Não-Linear • Um modelo que pode ser adequado é yi = e xii, i=1, ..., n. yi*=* + xi + i* • Observe que podemos tomar o logaritmo: ln(yi ) = ln ( e xii) = ln () + xi + ln(i) • Considerando • yi*=ln(yi) • *=ln() • i*=ln(i) 4 Dados: n=32 xi=15,27 xi 2=8,80 yi*=59,65 yi* 2=117,56 xi yi*=31,55 5 Exemplo 4: Insulina em coelhos 04,2 5133,1 0858,3 32 27,15 3280,8 32 65,59 32 27,15 3255,31 ˆ 2 2 1 2 1 ** xnx yxnyx n i i n i ii 89,0 32 27,15 04,2 32 65,59ˆˆ ** xy iii xxy 04,289,0 ˆˆˆ ** 369,6 32 65,59 3256,117)( 2 * 1 * 1 2** 22 ynyyySQT n i i n i i 298,65133,104,2)(ˆ 2 n 1i 22 xxSQReg i As hipóteses de interesse são: H0: = 0 H1: ≠ 0 6 Exemplo 4: Insulina em coelhos 99,0 369,6 298,62 SQT RegSQ R Fonte de variação gl SQ MQ F Valor P Regressão 1 6,298 6,298 3149,000 0,000 Resíduo 30 0,071 0,002 Total 31 6,369 RC = {F > 4,17}, obtido da tabela F(1;30) com = 5%. Conclusão: rejeitamos H0. 7 Exemplo 4: Insulina em coelhos ANOVA 8 Exemplo 4: Insulina em coelhos Um pesquisador deseja avaliar resistência de containeres de plástico. Mais precisamente, deseja verificar se a pressão exercida sobre o plástico no processo de produção do plástico tem algum efeito na resistência do container. Para avaliar isso, foi feito um estudo em que containeres foram produzidos sob diferentes pressões (em libras por polegadas ao quadrado). Foram produzidos n=1650 containeres. Para cada container, a resistência foi medida de alguma maneira apropriada. Exemplo 5: Containeres 9 Item Resistência do plástico Pressão 1 30,7 16 2 24,7 18 3 30,6 16 4 32,8 10 5 20,7 20 6 34,5 16 7 41,9 12 8 36,4 12 9 22,2 12 10 20,7 14 : : : : : : 1640 28,6 18 1641 30,1 16 1642 46,5 12 1643 34,6 18 1644 38,6 12 1645 28,6 14 1646 32,5 20 1647 38,6 14 1648 39,7 12 1649 14,6 20 1650 19,8 20 10 12 14 16 18 20 20 30 40 50 Diagrama de dispersão Pressão Re sis tê nc ia Dados (n= 1650) 10 Exemplo 5: Containeres INTERPRETAÇÃO DOS PARÂMETROS: 0: resistência média do container quando a pressão é 0. 1: aumento/decréscimo médio resistência média, quando a pressão aumenta 1 unidade. ei: erro aleatório. 11 SUPOSIÇÕES: ei ~ N (0, 2), independentes. Essa suposição é equivalente a supor yi ~N(0 + 1 xi , 2), independentes; Exemplo 5: Containeres MODELO UTILIZADO: yi =0 + 1 xi + ei, i =1, ..., n. yi: resistência do container de plástico xi:pressão sobre o plástico R2= 0,2137 12 Fonte de variação gl SQ QM F Valor P Regressão 1 19250 19250 448,0069593 < 0,0001 Resíduo 1648 70811,4 42,9681 Total 1649 90061,4 Coeficientes estimados Erro padrão Stat t valor-P 95% inferiores 95% superiores Intercepto 55,00 0,7268 61,9136 0,0000 53,5744 56,4256 Pressão ( libras) -1,00 0,0472 -21,1662 0,0000 -1,0927 -0,9073 ANOVA Exemplo 5: Containeres Podemos construir o diagrama de dispersão com a reta ajustada: 10 12 14 16 18 20 20 30 40 50 Diagrama de dispersão Pressão Re sis tên cia 13 Exemplo 5: Containeres 10 12 14 16 18 20 -2 -1 0 1 2 Resíduos estudentizados Pressão Re síd uo s 26 28 30 32 34 -2 -1 0 1 2 Resíduos estudentizados Valores previstos Re síd uo s 14 Exemplo 5: Containeres Suponha que agora o pesquisador deseja verificar a influência da temperatura durante o processo de fabricação na resistência do container. 200 220 240 260 280 300 20 30 40 50 Diagrama de dispersão Temperatura Re sis tê nc ia 15 Exemplo 5: Containeres MODELO UTILIZADO: yi =0 + 1 xi + ei, i =1, ..., n. yi: resistência do container de plástico xi: temperatura do processo de fabricação Resultados: 16 Fonte de variação gl SQ QM F Valor P Regressão 1 66000 66000 4520,435 0,0000 Resíduo 1648 24061,4 14,60036 Total 1649 90061,4 Coeficientes estimados Erro padrão Stat t valor-P 95% inferiores 95% superiores Intercepto -20,00 0,7496 -26,6811 0,0000 -21,4703 -18,5297 Temperatura (0 C) 0,20 0,0030 67,2342 0,0000 0,1942 0,2058 ANOVA R2= 0,7328 Exemplo 5: Containeres 200 220 240 260 280 300 20 30 40 50 Diagrama de dispersão Temperatura Re sis tê nc ia 17 Exemplo 5: Containeres 200 220 240 260 280 300 -2 -1 0 1 2 Resíduos estudentizados Temperatura Re síd uo s 20 25 30 35 40 -2 -1 0 1 2 Resíduos estudentizados Valores previstos Re síd uo s 18 Exemplo 5: Containeres Será possível considerar um modelo contendo tanto a pressão quanto a temperatura? O modelo de regressão linear pode ser escrito na forma: yi =0 + 1 x1i + 2 x2i+ ei, i = 1, ..., n. Observe que, para cada indivíduo ou unidade amostral, observamos (yi, x1i, x2i). No exemplo, x1: temperatura, x2: pressão PARÂMETROS 0: INTERCEPTO 1: INCLINAÇÃO ASSOCIADA A X1 2: INCLINAÇÃO ASSOCIADA A X2 ERRO: ei . 19 REGRESSÃO LINEAR MÚLTIPLA INTERPRETAÇÃO DOS PARÂMETROS: 0: valor médio da variável resposta Y quando X1= 0 e X2 = 0. 1: aumento/decréscimo médio no valor de Y, quando X1 aumenta de 1 unidade, mantendo-se X2 constante. 2: aumento/decréscimo médio no valor de Y, quando X2 aumenta de 1 unidade, mantendo-se X1 constante. 20 Sendo os coeficientes 0, 1 e 2 desconhecidos, é necessário estimá-los e testar hipóteses de interesse. REGRESSÃO LINEAR MÚLTIPLA SUPOSIÇÕES ei ~ N(0, 2) independentes. Essa suposição é equivalente a supor yi ~ N(0 + 1 x1i+ 2 x2i; 2 ) independentes; ESTIMAÇÃO DOS PARÂMETROS Utiliza-se o Método de Mínimos Quadrados. Método de Mínimos Quadrados: encontra estimadores de 0, 1 e 2 que minimizam a soma do quadrado dos erros: n i iii n i i xxye 1 2 22110 1 2 )( 21 REGRESSÃO LINEAR MÚLTIPLA OBS.: R2= 0,9465 22 Fonte de variação gl SQ QM F Valor P Regressão 2 85250 42625 14591,05 0,0000 Resíduo 1647 4811,4 2,921311 Total 1649 90061,4 Coeficientes estimados Erro padrão Stat t valor-P 95% inferiores 95% superiores Intercepto -5,00 0,3828 -13,06010,0000 -5,7509 -4,2491 Temperatura (0 C) 0,20 0,0013 150,3083 0,0000 0,1974 0,2026 Pressão (libras) -1,00 0,0123 -81,1758 0,0000 -1,0242 -0,9758 ANOVA Exemplo 5: Containeres Hipótese da ANOVA O teste F da ANOVA, neste caso, testa as hipóteses H0: 1 = 0 e 2 = 0 H1: 1 ≠ 0 ou 2 ≠ 0 23 Os testes t, neste caso, testam a hipótese nula de que cada parâmetro é igual a zero, individualmente. Análise de resíduos é também realizada. REGRESSÃO LINEAR MÚLTIPLA 200 220 240 260 280 300 -2 -1 0 1 2 3 Resíduos Temperatura Re síd uo s 10 12 14 16 18 20 -2 -1 0 1 2 3 Resíduos Pressão Re síd uo s 200 220 240 260 280 300 -1 0 1 2 Resíduos estudentizados Temperatura Re síd uo s 10 12 14 16 18 20 -1 0 1 2 Resíduos estudentizados Pressão Re síd uo s 24 Exemplo 5: Containeres Indivíduo Y X1 X2 . . . Xk 1 Y1 X11 X21 . . . Xk1 2 Y2 X12 X22 . . . Xk2 3 Y3 X13 X23 . . . Xk3 . . . . . . . . . . . . . . . . . . n Yn X1n X2n . . . Xkn Dados: Admitimos que X1, X2, ..., Xk são as variáveis independentes fixas (variáveis preditoras ou explicativas) e Y variável dependente, aleatória (variável resposta). O modelo de regressão linear múltipla será: yi = 0 + 1x1i + 2x2i + ... + kxki + i , i = 1, 2, ..., n, com n > k +1. 25 REGRESSÃO LINEAR MÚLTIPLA y1 = 0 + 1x11 + 2x21 + ... + kxk1 + 1, y2 = 0 + 1x12 + 2x22 + ... + kxk2 + 2, . . . yn = 0 + 1x1n + 2x2n + ... + kxkn + n. 26 Assim, . 1 1 1 ... ... ... 2 1 21 22212 12111 2 1 110 21210 11110 2 1 1 0 nknnn k k nknkn kk kk n kxxx xx xx x x xx xx xx y y y Matricialmente, escrevemos REGRESSÃO LINEAR MÚLTIPLA 27 .matrizdalinhaésimaaée XXε βXY ixxx xxx xxx xxx y y y kiii k í n n k k knnn k k kn n n ) ... 1( e , , 1 1 1 , 21 ))1(1( ' 2 1 1)( 1 0 1)1)(( 21 22212 12111 1))(( 2 1 )1( , XY Utilizando notação matricial, o modelo de regressão linear múltipla pode ser escrito por A matriz X é denominada matriz de planejamento ou matriz desenho. REGRESSÃO LINEAR MÚLTIPLA 28 SUPOSIÇÃO i ~ N (0, 2), independentes, i = 1, ..., n. que é equivalente a supor yi ~ N (0 + 1x1i + 2x2i + ... + kxki , 2 ), independentes. ESTIMAÇÃO DOS PARÂMETROS Utiliza-se método de mínimos quadrados para estimar os parâmetros de interesse. Método de Mínimos Quadrados: encontra estimadores de 0, 1, 2, ... , k que minimizam a soma do quadrado dos erros: ).()( )]...(-[ ∑∑ 1 2 22110 1 2 Xβ-YXβ-Y' ' n i kikiii n i i XXXy REGRESSÃO LINEAR MÚLTIPLA Estimador de mínimos quadrados: 29 ˆ ˆ ˆ )(ˆ 1 0 1- k YXXXβ '' Os valores ajustados ficam dados por: .ˆ ... ˆˆˆ 110 kikii xxy Interpretação de : jˆ Para cada aumento de uma unidade em Xj, temos um aumento médio (ou esperado) de unidades em Y, mantendo-se fixados os valores de X1, X2, ..., Xj-1, Xj+1, ..., Xk. jˆ REGRESSÃO LINEAR MÚLTIPLA 30 REGRESSÃO LINEAR MÚLTIPLA TESTE CONJUNTO PARA 1, 2 , ..., k Em geral uma hipótese de interesse é H0: 1 = 2 = . . . = k = 0 H1: Algum j , j = 1, ..., k, é diferente de zero. A estatística de teste das hipóteses acima é obtida na tabela de análise de variância: Fonte de Variação g.l. Soma de Quadrados Quadrado Médio Teste F Regressão k SQReg QMReg = SQReg/ k QMReg/QMRes Resíduo n – (k +1) SQRes QMRes = SQRes/(n – (k +1)) = Se 2 Total n -1 SQT ANOVA 31 SQTot SQRes SQTot SQReg R 12 Definimos o coeficiente de explicação: • 0 R2 1. • Quanto menor o valor de R2, mais evidências há de que o modelo não é adequado. REGRESSÃO LINEAR MÚLTIPLA Desvantagem do R2: sempre aumenta quando acrescentamos variáveis no modelo, mesmo quando a variável não é importante. )1-/( )]1(/[ 12 nSQT knSQRes R Alternativa: R2 ajustado INTERVALOS DE CONFIANÇA E TESTES DE HIPÓTESES PARA j 32 Resultado: ,ˆ 2 jjjj a;N~ kkkk k k aaa aaa aaa 10 11110 00100 1-)( XX ' sendo ajj o elemento jj da matriz sQM T jj jj Re -ˆ )0( a Pode-se ter interesse em testar Estatística de teste: Sob H0, T tem distribuição t de student com (n-(k+1)) graus de liberdade. A RC é dada por: RC = {T: T ≤ -tc ou T ≥ tc}. H0: j = j (0) H1: j ≠ j (0) jjjjjj aQMRestaQMRest ˆ; ˆ Intervalo de confiança para j, com nível de confiança = 1-: REGRESSÃO LINEAR MÚLTIPLA Definimos RESÍDUO: RESÍDUOS 33 Os erros são dados por ei = yi - 0 - 1 x1i - ... - k xki , i =1, ..., n. ...., ,1 , ˆ ˆˆˆ 110 nixxye ikkiii e i i S e z ˆ ˆ iie i i S e r 1 ˆ ˆ em que ii é o elemento (i,i) da matriz H=X(X´X) -1X´. RESÍDUO PADRONIZADO: RESÍDUO ESTUDENTIZADO: 34 RESÍDUOS Espera-se que em torno de 95% dos resíduos padronizados/estudentizados estejam entre os limites –2 e 2. Gráficos: - Resíduos (padronizados ou estudentizados) versus valores ajustados; - Resíduos (padronizados ou estudentizados) versus cada uma das variáveis Xj. Exemplo 6: Avaliação de residências Para fins de cálculo do valor de imposto territorial, o governo obteve uma amostra de 30 residências unifamiliares de um município localizado próximo à cidade de Nova York. As variáveis observadas foram: - Valor de avaliação, em 2002 (Y), em unidades monetárias; - Área do terreno , em acres (X1); - Espaço interno, em pés2 (X2); - Idade (tempo de construção), em anos (X3); - Número de cômodos (X4); - Número de banheiros (X5); - Número de automóveis que cabem na garagem (X6). O governo deseja criar um modelo para prever o valorde avaliação de imóveis com base em suas características. 35 Modelo completo: yi =0 + 1 x1i + 2 x2i + 3 x3i + 4 x4i + 5 x5i + 6 x6i + ei, i = 1, ..., 30. 36 Fonte de variação gl SQ QM F Valor P Regressão 6 357886,34 59647,72 21,97878 1,87862E-08 Resíduo 23 62419,20 2713,878 Total 29 420305,54 Região Crítica: RC = {F: F ≥ fc}, em que fc é obtido da tabela F(6; 23). Com 5% de significância, fc = 2,528. Como Fobs > fc ,rejeita-se H0, ou seja, pelo menos um dos coeficientes não é nulo. Hipóteses: H0: 1 = 2 = . . . = 6 = 0 H1: Algum j , j = 1, ..., 6, é diferente de zero. Exemplo 6: Avaliação de residências 37 R-quadrado 0,8515 R-quadrado ajustado 0,8127 Erro padrão 52,0949 Observações 30 Coeficientes estimados Erro padrão Stat t valor-P 95% inferiores 95% superiores Intercepto 71,99 65,393 1,101 0,2823 -63,28 207,27 Tamanho da Propriedade 301,61 79,959 3,772 0,0010 136,20 467,02 Tamanho da Casa 0,09 0,028 3,312 0,0030 0,04 0,15 Idade -1,19 0,535 -2,224 0,0362 -2,30 -0,08 Cômodos 11,02 7,447 1,480 0,1525 -4,38 26,43 Banheiros 14,82 16,805 0,882 0,3871 -19,95 49,58 Garagem 13,40 16,787 0,798 0,4330 -21,33 48,12 Exemplo 6: Avaliação de residências 38 Excluindo-se a variável Garagem: Fonte de variação gl SQ MQ F Valor P Regressão 5 356158 71231,59 26,65 4,61298E-09 Resíduo 24 64147,58 2672,816 Total 29 420305,5 Coeficientes estimados Erro padrão Stat t valor-P 95% inferiores 95% superiores Intercepto 74,57 64,817 1,151 0,2613 -59,20 208,35 Tamanho da Propriedade 305,23 79,224 3,853 0,0008 141,72 468,74 Tamanho da Casa 0,10 0,027 3,803 0,0009 0,05 0,16 Idade -1,31 0,509 -2,577 0,0166 -2,36 -0,26 Cômodos 9,89 7,255 1,363 0,1855 -5,09 24,86 Banheiros 17,93 16,220 1,106 0,2799 -15,54 51,41 R-quadrado 0,8474 R-quadrado ajustado 0,8156 Concl. ? Concl. ? Exemplo 6: Avaliação de residências 39 Excluindo-se a variável Banheiros: Fonte de variação gl SQ MQ F Valor P Regressão 4 352890,9 88222,72 32,72 1,33E-09 Resíduo 25 67414,67 2696,59 Total 29 420305,5 Coeficientes estimados Erro padrão Stat t valor-P 95% inferiores 95% superiores Intercepto 102,96 59,780 1,722 0,0974 -20,16 226,08 Tamanho da Propriedade 287,36 77,902 3,689 0,0011 126,92 447,80 Tamanho da Casa 0,12 0,023 5,027 0,0000 0,07 0,16 Idade -1,51 0,479 -3,151 0,0042 -2,49 -0,52 Cômodos 9,03 7,246 1,247 0,2240 -5,89 23,96 R-quadrado 0,8396 R-quadrado ajustado 0,8139 Exemplo 6: Avaliação de residências 40 Excluindo-se a variável Cômodos: Fonte de variação gl SQ MQ F Valor P Regressão 3 348699 116233 42,20 3,91E-10 Resíduo 26 71606,53 2754,10 Total 29 420305,5 Coeficientes estimados Erro padrão Stat t valor-P 95% inferiores 95% superiores Intercepto 136,79 53,830 2,541 0,0174 26,15 247,44 Tamanho da Propriedade 276,09 78,196 3,531 0,0016 115,35 436,82 Tamanho da Casa 0,13 0,021 6,157 0,0000 0,09 0,17 Idade -1,40 0,476 -2,942 0,0068 -2,38 -0,42 R-quadrado 0,8296 R-quadrado ajustado 0,8100 Todos coeficientes significantes a 5 %. Exemplo 6: Avaliação de residências 41 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 0 100 200 300 400 500 600 700 Re síd uo p ad ro ni za do Valor Ajustado Gráfico de resíduos padronizados -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 0,0000 0,1000 0,2000 0,3000 0,4000 0,5000 0,6000 0,7000 Re síd uo p ad ro ni za do Tamanho da propriedade Gráfico de resíduos padronizados -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 0 500 1000 1500 2000 2500 3000 3500 Re síd uo p ad ro ni za do Tamanho da casa Gráfico de resíduos padronizados -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 0 20 40 60 80 100 120 Re síd uo p ad ro ni za do Idade Gráfico de resíduos padronizados Exemplo 6: Avaliação de residências 42 Exemplo 6: Avaliação de residências 43 Modelo final ajustado: 321 40,113,0 09,27679,136ˆ xxxy Interpretação: - Para cada aumento de 1 acre no tamanho da propriedade, o valor de avaliação aumenta, em média, 276,09 u.m., mantendo- se fixados os valores das demais variáveis. - Para cada aumento de 1 pé2 no espaço interno da casa, o valor de avaliação aumenta, em média, 0,13 u.m., mantendo-se fixados os valores das demais variáveis. - Para cada aumento de 1 ano na idade da casa, o valor de avaliação diminui, em média, 1,40 u.m., mantendo-se fixados os valores das demais variáveis. Nota: 1 acre = 4046,85 m2 1 pé2 = 0,09 m2 Exemplo 6: Avaliação de residências Considere os dados relativos a preço (em dólar), comprimento (em metros) e capacidade do motor (em cv) de veículos vendidos no Brasil, classificados em duas categorias: N(nacionais) e I (importados). 44 Exemplo 7: Automóveis Veículo Preço Comprimento Motor N/I Asia Towner 9440 3,36 40 I Audi A3 38850 4,15 125 I Chevrolet Astra 10532 4,11 110 N Chevrolet Blazer 16346 4,6 106 N Chevrolet Corsa 6176 3,73 60 N Chevrolet Tigra 12890 3,92 100 I Chevrolet Vectra 13140 4,47 110 N Chrysler Neon 31640 4,36 115 I Dodge Dakota 11630 4,98 121 N Fiat Fiorino 6700 4,16 76 N Fiat Marea 12923 4,39 127 N Fiat Mille 5257 3,64 57 N Fiat Palio 6260 3,73 61 N Fiat Siena 7780 4,1 61 I Ford Fiesta 6316 3,83 52 N Ford Ka 5680 3,62 54 N Ford Mondeo 33718 4,56 130 I Honda Civic 14460 4,45 106 N Hyundai Accent 21500 4,12 91 I Peugeot 106 13840 3,68 50 I Renault Clio 13700 3,7 74 I Toyota Corolla 15520 4,39 116 N VW Gol 6340 3,81 54 N VW Golf 22200 4,15 100 I VW Parati 9300 4,08 69 N VW Polo 12018 4,14 99 I VW Santana 11386 4,57 101 N VW Saveiro 7742 4,38 88 N N/I 0 0 1 1 1 0 1 0 1 1 1 1 1 0 1 1 0 1 0 0 0 1 1 0 1 0 1 1 45 Corr (Preço, Compr.)= 0,374 Corr (Preço, Compr.)= 0,671 (I) Corr (Preço, Compr.)= 0,795 (N) Corr (Preço, Motor)= 0,653 Corr (Preço, Motor)= 0,810 (I) Corr (Preço, Motor)= 0,873 (N) Exemplo 7: Automóveis 46 Problema: Como incluir a variável Categoria (Nacional/Importado)? Hipótese da ANOVA: H0: 1 = 2 = 3 = 0 H1: Algum j , j = 1, 2, 3, é diferente de zero. Modelo: yi =0 + 1 x1i + 2 x2i+ 3 x3i + ei, i = 1, ..., 30, em que yi: preço do veículo i x1i: comprimento do veículo i x2i: motor do veículo i 0, se o veículo i é importado 1, se o veículo i é nacional. x3i = Obs.: Variável qualitativa que entra no modelo como variável quantitativa é usualmente denominada variável dummy. Exemplo 7: Automóveis 47 Coeficientes estimados Erro padrão Stat t valor-P 95% inferiores 95% superiores Intercepto 11210,04 15165,588 0,739 0,4670 -20090,20 42510,28 Comprimento -2969,84 4931,408 -0,602 0,5527 -13147,77 7208,08 Motor 229,09 65,775 3,483 0,0019 93,33 364,84 Categoria (N/I) -8851,93 2102,531 -4,210 0,0003 -13191,34 -4512,52 Fonte de variação gl SQ QM F Valor P Regressão 3 1466992089,66 488997363,22 20,61 0,000 Resíduo 24 569483602,05 23728483,42 Total 27 2036475691,71 R-Quadrado 0,7204 R-quadrado ajustado 0,6854 Exemplo 7: Automóveis 48 Interpretação de 3: O preço de um carro nacional é, em média, 8851,93dólares menor do que um carro importado (Referência), com a mesma capacidade do motor e com mesmo comprimento. Modelo estimado: 321 8851,93 -229,09 2969,84– 11210,04 ˆ xxxy implicando que, para 21 229,09 2969,84– 11210,04 ˆ xxyI Carros importados (x3=0) Carros nacionais (x3=1) 21 21 229,09 2969,84– 11,2358 93,8851229,09 2969,84– 11210,04 ˆ xx xxyN sendo o coeficiente de Comprimento não significativo (1=0), retiramos esta variável do modelo e refazemos a análise. Exemplo 7: Automóveis 49 Coeficientes estimados Erro padrão Stat t valor-P 95% inferiores 95% superiores Intercepto 2305,53 3329,038 0,693 0,4950 -4550,75 9161,81 Motor 195,14 33,466 5,831 0,0000 126,22 264,07 Categoria (N/I) -9409,11 1863,805 -5,048 0,0000 -13247,69 -5570,53 Fonte de variação gl SQ QM F Valor P Regressão 2 1458386218,12 729193109,06 31,53 0,0000 Resíduo 25 578089473,60 23123578,94 Total 27 2036475691,71 R-Quadrado 0,7161 R-quadrado ajustado 0,6934 Motor e Categoria significantes a 5%. Exemplo 7: Automóveis ANOVA 50 Modelo carros Importados: Modelo carros Nacionais: i iii x xxy 1 22110 195,142305,53 ˆ ˆˆˆ i ii x xy 1 1 195,1478,7103 11,9409195,142305,53ˆ x1: motor (cv) x2: Importado (0); Nacional (1) mesma inclinação Exemplo 7: Automóveis 51 Problema: Queremos retas que não sejam paralelas! Hipótese da ANOVA: H0: 1 = 2 = 3 = 0 H1: Algum j , j = 1, 2, 3, é diferente de zero. Modelo: yi =0 + 1 x1i + 2 x2i+ 3 x3i + ei, i = 1, ..., 30, em que yi: preço do veículo i x1i: motor do veículo i 0, se o veículo i é importado 1, se o veículo i é nacional. x3i = x1i x2i (“interação” entre x1 e x2) x2i = Exemplo 7: Automóveis 52 Veículo Preço Comprimento Motor N/I Asia Towner 9440 3,36 40 I Audi A3 38850 4,15 125 I Chevrolet Astra 10532 4,11 110 N Chevrolet Blazer 16346 4,6 106 N Chevrolet Corsa 6176 3,73 60 N Chevrolet Tigra 12890 3,92 100 I Chevrolet Vectra 13140 4,47 110 N Chrysler Neon 31640 4,36 115 I Dodge Dakota 11630 4,98 121 N Fiat Fiorino 6700 4,16 76 N Fiat Marea 12923 4,39 127 N Fiat Mille 5257 3,64 57 N Fiat Palio 6260 3,73 61 N Fiat Siena 7780 4,1 61 I Ford Fiesta 6316 3,83 52 N Ford Ka 5680 3,62 54 N Ford Mondeo 33718 4,56 130 I Honda Civic 14460 4,45 106 N Hyundai Accent 21500 4,12 91 I Peugeot 106 13840 3,68 50 I Renault Clio 13700 3,7 74 I Toyota Corolla 15520 4,39 116 N VW Gol 6340 3,81 54 N VW Golf 22200 4,15 100 I VW Parati 9300 4,08 69 N VW Polo 12018 4,14 99 I VW Santana 11386 4,57 101 N VW Saveiro 7742 4,38 88 N N/I 0 0 1 1 1 0 1 0 1 1 1 1 1 0 1 1 0 1 0 0 0 1 1 0 1 0 1 1 X3 0 0 110 106 60 0 110 0 121 76 127 57 61 0 52 54 0 106 0 0 0 116 54 0 69 0 101 88 Exemplo 7: Automóveis 53 Coeficientes estimados Erro padrão Stat t valor-P 95% inferiores 95% superiores Intercepto -6386,75 4209,334 -1,517 0,1423 -15074,39 2300,88 Motor 292,21 44,796 6,523 0,0000 199,76 384,67 Categoria (N/I) 5667,81 5492,656 1,032 0,3124 -5668,47 17004,10 Categoria Motor (X3) -171,01 59,456 -2,876 0,0083 -293,72 -48,30 Fonte de variação gl SQ MQ F Valor P Regressão 3 1606569247,59 535523082,53 29,90 0,0000 Resíduo 24 429906444,12 17912768,50 Total 27 2036475691,71 R-Quadrado 0,7889 R-quadrado ajustado 0,7625 Concl. ? Exemplo 7: Automóveis 54 Modelo carros Importados: Modelo carros Nacionais: i iiii xxxy (Motor)21,9226386,75- ˆ ˆ ˆˆˆ 3322110 i iiii xxxy (Motor) 20,21194,718 01,17181,5667292,2175,6386ˆ 321 x1: motor (cv) x2: Importado (0)/Nacional (1) x3: x1 x2 Intercepto e inclinação diferentes. Exemplo 7: Automóveis 55 Exemplo 7: Resíduos por categoria de carro Nacionais 56 Interpretação dos parâmetros: A potência do motor influencia o preço de forma diferente nos carros nacionais e importados. Sugestão: interpretar os parâmetros das retas ajustadas para cada categoria iiy (Motor)21,9226386,75 ˆ iiy (Motor) 20,21194,718ˆ - Carros importados: - Carros nacionais: O aumento de 1cv na potência do motor: - aumenta, em média, 292,21 dólares o preço de carros importados; - aumenta, em média, 121,20 dólares o preço de carros nacionais. Portanto, carros importados têm o preço (em média) mais alterados com o aumento de 1 cv na potência do motor quando comparados com carros nacionais. Exemplo 7: Automóveis
Compartilhar