Baixe o app para aproveitar ainda mais
Prévia do material em texto
8 REGRESSÃO 8.1 INTRODUÇÃO Muitas vezes estudamos certos fenômenos que envolvem duas ou mais variáveis, e freqüentemente estamos interessados em estabelecer uma relação funcional entre as mesmas. O problema da regressão consiste em determinar a função que exprime essa relação. Quando o problema envolve apenas duas variáveis ele é conhecido por regressão simples, e no caso de mais de duas variáveis por regressão múltipla. Basicamente, um problema de regressão envolve variáveis que podem ser controladas (podem ser relacionadas matematicamente) e variáveis que não podem ser controladas (variação aleatória). Seja Y uma variável aleatória que é influenciada pelas variáveis X1, X2, , Xn, então, Y = f(X) + , (8.1) onde: X é a variável independente (variável explicativa). Y é a variável dependente (variável resposta). é a componente aleatória da variação de Y. f é a função de regressão. Normalmente, nos experimentos realizados, X é uma variável que pode ser controlada pelo pesquisador. Por exemplo, suponhamos que Estatística Básica para os Cursos de Engenharia 215 estamos realizando ensaios de tração (Y) em peças de concreto durante o tempo de cura (X). A variável tempo X pode ser controlada pelo pesquisador, pois o mesmo pode determinar a resistência à tração para 1, 2, 3, dias (controlando o número de dias), enquanto que para a variável resistência à tração, isso não é possível. Supondo que no experimento realizado, os resultados obtidos foram X (dias) 1 2 3 5 10 28 Y (kgf/cm2) 10 23 28 30 35 40 Pode-se construir um diagrama de dispersão (gráfico cartesiano para os pontos observados) e ter uma primeira idéia da relação entre as variáveis X e Y, como mostra a Figura 8.1. Figura 8.1 – Diagrama de dispersão Uma simples análise do diagrama de dispersão pode sugerir uma relação funcional entre as variáveis envolvidas. Se os pontos tendem a se agrupar em torno de uma linha reta, pode ser que a relação linear seja 0 5 10 15 20 25 30 5 10 15 20 25 30 35 40 45 Y X Regressão 216 adequada; se os pontos tendem a se agrupar em torno de uma curva exponencial, a relação adequada talvez seja a função exponencial. Enfim, o aspecto pode sugerir uma relação funcional adequada ao problema de regressão. 8.2 REGRESSÃO LINEAR SIMPLES O modelo estatístico de uma regressão linear simples é do tipo Y = + X + , (8.2) onde e são parâmetros da regressão, sendo denominado de coeficiente de regressão linear. Ao estabelecer o modelo de regressão linear simples, deve-se pressupor que: 1o ) A relação entre X e Y é linear. 2o ) A variável X não é aleatória, ou seja, os valores de X são fixos. 3o ) E() = 0, ou seja, a média do erro (variável aleatória) é nula. 4o ) A variância de é sempre 2, ou seja, V() = 2. 5o ) Os erros são independentes. 6o ) Os erros têm distribuição normal. Em uma análise de regressão linear, devemos inicialmente estimar os parâmetros e , cujas estimativas chamaremos de a e b, respectivamente. Considerando para o modelo (8.2) que E(Y) = + X, (8.3) a equação de regressão (8.3) estimada será dada por Y = a + bX, (8.4) Estatística Básica para os Cursos de Engenharia 217 onde Y estima E(Y) = + X. O método que foi utilizado para determinar essas estimativas é conhecido como método dos mínimos quadrados (MMQ). Esse método consiste em tomar como estimativas os valores que minimizam a soma dos quadrados dos desvios Q e Y a bXi i i i n i n 2 2 11 , (8.5) dessa forma, deve-se ter Q a Y a bXi i 2 0( ) . (8.6) Q b Y a bX Xi i i 2 0( ) ( ) . (8.7) Simplificando as equações (8.6) e (8.7), obtém-se o denominado sistema de equações normais Y na b Xi i (8.8) X Y a X b Xi i i i 2 , (8.9) que resolvendo, determina-se a e b. Pode-se utilizar um modelo simplificado para a regressão linear simples, considerando-se as variáveis centradas XXx e YYy , (8.10) onde n iX X e n iY Y . Regressão 218 No modelo simplificado, a equação de regressão estimada tem a forma y bx , (8.11) onde YŶŷ e a estimativa de pelo método dos mínimos quadrados é dada por 22 x xy x xY b . (8.12) Exemplos 1. Foi realizada uma experiência relacionando os alongamentos de uma mola com as cargas aplicadas. Os resultados obtidos foram Carga (kg) 3 4 5 6 7 8 9 10 Alongamento (cm) 4,0 4,8 5,6 6,7 7,9 9,0 9,8 11,0 Determinar a equação de regressão linear. Como X é a variável não-aleatória, ela será representada pela carga (kg) e Y pelo alongamento (cm). Assim, obtém-se: X = 52, Y = 58,8, X2 = 380, XY = 424,9. 58,8 = 8a + 52b 424,9 = 52a + 380b, que resolvendo fornece a = 0,742 e b = 1,017, portanto, a equação de regressão estimada será Estatística Básica para os Cursos de Engenharia 219 Ŷ = 0,742 + 1,017X. O diagrama de dispersão e a reta de regressão são mostrados na Figura 8.2. Figura 8.2 – Diagrama de dispersão e reta de regressão 2. Para o problema anterior, estimar o alongamento da mola se a carga aplicada for de 6,5 kg. Para X = 6,5 kg, tem-se que Ŷ = 0,742 + 1,0176,5 = 7,35 cm. 3. Resolver o problema utilizando o modelo simplificado. 5,6 8 52 X e 35,7 8 8,58 Y . x2 = (X - X )2 = (X - 6,5)2 = 42 2 3 4 5 6 7 8 9 10 11 3 4 5 6 7 8 9 10 11 12 X Y Regressão 220 xY = (X - X )Y = (X - 6,5)Y = 42,7. 017,1 42 7,42 b , portanto, obtém-se .x017,1ŷ Podemos voltar às variáveis originais fazendo 5,6XXXx e 35,7ŶYŶŷ , logo )5,6X(017,135,7Ŷ ou .X017,1742,0Ŷ 8.3 FUNÇÕES LINEARIZÁVEIS O método de regressão linear simples pode ser aplicado a certas funções não-lineares, que por transformações convenientes podem ser linearizadas. Por exemplo, a função X β αY , pela transformação X 1 Z pode ser colocada na forma linear Y = + Z. Da mesma forma, a equação Y = AX pode ser colocada na forma V = + U, utilizando as transformações U = log X, V = log Y e = log A. Exemplo Os dados seguintes foram obtidos em diversos ensaios de tração, realizados em peças de concreto durante o tempo de cura. Estatística Básica para os Cursos de Engenharia 221 Tempo de cura (dias) 1 3 5 7 25 Resistência (kgf) 10 20 27 31 38 Pede-se a equação de regressão de mínimos quadrados, onde Y = A.B1/X. Y = A.B1/X log Y = log A + X 1 log B Z = a + b.V, onde Z = log Y, a = log A, V = X 1 e b = log B. Portanto, Z = na + bV VZ = aV + bV2 onde Z = 6,8035391, V = 1,7161905, V2 = 1,1731193, VZ = 1,9961924 e n = 5, logo 6,8035391 = 5a + 1,7161905b 1,9961924 = 1,7161905a + 1,1731193b. Resolvendo o sistema acima, obtém-se a = 1,560 e b = -0,580, portanto, Z = 1,560 - 0,580V, mas, log A = a log A = 1,560 A = 36,308 e log B = b log B = - 0,580 B = 0,263, que resulta em Regressão 222 1/X (0,263)36,308Ŷ 8.4 ANÁLISE DA VARIÂNCIA APLICADA À REGRESSÃO LINEAR SIMPLES A ANOVA aplicada à regressão linear simples possibilita testar a existência de regressão linear significativa o que é equivalente mostrar que o coeficiente de regressão 0. O desenvolvimento da ANOVA nesse caso possibilita montar o seguinte quadro Fonte de Variação Soma de quadrados GL Quadrado médio Estatística F Devido à regressão b.Sxy 1 b.Sxy 2 R xy s S.b F Residual Syy – b.Sxy n - 2 2 S.bS n s xyyy2 R Total Syy n - 1 onde n n 1i i n 1i in 1i ii n 1i iixy YX YXYYXXS (8.13) n 2 n 1i in 1i 2 i n 1i 2 iyy Y YYYS (8.14) Estatística Básica para os Cursos de Engenharia 223 Se F > F com 1 = 1 e 2 = n - 2, rejeita-se a hipótese: H0: = 0 (a regressão linear de Y sobre X não é significativa) em favor da hipótese H1: 0 (a regressão linear de Y sobre X é significativa). Exemplo Testar pela ANOVA a existência de regressão linear, para os dados do exemplo 1 da seção 8.2. ao nível de significância de 5%. Como já foi calculado para este exemplo, tem-se que b = 1,017; n = 8; X = 52; Y = 58,8; X2 = 380; XY = 424,9 e Y2 = 475,74. 7,42 8 8,5852 9,424Sxy . 56,43 8 2 8,58 74,475Syy . Fonte de Variação Soma de quadrados GL Quadrado médio Estatística F Devido à regressão 1,01742,7 = 43,4259 1 43,4259 1938,66 Residual 43,56-43,4259 = 0,1341 8-2=6 0,0224 Total 43,56 8-1=7 Regressão 224 Para = 0,05, 1 = 1 e 2 = 6, obtém-se na tabela F1,6(0,05) = 5,99. Como F = 1938,66 > F1,6(0,05) = 5,99, rejeita-se a hipótese H0, ou seja, a regressão linear é significativa ao nível de significância de 5%. 8.5 INTERVALOS DE CONFIANÇA PARA A REGRESSÃO LINEAR SIMPLES Os intervalos de confiança (1 - )100% para uma regressão linear simples são dados a seguir, onde todos eles envolvem o uso da distribuição t de Student com = n - 2 graus de liberdade. (1) Intervalo de confiança para xx 2 R2/ xx 2 R2/ S X n 1 .sta S X n 1 sta (8.15) onde n X X)XX(S 2 n 1i in 1i 2 i 2 n 1i ixx (8.16) (2) Intervalo de confiança para xx R 2/ xx R 2/ S s tb S s tb (8.17) (3) Intervalo de confiança para E(Yh), ou seja, para Y correspondendo a um valor de X que não exista na amostra Estatística Básica para os Cursos de Engenharia 225 xx 2 i R2/hh xx 2 i R2/h S XX n 1 stŶ)Y(E S XX n 1 stŶ (8.18) (4) Intervalo de confiança para Yh (um valor individual de Y dado um valor de X) ou intervalo de previsão xx 2 i R2/hh xx 2 i R2/h S XX n 1 1stŶY S XX n 1 1.stŶ (8.19) Exemplo Para o exemplo 1 da seção 8.2, determinar os intervalos de confiança de 95% para os parâmetros e e também o intervalo de confiança para E(Yh) e de previsão para Yh dado que X = 7,5. Tem-se que a = 0,740, b = 1,017, sR = 0 0224, = 0,150, t/2 = 2,45 (tabela: com = 8 - 2 = 6), n = 8, 42 8 52 380 n X XS 2 2 i2 ixx e 5,6 8 52 n X X i . - Intervalo da confiança para o parâmetro : 42 5,6 8 1 150,045,2740,0α 42 5,6 8 1 150,045,2740,0 22 , Regressão 226 resultando 0,349 1,131. - Intervalo de confiança para o parâmetro : 42 150,0 45,2017,1 42 150,0 45,2017,1 , resultando 0,960 1,074. - Intervalo de confiança para E(Yh) dado X = 7,5. para X = 7,5; tem-se que: , , , ,Yh 0 740 1017 7 5 8 368; portanto, 42 5,65,7 8 1 150,045,2368,8)Y(E 42 5,65,7 8 1 150,045,2368,8 2 h 2 resultando 8,226 E(Yh) 8,510. - Intervalo de previsão para Yh dado X = 7,5. Estatística Básica para os Cursos de Engenharia 227 42 5,65,7 8 1 1 150,045,2368,8Y 42 5,65,7 8 1 1150,045,2368,8 2 h 2 . resultando 7,974 Yh 8,762. 8.6 REGRESSÃO POLINOMIAL Uma equação de regressão polinomial pode ser obtida pelo método dos mínimos quadrados, de forma semelhante como foi obtida para a regressão linear. O modelo estatístico de uma regressão polinomial é do tipo Y = + 1X + 2X2 + + kXk + . (8.20) A equação de regressão estimada será dada por Y= a + b1X + b2X2 + + bkXk. (8.21) Particularmente, no caso de uma regressão parabólica, teremos Y = a + b1X + b2X2. (8.22) Aplicando o M.M.Q. em (8.22), para se obter a, b1 e b2, resulta o sistema Y na b X b Xi i i 1 2 2 X Y a X b X b Xi i i i i 1 2 2 3 (8.23) Regressão 228 X Y a X b X b Xi i i i i 2 2 1 3 2 4 A solução do sistema (8.23) fica mais simples quando se tem os valores de Xi igualmente espaçados, pois, nesse caso, trabalha-se com Xi - X ao invés dos Xi, sendo que os somatórios de expoentes ímpares em X se anulam. Nesse caso, a equação de regressão estimada será ( ) ( )Y a b X X b X X 1 2 2 . (8.24) Exemplo Ajustar uma parábola de mínimos quadrados para os dados experimentais seguintes e estimar o valor de Y para X = 7. Xi 1 2 3 4 5 6 Yi 3 4 6 8 12 18 Tem-se que X = 21, X2 = 91, X3 = 441, X4 = 2275, Y=51, XY = 229, X2Y = 1149, n = 6. O sistema fica 51 = 6a + 21b1 + 91 b2 229 = 21a + 91b1 + 441b2 1149 = 91a + 441b1 + 2275b2, que resolvendo, resulta a = 3,900, b1 = -1,239 e b2 = 0,589. Portanto, a equação da parábola de mínimos quadrados será Estatística Básica para os Cursos de Engenharia 229 Y = 3,900 - 1,239X + 0,589X2. Para X = 7 Y = 3,900 - 1,2397 + 0,58972 = 24,088. O diagrama de dispersão e a parábola de regressão são mostrados na Figura 8.3. Figura 8.3 – Diagrama de dispersão e parábola de regressão 0 1 2 3 4 5 6 7 0 5 10 15 20 25 X Y 8.7 REGRESSÃO LINEAR MÚLTIPLA O modelo estatístico de uma regressão linear múltipla, sendo Y a variável resposta (dependente) e X1, X2, , Xk, as k (k > 1) variáveis explicativas (independentes), será dado por Yj = + 1X1j + 2X2j + + kXkj + j , (8.25) com j = 1, 2, , n. Essa equação pode ser expressa como Regressão 230 Yj = + k 1i iji Xβ + j . (8.26) Em notação matricial Y = X + , (8.27) onde Y = Y Y Yn 1 2 , X = 1 1 1 11 21 12 22 2 1 2 X X X X X X X X X k1 k n n kn , = 1 k e = 1 2 n . A equação de regressão linear múltipla estimada, na forma matricial, será Y= Xb, (8.28)onde Y Y Y Yn 1 2 e b a b bk 1 . A aplicação do M.M.Q. fornece b = (X ' X)-1X ' Y (8.29) Exemplo Estatística Básica para os Cursos de Engenharia 231 Determinar a equação de regressão linear de mínimos quadrados para os dados experimentais seguintes, e estimar o valor de Y para X1j = 2 e X2j = 2. Yj 1,2 5,2 8,0 8,2 10,0 X1j 0 0 1 2 3 X2j 2 3 2 3 4 Tem-se que X'X = 1 1 1 1 1 0 0 1 2 3 2 3 2 3 4 1 0 2 1 0 3 1 1 2 1 2 3 1 3 4 5 6 14 6 14 20 14 20 42 , (X'X)-1 = 1 44 188 28 76 28 14 16 76 16 34 e X'Y = 1 1 1 1 1 0 0 1 2 3 2 3 2 3 4 1 2 52 8 0 8 2 10 0 32 6 54 4 98 6 , . , , , , , , , portanto, a estimativa b será dada por Regressão 232 b a b b 1 2 1 44 188 28 76 28 14 16 76 16 34 32 6 54 4 98 6 3 6 2 2 0 1 , , , , , , . A equação de regressão estimada de mínimos quadrados será , , ,Y X Xj j j 3 6 2 2 0 11 2 . Para X1j = 2 e X2j = 2, resulta Yj = 3,6 + 2,22 + 0,12 = 8,2. 8.8 COEFICIENTE DE CORRELAÇÃO LINEAR MÚLTIPLA Como foi visto para a correlação linear simples, tem-se também um coeficiente de correlação linear múltipla que possibilita determinar quantitativamente o grau de relação linear entre as variáveis envolvidas. Esse coeficiente, denotado por R, é dado por yyS ky S k by2S2by1S1b R , (8.30) onde n YX YXS i iiy . (8.31) Em notação matricial, teremos Estatística Básica para os Cursos de Engenharia 233 y'y y'X'b R , onde y = Y - Y . (8.32) O coeficiente de correlação linear múltipla varia de 0 a 1, ou seja, 0 R 1, ao contrário do coeficiente de correlação linear simples que varia de -1 a 1. No caso de correlação múltipla não tem sentido R tomar valores negativos. Quando se deseja saber até que ponto o modelo de regressão adotado explica a realidade pode-se usar alguns indicadores. Um desses indicadores é o coeficiente de explicação R2, que indica a parcela da variação total de Y que é explicada pelo hiperplano de regressão. Se R2 = 0 o modelo adotado não explica nada da variável Y, enquanto que R2 = 1 indica que o modelo adotado explica com perfeição a variação de Y. Exemplo Calcular o coeficiente de correlação e de explicação para o problema resolvido na seção 8.7. 348,34 48,3 68,1 48,1 32,1 32,5 43232 32100 11111 1,02,26,3y'X'b , 168,47 48,3 68,1 48,1 32,1 32,5 48,368,148,132,132,5y'y . Portanto, Regressão 234 8533,0 168,47 348,34 y'y y'X'b R e R2 = (0,8533)2 = 0,7281 ou 72,81%, ou seja, 72,81% da variação total de Y é explicada pelo modelo de regressão adotado. 8.9 TESTE DE EXISTÊNCIA DA REGRESSÃO Como na regressão linear simples, a existência da regressão linear múltipla pode ser testada através da aplicação da análise da variância. O quadro da análise de variância para a obtenção da estatística F do teste é dado a seguir. Fonte de Variação Soma de quadrados GL Quadrado médio Estatística F Devido à regressão b Si iy i k 1 k s b S kreg i iy i k 2 1 2 r 2 reg s s F Residual k 1i iyiyy SbS n-k-1 1kn SbS s k 1i iyiyy 2 r Total Syy n-1 Se F > Fk,n-k-1(), a regressão linear é significativa no nível de significância adotado, caso contrário, ela não é significativa nesse nível. Exemplo Estatística Básica para os Cursos de Engenharia 235 Testar, pela Análise da Variância, se o modelo de regressão adotado no exemplo da seção 8.7 é significativo ao nível de significância de 5%. 28,15 5 6,326 4,54 n YX YXS 1 1y1 , 32,7 5 6,3214 6,98 n YX YXS 2 2y2 , 348,3432,71,028,152,2SbSbSb y22y11 k 1i iyi , 168,47 5 6,32 72,259 n Y YS 2 2 2 yy , k = 2, n - k - 1 = 5 - 2 - 1 = 2 e n - 1 = 5 - 1 = 4. Fonte de Variação Soma de quadrados GL Quadrado médio Estatística F Devido à regressão 34,348 2 17,174 2,68 Residual 12,820 2 6,41 Total 47,168 4 Na tabela obtém-se Fk,n-k-1() = F2,2(0,05) = 19,00. Como F =2,68 < F2,2(0,05), a regressão linear não é significativa ao nível de significância de 5%. Regressão 236 8.10 ANÁLISE DE MELHORIA A análise de melhoria consiste na busca de equação mais elaborada de modo que o modelo possa ser considerado pelo menos satisfatório para a representação de um dado fenômeno. O procedimento consiste em primeiramente achar a equação da reta de regressão. A seguir verificamos se a adoção de uma parábola ao invés da reta traz uma melhoria de ajuste significativa. Ocorrendo essa melhoria, verificamos se a cúbica de regressão apresenta melhoria de ajuste em relação à parábola, e assim sucessivamente. Em geral essa análise deve prosseguir até que duas etapas sucessivas não tenham produzido melhoria significativa. Em seguida será visto como a Análise de Variância permite testar a melhoria no problema de regressão polinomial. Fonte de Variação Soma de quadrados GL Quadrado médio Estatística F Melhoria de ajuste Y YP i i n i 2 1 1 s Y YM P i i n i 2 2 1 F s s M P 2 2 Residual sobre a parábola Y Yi P i n i 2 1 n - 3 s Y Y nP i P i n i 2 2 1 3 Residual sobre a reta Y Yi i i n 2 1 n - 2 onde: Yi são os valores ajustados para a reta, YPi são os valores ajustados para a parábola e Yi são os valores observados da variável Y. Estatística Básica para os Cursos de Engenharia 237 Se F > F1,n-3() existe uma melhoria significativa no nível de significância ao utilizar para a regressão o modelo parabólico ao invés do modelo linear, caso contrário, a melhoria não é significativa no nível adotado. Exemplo Testar se a parábola de mínimos quadrados para o exemplo da seção 8.6 define uma regressão significativamente melhor que a reta, ao nível de significância de 5%. Para aquele exemplo, os dados eram X 1 2 3 4 5 6 Y 3 4 6 8 12 18 e a equação de regressão resultante para a parábola foi Y = 3,900 - 1,239X + 0,589X2. Ajustando uma reta a esses dados, obtemos a equação Ŷ = -1,600 + 2,886X. Na tabela seguinte estão resumidos os cálculos necessários para construir o quadro da Análise da Variância. Xi Yi Yi Y Yi i 2 YPi Y Yi Pi 2 Y YP ii 2 1 3 1,286 2,9378 3,250 0,0625 3,8573 2 4 4,172 0,0296 3,778 0,0493 0,1552 3 6 7,058 1,1194 5,484 0,2663 2,4775 4 8 9,944 3,7791 8,368 0,1354 2,4838 5 12 12,830 0,6889 12,430 0,1849 0,1600 6 18 15,716 5,2167 17,670 0,1089 3,8181 Total 13,7715 0,8073 12,9519 Regressão 238 O quadro da Análise da Variância resultante é Fonte de Variação Soma de quadrados GL Quadrado médioEstatística F Melhoria de ajuste 12,9519 1 12,9519 48,13 Residual sobre a parábola 0,8073 6-3=3 0,2691 Residual sobre a reta 13,7715 6-2=4 Na tabela, obtém-se F1,3() = 10,13. Como F = 48,13 > F1,3() = 10,13, rejeitamos ao nível de significância de 5%, a hipótese H0 de não haver melhoria de ajuste, ou seja, existe uma melhoria significativa de ajuste ao substituirmos o modelo linear pelo modelo parabólico. 8.11 PROBLEMAS PROPOSTOS 01. Suponha que a análise de certo combustível apresentou para Y (poder calorífico) e para X (% de cinzas) os resultados Y 13100 11200 10200 9600 8800 X 18,3 27,5 36,4 48,5 57,8 Determinar a equação de regressão linear de mínimos quadrados e estimar o poder calorífico para X = 30%. Construir também o diagrama de dispersão e traçar a reta ajustada. 02. Um pesquisador realizou certa experiência relacionando pressão Y com temperatura X, obtendo os resultados Estatística Básica para os Cursos de Engenharia 239 X (em 0C) 300 400 500 600 700 800 Y (em atm) 1,3 1,9 2,5 3,0 3,7 4,1 Pede-se: (a) a equação de regressão linear de mínimos quadrados. (b) a estimativa da pressão para a temperatura de 450. (c) o diagrama de dispersão e a correspondente reta. (d) o coeficiente de correlação linear. 03. Para o problema 02, utilizando a Análise de Variância, testar a existência de regressão linear ao nível de significância de 1%. 04. Para o problema 02, determinar os intervalos de confiança de 99% para os parâmetros e da regressão linear e os intervalos de confiança e de previsão correspondentes à temperatura X = 450. 05. A vazão V de um rio e a altura fluviométrica h estão relacionadas através de V = A.hb. Usando o conceito de linearização, ajustar uma reta de mínimos quadrados para os resultados experimentais seguintes V 4,95 5,10 6,94 9,57 13,67 18,54 h 1,20 1,45 1,57 1,68 1,89 2,10 06. Foram realizados 5 ensaios para a determinação da resistência à compressão (30 dias) do concreto, em função da dosagem de água lb água / kg cimento 0,3 0,4 0,5 0,6 0,7 resistência em kg/cm2 420 330 260 220 200 Pede-se a equação de regressão de mínimos quadrados. Supor que o modelo adequado é da forma bXa Y 1 . 07. Os dados da tabela abaixo representam o faturamento bruto de uma indústria de equipamentos mecânicos Regressão 240 Ano 1978 1979 1980 1981 1982 1983 Faturamento (em milhares de dólares) 50 60 65 78 80 95 08. Através da Análise da Variância, testar se a parábola de mínimos quadrados do problema 07 fornece uma resposta significativamente melhor que a reta, no nível de significância de 1%. 09. A tabela seguinte relaciona o consumo (em toneladas) de matéria prima para uma indústria produzir dois tipos de produtos: A e B, sendo X1 e X2 as quantidades produzidas de A e B, respectivamente. Consumo de matéria prima (Y) 3,5 4,0 5,4 6,1 7,0 7,5 8,0 X1 10 12 15 17 20 23 25 X2 8 9 11 13 15 16 18 Determinar a equação de regressão linear múltipla. 10. Para o problema 09, calcular o coeficiente de correlação linear múltipla e interpretar o resultado. 11. Uma certa constante (Y) assume os valores abaixo em função da temperatura (X1) e pressão (X2) aplicadas Y 0,15 0,25 0,30 0,55 0,60 X1 50 60 70 80 90 X2 0,5 1,5 2,3 3,1 3,3 Determinar a equação de regressão linear múltipla. 12. Através da Análise da Variância, testar para o problema 11 a existência de regressão linear múltipla significativa ao nível de 5%. 13. Para o problema anterior, calcular o coeficiente de correlação múltipla e interpretar o resultado. Estatística Básica para os Cursos de Engenharia 241 14. Para o problema 09, determinar a equação de regressão linear simples entre as variáveis Y e X1, calculando o coeficiente de correlação linear de Pearson. 15. Para o problema 09, determinar a equação de regressão linear simples entre as variáveis Y e X2, calculando o coeficiente de correlação linear e comparar com o obtido no problema anterior. 16. Em uma regressão linear múltipla, o coeficiente de explicação é definido por R2 (quadrado do coeficiente de correlação) e indica a parcela da variação total de Y que é explicada pelo hiperplano de regressão. Calcular o coeficiente de explicação para o problema 09 e interpretar o resultado. 17. Calcular o coeficiente de explicação R2 para o problema 11 e interpretar o resultado. 18. No problema 16 foi definido o coeficiente de explicação para a regressão linear múltipla. De forma semelhante define-se o coeficiente de explicação para a regressão linear simples por r2. Calcular o coeficiente de explicação e interpretar o resultado, para o problema 01. 19. Calcular o coeficiente de explicação para o problema 14 e 15, interpretando os resultados obtidos. 20. Através da Análise da Variância, testar a existência de regressão linear múltipla para o problema 09, usando o nível de significância de 1%.
Compartilhar