Buscar

Eng _Cap8

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 28 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 28 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 28 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

8 
 
REGRESSÃO 
 
 
8.1 INTRODUÇÃO 
 
Muitas vezes estudamos certos fenômenos que envolvem duas ou 
mais variáveis, e freqüentemente estamos interessados em estabelecer 
uma relação funcional entre as mesmas. O problema da regressão 
consiste em determinar a função que exprime essa relação. 
Quando o problema envolve apenas duas variáveis ele é 
conhecido por regressão simples, e no caso de mais de duas variáveis 
por regressão múltipla. 
Basicamente, um problema de regressão envolve variáveis que 
podem ser controladas (podem ser relacionadas matematicamente) e 
variáveis que não podem ser controladas (variação aleatória). 
Seja Y uma variável aleatória que é influenciada pelas variáveis 
X1, X2, , Xn, então, 
 
 
Y = f(X) +  , (8.1) 
 
onde: 
X é a variável independente (variável explicativa). 
Y é a variável dependente (variável resposta). 
 é a componente aleatória da variação de Y. 
f é a função de regressão. 
 
 
Normalmente, nos experimentos realizados, X é uma variável que 
pode ser controlada pelo pesquisador. Por exemplo, suponhamos que 
Estatística Básica para os Cursos de Engenharia 215 
estamos realizando ensaios de tração (Y) em peças de concreto durante 
o tempo de cura (X). A variável tempo X pode ser controlada pelo 
pesquisador, pois o mesmo pode determinar a resistência à tração para 
1, 2, 3,  dias (controlando o número de dias), enquanto que para a 
variável resistência à tração, isso não é possível. 
Supondo que no experimento realizado, os resultados obtidos 
foram 
 
 
X (dias) 1 2 3 5 10 28 
Y (kgf/cm2) 10 23 28 30 35 40 
 
 
Pode-se construir um diagrama de dispersão (gráfico cartesiano para os 
pontos observados) e ter uma primeira idéia da relação entre as 
variáveis X e Y, como mostra a Figura 8.1. 
 
Figura 8.1 – Diagrama de dispersão 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Uma simples análise do diagrama de dispersão pode sugerir uma 
relação funcional entre as variáveis envolvidas. Se os pontos tendem a 
se agrupar em torno de uma linha reta, pode ser que a relação linear seja 
0 5 10 15 20 25 30
5
10
15
20
25
30
35
40
45
Y
X
Regressão 216 
adequada; se os pontos tendem a se agrupar em torno de uma curva 
exponencial, a relação adequada talvez seja a função exponencial. 
Enfim, o aspecto pode sugerir uma relação funcional adequada ao 
problema de regressão. 
 
8.2 REGRESSÃO LINEAR SIMPLES 
 
O modelo estatístico de uma regressão linear simples é do tipo 
 
Y =  + X + , (8.2) 
 
onde  e  são parâmetros da regressão, sendo  denominado de 
coeficiente de regressão linear. 
Ao estabelecer o modelo de regressão linear simples, deve-se 
pressupor que: 
 
1o ) A relação entre X e Y é linear. 
2o ) A variável X não é aleatória, ou seja, os valores de X são 
fixos. 
3o ) E() = 0, ou seja, a média do erro  (variável aleatória) é 
nula. 
4o ) A variância de  é sempre 2, ou seja, V() = 2. 
5o ) Os erros são independentes. 
6o ) Os erros têm distribuição normal. 
 
Em uma análise de regressão linear, devemos inicialmente 
estimar os parâmetros  e , cujas estimativas chamaremos de a e b, 
respectivamente. Considerando para o modelo (8.2) que 
 
E(Y) =  + X, (8.3) 
 
a equação de regressão (8.3) estimada será dada por 
 
Y = a + bX, (8.4) 
Estatística Básica para os Cursos de Engenharia 217 
 
onde Y estima E(Y) =  + X. 
 
O método que foi utilizado para determinar essas estimativas é 
conhecido como método dos mínimos quadrados (MMQ). Esse método 
consiste em tomar como estimativas os valores que minimizam a soma 
dos quadrados dos desvios 
 
  Q e Y a bXi i i
i
n
i
n
   

 2
2
11
, (8.5) 
 
dessa forma, deve-se ter 
 
 


Q
a
Y a bXi i    2 0( ) . (8.6) 
 
 


Q
b
Y a bX Xi i i    2 0( ) ( ) . (8.7) 
 
Simplificando as equações (8.6) e (8.7), obtém-se o denominado 
sistema de equações normais 
 
Y na b Xi i   (8.8) 
 
X Y a X b Xi i i i  
2
, (8.9) 
 
que resolvendo, determina-se a e b. 
Pode-se utilizar um modelo simplificado para a regressão linear 
simples, considerando-se as variáveis centradas 
 
XXx  e YYy  , (8.10) 
onde 
n
iX
X

 e 
n
iY
Y

 . 
Regressão 218 
No modelo simplificado, a equação de regressão estimada tem a 
forma 
 
y bx , (8.11) 
onde 
YŶŷ  
 
e a estimativa de  pelo método dos mínimos quadrados é dada por 
 






22
x
xy
x
xY
b . (8.12) 
 
Exemplos 
 
1. Foi realizada uma experiência relacionando os alongamentos de uma 
mola com as cargas aplicadas. Os resultados obtidos foram 
 
Carga (kg) 3 4 5 6 7 8 9 10 
Alongamento (cm) 4,0 4,8 5,6 6,7 7,9 9,0 9,8 11,0 
 
Determinar a equação de regressão linear. 
 
Como X é a variável não-aleatória, ela será representada pela 
carga (kg) e Y pelo alongamento (cm). Assim, obtém-se: 
 
X = 52, Y = 58,8, X2 = 380, XY = 424,9. 
 
58,8 = 8a + 52b 
424,9 = 52a + 380b, 
 
que resolvendo fornece 
 
a = 0,742 e b = 1,017, 
 
portanto, a equação de regressão estimada será 
Estatística Básica para os Cursos de Engenharia 219 
 
Ŷ = 0,742 + 1,017X. 
 
O diagrama de dispersão e a reta de regressão são mostrados na 
Figura 8.2. 
 
Figura 8.2 – Diagrama de dispersão e reta de regressão 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
2. Para o problema anterior, estimar o alongamento da mola se a carga 
aplicada for de 6,5 kg. 
 
Para X = 6,5 kg, tem-se que 
 
Ŷ = 0,742 + 1,0176,5 = 7,35 cm. 
 
3. Resolver o problema utilizando o modelo simplificado. 
 
5,6
8
52
X  e 35,7
8
8,58
Y  . 
 
 x2 = (X - X )2 = (X - 6,5)2 = 42 
 
2 3 4 5 6 7 8 9 10 11
3
4
5
6
7
8
9
10
11
12
X
Y
Regressão 220 
xY = (X - X )Y = (X - 6,5)Y = 42,7. 
 
017,1
42
7,42
b  , 
portanto, obtém-se 
 
.x017,1ŷ  
 
Podemos voltar às variáveis originais fazendo 
 
5,6XXXx  e 35,7ŶYŶŷ  , 
logo 
)5,6X(017,135,7Ŷ  
ou 
.X017,1742,0Ŷ  
 
 
8.3 FUNÇÕES LINEARIZÁVEIS 
 
O método de regressão linear simples pode ser aplicado a certas 
funções não-lineares, que por transformações convenientes podem ser 
linearizadas. 
Por exemplo, a função 
X
β
αY  , pela transformação 
X
1
Z  pode ser colocada na forma linear Y =  + Z. Da mesma 
forma, a equação Y = AX pode ser colocada na forma V =  + U, 
utilizando as transformações U = log X, V = log Y e  = log A. 
 
Exemplo 
 
Os dados seguintes foram obtidos em diversos ensaios de tração, 
realizados em peças de concreto durante o tempo de cura. 
 
Estatística Básica para os Cursos de Engenharia 221 
Tempo de cura (dias) 1 3 5 7 25 
Resistência (kgf) 10 20 27 31 38 
 
Pede-se a equação de regressão de mínimos quadrados, onde 
 Y = A.B1/X. 
 
Y = A.B1/X  log Y = log A + 
X
1
 log B  Z = a + b.V, onde 
 
Z = log Y, a = log A, V = 
X
1
 e b = log B. 
 
Portanto, 
  Z = na + bV 
VZ = aV + bV2 
onde 
 
Z = 6,8035391, V = 1,7161905, V2 = 1,1731193, VZ = 
1,9961924 e n = 5, logo 
 
 
 6,8035391 = 5a + 1,7161905b 
 
 1,9961924 = 1,7161905a + 1,1731193b. 
 
Resolvendo o sistema acima, obtém-se 
 
a = 1,560 e b = -0,580, 
 
portanto, 
Z = 1,560 - 0,580V, 
 
mas, log A = a  log A = 1,560  A = 36,308 e 
 
 log B = b log B = - 0,580  B = 0,263, que resulta em 
Regressão 222 
 
1/X
(0,263)36,308Ŷ  
 
8.4 ANÁLISE DA VARIÂNCIA APLICADA À REGRESSÃO 
 LINEAR SIMPLES 
 
A ANOVA aplicada à regressão linear simples possibilita testar a 
existência de regressão linear significativa o que é equivalente mostrar 
que o coeficiente de regressão   0. 
O desenvolvimento da ANOVA nesse caso possibilita montar o 
seguinte quadro 
 
Fonte de 
Variação 
Soma de 
quadrados 
GL Quadrado médio 
 
Estatística F 
 
Devido à 
regressão 
 
 
b.Sxy 
 
 
1 
 
 
b.Sxy 
 
2
R
xy
s
S.b
F  
 
 
Residual 
 
 
 
Syy – b.Sxy 
 
 
n - 2 
 
2
S.bS
n
s
xyyy2
R



 
 
Total Syy n - 1 
 
 onde 
 
    
n
n
1i
i
n
1i
in
1i
ii
n
1i
iixy
YX
YXYYXXS

















 (8.13) 
 
n
2
n
1i
in
1i
2
i
n
1i
2
iyy
Y
YYYS











 (8.14) 
 
Estatística Básica para os Cursos de Engenharia 223 
Se F > F com 1 = 1 e 2 = n - 2, rejeita-se a hipótese: 
 
H0:  = 0 (a regressão linear de Y sobre X não é significativa) 
 
em favor da hipótese 
 
 H1:   0 (a regressão linear de Y sobre X é significativa). 
 
Exemplo 
 
Testar pela ANOVA a existência de regressão linear, para os 
dados do exemplo 1 da seção 8.2. ao nível de significância de 5%. 
 
Como já foi calculado para este exemplo, tem-se que 
 
 b = 1,017; n = 8;  X = 52;  Y = 58,8;  X2 = 380;  XY = 
424,9 e  Y2 = 475,74. 
 
7,42
8
8,5852
9,424Sxy 

 . 
 
 
56,43
8
2
8,58
74,475Syy  . 
 
 
Fonte de 
Variação 
Soma de 
quadrados 
GL Quadrado médio 
 
Estatística F 
 
Devido à 
regressão 
 
1,01742,7 
= 43,4259 
 
1 
 
43,4259 
 
1938,66 
 
Residual 
 
 
43,56-43,4259 
= 0,1341 
 
8-2=6 
 
0,0224 
 
Total 43,56 8-1=7 
 
Regressão 224 
Para  = 0,05, 1 = 1 e 2 = 6, obtém-se na tabela F1,6(0,05) = 5,99. 
Como F = 1938,66 > F1,6(0,05) = 5,99, rejeita-se a hipótese H0, ou seja, 
a regressão linear é significativa ao nível de significância de 5%. 
 
8.5 INTERVALOS DE CONFIANÇA PARA A REGRESSÃO 
 LINEAR SIMPLES 
 
Os intervalos de confiança (1 - )100% para uma regressão 
linear simples são dados a seguir, onde todos eles envolvem o uso da 
distribuição t de Student com  = n - 2 graus de liberdade. 
 
(1) Intervalo de confiança para  
 
 
xx
2
R2/
xx
2
R2/
S
X
n
1
.sta
S
X
n
1
sta   (8.15) 
onde 
 
n
X
X)XX(S
2
n
1i
in
1i
2
i
2
n
1i
ixx













 (8.16) 
 
 
(2) Intervalo de confiança para  
 
 
xx
R
2/
xx
R
2/
S
s
tb
S
s
tb   (8.17) 
 
 
(3) Intervalo de confiança para E(Yh), ou seja, para Y correspondendo 
a um valor de X que não exista na amostra 
 
 
Estatística Básica para os Cursos de Engenharia 225 
   
xx
2
i
R2/hh
xx
2
i
R2/h
S
XX
n
1
stŶ)Y(E
S
XX
n
1
stŶ



  
(8.18) 
(4) Intervalo de confiança para Yh (um valor individual de Y dado um 
valor de X) ou intervalo de previsão 
 
 
   
xx
2
i
R2/hh
xx
2
i
R2/h
S
XX
n
1
1stŶY
S
XX
n
1
1.stŶ



  
(8.19) 
 
Exemplo 
 
Para o exemplo 1 da seção 8.2, determinar os intervalos de 
confiança de 95% para os parâmetros  e  e também o intervalo de 
confiança para E(Yh) e de previsão para Yh dado que X = 7,5. 
 
Tem-se que 
 
a = 0,740, b = 1,017, sR = 0 0224, = 0,150, t/2 = 2,45 (tabela: 
com  = 8 - 2 = 6), 
 
n = 8, 
 
42
8
52
380
n
X
XS
2
2
i2
ixx 

 e 
5,6
8
52
n
X
X
i


 . 
 
- Intervalo da confiança para o parâmetro : 
 
 
   
42
5,6
8
1
150,045,2740,0α
42
5,6
8
1
150,045,2740,0
22
 , 
Regressão 226 
 
resultando 
0,349    1,131. 
 
- Intervalo de confiança para o parâmetro : 
 
 
42
150,0
45,2017,1
42
150,0
45,2017,1  , 
 
resultando 
0,960    1,074. 
 
 
- Intervalo de confiança para E(Yh) dado X = 7,5. 
 
para X = 7,5; tem-se que:  , , , ,Yh    0 740 1017 7 5 8 368; 
portanto, 
 
 
 
42
5,65,7
8
1
150,045,2368,8)Y(E
42
5,65,7
8
1
150,045,2368,8
2
h
2





 
 
resultando 
 
8,226  E(Yh)  8,510. 
 
 
- Intervalo de previsão para Yh dado X = 7,5. 
 
 
Estatística Básica para os Cursos de Engenharia 227 
 
 
42
5,65,7
8
1
1
150,045,2368,8Y
42
5,65,7
8
1
1150,045,2368,8
2
h
2





. 
 
resultando 
 
7,974  Yh  8,762. 
 
 
8.6 REGRESSÃO POLINOMIAL 
 
Uma equação de regressão polinomial pode ser obtida pelo 
método dos mínimos quadrados, de forma semelhante como foi obtida 
para a regressão linear. 
 
O modelo estatístico de uma regressão polinomial é do tipo 
 
Y =  + 1X + 2X2 +  + kXk + . (8.20) 
 
A equação de regressão estimada será dada por 
 
Y= a + b1X + b2X2 +  + bkXk. (8.21) 
 
Particularmente, no caso de uma regressão parabólica, teremos 
 
Y = a + b1X + b2X2. (8.22) 
 
Aplicando o M.M.Q. em (8.22), para se obter a, b1 e b2, resulta o 
sistema 
 
 Y na b X b Xi i i    1 2
2
 
 
X Y a X b X b Xi i i i i    1
2
2
3
 (8.23) 
Regressão 228 
 
 X Y a X b X b Xi i i i i
2 2
1
3
2
4    
 
 
A solução do sistema (8.23) fica mais simples quando se tem os 
valores de Xi igualmente espaçados, pois, nesse caso, trabalha-se com 
Xi - X ao invés dos Xi, sendo que os somatórios de expoentes ímpares 
em X se anulam. Nesse caso, a equação de regressão estimada será 
 
 ( ) ( )Y a b X X b X X    1 2
2
. (8.24) 
 
Exemplo 
 
Ajustar uma parábola de mínimos quadrados para os dados 
experimentais seguintes e estimar o valor de Y para X = 7. 
 
Xi 1 2 3 4 5 6 
Yi 3 4 6 8 12 18 
 
Tem-se que 
 
X = 21, X2 = 91, X3 = 441, X4 = 2275, 
Y=51, XY = 229, X2Y = 1149, n = 6. 
 
O sistema fica 
 
 51 = 6a + 21b1 + 91 b2 
 229 = 21a + 91b1 + 441b2 
1149 = 91a + 441b1 + 2275b2, 
 
que resolvendo, resulta 
a = 3,900, b1 = -1,239 e b2 = 0,589. 
 
Portanto, a equação da parábola de mínimos quadrados será 
 
Estatística Básica para os Cursos de Engenharia 229 
Y = 3,900 - 1,239X + 0,589X2. 
 
Para X = 7  Y = 3,900 - 1,2397 + 0,58972 = 24,088. 
 
O diagrama de dispersão e a parábola de regressão são mostrados 
na Figura 8.3. 
 
Figura 8.3 – Diagrama de dispersão e parábola de regressão 
0 1 2 3 4 5 6 7
0
5
10
15
20
25
X
Y
 
 
 
8.7 REGRESSÃO LINEAR MÚLTIPLA 
 
O modelo estatístico de uma regressão linear múltipla, sendo Y a 
variável resposta (dependente) e X1, X2,  , Xk, as k (k > 1) variáveis 
explicativas (independentes), será dado por 
 
 Yj =  + 1X1j + 2X2j +  + kXkj + j , (8.25) 
com j = 1, 2,  , n. Essa equação pode ser expressa como 
 
Regressão 230 
Yj =  + 

k
1i
iji Xβ + j . (8.26) 
Em notação matricial 
 
Y = X + , (8.27) 
 
onde 
 
Y = 
Y
Y
Yn
1
2













, X = 
1
1
1
11 21
12 22 2
1 2
X X X
X X X
X X X
k1
k
n n kn


    













,  = 



1

k












 e  = 



1
2

n












. 
 
 
A equação de regressão linear múltipla estimada, na forma 
matricial, será 
 
Y= Xb, (8.28)onde 
 




Y
Y
Y
Yn













1
2

 e b
a
b
bk













1

. 
 
 
A aplicação do M.M.Q. fornece 
 
b = (X ' X)-1X ' Y (8.29) 
 
Exemplo 
 
Estatística Básica para os Cursos de Engenharia 231 
Determinar a equação de regressão linear de mínimos quadrados 
para os dados experimentais seguintes, e estimar o valor de Y para 
X1j = 2 e X2j = 2. 
 
Yj 1,2 5,2 8,0 8,2 10,0 
X1j 0 0 1 2 3 
X2j 2 3 2 3 4 
 
Tem-se que 
 
X'X = 
1 1 1 1 1
0 0 1 2 3
2 3 2 3 4
1 0 2
1 0 3
1 1 2
1 2 3
1 3 4
5 6 14
6 14 20
14 20 42





































, 
 
(X'X)-1 = 
1
44
188 28 76
28 14 16
76 16 34


 










 e 
 
X'Y = 
1 1 1 1 1
0 0 1 2 3
2 3 2 3 4
1 2
52
8 0
8 2
10 0
32 6
54 4
98 6





































,
.
,
,
,
,
,
,
, 
 
 
portanto, a estimativa b será dada por 
 
 
Regressão 232 
b
a
b
b














 































1
2
1
44
188 28 76
28 14 16
76 16 34
32 6
54 4
98 6
3 6
2 2
0 1
,
,
,
,
,
,
. 
 
 
A equação de regressão estimada de mínimos quadrados será 
 
 , , ,Y X Xj j j  3 6 2 2 0 11 2 . 
 
Para X1j = 2 e X2j = 2, resulta 
 
Yj = 3,6 + 2,22 + 0,12 = 8,2. 
 
 
8.8 COEFICIENTE DE CORRELAÇÃO LINEAR MÚLTIPLA 
 
Como foi visto para a correlação linear simples, tem-se também 
um coeficiente de correlação linear múltipla que possibilita determinar 
quantitativamente o grau de relação linear entre as variáveis envolvidas. 
Esse coeficiente, denotado por R, é dado por 
 
 
yyS
ky
S
k
by2S2by1S1b
R



, (8.30) 
 
onde 

 

n
YX
YXS
i
iiy . (8.31) 
 
Em notação matricial, teremos 
 
Estatística Básica para os Cursos de Engenharia 233 
y'y
y'X'b
R  , onde y = Y - Y . (8.32) 
 
O coeficiente de correlação linear múltipla varia de 0 a 1, ou seja, 
0  R  1, ao contrário do coeficiente de correlação linear simples que 
varia de -1 a 1. No caso de correlação múltipla não tem sentido R tomar 
valores negativos. 
Quando se deseja saber até que ponto o modelo de regressão 
adotado explica a realidade pode-se usar alguns indicadores. Um desses 
indicadores é o coeficiente de explicação R2, que indica a parcela da 
variação total de Y que é explicada pelo hiperplano de regressão. Se R2 
= 0 o modelo adotado não explica nada da variável Y, enquanto que R2 
= 1 indica que o modelo adotado explica com perfeição a variação de Y. 
 
Exemplo 
 
Calcular o coeficiente de correlação e de explicação para o 
problema resolvido na seção 8.7. 
 
  348,34
48,3
68,1
48,1
32,1
32,5
43232
32100
11111
1,02,26,3y'X'b 




























 , 
 
  168,47
48,3
68,1
48,1
32,1
32,5
48,368,148,132,132,5y'y 


















 . 
Portanto, 
 
Regressão 234 
8533,0
168,47
348,34
y'y
y'X'b
R  e R2 = (0,8533)2 = 0,7281 ou 
72,81%, 
 
ou seja, 72,81% da variação total de Y é explicada pelo modelo de 
regressão adotado. 
 
 
8.9 TESTE DE EXISTÊNCIA DA REGRESSÃO 
 
Como na regressão linear simples, a existência da regressão 
linear múltipla pode ser testada através da aplicação da análise da 
variância. O quadro da análise de variância para a obtenção da 
estatística F do teste é dado a seguir. 
 
Fonte de 
Variação 
Soma de 
quadrados 
GL Quadrado médio 
 
Estatística 
F 
 
Devido à 
regressão 
 
b Si iy
i
k


1
 
 
 
k s
b S
kreg
i iy
i
k
2 1


 
 
2
r
2
reg
s
s
F  
 
 
 
Residual 
 
 
 



k
1i
iyiyy SbS
 
 
 
 
n-k-1 
 
1kn
SbS
s
k
1i
iyiyy
2
r





 
 
Total Syy n-1 
 
Se F > Fk,n-k-1(), a regressão linear é significativa no nível de 
significância  adotado, caso contrário, ela não é significativa nesse 
nível. 
 
Exemplo 
Estatística Básica para os Cursos de Engenharia 235 
Testar, pela Análise da Variância, se o modelo de regressão 
adotado no exemplo da seção 8.7 é significativo ao nível de 
significância de 5%. 
 
28,15
5
6,326
4,54
n
YX
YXS
1
1y1 


 
, 
 

 


 32,7
5
6,3214
6,98
n
YX
YXS
2
2y2 , 
 
348,3432,71,028,152,2SbSbSb y22y11
k
1i
iyi 

, 
 
   
168,47
5
6,32
72,259
n
Y
YS
2
2
2
yy 

, 
 
k = 2, n - k - 1 = 5 - 2 - 1 = 2 e n - 1 = 5 - 1 = 4. 
 
 
Fonte de 
Variação 
Soma de 
quadrados 
GL Quadrado médio 
 
Estatística F 
 
Devido à 
regressão 
 
34,348 
 
2 
 
17,174 
 
2,68 
 
Residual 
 
 
12,820 
 
2 
 
6,41 
 
Total 47,168 4 
 
 
Na tabela obtém-se Fk,n-k-1() = F2,2(0,05) = 19,00. Como F 
=2,68 < F2,2(0,05), a regressão linear não é significativa ao nível de 
significância de 5%. 
Regressão 236 
 
8.10 ANÁLISE DE MELHORIA 
 
A análise de melhoria consiste na busca de equação mais 
elaborada de modo que o modelo possa ser considerado pelo menos 
satisfatório para a representação de um dado fenômeno. O 
procedimento consiste em primeiramente achar a equação da reta de 
regressão. A seguir verificamos se a adoção de uma parábola ao invés 
da reta traz uma melhoria de ajuste significativa. Ocorrendo essa 
melhoria, verificamos se a cúbica de regressão apresenta melhoria de 
ajuste em relação à parábola, e assim sucessivamente. Em geral essa 
análise deve prosseguir até que duas etapas sucessivas não tenham 
produzido melhoria significativa. 
Em seguida será visto como a Análise de Variância permite testar 
a melhoria no problema de regressão polinomial. 
 
 
Fonte de 
Variação 
Soma de 
quadrados 
GL Quadrado médio 
 
Estatística 
F 
 
Melhoria 
de ajuste 
 
  Y YP i
i
n
i



2
1
 
 
 
1 
 
 s Y YM P i
i
n
i
2
2
1
 

   
 
F
s
s
M
P

2
2
 
 
Residual 
sobre a 
parábola 
 
 
 Y Yi P
i
n
i


 
2
1
 
 
 
n - 3 
 
s
Y Y
nP
i P
i
n
i
2
2
1
3




 
 
 
Residual 
sobre a 
reta 
 Y Yi i
i
n


 
2
1
 
 
n - 2 
 
 
onde: Yi são os valores ajustados para a reta, 
 YPi são os valores ajustados para a parábola e 
 Yi são os valores observados da variável Y. 
Estatística Básica para os Cursos de Engenharia 237 
Se F > F1,n-3() existe uma melhoria significativa no nível de 
significância  ao utilizar para a regressão o modelo parabólico ao 
invés do modelo linear, caso contrário, a melhoria não é significativa no 
nível  adotado. 
 
Exemplo 
 
Testar se a parábola de mínimos quadrados para o exemplo da 
seção 8.6 define uma regressão significativamente melhor que a reta, ao 
nível de significância de 5%. 
 Para aquele exemplo, os dados eram 
 
X 1 2 3 4 5 6 
Y 3 4 6 8 12 18 
 
e a equação de regressão resultante para a parábola foi 
Y = 3,900 - 1,239X + 0,589X2. 
 
Ajustando uma reta a esses dados, obtemos a equação 
 
Ŷ = -1,600 + 2,886X. 
 
Na tabela seguinte estão resumidos os cálculos necessários para 
construir o quadro da Análise da Variância. 
 
Xi Yi Yi  Y Yi i 
2
 
YPi
  Y Yi Pi 
2
 
  Y YP ii 
2
 
1 3 1,286 2,9378 3,250 0,0625 3,8573 
2 4 4,172 0,0296 3,778 0,0493 0,1552 
3 6 7,058 1,1194 5,484 0,2663 2,4775 
4 8 9,944 3,7791 8,368 0,1354 2,4838 
5 12 12,830 0,6889 12,430 0,1849 0,1600 
6 18 15,716 5,2167 17,670 0,1089 3,8181 
Total 13,7715 0,8073 12,9519 
 
Regressão 238 
 
O quadro da Análise da Variância resultante é 
 
Fonte de 
Variação 
Soma de 
quadrados 
GL Quadrado médioEstatística 
F 
 
Melhoria 
de ajuste 
 
12,9519 
 
1 
 
12,9519 
 
48,13 
 
Residual 
sobre a 
parábola 
 
 
0,8073 
 
 
 
 
6-3=3 
 
 
0,2691 
 
Residual 
sobre a 
reta 
 
13,7715 
 
6-2=4 
 
Na tabela, obtém-se F1,3() = 10,13. Como F = 48,13 > F1,3() 
= 10,13, rejeitamos ao nível de significância de 5%, a hipótese H0 de 
não haver melhoria de ajuste, ou seja, existe uma melhoria significativa 
de ajuste ao substituirmos o modelo linear pelo modelo parabólico. 
 
 
8.11 PROBLEMAS PROPOSTOS 
 
01. Suponha que a análise de certo combustível apresentou para Y 
(poder calorífico) e para X (% de cinzas) os resultados 
 
Y 13100 11200 10200 9600 8800 
X 18,3 27,5 36,4 48,5 57,8 
 
Determinar a equação de regressão linear de mínimos quadrados e 
estimar o poder calorífico para X = 30%. Construir também o diagrama 
de dispersão e traçar a reta ajustada. 
 
02. Um pesquisador realizou certa experiência relacionando pressão Y 
com temperatura X, obtendo os resultados 
Estatística Básica para os Cursos de Engenharia 239 
 
X (em 0C) 300 400 500 600 700 800 
Y (em atm) 1,3 1,9 2,5 3,0 3,7 4,1 
 
Pede-se: (a) a equação de regressão linear de mínimos quadrados. 
 (b) a estimativa da pressão para a temperatura de 450. 
 (c) o diagrama de dispersão e a correspondente reta. 
 (d) o coeficiente de correlação linear. 
 
03. Para o problema 02, utilizando a Análise de Variância, testar a 
existência de regressão linear ao nível de significância de 1%. 
 
04. Para o problema 02, determinar os intervalos de confiança de 99% 
para os parâmetros  e  da regressão linear e os intervalos de 
confiança e de previsão correspondentes à temperatura X = 450. 
 
05. A vazão V de um rio e a altura fluviométrica h estão relacionadas 
através de V = A.hb. Usando o conceito de linearização, ajustar uma reta 
de mínimos quadrados para os resultados experimentais seguintes 
 
V 4,95 5,10 6,94 9,57 13,67 18,54 
h 1,20 1,45 1,57 1,68 1,89 2,10 
 
06. Foram realizados 5 ensaios para a determinação da resistência à 
compressão (30 dias) do concreto, em função da dosagem de água 
 
lb água / kg cimento 0,3 0,4 0,5 0,6 0,7 
resistência em kg/cm2 420 330 260 220 200 
 
Pede-se a equação de regressão de mínimos quadrados. Supor que o 
modelo adequado é da forma bXa
Y
1
 . 
07. Os dados da tabela abaixo representam o faturamento bruto de uma 
indústria de equipamentos mecânicos 
 
Regressão 240 
Ano 1978 1979 1980 1981 1982 1983 
Faturamento 
(em milhares 
de dólares) 
 
50 
 
60 
 
65 
 
78 
 
80 
 
95 
 
08. Através da Análise da Variância, testar se a parábola de mínimos 
quadrados do problema 07 fornece uma resposta significativamente 
melhor que a reta, no nível de significância de 1%. 
 
09. A tabela seguinte relaciona o consumo (em toneladas) de matéria 
prima para uma indústria produzir dois tipos de produtos: A e B, sendo 
X1 e X2 as quantidades produzidas de A e B, respectivamente. 
 
Consumo de 
matéria prima (Y) 
3,5 4,0 5,4 6,1 7,0 7,5 8,0 
X1 10 12 15 17 20 23 25 
X2 8 9 11 13 15 16 18 
Determinar a equação de regressão linear múltipla. 
 
10. Para o problema 09, calcular o coeficiente de correlação linear 
múltipla e interpretar o resultado. 
 
11. Uma certa constante (Y) assume os valores abaixo em função da 
temperatura (X1) e pressão (X2) aplicadas 
 
Y 0,15 0,25 0,30 0,55 0,60 
X1 50 60 70 80 90 
X2 0,5 1,5 2,3 3,1 3,3 
 
Determinar a equação de regressão linear múltipla. 
 
12. Através da Análise da Variância, testar para o problema 11 a 
existência de regressão linear múltipla significativa ao nível de 5%. 
 
13. Para o problema anterior, calcular o coeficiente de correlação 
múltipla e interpretar o resultado. 
Estatística Básica para os Cursos de Engenharia 241 
 
14. Para o problema 09, determinar a equação de regressão linear 
simples entre as variáveis Y e X1, calculando o coeficiente de 
correlação linear de Pearson. 
 
15. Para o problema 09, determinar a equação de regressão linear 
simples entre as variáveis Y e X2, calculando o coeficiente de 
correlação linear e comparar com o obtido no problema anterior. 
 
16. Em uma regressão linear múltipla, o coeficiente de explicação é 
definido por R2 (quadrado do coeficiente de correlação) e indica a 
parcela da variação total de Y que é explicada pelo hiperplano de 
regressão. Calcular o coeficiente de explicação para o problema 09 e 
interpretar o resultado. 
 
17. Calcular o coeficiente de explicação R2 para o problema 11 e 
interpretar o resultado. 
 
18. No problema 16 foi definido o coeficiente de explicação para a 
regressão linear múltipla. De forma semelhante define-se o coeficiente 
de explicação para a regressão linear simples por r2. Calcular o 
coeficiente de explicação e interpretar o resultado, para o problema 01. 
 
19. Calcular o coeficiente de explicação para o problema 14 e 15, 
interpretando os resultados obtidos. 
 
20. Através da Análise da Variância, testar a existência de regressão 
linear múltipla para o problema 09, usando o nível de significância de 
1%.

Continue navegando