Buscar

Regressão Simples

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 18 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

REGRESSÃO SIMPLES – JAIR MENDES MARQUES 1 
 
 
REGRESSÃO SIMPLES 
 
 
1 INTRODUÇÃO 
 
Muitas vezes estudamos certos fenômenos que envolvem duas ou mais variáveis, e 
freqüentemente estamos interessados em estabelecer uma relação funcional entre as mesmas. O 
problema da regressão consiste em determinar a função que exprime essa relação. 
Quando o problema envolve apenas duas variáveis ele é conhecido por regressão simples, e no 
caso de mais de duas variáveis por regressão múltipla. 
Basicamente, um problema de regressão envolve variáveis que podem ser controladas (podem 
ser relacionadas matematicamente) e variáveis que não podem ser controladas (variação aleatória). 
Seja Y uma variável aleatória que é influenciada pelas variáveis X1, X2, …, Xn, então, 
 
 
Y = f(X) + ε , (1) 
 
onde: 
X é a variável independente (variável explicativa). 
Y é a variável dependente (variável resposta). 
ε é a componente aleatória da variação de Y. 
f é a função de regressão. 
 
 
Normalmente, nos experimentos realizados, X é uma variável que pode ser controlada pelo 
pesquisador. Por exemplo, suponhamos que estamos realizando ensaios de tração (Y) em peças de 
concreto durante o tempo de cura (X). A variável tempo X pode ser controlada pelo pesquisador, pois 
o mesmo pode determinar a resistência à tração para 1, 2, 3, … dias (controlando o número de dias), 
enquanto que para a variável resistência à tração, isso não é possível. 
Supondo que no experimento realizado, os resultados obtidos foram 
 
 
X (dias) 1 2 3 5 10 28 
Y (kgf/cm2) 10 23 28 30 35 40 
 
 
Pode-se construir um diagrama de dispersão (gráfico cartesiano para os pontos observados) e ter uma 
primeira idéia da relação entre as variáveis X e Y, como mostra a Figura 1. 
 
 
 
 
 
 
 
 
 REGRESSÃO SIMPLES – JAIR MENDES MARQUES 
 
 
Figura 1 – Diagrama de dispersão 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Uma simples análise do diagrama de dispersão pode sugerir uma relação funcional entre as 
variáveis envolvidas. Se os pontos tendem a se agrupar em torno de uma linha reta, pode ser que a 
relação linear seja adequada; se os pontos tendem a se agrupar em torno de uma curva exponencial, a 
relação adequada talvez seja a função exponencial. Enfim, o aspecto pode sugerir uma relação 
funcional adequada ao problema de regressão. 
 
2 REGRESSÃO LINEAR SIMPLES 
 
O modelo estatístico de uma regressão linear simples é do tipo 
 
Y = α + βX + ε, (2) 
 
onde α e β são parâmetros da regressão, sendo β denominado de coeficiente de regressão linear. 
Ao estabelecer o modelo de regressão linear simples, deve-se pressupor que: 
 
1o )
 A relação entre X e Y é linear. 
2o )A variável X não é aleatória, ou seja, os valores de X são fixos. 
3o )
 E(ε) = 0, ou seja, a média do erro ε (variável aleatória) é nula. 
4o )A variância de ε é sempre σ2, ou seja, V(ε) = σ2. 
5o )
 Os erros são independentes. 
6o )
 Os erros têm distribuição normal. 
 
Em uma análise de regressão linear, devemos inicialmente estimar os parâmetros α e β, cujas 
estimativas chamaremos de a e b, respectivamente. Considerando para o modelo (2) que 
 
 E(Y) = α + βX, (3) 
 
a equação de regressão (3) estimada será dada por 
 
$Y = a + bX, (4) 
 
onde $Y estima E(Y) = α + βX. 
 
0 5 10 15 20 25 30
5
10
15
20
25
30
35
40
45
Y
X
REGRESSÃO SIMPLES – JAIR MENDES MARQUES 3 
O método que foi utilizado para determinar essas estimativas é conhecido como método dos 
mínimos quadrados (MMQ). Esse método consiste em tomar como estimativas os valores que 
minimizam a soma dos quadrados dos desvios 
 
( )[ ]Q e Y a bXi i i
i
n
i
n
= = − +
==
∑∑ 2
2
11
, (5) 
 
dessa forma, deve-se ter 
 
[ ]∂∂
Q
a
Y a bXi i= − − + =∑2 0( ) . (6) 
 
[ ]∂∂
Q
b Y a bX Xi i i= − + − =∑2 0( ) ( ) . (7) 
 
Simplificando as equações (6) e (7), obtém-se o denominado sistema de equações normais 
 
Y na b Xi i∑ ∑= + (8) 
 
X Y a X b Xi i i i= + ∑∑∑ 2 , (9) 
 
que resolvendo, determina-se a e b. 
 
Exemplos 
 
1. Foi realizada uma experiência relacionando os alongamentos de uma mola com as cargas aplicadas. 
Os resultados obtidos foram 
 
Carga (kg) 3 4 5 6 7 8 9 10 
Alongamento (cm) 4,0 4,8 5,6 6,7 7,9 9,0 9,8 11,0 
 
Determinar a equação de regressão linear. Elaborar o diagrama de dispersão e traçar a reta de 
regressão. 
 
2. Para o problema anterior, estimar o alongamento da mola se a carga aplicada for de 6,5 kg. 
 
3. Com os dados da tabela seguinte (Brasil – Índice da quantidade demandada Q e da tarifa T de 
energia elétrica (1986 = 100) solicita-se estimar a equação de demanda por energia elétrica, utilizando 
o modelo linear. 
 
Ano 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 
Q 69 76 81 90 94 100 103 108 113 115 
T 143 134 117 111 109 100 137 122 85 90 
 
 
3.3 ANÁLISE DOS RESÍDUOS 
 
Na análise de regressão linear, assumimos que os erros ε1, ε2, . . . εn satisfazem os seguintes 
pressupostos: 
• seguem uma distribuição normal; 
 REGRESSÃO SIMPLES – JAIR MENDES MARQUES 
 
• têm média zero; 
• têm variância σ2 constante (homocedasticidade); 
• são independentes. 
 
A verificação desses pressupostos é fundamental, pois toda a inferência estatística no modelo 
de regressão linear (testes de hipóteses e intervalos de confiança) se baseia nesses pressupostos. A 
análise de resíduos é fundamental para verificar a violação desses pressupostos. 
 
(1) Verificação da normalidade dos resíduos εi’s 
 
A normalidade dos resíduos pode ser verificada através da análise do Q-Q plot (teste 
envolvendo os quantis), o Teste de Kolmogorov-Smirnov (Teste K-S), o Teste de Normalidade de 
Lilliefors e outros. 
 
Exemplo: - Para o exemplo visto (problema das cargas e alongamentos de uma mola), testar a 
normalidade dos resíduos. Vamos utilizar o teste envolvendo os quantis. 
 
Lembrando: Yˆ = 0,742 + 1,017X. 
 
Carga (kg) – X 3 4 5 6 7 8 9 10 
Alongamento 
(cm) -Y 
4,0 4,8 5,6 6,7 7,9 9,0 9,8 11,0 
Resíduos 
= Y- Yˆ 
0,207 0,010 0,227 0,144 0,039 0,122 0,095 0,088 
 
• Análise do Q-Q plot 
 
 Resíduos ordenados 
(Y- Yˆ )(j) 
Probabilidade=(j-1/2)/n Quantil normal padronizado 
q(j) 
-0,227 0,0625 -1,5341 
-0,144 0,1875 -0,8871 
-0,095 0,3125 -0,4888 
-0,010 0,4375 -0,1573 
0,039 0,5625 0,1573 
0,088 0,6875 0,4888 
0,122 0,8125 0,8871 
0,207 0,9375 1,5341 
 
REGRESSÃO SIMPLES – JAIR MENDES MARQUES 5 
 
 
 
Correlação entre resíduos e q(j) : rq = 0,9852 
 
Na Tabela, para α = 0,05 verifica-se que rq > coef. tabelado (abaixo de 0,9198), portanto a 
normalidade é significativa. 
 
Tabela 1 – Valores críticos para o coeficiente de correlação 
 do teste Q-Q Plot de normalidade 
 
Nível de significância Tamanho da 
amostra (n) 0.01 0.05 
5 0.8299 0.8788 
10 0.8801 0.9198 
15 0.9126 0.9389 
20 0.9269 0.9508 
25 0.9410 0.9591 
30 0.9479 0.9652 
35 0.9538 0.9682 
40 0.9599 0.9726 
45 0.9632 0.9749 
50 0.9671 0.9768 
550.9695 0.0787 
60 0.9720 0.9801 
75 0.9771 0.0838 
100 0.9822 0.9873 
150 0.9879 0.9913 
200 0.9905 0.9931 
300 0.9935 0.9953 
 
 
(2) Verificação da média nula, variância constante e independência dos erros 
 
Estes pressupostos podem ser verificados graficamente, representando os resíduos em função 
dos valores estimados da variável dependente iYˆ (gráfico residual) ou em função dos valores de uma 
das variáveis independentes Xi. 
 REGRESSÃO SIMPLES – JAIR MENDES MARQUES 
 
Os pontos do gráfico devem distribuir-se de forma aleatória em torno da reta qu corresponde ao 
resíduo zero, formando uma faixa de largura uniforme. Dessa forma é de se esperar que os erros sejam 
independentes, de média nula e variância constante. 
Quando os resíduos não se comportam de forma aleatória, ou seja, seguem um padrão, a 
condição de independência não é satisfeita. Isto pode traduzir o fato de não existir uma relação linear 
entre as variáveis ou então, não constam no modelo uma ou várias variáveis independentes que 
influenciam significativamente a variável dependente e portanto também os erros. 
 
Para o exemplo: 
 
Carga (kg) – X 3 4 5 6 7 8 9 10 
Alongamento (cm) -
Y 
4,0 4,8 5,6 6,7 7,9 9,0 9,8 11,0 
Resíduos = Y- Yˆ 0,207 0,010 0,227 0,144 0,039 0,122 0,095 0,088 
Yˆ 3,793 4,810 5,827 6,844 7,861 8,878 9,895 10,912 
 
Resíduos versus Y estimados: 
 
 
 
 
 
 
 
 
 
 
 
 
 
REGRESSÃO SIMPLES – JAIR MENDES MARQUES 7 
Resíduos versus X: 
 
 
 
 
 
 
A análise gráfica dos resíduos, dá a indicação de que os resíduos parecem distribuir-se 
aleatoriamente em torno da reta X = 0, com dispersão constante, sugerindo que não há violações sérias 
dos pressupostos de homocedasticidade, média nula e de independência dos erros. 
 
Nos três primeiros gráficos (Figuras 1, 2 e 3), os resíduos apresentam comportamentos 
padronizados, logo não há independência. Pelo contrário, no último gráfico (Figura 4) os resíduos 
parecem estar distribuídos de forma aleatória, sustentando a independência dos erros. 
 
 
 REGRESSÃO SIMPLES – JAIR MENDES MARQUES 
 
Figura 1 
0
1
2
3
4
5
6
7
0 5 10 15 20 25 30
 
 
 
Figura 2 
0
2
4
6
8
10
12
0 5 10 15 20 25
 
 
 
 
 
 
 
 
 
 
 
REGRESSÃO SIMPLES – JAIR MENDES MARQUES 9 
Figura 3 
0
5
10
15
20
25
0 5 10 15 20 25 30
 
 
Figura 4 
-8
-6
-4
-2
0
2
4
6
8
0 10 20 30 40
 
 
 
Se a dispersão dos resíduos aumentar ou diminuir com os valores das variáveis independentes 
Xi, ou com os valores estimados da variável independente Yˆ , a hipótese de variância constante dos 
resíduos deve ser rejeitada. 
No gráfico (Figura 5) os resíduos apresentam um comportamento tendencialmente crescente, 
enquanto que no gráfico (Figura 6) o comportamento é tendencialmente decrescente, indicando que há 
violação da hipótese de homogeneidade da variância. 
 
 REGRESSÃO SIMPLES – JAIR MENDES MARQUES 
 
Figura 5 
-20
-15
-10
-5
0
5
10
15
20
0 5 10 15 20 25
 
 
Figura 6 
-20
-15
-10
-5
0
5
10
15
20
0 5 10 15 20 25
 
 
 
Como a análise gráfica é um método subjetivo da análise dos resíduos. Nesse sentido, a 
verificação da independência é usualmente feita através do teste de Durbin-Watson. Se houver 
independência, a magnitude de um resíduo não influencia a magnitude do resíduo seguinte. Neste 
caso, a correlação entre resíduos sucessivos é nula (ρ = 0). As hipóteses do teste, para testar se a 
relação entre dois resíduos consecutivos é estatisticamente significativa, são então: 
 
H0: ρ = 0 (existe independência) 
 
H1 : ρ ≠ 0 (existe dependência) 
 
A estatística d de Durbin-Watson é dada por: 
 
 
REGRESSÃO SIMPLES – JAIR MENDES MARQUES 11 
∑
∑
=
−
=
+ −
=
n
1i
2
i
1n
1i
2
i1i
d
)dd(
d (10) 
 
Tomada de decisão: compara-se o valor para a estatística d com os valores críticos da tabela de 
Durbin-Watson, dL e dU, e toma-se a decisão recorrendo à seguinte tabela: 
 
d [0, dL [ [dL, dU[ [dU, 4-dU[ [4-dU, 4-dL[ [4 – dL, 4[ 
Decisão Rejeitar H0 
Dependência 
Nada se 
pode 
concluir 
Não rejeitar 
H0 
Indepen. 
Nada se 
pode 
concluir 
Rejeitar H0 
Dependência 
 
 
 
Aplicar o Teste de Durbin-Watson para o exemplo visto. 
 
 
Carga di 2id ii dd −+1 21 )( ii dd −+ 
3 0,207 0,042849 -0,217 0,047089 
4 -0,010 0,000100 -0,217 0,047089 
5 -0,227 0,051529 0,083 0,006889 
6 -0,144 0,020736 0,183 0,033489 
7 0,039 0,001521 0,083 0,006889 
8 0,122 0,014884 -0,217 0,047089 
9 -0,095 0,009216 0,183 0,033489 
10 0,088 0,007744 
Σ 0,148579 0,222023 
 
494309,1
148579,0
222023,0
d
)dd(
d
n
1i
2
i
1n
1i
2
i1i
==
−
=
∑
∑
=
−
=
+
 
 
Na Tabela de Durbin-Watson, com 05,0=α e n = 8. resulta: dL=0,58 e dU=0,73 e, 
 
[dU, 4-dU[ = [0,73 , 4 – 0,73[ = [0,73 , 3,27[ 
 
Como d = 1,494309 Є [0,73 , 3,27[ , não é rejeitada a hipótese de independência dos resíduos. 
 
 
3.4 FUNÇÕES LINEARIZÁVEIS 
 
O método de regressão linear simples pode ser aplicado a certas funções não-lineares, que por 
transformações convenientes podem ser linearizadas. 
 REGRESSÃO SIMPLES – JAIR MENDES MARQUES 
 
Por exemplo, a função 
X
β
αY += , pela transformação 
X
1
Z = pode ser colocada na forma 
linear Y = α + βZ. Da mesma forma, a equação Y = AXβ pode ser colocada na forma V = α + βU, 
utilizando as transformações U = log X, V = log Y e α = log A. 
 
Exemplo 
 
Os dados seguintes foram obtidos em diversos ensaios de tração, realizados em peças de 
concreto durante o tempo de cura. 
 
Tempo de cura (dias) 1 3 5 7 25 
Resistência (kgf) 10 20 27 31 38 
 
Pede-se a equação de regressão de mínimos quadrados, onde 
 Y = A.B1/X. 
 
3.5 ESTATÍSTICAS DE AVALIAÇÃO DO MODELO 
 
3.5.1 ANÁLISE DA VARIÂNCIA APLICADA À REGRESSÃO 
 LINEAR SIMPLES 
 
A ANOVA aplicada à regressão linear simples possibilita testar a existência de regressão linear 
significativa o que é equivalente mostrar que o coeficiente de regressão β ≠ 0. 
O desenvolvimento da ANOVA nesse caso possibilita montar o seguinte quadro 
 
Fonte de 
Variação 
Soma de 
quadrado
s 
GL Quadrado médio 
 
Estatística F 
 
Devido à 
regressã
o 
 
 
b.Sxy 
 
 
1 
 
 
b.Sxy 
 
2
R
xy
s
S.b
F = 
 
 
Residual 
 
 
 
Syy – 
b.Sxy 
 
 
n - 2 
 
2
S.bS
n
s
xyyy2
R
−
=
−
 
 
Total Syy n - 1 
 
 onde 
 
( )( ) ( )
n
n
1i
i
n
1i
in
1i
ii
n
1i
iixy
YX
YXYYXXS












−=−−=
∑∑
∑∑ ==
==
 (11) 
( )
n
2
n
1i
in
1i
2
i
n
1i
2
iyy
Y
YYYS






−=−=
∑
∑∑ =
==
 (12) 
 
Se F > Fα com ν1 = 1 e ν2 = n - 2, rejeita-se a hipótese: 
 
REGRESSÃO SIMPLES – JAIR MENDES MARQUES 13 
H0: β = 0 (a regressão linear de Y sobre X não é significativa) 
 
em favor da hipótese 
 
 H1: β ≠ 0 (a regressão linear de Y sobre X é significativa). 
 
Exemplos 
 
1. Testar pela ANOVA a existência de regressão linear, paraos dados do exemplo 1 (carga x 
alongamento) da seção 2 ao nível de significância de 5%. 
 
Como já foi calculado para este exemplo, tem-se que 
 
 b = 1,017; n = 8; Σ X = 52; Σ Y = 58,8; Σ X2 = 380; Σ XY = 424,9 e Σ Y2 = 475,74. 
 
7,42
8
8,58529,424Sxy =
×
−= . 
 
( ) 56,43
8
28,58
74,475Syy =−= . 
 
 
Fonte de 
Variação 
Soma de 
quadrados 
GL Quadrado 
médio 
 
Estatística 
F 
 
Devido à 
regressã
o 
 
1,017×42,7 
= 43,4259 
 
1 
 
43,4259 
 
1938,66 
 
Residual 
 
 
43,56-
43,4259 
= 0,1341 
 
8-2=6 
 
0,0224 
 
Total 43,56 8-1=7 
 
Para α = 0,05, ν1 = 1 e ν2 = 6, obtém-se na tabela F1,6(0,05) = 5,99. Como F = 1938,66 > F1,6(0,05) 
= 5,99, rejeita-se a hipótese H0, ou seja, a regressão linear é significativa ao nível de significância de 
5%. 
 
2. Testar pela ANOVA a existência de regressão linear, para os dados do exemplo 3 (demanda por 
energia elétrica x tarifa real média) da seção 2 ao nível de significância de 5%. 
 
3.5.2 COEFICIENTE DE DETERMINAÇÃO 
 
O coeficiente de determinação, R2, indica a parcela da variação de Y explicada pela variação de 
X. R2 pode ser interpretado como oquadrado da correlação simples entre os valores observados e os 
estimados de Y. 
 
Fórmula: 
Syy
S.b
R xy=2 
 
 REGRESSÃO SIMPLES – JAIR MENDES MARQUES 
 
Exemplos: 
 
1. Calcular o coeficiente de determinação para o exemplo (carga x alongamento) e interpretar. 
2. Calcular o coeficiente de determinação para o exemplo (demanda x tarifa de energia elétrica) e 
interpretar o resultado. 
 
3.5.3 VARIÂNCIA AMOSTRAL OU RESIDUAL 
 
A estimativa da variância residual 2Rs mede o grau de dispersão entre os valores observados e os 
estimados de Y. A raiz quadrada de 2Rs é denominada de erro-padrão da estimativa (sR). 
 
Fórmula: 
22
2
2
−
−
=
−
−
=
∑
n
)YˆY(
n
S.bS
s
xyyy
R 
Exemplos: 
 
1. Calcular a variância amostral ou residual para o exemplo (carga x alongamento) 
 
2. Calcular a variância amostral ou residual para o exemplo (demanda x tarifa de energia elétrica. 
 
 
3.5.4 ESTATÍSTICA t 
 
A estatística t tem por finalidade testar a significância dos parâmetros estimados do modelo, o 
que equivale ao teste do efeito individual de X e do termo constante. 
 
(1) Para o parâmetro β 
 
A estatística do teste é: 
bs
b
t 0
β−
= , onde 
∑
= 2
2
x
s
s Rb , com ∑ ∑ −=
22 )XX(x 
 
Obs.: No caso do modelo linear simples, esse teste equivale ao realizado com a estatística F 
(ANOVA). 
 
Exemplos: 
 
1. Para o exemplo (carga x alongamento) testar a significância do parâmetro β estimado. Aqui testar a 
presença de efeito positivo, ou seja, que aumento da carga acarreta o aumento do alongamento. 
Utilizar o nível de significância de 0,05. 
 
2. Para o exemplo (demanda x tarifa) testar a significância do parâmetro β estimado. Aqui testar a 
presença de efeito negativo, ou seja, que aumento tarifa acarreta diminuição da demanda. Utilizar o 
nível de significância de 0,05. 
 
(2) Para o parâmetro α 
 
A estatística do teste é: 
as
a
t
α−
= , onde: 
∑
∑
= 2
22
x.n
s.X
s Ra . 
 
Exemplos 
 
REGRESSÃO SIMPLES – JAIR MENDES MARQUES 15 
1. Para o exemplo (carga x alongamento) testar a significância do parâmetro α estimado.Utilizar o 
nível de significância de 0,05. 
 
2. Para o exemplo (demanda x tarifa) testar a significância do parâmetro α estimado. Utilizar o nível 
de significância de 0,05. 
 
 
3.5.5 INTERVALOS DE CONFIANÇA PARA A REGRESSÃO 
 LINEAR SIMPLES 
 
Os intervalos de confiança (1 - α)100% para uma regressão linear simples são dados a seguir, 
onde todos eles envolvem o uso da distribuição t de Student com ν = n - 2 graus de liberdade. 
 
(1) Intervalo de confiança para α 
 
 
xx
2
R2/
xx
2
R2/ S
X
n
1
.sta
S
X
n
1
sta +⋅+≤α≤+⋅⋅− αα (13) 
onde 
 
n
X
X)XX(S
2
n
1i
in
1i
2
i
2
n
1i
ixx








−=−=
∑
∑∑ =
==
 (14) 
 
 
(2) Intervalo de confiança para β 
 
 
xx
R
2/
xx
R
2/ S
s
tb
S
s
tb ⋅+≤β≤⋅− αα (15) 
 
 
(3) Intervalo de confiança para E(Yh), ou seja, para Y correspondendo a um valor de X que não 
exista na amostra 
 
( ) ( )
xx
2
i
R2/hh
xx
2
i
R2/h S
XX
n
1
stYˆ)Y(E
S
XX
n
1
stYˆ
−
+⋅⋅+≤≤
−
+⋅⋅− αα (16) 
 
(4) Intervalo de confiança para Yh (um valor individual de Y dado um valor de X) ou intervalo de 
previsão 
 
 
( ) ( )
xx
2
i
R2/hh
xx
2
i
R2/h S
XX
n
11stYˆY
S
XX
n
11.stYˆ −++⋅⋅+≤≤−++⋅− αα (17) 
 
Exemplo 
 
 REGRESSÃO SIMPLES – JAIR MENDES MARQUES 
 
1. Para o exemplo (carga x alongamento), determinar os intervalos de confiança de 95% para os 
parâmetros α e β e também o intervalo de confiança para E(Yh) e de previsão para Yh dado que X = 
7,5. 
 
2. Para o exemplo (demanda x tarifa), determinar os intervalos de confiança de 95% para os 
parâmetros α e β e também o intervalo de confiança para E(Qh) e de previsão para Qh dado que T = 
120. 
 
 
 
3.6 REGRESSÃO POLINOMIAL 
 
Uma equação de regressão polinomial pode ser obtida pelo método dos mínimos quadrados, de 
forma semelhante como foi obtida para a regressão linear. 
 
O modelo estatístico de uma regressão polinomial é do tipo 
 
Y = α + β1X + β2X2 + … + βkXk + ε. (18) 
 
A equação de regressão estimada será dada por 
 
$Y= a + b1X + b2X2 + … + bkXk. (19) 
 
Particularmente, no caso de uma regressão parabólica, teremos 
 
$Y = a + b1X + b2X2. (20) 
 
 
Aplicando o M.M.Q. em (20), para se obter a, b1 e b2, resulta o sistema 
 
 
 
 
Y na b X b Xi i i= + + ∑∑∑ 1 2 2 
 
 X Y a X b X b Xi i i i i= + + ∑∑∑∑ 1 2 2 3 (21) 
 
 X Y a X b X b Xi i i i i
2 2
1
3
2
4
= + + ∑∑∑∑ 
 
 
A solução do sistema (21) fica mais simples quando se tem os valores de Xi igualmente 
espaçados, pois, nesse caso, trabalha-se com Xi - X ao invés dos Xi, sendo que os somatórios de 
expoentes ímpares em X se anulam. Nesse caso, a equação de regressão estimada será 
 
$ ( ) ( )Y a b X X b X X= + − + −1 2 2 . (22) 
 
Exemplo 
 
Ajustar uma parábola de mínimos quadrados para os dados experimentais seguintes e estimar o 
valor de Y para X = 7. 
REGRESSÃO SIMPLES – JAIR MENDES MARQUES 17 
 
Xi 1 2 3 4 5 6 
Yi 3 4 6 8 12 18 
 
 
 
3.7 PROBLEMAS PROPOSTOS 
 
01. Suponha que a análise de certo combustível apresentou para Y (poder calorífico) e para X (% de 
cinzas) os resultados 
 
Y 13100 11200 10200 9600 8800 
X 18,3 27,5 36,4 48,5 57,8 
 
Determinar a equação de regressão linear de mínimos quadrados e estimar o poder calorífico para X = 
30%. Construir também o diagrama de dispersão e traçar a reta ajustada. 
 
02. Um pesquisador realizou certa experiência relacionando pressão Y com temperatura X, obtendo os 
resultados 
 
X (em 0C) 300 400 500 600 700 800Y (em atm) 1,3 1,9 2,5 3,0 3,7 4,1 
 
Pede-se: (a) a equação de regressão linear de mínimos quadrados. 
 (b) a estimativa da pressão para a temperatura de 450. 
 (c) o diagrama de dispersão e a correspondente reta. 
 (d) o coeficiente de correlação linear. 
 
03. Para o problema 02, utilizando a Análise de Variância, testar a existência de regressão linear ao 
nível de significância de 1%. 
 
04. Para o problema 02, determinar os intervalos de confiança de 99% para os parâmetros α e β da 
regressão linear e os intervalos de confiança e de previsão correspondentes à temperatura X = 450. 
 
05. A vazão V de um rio e a altura fluviométrica h estão relacionadas através de V = A.hb. Usando o 
conceito de linearização, ajustar uma reta de mínimos quadrados para os resultados experimentais 
seguintes 
 
 
V 4,95 5,10 6,94 9,57 13,67 18,54 
h 1,20 1,45 1,57 1,68 1,89 2,10 
 
06. Foram realizados 5 ensaios para a determinação da resistência à compressão (30 dias) do concreto, 
em função da dosagem de água 
 
lb água / kg cimento 0,3 0,4 0,5 0,6 0,7 
resistência em kg/cm2 420 330 260 220 200 
 
Pede-se a equação de regressão de mínimos quadrados. Supor que o modelo adequado é da forma 
bXa
Y
1
+= . 
 REGRESSÃO SIMPLES – JAIR MENDES MARQUES 
 
07. Os dados da tabela abaixo representam o faturamento bruto de uma indústria de equipamentos 
mecânicos 
 
 
 
Ano 1978 1979 1980 1981 1982 1983 
Faturamento 
(em milhares 
de dólares) 
 
50 
 
60 
 
65 
 
78 
 
80 
 
95 
 
Ajustar uma parábola de mínimos quadrados. 
 
08. Considere um experimento em que se analisa a octanagem da gasolina em função da adição de um 
novo aditivo . Para isso, foram realizados ensaios com os percentuais de 
1, 2, 3, 4, 5 e 6% de aditivo. Os resultados são mostrados a seguir: 
 
X 1 2 3 4 5 6 
Y 80,5 81,6 82,1 83,7 83,9 85,0 
 
Observe que é razoável supor uma relação aproximadamente linear entre X e Y para os níveis de 
aditivo ensaiados (de 1 a 6%). 
 
Pede-se: (a) a equação de regressão linear de mínimos quadrados; (b) a estimativa da pressão para a 
temperatura de 450; (c) o diagrama de dispersão e a correspondente reta; (d) o coeficiente de correlação 
linear; (e) Aplicar a ANOVA ao modelo; (f) Testar a significância dos parâmetros α e β, ao nível de 
significância de 5%; (g) Construir os intervalos de confiança de 95% para os parâmetros α e β; (h) 
Construir os intervalos de confiança de 95% para a estimativa de Y e de previsão quando X = 3,5 .

Outros materiais