A maior rede de estudos do Brasil

Grátis
54 pág.
 Regressão I

Pré-visualização | Página 1 de 3

ANÁLISE DE REGRESSÃO 
- Regressão Linear Simples - 
(I) 
1 
 REGRESSÃO LINEAR SIMPLES 
Exemplo 1: Um psicólogo está investigando a relação entre 
o tempo que um indivíduo leva para reagir a um estímulo 
visual (Y) com o sexo (W), idade (X) e acuidade visual (Z, 
medida em porcentagem). 
Y : tempo de reação 
X : idade 
20 30 40
90
100
110
120
130
X
Y
Pelo gráfico: média de 
Y aumenta conforme as 
pessoas envelhecem 
Analisamos utilizando 
ANOVA 
 
Modelo de Regressão 
 
2 
Coeficiente de correlação linear de Pearson: 
 É uma medida que avalia o quanto a “nuvem de pontos” no 
diagrama de dispersão aproxima-se de uma reta. 
 
 
 
 
 
 
sendo que, 
 
 
 
 
 
 
mente.respectiva,e de padrão desvios os são e 
mente,respectiva ,e de amostrais médias as são e
YXSS
YXYX
YX 
 
YX
n
i
ii
SSn
YYXX
r
)1(
))((
1





3 
 REGRESSÃO LINEAR SIMPLES 
• Propriedade: -1  r  1 
 
• Casos particulares: 
 r = 1  correlação linear positiva e perfeita 
 r = -1  correlação linear negativa e perfeita 
 r = 0  inexistência de correlação linear 
 
 
 
 
 
20 30 40
90
100
110
120
130
X
Y
No exemplo: Correlação entre Y e X = 0,768 . 
4 
 REGRESSÃO LINEAR SIMPLES 
5 
Diagramas de Dispersão 
 Explicar a forma da relação por meio de uma 
função matemática: Y =  + ×X 
 REGRESSÃO LINEAR SIMPLES 
Modelo de Análise de Variância 
Modelo estatístico: 
 Observação = parte previsível + erro aleatório (variação indiv.) 
 
Relembrando, temos k populações: 
 
 
 
 
 
 
 
 
O modelo pode ser escrito na forma: 
 yij=i+ eij, i=1, ..., k e j=1, 2, ..., ni. 
 
 
6 
População 1 População 2 . . . População k 
Y1,1 Y2,1 . . . Yk,1 
Y1,2 Y2,2 . . . Yk,2 
... ... ... 
Y1,n1 Y2,n2 . . . Yk,nk 
Modelo estatístico: 
 Observação = parte previsível + erro aleatório (variação indiv.) 
O modelo de regressão linear simples pode ser escrito na forma: 
 yi = +  xi + ei, i=1, ..., n. 
em que a variável resposta Y é a variável dependente e a variável X é 
a variável independente ou explicativa. 
Observe que, para cada indivíduo ou unidade amostral, observamos 
o par (xi, yi). 
PARÂMETROS: 
  : INTERCEPTO 
 : INCLINAÇÃO 
 2: Variância do erro. 
ERRO: ei . 
 
 
7 
 Modelo de Regressão Linear Simples 
SIGNIFICADO DOS PARÂMETROS: 
 : valor médio (ou valor esperado) da variável resposta Y, 
quando X = 0. 
 : inclinação da reta. 
 e
i
: erro aleatório – espera-se que esse erro seja pequeno. 
 
 e  desconhecidos: precisamos estimá-los e testar hipóteses 
de interesse. 
 Por exemplo: interesse em verificar se  é igual a zero ou não. 
 
SUPOSIÇÕES: 
 ei ~ N (0,
2), independentes, i = 1, ..., n. 
 Essa suposição é equivalente a supor yi ~N( +  xi , 
2 ), 
independentes. 
 
 8 
 Modelo de Regressão Linear Simples 
Modelo de regressão linear simples: 
 yi =  +  xi + ei, i = 1, ..., n. 
 
Erro: 
 ei = yi -  -  xi 
 
ESTIMAÇÃO DOS PARÂMETROS: 
 Utiliza-se o método de mínimos quadrados para estimar os 
parâmetros de interesse. 
 
Método de Mínimos Quadrados: encontra estimadores de  
e  que minimizam a soma do quadrado dos erros (ou 
resíduos): 
 
 
 
 



n
1i
2
1
2 )( ii
n
i
i xye 
9 
 Modelo de Regressão Linear Simples 
Pode-se demonstrar que os estimadores de mínimos quadrados 
são dados por 
 
 
 
 
 
 
 
 
A reta de regressão estimada fica dada por: 
 
 
 
Os valores são conhecidos como VALORES AJUSTADOS. 
 
 
 
 
2
1
2
1ˆ
xnx
yxnyx
n
i
i
n
i
ii







 
iyˆ
xy  ˆˆ 
ii xy  ˆˆˆ 
10 
 Modelo de Regressão Linear Simples 
Interpretação de : 
XY  ˆˆˆ 
ˆ
Para cada aumento de uma unidade em X, temos um 
aumento médio (ou esperado) de unidades em Y. 
ˆ



ˆ
)1(ˆ
)ˆˆ()1(ˆˆˆˆ
11
1112



xx
xxyy
11 x1x
2yˆ
1yˆ
ˆ
11 
 Modelo de Regressão Linear Simples 
Exemplo 1: Tempo de Reação 
Indivíduo Y Idade Y2 Idade2 Y*Idade 
1 96 20 9216 400 1920 
2 92 20 8464 400 1840 
3 106 20 11236 400 2120 
4 100 20 10000 400 2000 
5 98 25 9604 625 2450 
6 104 25 10816 625 2600 
7 110 25 12100 625 2750 
8 101 25 10201 625 2525 
9 116 30 13456 900 3480 
10 106 30 11236 900 3180 
11 109 30 11881 900 3270 
12 100 30 10000 900 3000 
13 112 35 12544 1225 3920 
14 105 35 11025 1225 3675 
15 118 35 13924 1225 4130 
16 108 35 11664 1225 3780 
17 113 40 12769 1600 4520 
18 112 40 12544 1600 4480 
19 127 40 16129 1600 5080 
20 117 40 13689 1600 4680 
SOMA 2150 600 232498 19000 65400 
Exemplo 1: Um psicólogo está investigando a relação entre o tempo que 
um indivíduo leva para reagir a um estímulo visual (Y) e idade (X). 
12 
 
ii xy 0,9080,50





ˆ
80,50300,90107,50ˆ
0,90
302019000
107,5302065400ˆ
2
α
β
Interpretação: aumentando-se 1 ano na idade, o tempo médio de 
reação aumenta 0,90. 
98,50200,9080,50(20)ˆ y
Podemos prever, por exemplo, o tempo médio de reação para 
pessoas de 20 anos  
13 
 
Exemplo 1: Tempo de Reação 
14 
116,5.(40)ˆ 112;(35)ˆ 107,50;(30)ˆ 103;(25)ˆ  y yyy
Vantagem: permite estimar o tempo médio de reação para 
idades não observadas 
 
110,20330,9080,50(33)ˆ y
20 30 40
 90
100
110
120
130
X
Y
Y = 80,5 + 0,9X
R-Sq = 59,0 %
Regression Plot
Exemplo 1: Tempo de Reação 
TESTE PARA  
 Em geral uma hipótese de interesse é 
 H0:  = 0 
 H1:  ≠ 0 
 Observe que, se  = 0, o modelo fica dado por 
 yi =  + ei, i =1, ..., n. (MODELO 0) 
 
 Pode-se demonstrar que, se o MODELO 0 é verdadeiro, o 
estimador de mínimos quadrados de  é dado por 
 
 
 
 
 
 
yα ˆ
15 
 Modelo de Regressão Linear Simples 
Definimos a soma de quadrados total, dada pela soma do 
quadrado dos erros do MODELO 0: 
 
 
Definimos a soma de quadrados residual, dada pela soma do 
quadrado dos erros do MODELO de regressão: 
 
 
Definimos a soma de quadrados da regressão, dada por: 
 
 
 



n
i
i yySQT
1
2)(



n
ii
n
ii yyxySQRes
1i
2
1i
2 )ˆ( )ˆˆ( 



n
i xxSQResSQT-SQReg
1i
22 )(ˆ 
16 
No exemplo, 
SQT= 
SQReg = 
SQRes = 
 Modelo de Regressão Linear Simples 
Definimos os quadrados médios, dados por: 
 
 
 
 
 
 
 
 
 
A estatística F é dada por: 
 
2
1
yS
n
SQT
QMT 


2
2
eS
n
SQRes
QMRes 


17 
 Estimativa de 2 
No exemplo, F = 
 Modelo de Regressão Linear Simples 
1
SQReg
QMReg 
QMRes
QMReg
F 
Podemos organizar os resultados em uma tabela de Análise de 
Variância (ANOVA): 
 
 
 
 
 
 
 
 
 
 
 
 
18 
Fonte de 
Variação 
g.l. 
Soma de 
Quadrados 
Quadrado Médio Teste F 
Regressão 1 SQReg QMReg = SQReg F= QMReg/QMRes 
Resíduo n - 2 SQRes QMRes = SQRes/( n - 2) 
Total n - 1 SQT 
Observações: 
 A estatística F tem distribuição F com 1 grau de liberdade no 
numerador e (n-2) no denominador. 
 A Região Crítica é dada por 
 RC = {F: F ≥ fc}, em que fc é obtido da tabela F(1; n-2). 
 Se FobsRC ou P-valor < , então concluímos que

Crie agora seu perfil grátis para visualizar sem restrições.