Buscar

Regressão linear simples

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1 
Profª Fernanda Maria de Almeida – CCO 350 
UNIVERSIDADE FEDERAL DE VIÇOSA 
DEPARTAMENTO DE ADMINISTRAÇÃO E CONTABILIDADE 
CCO 350 – MÉTODOS QUANTITATIVOS EM ADMINISTRAÇÃO E 
CONTABILIDADE 
 
Profª Fernanda Maria de Almeida 
 
Aula prática II – 2017/II: 
“Modelos de Regressão Linear Simples e Múltipla (MRLS e MRLM)” 
 
 
 
1. Regressão Simples 
Exemplo: análise dos efeitos da educação (anos de estudo) sobre os salários (R$) dos 
brasileiros. 
iii ueducacaosalario  10 
 
sendo ut o termo de erro. 
Antes de estimar o modelo, pode-se desejar avaliar a correlação e a dispersão entre 
salário e educação: 
 
Matriz de correlações: Comando: corr salario educacao 
 educacao 0.4059 1.0000
 salario 1.0000
 
 salario educacao
 
 
Diagrama de Dispersão: twoway (scatter salario educacao) 
0
50
00
10
00
0
15
00
0
20
00
0
25
00
0
S
A
LA
R
IO
0 5 10 15 20
EDUCACAO
 
 
2 
Profª Fernanda Maria de Almeida – CCO 350 
No Stata, após inserir os dados, estima-se o modelo pelo comando reg salario educacao: 
 
 _cons -904.8517 684.9678 -1.32 0.187 -2250.472 440.7687
 educacao 541.3593 53.24804 10.17 0.000 436.7534 645.9651
 
 salario Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 7.1604e+09 525 13638884.4 Root MSE = 3378.4
 Adj R-squared = 0.1632
 Residual 5.9807e+09 524 11413515.8 R-squared = 0.1648
 Model 1.1797e+09 1 1.1797e+09 Prob > F = 0.0000
 F(1, 524) = 103.36
 Source SS df MS Number of obs = 526
 
 
Para encontrar os resíduos estimados, utiliza-se o comando predict residuo, r: 
Para visualizar os resíduos: 
list resíduo 
 14. -91.45943 
 13. 3178.541 
 12. 1997.181 
 11. -1506.896 
 
 10. 9881.744 
 9. -1991.459 
 8. -591.4594 
 7. 2410.385 
 6. 993.1035 
 
 5. -291.4594 
 4. 2573.978 
 3. -2050.1 
 2. -2351.459 
 1. -1950.1 
 
 residuo 
 
 
Obs: Aqui se tem os resíduos das 14 primeiras observações, mas no programa estão todos os 
526. 
 Para encontrar os valores estimados do salario, utiliza-se o comando predict ychapeu, 
xb: 
 14. 5591.459 
 13. 5591.459 
 12. 6132.819 
 11. 7756.896 
 
 10. 8298.256 
 9. 5591.459 
 8. 5591.459 
 7. 8839.615 
 6. 7756.896 
 
 5. 5591.459 
 4. 3426.022 
 3. 5050.1 
 2. 5591.459 
 1. 5050.1 
 
 ychapeu 
 
. list ychapeu
. predict ychapeu, xb
 
 
2. Regressão Múltipla 
 
 Um modelo de regressão é chamado modelo de regressão múltipla quando se 
tem mais de uma variável explicativa. Por exemplo, é possível se estudar os efeitos da 
educação e da experiência sobre os salários dos brasileiros, entretanto, há diversas 
outras variáveis que possivelmente afetam esses salários (gênero, raça, etc.). 
3 
Profª Fernanda Maria de Almeida – CCO 350 
 Nesse sentido, seja o salário (salarioi), de cada uma das 526 pessoas (i) de uma 
amostra da população brasileira, como função do número de anos de estudo 
(educacaoi) e da experiência em anos (experienciai). Assim: 
 
iiii
uaexperiencieducacaosalario 
210
 , (1) 
sendo ui o termo de erro. 
 
 No Stata, após inserir os dados, estima-se o modelo pelo comando reg salario 
educacao experiencia: 
 
 
 _cons -3390.54 766.5661 -4.42 0.000 -4896.466 -1884.613
 experiencia 70.0954 10.97764 6.39 0.000 48.52972 91.66107
 educacao 644.2721 53.80607 11.97 0.000 538.5695 749.9747
 
 salario Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 7.1604e+09 525 13638884.4 Root MSE = 3257
 Adj R-squared = 0.2222
 Residual 5.5482e+09 523 10608336.1 R-squared = 0.2252
 Model 1.6123e+09 2 806127261 Prob > F = 0.0000
 F(2, 523) = 75.99
 Source SS df MS Number of obs = 526
 
 
2. Variáveis dummies 
 Ainda considerando o exemplo anterior (equação (1)), supõe-se que seja 
importante saber se o gênero afeta os salários médios dos brasileiros. Para tanto, a 
proposição é o uso de um MRLM com variáveis dummies na forma aditiva. 
 
iiiii ugeneroeducacaosalario  3210  aexperienci, (3) 
 A variável generoi trata-se de uma dummy, que possui valor 1 caso a pessoa i 
seja do sexo feminino e 0 para masculino. 
 
 
 _cons -1734.481 753.6203 -2.30 0.022 -3214.982 -253.9798
 genero -2155.517 270.3055 -7.97 0.000 -2686.537 -1624.497
 experiencia 64.24172 10.40033 6.18 0.000 43.81008 84.67336
 educacao 602.5802 51.11738 11.79 0.000 502.1591 703.0012
 
 salario Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 7.1604e+09 525 13638884.4 Root MSE = 3078.1
 Adj R-squared = 0.3053
 Residual 4.9457e+09 522 9474467.89 R-squared = 0.3093
 Model 2.2147e+09 3 738247358 Prob > F = 0.0000
 F(3, 522) = 77.92
 Source SS df MS Number of obs = 526
 
4 
Profª Fernanda Maria de Almeida – CCO 350 
Será que o fato de o indivíduo ser do sexo feminino altera os efeitos da educação sobre 
o salário? E da experiência? 
Para responder a esses questionamentos, a proposição é a estimação de MRLM 
com variáveis dummies na forma multiplicativa. 
No caso da primeira pergunta: 
 
 iiiii uacaogeneroeducaexperiencieducacaosalario  3210  (3) 
 
Para criar a variável multiplicativa generoeducação: 
 
gen generoeducacao = genero*educacao 
 
 
 _cons -2620.269 730.1383 -3.59 0.000 -4054.639 -1185.898
generoeducacao -169.6616 21.10975 -8.04 0.000 -211.1321 -128.1911
 experiencia 65.06158 10.38441 6.27 0.000 44.66122 85.46195
 educacao 669.4726 50.90241 13.15 0.000 569.4738 769.4713salario Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 7.1604e+09 525 13638884.4 Root MSE = 3075.4
 Adj R-squared = 0.3065
 Residual 4.9372e+09 522 9458240.78 R-squared = 0.3105
 Model 2.2232e+09 3 741070875 Prob > F = 0.0000
 F(3, 522) = 78.35
 Source SS df MS Number of obs = 526
. reg salario educacao experiencia generoeducacao
 
 
3. Suposições Básicas de validação dos modelos de regressão 
✓ Independência dos erros ou ausência de autocorrelação; 
✓ Homocedasticidade; 
✓ Normalidade dos resíduos; 
✓ Ausência de multicolinearidade.

Continue navegando