Livro Analise de regressão
402 pág.

Livro Analise de regressão


DisciplinaMatemática Financeira58.098 materiais1.519.019 seguidores
Pré-visualização50 páginas
(4.72) 
onde 1\u2c6\u3b8 e 2\u2c6\u3b8 são estimativas dos coeficientes de regressão de jx3 contra jx1 e jx2 . 
De (4.70) e (4.72), segue-se que 
 \uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8f0
\uf8ee
+
+
=
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8f0
\uf8ee
=
322
311
3
2
1
2
1
\u2c6
\u2c6
 
\u2c610
\u2c601)( \u3b2\u3b8\u3b2
\u3b2\u3b8\u3b2
\u3b2
\u3b2
\u3b2
\u3b8
\u3b8gE 
ou seja, 
 3111
\u2c6)( \u3b2\u3b8\u3b2 +=gE 
e 
 
 
 170 
 3222
\u2c6)( \u3b2\u3b8\u3b2 +=gE 
Verificamos que as estimativas dos coeficientes obtidos ( 1g e 2g ) com o 
modelo erroneamente especificado são tendenciosas. O viés de ig como estimativa de 
i\u3b2 depende do valor do parâmetro da variável excluída ( 3\u3b2 , no caso acima) e do valor 
da estimativa do coeficiente relativo a ijx na regressão da variável excluída contra as 
variáveis incluídas. 
Consideremos, agora, o caso em que o modelo correto seria 
 uuxxy jjjj \u2212++= 2211 \u3b2\u3b2 
e o pesquisador, erroneamente, ajusta a regressão 
 jjjj xgxgxgy 332211\u2c6 ++= 
Neste caso 
 
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
\u2211\u2211\u2211
\u2211\u2211\u2211
\u2211\u2211\u2211
=\u2032
2
33231
32
2
221
3121
2
1
jjjjj
jjjjj
jjjjj
xxxxx
xxxxx
xxxxx
VV 
e 
 
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
\u2211\u2211
\u2211\u2211
\u2211\u2211
=\u2032
jjjj
jjj
jjj
xxxx
xxx
xxx
3231
2
221
21
2
1
XV 
Então, de acordo com (4.71), 
 XVVVP \u2032\u2032= \u22121)( = 
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
00
10
01
 
Substituindo esse resultado em (4.70), obtemos 
 
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
=\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8f0
\uf8ee
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
=
0
 
00
10
01
)( 2
1
2
1 \u3b2
\u3b2
\u3b2
\u3b2
gE , 
ou seja, 
 11)( \u3b2=gE , 
 22 )( \u3b2=gE 
e 
 0)( 3 =gE 
 
 
 171 
É interessante notar que quando incluímos uma variável desnecessária, as 
estimativas dos coeficientes permanecem não-tendenciosas, diferentemente do que 
ocorre quando deixamos de incluir uma das variáveis explanatórias importantes. Isso 
mostra que é preferível incluir uma variável desnecessária que não incluir uma variável 
relevante. Entretanto, a inclusão de variáveis desnecessárias também é prejudicial, pois 
em geral faz com que aumente a variância dos estimadores. 
Há, também, o perigo de um controle inapropriado mascarar o efeito que se 
deseja captar. Considere um pesquisador que deseja avaliar o efeito das transferências 
de renda do Programa Bolsa Família sobre a pobreza, utilizando dados por Unidade de 
Federação. A variável dependente é a redução da pobreza e a variável explanatória 
fundamental é o montante de transferências per capita em certo período. Devem ser 
controladas características específicas de cada Unidade da Federação que condicionam 
o efeito das transferências sobre a pobreza, mas é um absurdo incluir, nesses controles, 
mudanças na renda média e no índice de Gini da distribuição da renda em cada Unidade 
da Federação. Aumentando a renda dos pobres, as transferências contribuem para 
reduzir a desigualdade e aumentar um pouco a renda média da população. Usando uma 
medida de desigualdade e a renda média como controles o pesquisador torna 
praticamente impossível captar o efeito das transferências sobre a pobreza7. O exercício 
4.39 apresenta dados numéricos artificiais que ilustram a questão. 
O problema dos \u201cmaus controles\u201d é discutido em Angrist e Pischke (2009, p. 64-
68). Eles assinalam que nem sempre mais controle é melhor, que variáveis medidas 
antes que a variável explanatória de interesse tenha sido determinada são geralmente 
bons controles e que é necessário verificar se alguma variável de controle é, ela própria, 
determinada pela variável explanatória de interesse. 
 
4.15. Transformação das variáveis para obter a matriz de correlações 
simples 
Consideremos o modelo 
 uuxy jiji
i
j \u2212+\u2211= \u3b2 
 
7
 Como ocorre frequentemente, isso pode parecer óbvio depois de assinalado. Mas em dois artigos 
publicados na Revista Brasileira de Economia há erro de especificação semelhante, incluindo o índice de 
Gini e o PIB per capita de cada Unidade da Federação em modelos destinados a captar o efeito de 
transferências do governo federal sobre a pobreza: Marinho e Araujo (2010) e Marinho et al. (2011). 
 
 
 172 
ou 
 \u3c9\u3b5\u3b3 ++\u2211= jiji
i
j vz (4.73) 
onde 
 
2
j
j
j
y
y
z
\u2211
= , 
2
ij
ij
ij
x
x
v
\u2211
= , i = 1, 2, ..., k (4.74) 
 
2
2
j
ij
ii
y
x
\u2211
\u2211
= \u3b2\u3b3 , (4.75) 
 
2
j
j
j
y
u
\u2211
=\u3b5 e 
2
jy
u
\u2211
=\u3c9 
Indicando por V a matriz das variáveis explanatórias e por z o vetor dos 
valores da variável dependentes, temos 
 
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
=\u2032
1
...1
...1
21
212
112
K
MMM
kk
k
k
rr
rr
rr
VV e 
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
=\u2032
Yk
Y
Y
r
r
r
M
2
1
zV 
pois 12 =\u2211 ij
i
v , ihhjij
i
rvv =\u2211 com i \u2260 h, e Yijij
i
ryv =\u2211 
As estimativas de mínimos quadrados dos i\u3b3 são dadas por 
 zVVVc \u2032\u2032= \u22121)( 
Geralmente, os programas de computador para ajuste de regressões múltiplas 
fazem, no início, as transformações (4.74). Note que os elementos das matrizes VV\u2032 e 
zV\u2032 , que passam a ser utilizadas em lugar de XX\u2032 e yX\u2032 , variam apenas de \u20131 a +1. 
Isso contribui para diminuir os efeitos dos erros de arredondamento. Obtidas as 
estimativas de i\u3b3 , as estimativas dos parâmetros i\u3b2 são, de acordo com (4.75), dadas 
por 
 
2
2
ij
j
ii
x
y
cb
\u2211
\u2211
= 
 
 
 173 
4.16. Regressões que se tornam lineares por anamorfose 
Vários modelos estatísticos podem ser facilmente transformados em modelos de 
regressão linear múltipla. 
Assim, a regressão quadrática 
 jjjj uXXY +++=
2
21 \u3b2\u3b2\u3b1 
pode ser encarada como uma regressão linear múltipla com duas variáveis 
explanatórias, fazendo jj XX 1= e jj XX 2
2
= . 
De maneira análoga, qualquer regressão polinomial pode ser ajustada como uma 
regressão linear múltipla. 
Em pesquisas econômicas, é freqüentemente utilizado o modelo 
 jkjjjj
kXXXY \u3b5\u3b1 \u3b2\u3b2\u3b2 ...21 11= 
Aplicando logaritmos, obtemos 
 jiji
i
j XY \u3b5\u3b2\u3b1 loglogloglog +\u2211+= , 
que é um modelo de regressão linear múltipla nos logaritmos das variáveis. Neste caso, 
desde que jju \u3b5log= obedeça às pressuposições vistas na seção 4.1, as estimativas de 
mínimos quadrados têm as propriedades estatísticas desejáveis. 
 
4.17. Ortogonalidade e multicolinearidade na matriz X 
Vejamos o que ocorre quando todas as colunas da matriz X são ortogonais entre 
si, isto é, 
 0=\u2211 hjij
i
xx para i \u2260 h 
A matriz XX\u2032 é, então, uma matriz diagonal. 
Tendo em vista o modelo 
 uuxy jiji
i
j ++\u2211= \u3b2 
temos, neste caso, que 
 
 
 174 
 
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
\u2211
\u2211
\u2211
=\u2032
\u2212
2
2
2
2
1
1
100
010
001
)(
kj
j
j
x
x
x
XX 
e 
 
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fa
\uf8fb
\uf8f9
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8ef
\uf8f0
\uf8ee
\u2211
\u2211
\u2211
\u2211
\u2211
\u2211
=\u2032\u2032=
\u2212
2
2
2
2
2
1
1
1)(
kj
jkj
j
jj
j
jj
x
yx
x
yx
x
yx
yXXXb 
Portanto, as estimativas dos parâmetros da regressão múltipla coincidem com as 
estimativas dos coeficientes das regressões lineares simples de jY contra cada uma das 
variáveis explanatórias e a soma de quadrados de regressão, dada por 
 S.Q.Regr. = jijjii yxb \u2211\u2211 , 
é, neste caso, igual à soma das somas de quadrados de regressão das regressões lineares 
simples de jY contra cada uma das variáveis explanatórias. O coeficiente de 
determinação múltipla é, portanto, igual à soma dos coeficientes de determinação das 
regressões lineares simples mencionadas. 
Como vimos, a ortogonalidade
Annanda
Annanda fez um comentário
salvou meu TCC! obrigada!
0 aprovações
Douglas
Douglas fez um comentário
Muito obrigado por compartilhar!
0 aprovações
Carregar mais