Tópico 10

•

UFJF

Isadora Lupchinski

06.12.2017

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 25 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 25 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 25 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Econometria II

446 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Tópico 10 – Estimação de Variáveis 
Instrumentais e Mínimos 
Quadrados em Dois Estágios 
Bibliografia:
STOCK, James H. e WATSON, Mark W. Econometria. 1ª. Edição. Prentice Hall, 2004.
WOOLDRIDGE, J.M. Introdução à Econometria: uma abordagem moderna. 4ª 
ed. São Paulo: Pioneira Thomson Learning, 22015. (capítulo 15).
Variáveis instrumentais
Qualquer que seja a fonte da correlação entre 𝑥 e 𝑢, se existe 
uma variável instrumental válida, 𝑧, o efeito de uma variação 
em 𝑥 sobre 𝑦 pode ser estimado utilizando o estimador de VI.
As duas condições para um instrumento:
Uma variável instrumental válida (“instrumento”) deve satisfazer
duas condições:
1. Relevância do instrumento: 𝐶𝑜𝑣 𝑧, 𝑥 ≠ 0
2. Exogeneidade do instrumento: 𝐶𝑜𝑣 𝑧, 𝑢 = 0
 𝑧 é chamada de variável instrumental de x.
Inferência com a estimação V.I
A hipótese de homocedasticidade neste caso é declarada
condicional às variável instrumental:
𝐸 𝑢2 𝑧 = 𝜎2 = 𝑉𝑎𝑟(𝑢) (1)
Par fazer a inferência sobre 𝛽1, precisamos de um erro-padrão
que possa ser usado para calcular estatísticas 𝑡 e intervalos de
confiança.
A abordagem habitual é impor uma hipótese de
homocedasticidade, exatamente como no caso de MQO.
O efeito de instrumento fraco
Embora VI seja consistente quando 𝑧 e 𝑢 são não correlacionados e 𝑥
e 𝑧 tem qualquer correlação, positiva ou negativa, as estimativas de
VI podem ter grandes erros-padrão, especialmente se 𝑧 e 𝑥 forem
apenas fracamente correlacionadas.
A fraca correlação entre 𝑧 e 𝑥 pode apresentar um grande viés
assimptótico, mesmo se 𝑧 e 𝑢 forem só moderadamente
correlacionados.
O viés assimptótico no estimador VI será menor que o dos MQO 
somente se:
𝐶𝑜𝑟𝑟(𝑧,𝑢)
𝐶𝑜𝑟𝑟(𝑧,𝑥)
< 𝐶𝑜𝑟𝑟(𝑥, 𝑢)
Exemplo
Quando 𝑧 e 𝑥 não têm nenhuma correlação, as coisas ficam
particularmente ruins, seja 𝑧 correlacionado ou não com 𝑢.
O exemplo ilustra porque devemos sempre verificar se a variável
explicativa endógena é correlacionada com a candidata VI.
Exemplo: A estimação do efeito do hábito de fumar sobre o peso
de nascimento.
Packs (maços): é a quantidade de maços de cigarros fumados pela
mãe por dia.
 Packs (maços) poderiam está correlacionados com outros fatores
relativos à saúde ou à existência de um bom procedimento pré-natal,
de forma que maços e 𝑢 pudessem ser correlacionados.
Uma possível variável instrumental de maços seria o preço médio
dos cigarros no estado de residência, 𝑝𝑟𝑒𝑐𝑖𝑔.
 Consideraremos que 𝑝𝑟𝑒𝑐𝑖𝑔 e 𝑢 não correlacionados.
Exemplo
A teoria econômica básica sugere que 𝑚𝑎ç𝑜𝑠 e 𝑝𝑟𝑒𝑐𝑖𝑔 são
negativamente correlacionados.
Para verificar isso, regredimos 𝑚𝑎ç𝑜𝑠 sobre 𝑝𝑟𝑒𝑐𝑖𝑔
 
 _cons .0674257 .1025384 0.66 0.511 -.1337215 .2685728
 cigprice .0002829 .000783 0.36 0.718 -.0012531 .0018188
 
 packs Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 123.696129 1387 .089182501 Root MSE = .29873
 Adj R-squared = -0.0006
 Residual 123.684481 1386 .089238442 R-squared = 0.0001
 Model .011648626 1 .011648626 Prob > F = 0.7179
 F( 1, 1386) = 0.13
 Source SS df MS Number of obs = 1388
. reg packs cigprice
Isso não indica qualquer relação entre o hábito de fumar durante a
gravidez e o preço dos cigarros, o que talvez não seja tão surpreendente
devido à natureza dependente do hábito de fumar.
 
Instruments: cigprice
Instrumented: packs
 
 _cons 4.448137 .9081547 4.90 0.000 2.66663 6.229643
 packs 2.988674 8.698884 0.34 0.731 -14.07573 20.05308
 
 lbwght Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 50.4203246 1387 .036352073 Root MSE = .93886
 Adj R-squared = .
 Residual 1221.70115 1386 .881458263 R-squared = .
 Model -1171.28083 1 -1171.28083 Prob > F = 0.7312
 F( 1, 1386) = 0.12
 Source SS df MS Number of obs = 1388
Instrumental variables (2SLS) regression
 
 _cons .0674257 .1025384 0.66 0.511 -.1337215 .2685728
 cigprice .0002829 .000783 0.36 0.718 -.0012531 .0018188
 
 packs Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 123.696129 1387 .089182501 Root MSE = .29873
 Adj R-squared = -0.0006
 Residual 123.684481 1386 .089238442 R-squared = 0.0001
 Model .011648626 1 .011648626 Prob > F = 0.7179
 F( 1, 1386) = 0.13
 Source SS df MS Number of obs = 1388
 
First-stage regressions
. ivreg lbwght (packs = cigprice ), first
R- quadrado é negativo.
O coeficiente de maços é enorme e tem um sinal inesperado.
O erro-padrão também é muito grande, de modo que maços não é significante.
Entretanto, as estimativas não tem significado, pois precig não atende o requisito de um VI.
Maços e 𝑝𝑟𝑒𝑐𝑖𝑔 não são correlacionados: não devemos usar 𝑝𝑟𝑒𝑐𝑖𝑔 como uma VI de
maços.
Se fizermos temos os seguintes resultados.
Estimação de V.I com regressão múltipla
Modelo estrutural: é o modelo em que estamos interessados em
estimar.
Considere um modelo linear padrão com duas variáveis explicativas.
Equação estrutural:
𝑦1 = 𝛽0 + 𝛽1𝑦2 + 𝛽2𝑧1 + 𝑢 (2)
Onde 𝑧1 é exógena e 𝑦2 é endógena.
Equação na forma reduzida:
𝑦2 = 𝜋𝑜 + 𝜋1𝑧1 + 𝜋2𝑧2 + 𝑣2 (3)
Onde 𝑧2 é uma variável instrumental e 𝜋2 ≠ 0.
Nosso problema: uma ou mais variáveis que são endógenas.
Precisamos de um instrumento para cada variável endógena.
MQO2E: Mínimos Quadrados em dois
Estágios(2SLS)
Equivale ao caso quando múltiplas variáveis instrumentais são
correlacionadas com a variável explicativa endógena.
Forma reduzida para 𝑦2 (variável explicativa endógena):
𝑦2 = 𝜋0 + 𝜋1𝑧1 + 𝜋2𝑧2 + 𝜋3𝑧3 + 𝑣2 (4)
Onde: 𝐸 𝑣2 = 0; 𝐶𝑜𝑣 𝑧1, 𝑣2 = 0 , 𝐶𝑜𝑣 𝑧2, 𝑣2 = 0 e
𝐶𝑜𝑣 𝑧3, 𝑣2 = 0
MQO2E: Mínimos Quadrados em dois
Estágios (2SLS)
Supondo que a variável explicativa endógena 𝑦2 tenha a
possibilidade de ser correlacionada com duas variáveis
exógenas :
𝑦2 = 𝜋0 + 𝜋1𝑧1 + 𝜋2𝑧2 + 𝜋3𝑧3 (5)
A melhor variável instrumental de 𝑦2 é a combinação linear
dos 𝑧𝑗, que chamamos de 𝑦2
∗.
𝑦2
∗ = 𝜋0 + 𝜋1𝑧1 + 𝜋2𝑧2 + 𝜋3𝑧3 (6)
MQO2E: Mínimos Quadrados em dois
Estágios (2SLS)
Realiza a Hipótese nula: 𝜋2= 0, 𝜋3 = 0.
Precisamos de pelo menos:𝜋2 ≠ 0, 𝜋3 ≠ 0.
Esta é a hipótese de identificação principal, uma vez que
assumimos que os 𝑧𝑠 são exógenos.
Exemplo
Exemplo: Retorno da educação para mulheres que trabalham.
1º: estimamos a equação do 𝑒𝑑𝑢𝑐 sobre 𝑒𝑥𝑝𝑒𝑟 , 𝑒𝑥𝑝𝑒𝑟2 ,
𝑚𝑜𝑡ℎ𝑒𝑑𝑢𝑐 e 𝑓𝑎𝑡ℎ𝑒𝑑𝑢𝑐
 
 _cons 8.366716 .2667111 31.37 0.000 7.843125 8.890307
 fatheduc .1845745 .0244979 7.53 0.000 .1364817 .2326674
 motheduc .1856173 .0259869 7.14 0.000 .1346014 .2366331
 expersq -.0018564 .0008276 -2.24 0.025 -.0034812 -.0002317
 exper .085378 .0255485 3.34 0.001 .0352228 .1355333
 
 educ Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 3910.03984 752 5.19952106 Root MSE = 1.9636
 Adj R-squared = 0.2584
 Residual 2884.0966 748 3.85574412 R-squared = 0.2624
 Model 1025.94324 4 256.48581 Prob > F = 0.0000
 F( 4, 748) = 66.52
 Source SS df MS Number of obs = 753
. reg educ exper expersq motheduc fatheduc
Exemplo
Exemplo: Retorno da educação para mulheres que trabalham.
2º: testamos a hipótese nula de 𝑚𝑜𝑡ℎ𝑒𝑑𝑢𝑐 e 𝑓𝑎𝑡ℎ𝑒𝑑𝑢𝑐 usando
um teste F.
 Resultado: 𝑒𝑑𝑢𝑐 é parcialmente correlacionado com a
educação da mãe e do pai.
 Prob > F = 0.0000
 F( 2, 748) = 124.76
 ( 2) fatheduc = 0
 ( 1) motheduc = 0
. test motheduc fatheduc
Exemplo: Retorno da educação para mulheres 
que trabalham
3º: estimando por MQ2E.
O retorno da educação estimado está em torno de 6,1%.
Em razão de seu erro-padrão ser relativamente grande, a estimativa de
MQ2E é pouco significativa no nível de 5%.
 
Instruments: exper expersq motheduc fatheduc
Instrumented: educ
 
 _cons .0481003 .4003281 0.12 0.904 -.7387745 .8349751
 expersq -.000899 .0004017 -2.24 0.026 -.0016885 -.0001094
 exper .0441704 .0134325 3.29 0.001 .0177679 .0705729
 educ .0613966 .0314367 1.95 0.051 -.0003945 .1231878
 
 lwage Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 223.327451 427 .523015108 Root MSE = .67471
 Adj R-squared = 0.1296
 Residual 193.020022 424 .4552359 R-squared = 0.1357
 Model 30.3074295 3 10.1024765 Prob > F = 0.0000
 F( 3, 424) = 8.14
 Source SS df MS Number of obs = 428
Instrumental variables (2SLS) regression
. ivreg lwage (educ = motheduc fatheduc) exper expersq
Erros nas variáveis com estimação de V.I
O uso da VI pode solucionar o problema de erro de medida.
𝑦 = 𝛽0 + 𝛽1𝑥1
∗ + 𝛽2𝑥2 + 𝑢 (7)
Observamos 𝑥1 ao invés de 𝑥1
∗, pois 𝑥1 não é observável:
𝑥1 = 𝑥1
∗ + 𝑒1 (8)
Sendo 𝑒1 o erro de medida. Onde 𝑒1 é viesado e inconsistente.
Se as hipóteses dos erros clássicos nas variáveis (ECV) se
mantiverem, o viés no estimador MQO de 𝛽1 tenderá a zero.
𝐶𝑜𝑣 𝑥1
∗, 𝑒1 = 0 → 𝑒1 não correlacionado com a variável
explicativa não observada.
Erros nas variáveis com estimação de V.I
Presumimos que 𝑢 é não correlacionado com 𝑥1
∗, 𝑥1 e 𝑥2: no
caso de ECV, presumimos que 𝑒1 é não correlacionado com 𝑥1
∗
e 𝑥2.
Assim 𝑥2 é exógeno, mas 𝑥1 é correlacionado com 𝑒1.
O que precisamos é de uma VI de 𝑥1 . Tal VI deve ser
correlacionada com 𝑥1 , não correlacionada com u e não
correlacionada com o erro de estimação, 𝑒1.
Assim, se existe um z, tal que 𝐶𝑜𝑟𝑟 𝑧, 𝑢 = 0 e 𝐶𝑜𝑟𝑟 𝑧, 𝑥1 ≠
0, então → VI removerá o viés de atenuação.
Exemplo: o uso de duas notas de testes como 
indicadores de aptidão
QI desempenha o papel de primeira nota de teste e 𝐾𝑊𝑊
(conhecimento do mundo do trabalho) é a segunda nota de teste.
Em vez de adicionar QI e fazer o MQO, adicionamos QI e usamos
𝐾𝑊𝑊 como sua variável instrumental
Exemplo: o uso de duas notas de testes como 
indicadores de aptidão
O coeficiente de educ é 0,025 (erro padrão=0,017). Essa estimativa é baixa, e
não estatisticamente diferente de zero.
É um resultado problemático, sugerindo que uma de nossas hipóteses não se
sustenta; talvez 𝑒1 e 𝑒2 sejam correlacionados.
 
Instruments: educ exper tenure married south urban black KWW
Instrumented: IQ
 
 _cons 4.592453 .3257807 14.10 0.000 3.953099 5.231807
 black -.0225611 .0739597 -0.31 0.760 -.1677092 .122587
 urban .1767058 .0282117 6.26 0.000 .1213394 .2320722
 south -.0515532 .0311279 -1.66 0.098 -.1126426 .0095362
 married .2006904 .0406775 4.93 0.000 .1208596 .2805212
 tenure .0104562 .0026012 4.02 0.000 .0053512 .0155612
 exper .01442 .0033208 4.34 0.000 .0079029 .0209371
 educ .0250321 .0166068 1.51 0.132 -.0075591 .0576234
 IQ .0130473 .0049341 2.64 0.008 .0033641 .0227305
 
 lwage Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 165.656294 934 .177362199 Root MSE = .38067
 Adj R-squared = 0.1830
 Residual 134.189787 926 .144913377 R-squared = 0.1900
 Model 31.4665073 8 3.93331341 Prob > F = 0.0000
 F( 8, 926) = 36.96
 Source SS df MS Number of obs = 935
Instrumental variables (2SLS) regression
. ivreg lwage educ exper tenure married south urban black (IQ =KWW) 
Teste para Endogeneidade
MQO é preferido a VI se não tivermos um problema de
endogeneidade, ou seja, quando as variáveis explicativas são
exógenas;
Precisamos, portanto, testar a existência de endogeneidade.
Ideia do teste de Hausman: verificar se há diferenças entre as
estimativas de MQO e VI.
Teste para Endogeneidade
Para ilustrar, suponha que temos uma única variável suspeita
de ser endógena
𝑦1 = 𝛽0 + 𝛽1𝑦2 + 𝛽2𝑧1 + 𝛽3𝑧2 + 𝑢1 (9)
Teste mais simples: usar uma regressão para testar
endogeneidade:
𝑦2 = 𝜋0 + 𝜋1𝑧1 + 𝜋2𝑧2 + 𝜋3𝑧3 + 𝜋4𝑧4 + 𝑣2 (10)
Se 𝑦2 é endógeno, então 𝑣2 (a partir da forma da equação
reduzida) e 𝑢1 (do modelo estrutural) podem estar
correlacionados.
O melhor teste é baseado nesta observação.
Teste para Endogeneidade
Forma reduzida:
𝑦2 = 𝜋0 + 𝜋1𝑧1 + 𝜋2𝑧2 + 𝜋3𝑧3 + 𝜋4𝑧4 + 𝑣2 (11)
Agora cada 𝑧𝑗 é não correlacionadocom 𝑢1 ,y2 será não
correlacionado com 𝑢1 se e somente se, 𝑣2 for não
correlacionado com 𝑢1.
Como podemos estimar a forma reduzida de 𝑦2 por MQO,
podemos obter os resíduos da forma reduzida, ො𝑣2. Portanto
estimamos:
𝑦1 = 𝛽0 + 𝛽1𝑦2 + 𝛽2𝑧1 + 𝛽3𝑧2 + 𝛿1 ො𝑣2 + 𝑒𝑟𝑟𝑜 (12)
𝐻0: 𝛿1 = 0 (exogeneidade), se rejeitamos 𝐻0 a um nível
pequeno de significância, concluímos que 𝑦2 é endógeno
porque 𝑣2 e 𝑢1 são correlacionados.
Teste para Endogeneidade
Procedimentos:
Estime a forma reduzida de 𝑦2, regredindo 𝑦2 sobre todas as
variáveis exógenas (inclusive aquelas da equação estrutural e
as Vis adicionais). Obtenha os resíduos, ො𝑣2.
Adicione ො𝑣2 à equação estrutural (que inclui 𝑦2 e verifique a
significância de ො𝑣2, usando uma regressão MQO.
Se o coeficiente de ො𝑣2 for estatisticamente diferente de zero,
concluiremos que 𝑦2 é endógeno (rejeitamos a hipótese nula de
exogeneidade).
Podemos usar um teste t robusto em relação a
heterocedasticidade.
Se há múltiplas variáveis endógenas, faça testes conjuntos dos
resíduos para cada primeiro estágio.
Teste de endogeneidade de uma única variável 
explicativa
Exemplo: Retorno da educação para mulheres que trabalham.
1º: Estime a forma reduzida de 𝑦2, regredindo 𝑦2 sobre todas
as variáveis exógenas.
 
 _cons 9.10264 .4265614 21.34 0.000 8.264196 9.941084
 fatheduc .1895484 .0337565 5.62 0.000 .1231971 .2558997
 motheduc .157597 .0358941 4.39 0.000 .087044 .2281501
 expersq -.0010091 .0012033 -0.84 0.402 -.0033744 .0013562
 exper .0452254 .0402507 1.12 0.262 -.0338909 .1243417
 
 educ Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 2230.19626 427 5.22294206 Root MSE = 2.039
 Adj R-squared = 0.2040
 Residual 1758.57526 423 4.15738833 R-squared = 0.2115
 Model 471.620998 4 117.90525 Prob > F = 0.0000
 F( 4, 423) = 28.36
 Source SS df MS Number of obs = 428
. reg educ exper expersq motheduc fatheduc if lwage<.
Teste de endogeneidade de uma única variável 
explicativa
Exemplo: Retorno da educação para mulheres que trabalham.
2º: Obter os resíduos 𝑢ℎ𝑎𝑡1.
3º: Adicione 𝑢ℎ𝑎𝑡1 á equação estrutural (que inclui 𝑦2) e
verifique a significância de 𝑢ℎ𝑎𝑡1 , usando uma regressão
MQO.
Se o coeficiente 𝑢ℎ𝑎𝑡1 for estatisticamente diferente de zero:
então 𝑦2 é endógeno.
Teste de endogeneidade de uma única variável 
explicativa
Exemplo: Retorno da educação para mulheres que trabalham.
Se o coeficiente 𝑢ℎ𝑎𝑡1 for estatisticamente diferente de zero: então
𝑦2 é endógeno.
Há uma correlação positiva entre o erro e 𝑢ℎ𝑎𝑡1.
 
 _cons .0481003 .3945753 0.12 0.903 -.7274721 .8236727
 uhat1 .0581666 .0348073 1.67 0.095 -.0102501 .1265834
 expersq -.000899 .0003959 -2.27 0.024 -.0016772 -.0001208
 exper .0441704 .0132394 3.34 0.001 .0181471 .0701937
 educ .0613966 .0309849 1.98 0.048 .000493 .1223003
 
 lwage Coef. Std. Err. t P>|t| [95% Conf. Interval]
 
 Total 223.327451 427 .523015108 Root MSE = .66502
 Adj R-squared = 0.1544
 Residual 187.070135 423 .442246183 R-squared = 0.1624
 Model 36.2573159 4 9.06432898 Prob > F = 0.0000
 F( 4, 423) = 20.50
 Source SS df MS Number of obs = 428
. reg lwage educ exper expersq uhat1