Baixe o app para aproveitar ainda mais
Prévia do material em texto
Tópico 10 – Estimação de Variáveis Instrumentais e Mínimos Quadrados em Dois Estágios Bibliografia: STOCK, James H. e WATSON, Mark W. Econometria. 1ª. Edição. Prentice Hall, 2004. WOOLDRIDGE, J.M. Introdução à Econometria: uma abordagem moderna. 4ª ed. São Paulo: Pioneira Thomson Learning, 22015. (capítulo 15). Variáveis instrumentais Qualquer que seja a fonte da correlação entre 𝑥 e 𝑢, se existe uma variável instrumental válida, 𝑧, o efeito de uma variação em 𝑥 sobre 𝑦 pode ser estimado utilizando o estimador de VI. As duas condições para um instrumento: Uma variável instrumental válida (“instrumento”) deve satisfazer duas condições: 1. Relevância do instrumento: 𝐶𝑜𝑣 𝑧, 𝑥 ≠ 0 2. Exogeneidade do instrumento: 𝐶𝑜𝑣 𝑧, 𝑢 = 0 𝑧 é chamada de variável instrumental de x. Inferência com a estimação V.I A hipótese de homocedasticidade neste caso é declarada condicional às variável instrumental: 𝐸 𝑢2 𝑧 = 𝜎2 = 𝑉𝑎𝑟(𝑢) (1) Par fazer a inferência sobre 𝛽1, precisamos de um erro-padrão que possa ser usado para calcular estatísticas 𝑡 e intervalos de confiança. A abordagem habitual é impor uma hipótese de homocedasticidade, exatamente como no caso de MQO. O efeito de instrumento fraco Embora VI seja consistente quando 𝑧 e 𝑢 são não correlacionados e 𝑥 e 𝑧 tem qualquer correlação, positiva ou negativa, as estimativas de VI podem ter grandes erros-padrão, especialmente se 𝑧 e 𝑥 forem apenas fracamente correlacionadas. A fraca correlação entre 𝑧 e 𝑥 pode apresentar um grande viés assimptótico, mesmo se 𝑧 e 𝑢 forem só moderadamente correlacionados. O viés assimptótico no estimador VI será menor que o dos MQO somente se: 𝐶𝑜𝑟𝑟(𝑧,𝑢) 𝐶𝑜𝑟𝑟(𝑧,𝑥) < 𝐶𝑜𝑟𝑟(𝑥, 𝑢) Exemplo Quando 𝑧 e 𝑥 não têm nenhuma correlação, as coisas ficam particularmente ruins, seja 𝑧 correlacionado ou não com 𝑢. O exemplo ilustra porque devemos sempre verificar se a variável explicativa endógena é correlacionada com a candidata VI. Exemplo: A estimação do efeito do hábito de fumar sobre o peso de nascimento. Packs (maços): é a quantidade de maços de cigarros fumados pela mãe por dia. Packs (maços) poderiam está correlacionados com outros fatores relativos à saúde ou à existência de um bom procedimento pré-natal, de forma que maços e 𝑢 pudessem ser correlacionados. Uma possível variável instrumental de maços seria o preço médio dos cigarros no estado de residência, 𝑝𝑟𝑒𝑐𝑖𝑔. Consideraremos que 𝑝𝑟𝑒𝑐𝑖𝑔 e 𝑢 não correlacionados. Exemplo A teoria econômica básica sugere que 𝑚𝑎ç𝑜𝑠 e 𝑝𝑟𝑒𝑐𝑖𝑔 são negativamente correlacionados. Para verificar isso, regredimos 𝑚𝑎ç𝑜𝑠 sobre 𝑝𝑟𝑒𝑐𝑖𝑔 _cons .0674257 .1025384 0.66 0.511 -.1337215 .2685728 cigprice .0002829 .000783 0.36 0.718 -.0012531 .0018188 packs Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 123.696129 1387 .089182501 Root MSE = .29873 Adj R-squared = -0.0006 Residual 123.684481 1386 .089238442 R-squared = 0.0001 Model .011648626 1 .011648626 Prob > F = 0.7179 F( 1, 1386) = 0.13 Source SS df MS Number of obs = 1388 . reg packs cigprice Isso não indica qualquer relação entre o hábito de fumar durante a gravidez e o preço dos cigarros, o que talvez não seja tão surpreendente devido à natureza dependente do hábito de fumar. Instruments: cigprice Instrumented: packs _cons 4.448137 .9081547 4.90 0.000 2.66663 6.229643 packs 2.988674 8.698884 0.34 0.731 -14.07573 20.05308 lbwght Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 50.4203246 1387 .036352073 Root MSE = .93886 Adj R-squared = . Residual 1221.70115 1386 .881458263 R-squared = . Model -1171.28083 1 -1171.28083 Prob > F = 0.7312 F( 1, 1386) = 0.12 Source SS df MS Number of obs = 1388 Instrumental variables (2SLS) regression _cons .0674257 .1025384 0.66 0.511 -.1337215 .2685728 cigprice .0002829 .000783 0.36 0.718 -.0012531 .0018188 packs Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 123.696129 1387 .089182501 Root MSE = .29873 Adj R-squared = -0.0006 Residual 123.684481 1386 .089238442 R-squared = 0.0001 Model .011648626 1 .011648626 Prob > F = 0.7179 F( 1, 1386) = 0.13 Source SS df MS Number of obs = 1388 First-stage regressions . ivreg lbwght (packs = cigprice ), first R- quadrado é negativo. O coeficiente de maços é enorme e tem um sinal inesperado. O erro-padrão também é muito grande, de modo que maços não é significante. Entretanto, as estimativas não tem significado, pois precig não atende o requisito de um VI. Maços e 𝑝𝑟𝑒𝑐𝑖𝑔 não são correlacionados: não devemos usar 𝑝𝑟𝑒𝑐𝑖𝑔 como uma VI de maços. Se fizermos temos os seguintes resultados. Estimação de V.I com regressão múltipla Modelo estrutural: é o modelo em que estamos interessados em estimar. Considere um modelo linear padrão com duas variáveis explicativas. Equação estrutural: 𝑦1 = 𝛽0 + 𝛽1𝑦2 + 𝛽2𝑧1 + 𝑢 (2) Onde 𝑧1 é exógena e 𝑦2 é endógena. Equação na forma reduzida: 𝑦2 = 𝜋𝑜 + 𝜋1𝑧1 + 𝜋2𝑧2 + 𝑣2 (3) Onde 𝑧2 é uma variável instrumental e 𝜋2 ≠ 0. Nosso problema: uma ou mais variáveis que são endógenas. Precisamos de um instrumento para cada variável endógena. MQO2E: Mínimos Quadrados em dois Estágios(2SLS) Equivale ao caso quando múltiplas variáveis instrumentais são correlacionadas com a variável explicativa endógena. Forma reduzida para 𝑦2 (variável explicativa endógena): 𝑦2 = 𝜋0 + 𝜋1𝑧1 + 𝜋2𝑧2 + 𝜋3𝑧3 + 𝑣2 (4) Onde: 𝐸 𝑣2 = 0; 𝐶𝑜𝑣 𝑧1, 𝑣2 = 0 , 𝐶𝑜𝑣 𝑧2, 𝑣2 = 0 e 𝐶𝑜𝑣 𝑧3, 𝑣2 = 0 MQO2E: Mínimos Quadrados em dois Estágios (2SLS) Supondo que a variável explicativa endógena 𝑦2 tenha a possibilidade de ser correlacionada com duas variáveis exógenas : 𝑦2 = 𝜋0 + 𝜋1𝑧1 + 𝜋2𝑧2 + 𝜋3𝑧3 (5) A melhor variável instrumental de 𝑦2 é a combinação linear dos 𝑧𝑗, que chamamos de 𝑦2 ∗. 𝑦2 ∗ = 𝜋0 + 𝜋1𝑧1 + 𝜋2𝑧2 + 𝜋3𝑧3 (6) MQO2E: Mínimos Quadrados em dois Estágios (2SLS) Realiza a Hipótese nula: 𝜋2= 0, 𝜋3 = 0. Precisamos de pelo menos:𝜋2 ≠ 0, 𝜋3 ≠ 0. Esta é a hipótese de identificação principal, uma vez que assumimos que os 𝑧𝑠 são exógenos. Exemplo Exemplo: Retorno da educação para mulheres que trabalham. 1º: estimamos a equação do 𝑒𝑑𝑢𝑐 sobre 𝑒𝑥𝑝𝑒𝑟 , 𝑒𝑥𝑝𝑒𝑟2 , 𝑚𝑜𝑡ℎ𝑒𝑑𝑢𝑐 e 𝑓𝑎𝑡ℎ𝑒𝑑𝑢𝑐 _cons 8.366716 .2667111 31.37 0.000 7.843125 8.890307 fatheduc .1845745 .0244979 7.53 0.000 .1364817 .2326674 motheduc .1856173 .0259869 7.14 0.000 .1346014 .2366331 expersq -.0018564 .0008276 -2.24 0.025 -.0034812 -.0002317 exper .085378 .0255485 3.34 0.001 .0352228 .1355333 educ Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 3910.03984 752 5.19952106 Root MSE = 1.9636 Adj R-squared = 0.2584 Residual 2884.0966 748 3.85574412 R-squared = 0.2624 Model 1025.94324 4 256.48581 Prob > F = 0.0000 F( 4, 748) = 66.52 Source SS df MS Number of obs = 753 . reg educ exper expersq motheduc fatheduc Exemplo Exemplo: Retorno da educação para mulheres que trabalham. 2º: testamos a hipótese nula de 𝑚𝑜𝑡ℎ𝑒𝑑𝑢𝑐 e 𝑓𝑎𝑡ℎ𝑒𝑑𝑢𝑐 usando um teste F. Resultado: 𝑒𝑑𝑢𝑐 é parcialmente correlacionado com a educação da mãe e do pai. Prob > F = 0.0000 F( 2, 748) = 124.76 ( 2) fatheduc = 0 ( 1) motheduc = 0 . test motheduc fatheduc Exemplo: Retorno da educação para mulheres que trabalham 3º: estimando por MQ2E. O retorno da educação estimado está em torno de 6,1%. Em razão de seu erro-padrão ser relativamente grande, a estimativa de MQ2E é pouco significativa no nível de 5%. Instruments: exper expersq motheduc fatheduc Instrumented: educ _cons .0481003 .4003281 0.12 0.904 -.7387745 .8349751 expersq -.000899 .0004017 -2.24 0.026 -.0016885 -.0001094 exper .0441704 .0134325 3.29 0.001 .0177679 .0705729 educ .0613966 .0314367 1.95 0.051 -.0003945 .1231878 lwage Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 223.327451 427 .523015108 Root MSE = .67471 Adj R-squared = 0.1296 Residual 193.020022 424 .4552359 R-squared = 0.1357 Model 30.3074295 3 10.1024765 Prob > F = 0.0000 F( 3, 424) = 8.14 Source SS df MS Number of obs = 428 Instrumental variables (2SLS) regression . ivreg lwage (educ = motheduc fatheduc) exper expersq Erros nas variáveis com estimação de V.I O uso da VI pode solucionar o problema de erro de medida. 𝑦 = 𝛽0 + 𝛽1𝑥1 ∗ + 𝛽2𝑥2 + 𝑢 (7) Observamos 𝑥1 ao invés de 𝑥1 ∗, pois 𝑥1 não é observável: 𝑥1 = 𝑥1 ∗ + 𝑒1 (8) Sendo 𝑒1 o erro de medida. Onde 𝑒1 é viesado e inconsistente. Se as hipóteses dos erros clássicos nas variáveis (ECV) se mantiverem, o viés no estimador MQO de 𝛽1 tenderá a zero. 𝐶𝑜𝑣 𝑥1 ∗, 𝑒1 = 0 → 𝑒1 não correlacionado com a variável explicativa não observada. Erros nas variáveis com estimação de V.I Presumimos que 𝑢 é não correlacionado com 𝑥1 ∗, 𝑥1 e 𝑥2: no caso de ECV, presumimos que 𝑒1 é não correlacionado com 𝑥1 ∗ e 𝑥2. Assim 𝑥2 é exógeno, mas 𝑥1 é correlacionado com 𝑒1. O que precisamos é de uma VI de 𝑥1 . Tal VI deve ser correlacionada com 𝑥1 , não correlacionada com u e não correlacionada com o erro de estimação, 𝑒1. Assim, se existe um z, tal que 𝐶𝑜𝑟𝑟 𝑧, 𝑢 = 0 e 𝐶𝑜𝑟𝑟 𝑧, 𝑥1 ≠ 0, então → VI removerá o viés de atenuação. Exemplo: o uso de duas notas de testes como indicadores de aptidão QI desempenha o papel de primeira nota de teste e 𝐾𝑊𝑊 (conhecimento do mundo do trabalho) é a segunda nota de teste. Em vez de adicionar QI e fazer o MQO, adicionamos QI e usamos 𝐾𝑊𝑊 como sua variável instrumental Exemplo: o uso de duas notas de testes como indicadores de aptidão O coeficiente de educ é 0,025 (erro padrão=0,017). Essa estimativa é baixa, e não estatisticamente diferente de zero. É um resultado problemático, sugerindo que uma de nossas hipóteses não se sustenta; talvez 𝑒1 e 𝑒2 sejam correlacionados. Instruments: educ exper tenure married south urban black KWW Instrumented: IQ _cons 4.592453 .3257807 14.10 0.000 3.953099 5.231807 black -.0225611 .0739597 -0.31 0.760 -.1677092 .122587 urban .1767058 .0282117 6.26 0.000 .1213394 .2320722 south -.0515532 .0311279 -1.66 0.098 -.1126426 .0095362 married .2006904 .0406775 4.93 0.000 .1208596 .2805212 tenure .0104562 .0026012 4.02 0.000 .0053512 .0155612 exper .01442 .0033208 4.34 0.000 .0079029 .0209371 educ .0250321 .0166068 1.51 0.132 -.0075591 .0576234 IQ .0130473 .0049341 2.64 0.008 .0033641 .0227305 lwage Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 165.656294 934 .177362199 Root MSE = .38067 Adj R-squared = 0.1830 Residual 134.189787 926 .144913377 R-squared = 0.1900 Model 31.4665073 8 3.93331341 Prob > F = 0.0000 F( 8, 926) = 36.96 Source SS df MS Number of obs = 935 Instrumental variables (2SLS) regression . ivreg lwage educ exper tenure married south urban black (IQ =KWW) Teste para Endogeneidade MQO é preferido a VI se não tivermos um problema de endogeneidade, ou seja, quando as variáveis explicativas são exógenas; Precisamos, portanto, testar a existência de endogeneidade. Ideia do teste de Hausman: verificar se há diferenças entre as estimativas de MQO e VI. Teste para Endogeneidade Para ilustrar, suponha que temos uma única variável suspeita de ser endógena 𝑦1 = 𝛽0 + 𝛽1𝑦2 + 𝛽2𝑧1 + 𝛽3𝑧2 + 𝑢1 (9) Teste mais simples: usar uma regressão para testar endogeneidade: 𝑦2 = 𝜋0 + 𝜋1𝑧1 + 𝜋2𝑧2 + 𝜋3𝑧3 + 𝜋4𝑧4 + 𝑣2 (10) Se 𝑦2 é endógeno, então 𝑣2 (a partir da forma da equação reduzida) e 𝑢1 (do modelo estrutural) podem estar correlacionados. O melhor teste é baseado nesta observação. Teste para Endogeneidade Forma reduzida: 𝑦2 = 𝜋0 + 𝜋1𝑧1 + 𝜋2𝑧2 + 𝜋3𝑧3 + 𝜋4𝑧4 + 𝑣2 (11) Agora cada 𝑧𝑗 é não correlacionadocom 𝑢1 ,y2 será não correlacionado com 𝑢1 se e somente se, 𝑣2 for não correlacionado com 𝑢1. Como podemos estimar a forma reduzida de 𝑦2 por MQO, podemos obter os resíduos da forma reduzida, ො𝑣2. Portanto estimamos: 𝑦1 = 𝛽0 + 𝛽1𝑦2 + 𝛽2𝑧1 + 𝛽3𝑧2 + 𝛿1 ො𝑣2 + 𝑒𝑟𝑟𝑜 (12) 𝐻0: 𝛿1 = 0 (exogeneidade), se rejeitamos 𝐻0 a um nível pequeno de significância, concluímos que 𝑦2 é endógeno porque 𝑣2 e 𝑢1 são correlacionados. Teste para Endogeneidade Procedimentos: Estime a forma reduzida de 𝑦2, regredindo 𝑦2 sobre todas as variáveis exógenas (inclusive aquelas da equação estrutural e as Vis adicionais). Obtenha os resíduos, ො𝑣2. Adicione ො𝑣2 à equação estrutural (que inclui 𝑦2 e verifique a significância de ො𝑣2, usando uma regressão MQO. Se o coeficiente de ො𝑣2 for estatisticamente diferente de zero, concluiremos que 𝑦2 é endógeno (rejeitamos a hipótese nula de exogeneidade). Podemos usar um teste t robusto em relação a heterocedasticidade. Se há múltiplas variáveis endógenas, faça testes conjuntos dos resíduos para cada primeiro estágio. Teste de endogeneidade de uma única variável explicativa Exemplo: Retorno da educação para mulheres que trabalham. 1º: Estime a forma reduzida de 𝑦2, regredindo 𝑦2 sobre todas as variáveis exógenas. _cons 9.10264 .4265614 21.34 0.000 8.264196 9.941084 fatheduc .1895484 .0337565 5.62 0.000 .1231971 .2558997 motheduc .157597 .0358941 4.39 0.000 .087044 .2281501 expersq -.0010091 .0012033 -0.84 0.402 -.0033744 .0013562 exper .0452254 .0402507 1.12 0.262 -.0338909 .1243417 educ Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 2230.19626 427 5.22294206 Root MSE = 2.039 Adj R-squared = 0.2040 Residual 1758.57526 423 4.15738833 R-squared = 0.2115 Model 471.620998 4 117.90525 Prob > F = 0.0000 F( 4, 423) = 28.36 Source SS df MS Number of obs = 428 . reg educ exper expersq motheduc fatheduc if lwage<. Teste de endogeneidade de uma única variável explicativa Exemplo: Retorno da educação para mulheres que trabalham. 2º: Obter os resíduos 𝑢ℎ𝑎𝑡1. 3º: Adicione 𝑢ℎ𝑎𝑡1 á equação estrutural (que inclui 𝑦2) e verifique a significância de 𝑢ℎ𝑎𝑡1 , usando uma regressão MQO. Se o coeficiente 𝑢ℎ𝑎𝑡1 for estatisticamente diferente de zero: então 𝑦2 é endógeno. Teste de endogeneidade de uma única variável explicativa Exemplo: Retorno da educação para mulheres que trabalham. Se o coeficiente 𝑢ℎ𝑎𝑡1 for estatisticamente diferente de zero: então 𝑦2 é endógeno. Há uma correlação positiva entre o erro e 𝑢ℎ𝑎𝑡1. _cons .0481003 .3945753 0.12 0.903 -.7274721 .8236727 uhat1 .0581666 .0348073 1.67 0.095 -.0102501 .1265834 expersq -.000899 .0003959 -2.27 0.024 -.0016772 -.0001208 exper .0441704 .0132394 3.34 0.001 .0181471 .0701937 educ .0613966 .0309849 1.98 0.048 .000493 .1223003 lwage Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 223.327451 427 .523015108 Root MSE = .66502 Adj R-squared = 0.1544 Residual 187.070135 423 .442246183 R-squared = 0.1624 Model 36.2573159 4 9.06432898 Prob > F = 0.0000 F( 4, 423) = 20.50 Source SS df MS Number of obs = 428 . reg lwage educ exper expersq uhat1
Compartilhar