Baixe o app para aproveitar ainda mais
Prévia do material em texto
Tópico 11 – Estimação de Variáveis Instrumentais e Mínimos Quadrados em Dois Estágios Bibliografia: STOCK, James H. e WATSON, Mark W. Econometria. 1ª. Edição. Prentice Hall, 2004. WOOLDRIDGE, J.M. Introdução à Econometria: uma abordagem moderna. 4ª ed. São Paulo: Pioneira Thomson Learning, 22015. (capítulo 15). Teste de Restrição de Sobreidentificada Se há apenas 1 instrumento para nossa variável endógena, o modelo é considerado exatamente identificado. Se temos múltiplos instrumentos, é possível testar a sobreidentificação para ver se outros instrumentos são correlacionados com o erro. A ideia geral é que temos mais instrumentos do que precisamos para estimar consistentemente os parâmetros. Teste de Restrição de Sobreidentificada Procedimentos: Estime a equação estrutural por MQ2E e obtenha os resíduos MQ2E, ො𝑢1. Regrida ො𝑢1 sobre todas as variáveis exógenas. Obtenha o R- quadrado, digamos 𝑅1 2 para formar o 𝑛𝑅2. Sob a hipótese nula de que todos os instrumentos não são correlacionados com o erro , 𝑢1, n𝑅1 2~χ𝑞 2 , em que q é número de instrumentos extras (por exemplo: considere uma variável explicativa endógena, 𝑦2, e três instrumentos propostos para ela → 𝑞 = 3 − 1 = 2 restrições sobreidentificadoras). Se 𝑛𝑅1 2 exceder o valor crítico tabelado de 5% na distribuição χ𝑞 2 rejeitamos 𝐻0 e concluímos que pelo menos algumas das VIs não são exógenas. Teste de restrições sobreidentificadoras Exemplo: Retorno da educação para mulheres que trabalham. 1º: estime a equação estrutural por MQ2E Instruments: exper expersq motheduc fatheduc Instrumented: educ _cons .0481003 .4003281 0.12 0.904 -.7387745 .8349751 expersq -.000899 .0004017 -2.24 0.026 -.0016885 -.0001094 exper .0441704 .0134325 3.29 0.001 .0177679 .0705729 educ .0613966 .0314367 1.95 0.051 -.0003945 .1231878 lwage Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 223.327451 427 .523015108 Root MSE = .67471 Adj R-squared = 0.1296 Residual 193.020022 424 .4552359 R-squared = 0.1357 Model 30.3074295 3 10.1024765 Prob > F = 0.0000 F( 3, 424) = 8.14 Source SS df MS Number of obs = 428 Instrumental variables (2SLS) regression . ivreg lwage (educ = motheduc fatheduc) exper expersq Teste de restrições sobreidentificadoras Exemplo: Exemplo 15.8: Retorno da educação para mulheres que trabalham. 2º: Obtenha os resíduos 𝑢ℎ𝑎𝑡1 3º: regrida 𝑢ℎ𝑎𝑡1 sobre todas as variáveis exógenas. Obtenha o R- Quadrado. _cons .0109641 .1412571 0.08 0.938 -.2666892 .2886173 expersq 7.34e-07 .0003985 0.00 0.999 -.0007825 .000784 exper -.0000183 .0133291 -0.00 0.999 -.0262179 .0261813 fatheduc .0057823 .0111786 0.52 0.605 -.0161902 .0277547 motheduc -.0066065 .0118864 -0.56 0.579 -.0299704 .0167573 uhat1 Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 193.020022 427 .452037522 Root MSE = .67521 Adj R-squared = -0.0086 Residual 192.849519 423 .455909028 R-squared = 0.0009 Model .170502977 4 .042625744 Prob > F = 0.9845 F( 4, 423) = 0.09 Source SS df MS Number of obs = 428 . reg uhat1 motheduc fatheduc exper expersq Teste de restrições sobreidentificadoras 4º: sob a hipótese nula de que todas as VIs são não correlacionada com 𝑢. Se 𝑛𝑅2 exceder o valor crítico de 5% na distribuição χ𝑞 2: rejeitamos a hipótese nula → pelo menos algumas das VIs não são exógenas. n = 428 observações R-quadrado = 0.0009 nR2= 428. (0.0009) = 0.3852 em uma distribuição χ1 2 (p-valor = 0.535) Resultado: p-valor> 0.05: não rejeita a hipótese nula. Portanto, as variáveis da educação dos pais passam no teste de sobreidentificação. Rejeitar a hipótese nula significa que pelo menos uma das IVs não é exógena. Teste de restrições sobreidentificadoras Quando adicionamos a educação do marido a lista de VI, obtemos duas restrições sobreidentificadoras Instruments: exper expersq motheduc fatheduc huseduc Instrumented: educ _cons -.1868574 .2853959 -0.65 0.513 -.7478243 .3741096 expersq -.0008628 .0003962 -2.18 0.030 -.0016415 -.0000841 exper .0430973 .0132649 3.25 0.001 .0170242 .0691704 educ .0803918 .021774 3.69 0.000 .0375934 .1231901 lwage Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 223.327451 427 .523015108 Root MSE = .6693 Adj R-squared = 0.1435 Residual 189.934709 424 .447959218 R-squared = 0.1495 Model 33.3927427 3 11.1309142 Prob > F = 0.0000 F( 3, 424) = 11.52 Source SS df MS Number of obs = 428 Instrumental variables (2SLS) regression . ivreg lwage (educ = motheduc fatheduc huseduc) exper expersq Teste de restrições sobreidentificadoras 𝑝𝑟𝑒𝑑𝑖𝑐𝑡 𝑑𝑜𝑢𝑏𝑙𝑒 𝑢ℎ𝑎𝑡2, 𝑟𝑒𝑠 _cons .0086063 .1772724 0.05 0.961 -.3398405 .3570531 expersq -8.88e-06 .0003956 -0.02 0.982 -.0007865 .0007687 exper .000056 .0132285 0.00 0.997 -.025946 .026058 huseduc .0067811 .0114259 0.59 0.553 -.0156776 .0292398 fatheduc .0006734 .0113798 0.06 0.953 -.0216948 .0230417 motheduc -.0103852 .0118688 -0.87 0.382 -.0337145 .0129442 uhat2 Coef. Std. Err. t P>|t| [95% Conf. Interval] Total 189.934709 427 .444811964 Root MSE = .67001 Adj R-squared = -0.0092 Residual 189.439883 422 .448909675 R-squared = 0.0026 Model .494825827 5 .098965165 Prob > F = 0.9537 F( 5, 422) = 0.22 Source SS df MS Numberof obs = 428 . reg uhat2 motheduc fatheduc huseduc exper expersq Teste de restrições sobreidentificadoras n = 428 observações R-quadrado = 0.0026 𝑛𝑅2= 428. (0.0026) = 1.11 (p-valor = 0.574) Resultado: p-valor > 0.05: não rejeita a hipótese nula É ideal adicionar 𝑒𝑑𝑢𝑐𝑚𝑎𝑟 a lista de VI: Reduz o erro-padrão da estimativa de MQ2E; A estimativa de MQ2E de 𝑒𝑑𝑢𝑐 usando as três variáveis instrumentais é 0.080, de modo que isso torna 𝑒𝑑𝑢𝑐 mais significante do que quando 𝑒𝑑𝑢𝑐𝑚𝑎𝑟 não é usada como uma VI. (0.061). Tópico 11 – Modelos de equações simultâneas Bibliografia: WOOLDRIDGE, J.M. Introdução à Econometria: uma abordagem moderna. 4ª ed. São Paulo: Pioneira Thomson Learning, 22015. (capítulo 16). Modelos de equações simultâneas O método de variáveis instrumentais pode solucionar dois problemas de endogeneidade: variáveis omitidas e erro de medida. Em ambos os casos, poderíamos estimar os parâmetros de interesse por MQO se pudéssemos coletar dados melhores. Outra forma importante de endogeneidade de variáveis explicativas é a simultaneidade. Simultaneidade: ocorre quando uma ou mais variáveis explicativas são conjuntamente determinadas com a variável dependente. O principal método para estimar modelos de equações simultâneas (MES) é o das variáveis instrumentais. Modelos de equações simultâneas 𝑦1 = 𝛼1𝑦2 + 𝛽1𝑧1 + 𝑢1 (1) 𝑦2 = 𝛼2𝑦1 + 𝛽2𝑧2 + 𝑢2 (2) Quando há simultaneadade, o MQO gera estimadores viesados e inconsistentes. Modelos de equações simultâneas O ponto mais importante a lembrar no uso de modelos de equações simultâneas é que cada equação no sistema deve ter uma interpretação causal, ceteris paribus. Comecemos com a equação que queremos estimar, a função de Oferta de Trabalho: ℎ𝑠 = 𝛼1𝑤 + 𝛽1𝑧1 + 𝑢1 (3) onde: ℎ𝑠 = total anual de horas cumpridas por trabalhadores na agricultura; 𝑤 = média do salário por hora oferecida a tais trabalhadores; 𝑧= alguma variável observada afetando a oferta de mão de obra (por exemplo: média de salário na indústria); 𝑢1 = termo de erro aleatório. Exemplo: oferta e demanda Esta é uma equação estrutural → derivada da teoria econômica → que possui uma interpretação causal onde 𝑤 afeta diretamente ℎ𝑠 . O coeficiente 𝛼1 indica como a oferta de mão de obra muda quando o salário muda. Se ℎ𝑠 e 𝑤 estiverem na forma logarítmica, 𝛼1 será a elasticidade da oferta de mão de obra. Em geral, espera-se que 𝛼1 seja positiva (embora a teoria econômica não impeça que 𝛼1 ≤ 0. Exemplo: oferta e demanda Elasticidade da oferta de mão de obra são importantes na determinação de como os trabalhadores alterarão o número de horas que desejam trabalhar quando os impostos sobre os salários se alteram. Por exemplo, se 𝑧1 for o salário industrial, esperamos 𝛽1 ≤ 0 →com outros fatores permanecendo iguais, se o salário industrial aumenta, mais trabalhadores irão para a indústria do que para a agricultura. Exemplo: oferta e demanda Problema: não podemos simplesmente regredir as horas observadas sobre os salários, pois as horas observadas são determinadas pelo equilíbrio entre oferta e demanda. Considerando equação estrutural, a função de Demanda por Trabalho: ℎ𝑑 = 𝛼2𝑤 + 𝛽2𝑧2 + 𝑢2 (4) Em que ℎ𝑑 representa horas demandadas. Como na função de oferta, escrevemos horas demandadas como uma função do salário , 𝑤, mantendo 𝑧2 e 𝑢2 fixos. A variável 𝑧2 (por exemplo: áreas agrícola) é um deslocador observável da demanda e 𝑢2 é um deslocador não observável da demanda. Exemplo: oferta e demanda Então as horas são determinadas por um Modelo de Equações Simultâneas (MES). As equações descrevem relações totalmente diferentes. A oferta de mão de obra é uma equação comportamental dos trabalhadores, e a demanda por mão de obra é uma relação comportamental dos fazendeiros. ℎ e 𝑤 são endógenos pois ambos são determinados pelo equilíbrio de oferta e demanda. Elas se tornam interligadas em uma análise econométrica pois salários e horas observados são determinados pela interseção da oferta e demanda. Em outras palavras, em cada município 𝑖, as horas observadas, ℎ𝑖, e os salários observados, 𝑤𝑖 , são determinados pela condição de equilíbrio: 𝒉𝒊𝒔 = 𝒉𝒊𝒅. Exemplo: oferta e demanda Quando combinamos a condição de equilíbrio com as equações de oferta e demanda. ℎ𝑖 = 𝛼1𝑤𝑖 + 𝛽1𝑧𝑖1 + 𝑢𝑖1 (5) ℎ𝑖 = 𝛼2𝑤𝑖 + 𝛽2𝑧𝑖2 + 𝑢𝑖2 (6) Onde 𝑖= município→ ℎ𝑖 e 𝑤𝑖 são os valores de equilíbrio observados de cada município 𝑖. Estas 2 equações constituem um modelo de equações simultâneas (MES). Exercícios – Variáveis Instrumentais 1) Considere um modelo de regressão simples para estimar o efeito da propriedade de um computador pessoal (PC) na nota média de graduação de formados de uma grande universidade pública: 𝑠𝑢𝑝𝐺𝑃𝐴 = 𝛽0 + 𝛽1𝑃𝐶 + 𝑢 Em que 𝑃𝐶 é uma variável binária que indica a propriedade de um 𝑃𝐶. a) Por que a propriedade de um 𝑃𝐶 pode estar correlacionada com 𝑢? b) Explique por que 𝑃𝐶 possivelmente está relacionado à renda anual dos pais. Isso significa que a renda dos pais será uma boa VI de 𝑃𝐶? Por quê? 2) Suponha que você queria estimar o efeito da frequência às aulas sobre o desempenho dos alunos. Um modelo básico é: 𝑟𝑒𝑠𝑝𝑎𝑑 = 𝛽0 + 𝛽1𝑡𝑎𝑥𝑎𝑓𝑟𝑒𝑞 +2 𝑝𝑟𝑠𝐺𝑃𝐴 + 𝛽3𝐴𝐶𝑇 + 𝑢 Em que 𝑟𝑒𝑠𝑝𝑎𝑑 é o resultado padronizado do exame final, 𝑡𝑎𝑥𝑎𝑓𝑟𝑒𝑞 corresponde a taxa de frequência escola, 𝑝𝑟𝑠𝐺𝑃𝐴 é a média geral das notas em curso superior e 𝐴𝐶𝑇 é a nota do teste de avaliação de conhecimentos para ingresso em curso superior nos Estados Unidos. a) Defina 𝑑𝑖𝑠𝑡como a distância da residência do aluno até o local de estudos. Você considera que 𝑑𝑖𝑠𝑡 é não correlacionada com 𝑢? b) Supondo que 𝑑𝑖𝑠𝑡 e 𝑢 sejam não correlacionados, que outra hipótese 𝑑𝑖𝑠𝑡 terá que satisfazer para ser uma 𝑉𝐼 válida de 𝑡𝑎𝑥𝑎𝑓𝑟𝑒𝑞?
Compartilhar