Baixe o app para aproveitar ainda mais
Prévia do material em texto
EAE 5811 - Econometria I Prof. Dr. Ricardo Avelino Monitores: Bruno Gasperini e Ricardo Sabbadini Gabarito da Lista 5 Data de entrega: 23/06 1) Suponha que y é uma variável binária e d1; d2; :::; dM são variáveis dummy para categorias mutuamente exclusivas e que formam uma partição da população, isto é, cada observação da amostra assume apenas um valor para uma dessas M dummies. a) Mostre que os valores previstos da regressão (MPL modelo de prob- abilidade linear) de y em d1; d2; ..., dM sempre estão no intervalo unitário. Ademais, mostre quais são os coe cientes das dummies e os valores previstos para cada observação. Repare que a regressão não possui constante. b) O que acontece se y é regredido contra M combinações lineares inde- pendentes de d1; d2, ..., dM , por exemplo 1,d2; :::; dM? Resposta: (a) As dummies são ortogonais, isto é dki � dmi = 0;8 k 6= m: Por isso, é fácil perceber que pelo teorema de FWL, o coe ciente de dm na regressão de y em d1; d2; :::; dM é idêntico ao da regressão de de y em dm. Por FWL o coe ciente de dm na regressão de y em d1; d2; :::; dM é idêntico ao da regressão de y nos resíduos da regressão de dm em d1; d2; :::; dm� 1; dm+ 1; :::; dM: mas esses últimos resíduos são exatamente dm, pois todas as dummies são ortogonais (não só na população, mas também na amostra). Para explicar isso de maneira sucinta mostrarei o caso de apenas duas dum- mies. Caso você tenha dúvida de como expandir desse caso para o geral com M dummies cheque no capítulo do Baby Wooldridge de regressão múltipla a fórmula do coe ciente em regressão multipla (sem nada de matrizes). Suponha que há duas dummies, dki e dmi: O coe ciente de dmi na regressão de dki em dmi (repare que como não há constante) é dado por: �^ = P dki � dmiP dm2i = P 0P dmi = 0 Logo, é fácil ver porque os resíduos da regressão de dki em dmi são a própria dummy dki: Voltando, então o coe ciente de dm na regressão de y em d1; d2; :::; dM é idêntico ao da regressão de de y em dm, que é: �^m = P yi � dmiP dm2i = P yi � dmiP dmi Note que obviamente P dm2i = P dmi, pois se trata de uma dummy (02 = 0; 12 = 1). Então P yi � dmi é igual ao número de observações para as quais y é um na categoria m. É nítido que P yi � dmi � P dmi: Então �^m sempre 1 está no intervalo unitário, o que queríamos mostrar, pois o valor previsto para uma observação no intervalo j é simplesmente �^j � 1. Ademais �^m é a fração de indivíduos com y = 1 para aqueles na categoria m. (b) Pelo resultado de uma questão da primeira prova (você deveria mostrar esse resultado nesse item, ele é omitido aqui simplesmente porque é a mesma demostração contida no gabarito da primeira prova do curso) os valores pre- vistos serão os mesmos, continuarão no intervalo unitário. Para os coe cientes (denotemos os novos coe cientes de ^m e a constante por �^)note que, no ex- emplo em que se substitui d1 por uma constante, para que os valores previstos sejam os mesmos, devemos ter que: Para o intervalo 1: �^1 � 1 = �^ Para outro intervalo qualquer m 6= 1 : �^m � 1 = �^ + ^m 2) Sejam z1 um vetor de variáveis, z2 uma variável contínua e d uma variável binária. a) No modelo P (y = 1=z1; z2; d) = �(z1�1 + 1z2 + 2z 2 2) encontre o efeito parcial de z2 sobre P (y = 1=z1; z2; d):Como você estimaria esse efeito? b) No modelo P (y = 1=z1; z2; d) = �(z1�1 + 1z2 + 2d+ 3z2d) encontre o efeito parcial de z2 sobre P (y = 1=z1; z2; d): Como você estimaria o efeito de d sobre essa probabilidade? Como você estimaria esses dois efeitos? c) Descreva como você obteria erros padrões para os efeitos parciais dos itens anteriores? Resposta: (a) Trata-se de um probit. É fácil ver pela regra da cadeia que: @P (y = 1=z1; z2; d) @z2 = �(z1�1 + 1z2 + 2z 2 2)� [ 1 + 2 2z2] Para um dado vetor z, pode ser estimado por: �(z1�^1 + ^1z2 + ^2z 2 2)� [ ^1 + 2 ^2z2] em que os parâmetros são obtidos em um probit de y em z1;z2 e z22 : 2 (b) Nesse caso: @P (y = 1=z1; z2; d) @z2 = �(z1�1 + 1z2 + 2d+ 3z2d)� [ 1 + 3d] Para um dado vetor z, pode ser estimado por: �(z1�^1 + ^1z2 + ^2d+ ^3z2d)� [ ^1 + ^3d] em que os parâmetros são obtidos em um probit de y em z1;z2; d e z2d: O efeito pode ser estimado nos valores médios de z e com d = 1 ou d = 0 ou no no valor médio de d (que não existe para nenhuma observação na amostra). Quanto ao efeito de d sobre esta probabilidade, ele é: P (y = 1=z1; z2; 1)� P (y = 1=z1; z2; 0) = = �(z1�1 + 1z2 + 2 + 3z2)� �(z1�1 + 1z2) Novamente se substituem os parâmetros pelos coe cientes do probit de y em z1;z2; d e z2d: O efeito pode ser estimado nos valores médios de z: (c) É possível aplicar o método delta. Para isso precisamos da matriz de var-cov dos parâmetros estimados (pode ser a matriz fornecida pelo software baseada no hessiano da função de log-verossimilhança ou na esperança condi- cional nas variáveis explicativas do hessiano da função de log-verossimilhança ou no produto interno dos scores, primeiras derivadas) e das derivadas das funções de interese em relação aos parâmetros (não em relação às variáveis). Por exem- plo, para �(z1�^1 + ^1z2 + ^2d+ ^3z2d)� [ ^1 + ^3d]; precisamos encontrar: @�(z1�1 + 1z2 + 2d+ 3z2d)� [ 1 + 3d] @�1 ; @�(z1�1 + 1z2 + 2d+ 3z2d)� [ 1 + 3d] @ 1 @�(z1�1 + 1z2 + 2d+ 3z2d)� [ 1 + 3d] @ 2 @�(z1�1 + 1z2 + 2d+ 3z2d)� [ 1 + 3d] @ 3 3) Considere o seguinte modelo probit: P (y = 1=z; q) = �(z1�1 + 1z2q) 3 em que q é independente de z e distribuida como uma normal (0,1), z é observável, mas q, não. (a) Encontre o efeito parcial de z2 sobre P (y = 1=z; q): (b) Mostre que: P (y = 1=z) = �( z1�1 (1 + 21z 2 2) 1=2 ) (c) De na � � 21: Descreva sinteticamente como você testaria H0 : � = 0: Resposta: (a) Pela regra da cadeia: @P (y = 1=z; q) @z2 = �(z1�1 + 1z2q)� [ 1q] (b) De na y� = z1�1 + 1z2q + e: Suponha que e é independente de z e q e se distribui como uma normal padrão.Temos que y = 1 quando y� > 0: P (y = 1=z; q) = P (y� > 0=z; q) = = P (z1�1 + 1z2q + e > 0=z; q) = = P (e > �[z1�1 + 1z2q]=z; q) = 1� �(�[z1�1 + 1z2q]) = P (e < �[z1�1 + 1z2q]=z; q) = �(z1�1 + 1z2q) Em que a última passagem decorre da simetria da distribuição normal. Sabemos que e é independente de z e q e que q é independente de z e distribuida como uma normal (0,1). Logo: 1z2q + e=z~Normal(0; 2 1z 2 2 + 1) Pois note que: E[ 1z2q + e=z] = 1z2E[q=z] + E[e=z] = = 1z2E[q] + E[e] = 0 + 0 = 0 V ar[ 1z2q + e=z] = 2 1z 2 2V ar[q=z] + V ar[e=z] + 2Cov(q; e=z) = = 21z 2 21 + 1 + 0 = 2 1z 2 2 + 1 Pois Cov(q; e=z) = 0; dado que e é independente de z e q: Fica óbvio que: 4 1z2q + ep 21z 2 2 + 1 =z~Normal(0; 1) Então: P (y = 1=z) = P (y� > 0=z) = = P (z1�1 + 1z2q + e > 0=z) = = P ( 1z2q + e > �[z1�1]=z) = = P ( 1z2q + ep 21z 2 2 + 1 > �[z1�1]p 21z 2 2 + 1 =z) = = 1� �( �[z1�1]p 21z 2 2 + 1 ) = �( z1�1p 21z 2 2 + 1 ) Isso prova o resultado. (c) A maneira mais fácil de fazer esse teste é usar o teste LM (outras opções seriam o teste de Wald e o teste LR) que se baseia somente no modelo restrito, aquele com � = 0: O modelo restrito é apenas um probit simples de y em z1: Logo, com esse teste precisamos apenas estimar esse probit e obter a primeira derivada da função de log-verossimilhança (score) em relação à �1 e � (no caso irrestrito, pois no restrito essa derivada não depende de �) e a matriz de infor- mação de sher (hessiano, também no caso irrestrito) e avaliá-las nas estimativas restritas (�1 = �^1 e � = 0). Veja o teorema 16.7 de Greene. Então, podemos comparar a estatística de interesse, do teste LM que pode ser calculado com as informações acima, com sua distribuição sob a hipótese nula, uma �2 com um grau de liberdade (pois há uma restrição). O teste de Wald é mais complicado, pois exige a estimação do modelo ir- restrito, que pode ser obtida por máxima verossimilhança, mas não é um probit simples. O mesmo para o teste LR. 4) Suponha que y segue um modelo linear de probabilidade. Escreva sua função de log-verossimilhançae explique porque pode ser difícil obter o esti- mador de máxima verossimilhança. Resposta: No modelo linear: E(y=x) = P (y = 1=x)� 1 = x� Então para cada observação a log-verossimilhança é: li(�=xi) = logf(x�) yi(1� x�)1�yig = = yilog(x�) + (1� yi)log(1� x�) = 5 Mas para cada indivíduo, li(�=xi) só é de nida se 0 < x� < 1: Esse é o motivo porque pode ser difícil obter um estimador de MV de �: Ademais, teríamos que a log-verossimilhança da amostra é: L(�=xi) = X fyilog(x�) + (1� yi)log(1� x�)g Como li(�=xi) só é de nida se 0 < x� < 1, a cada iteração do algoritmo da estimação de MV teríamos que checar essa condição para as N observações. É provável que isso fosse violado para alguma observação. 5) Suponha que você tem um grupo de controle, A, e um de tratamento, B, observados por dois períodos.Entre os dois períodos a política de interesse é implementada para o grupo B. (a) Se sua variável dependente é binária e não existem outras variáveis ex- plicativas além de um indicador de tratamento pela política de interesse, qual a maneira mais simples de se obter o efeito da política? (b) Se há outras variáveis explicativas, escreva um modelo probit (note que não é necessário um modelo probit para dados em painel, esqueça a existência de um possível "efeito- xo" para cada indivíduo) que lhe permita estimar o efeito da política sobre a variável dependente binária. Resposta: (a) Na ausência de outras variáveis explicativas o estimador mais simples é o de diferenças em diferenças, é a diferença entre "a diferença das médias da variável y dos grupos B e A no período 2" e a "a diferença das médias da variável y dos grupos B e A no período 1". Esse estimador fornece o aumento da probabilidade da variávely assumir valor 1 em virtude do tratamento. Como "a diferença das médias da variável y dos grupos B e A no período t" está no intervalo [0;1], o estimador em questão ca entre -1 e 1, representando de diminuições de 100% a aumentos de 100%. (b) Seja d2 uma dummy para o segundo período e dB uma dummy para o grupo de controle. Então, usando todas as observações faríamos um probit de y em 1;x; d2; dB e d2� dB: P (y = 1=x; d2; dB) = �(x� + �0 + �1d2 + �2dB + �3d2� dB) Com essas estimativas, faríamos um estimador equivalente ao de diferenças em diferenças numa regressão linear, que é: [�(x�^ + �^0 + �^1 + �^2 + �^3)� �(x�^ + �^0 + �^1)]� [�(x�^ + �^0 + �^2)� �(x�^ + �^0)] 6) Seja t�i a duração de um evento (uma variável contínua). Considere o seguinte modelo: 6 t�i = exp(xi� + ui) ui~N(0; � 2) ti = minft�i ; cg; c > 0 a) Encontre P (ti = c=xi); a probabilidade da observação ser censurada. O que acontece quando c!1? b) Qual a densidade de ln(ti), dado xi, quando ti < c? Agora escreva a densidade completa de ti dado xi: c) Escreva a função de log-verossimilhança para uma observação i qualquer. d) Particione � em �1 e �2. Como você testaria �2 = 0? e) Obtenha a função de máxima veressimilhança se a censura varia para cada indivíduo, isto é, ti = minft�i ; cig; ci > 0; em que ci é observado para todo i. Suponha que ui é independete de ci e xi. Resposta: (a) P (ti = c=xi) = P (ln(ti) = ln(c)=xi) = = P (ln(t�i ) > ln(c)=xi) = P (xi� + ui > ln(c)=xi) = = P (ui > ln(c)� xi�=xi) = P (ui � > ln(c)� xi� � =xi) = = 1� �(ln(c)� xi� � ) E se c!1?) log(c)!1) c ! 1) ln(c)!1) ln(c)� xi� � !1 ) �(ln(c)� xi� � )! 1) P (ti = c=xi)! 0 (b) Quando ti < c, a densidade de ln(ti) é igual à de ln(t�i ). Veja: P [ln(ti) � z =xi] = P [ln(minft�i ; cg) � z =xi] = P [ln(t�i ) � z =xi] = = P [xi� + ui � z =xi] = P [ui � z � xi� =xi] = = P [ ui � � z � xi� � =xi] = �( z � xi� � ) = F (z) Como ui~N(0; �2), então, quando ti < c, ln(ti) =xi~N(xi�; �2) 7 Seja F () a fda e f() a densidade de ln(ti) para ti < c é : F (z) = �( z � xi� � ) f(z) = �( z�xi�� ) � ; z < ln(c) Para escrever a densidade completa de ti dado xi precisamos da densidade quando ti = c, que é a probabilidade de ti = c, pois existe uma massa de prob- abilidade nesse ponto, nesse ponto a probabilidade é discreta. Mas já sabemos essa probabilidade do item anterior. Então a densidade completa é: f(z) = �( z�xi�� ) � ; z < ln(c) f(z) = 1� �(ln(c)� xi� � ); z = ln(c) (c) Seja 1[:] uma função indicador. Então a log-verossimilhança para uma observação i é: li(�) = 1[ti = c]� lnf1� �(ln(c)� xi� � )g+ 1[ti < c]� lnf �( ln(ti)�xi�� ) � g (d) O teste mais prático a se aplicar aqui é o teste LR. Basta estimar primeiramente o tobit usando x e depois apenas com x1. Então se calcula a estatística LR = 2� (Lirrestrito�Lrestrito) a partir do valor das log-likelihoods amostrais nos respectivos estimadores de MV e a comparamos a uma dis- tribuição �2 com número de graus de liberdade igual à dimensão de �2, que é a distribuição da estatística sob H0 : �2 = 0: Com p-valor baixo, rejeita-se H0: (e)Como ui é independente de ci e xi a densidade de yi dado ci e xi é a mesma que a densidade de yi dado xi, exceto pelo fato de que c é trocado por ci. 7) Ache o sinal da derivada de V ar (ZjZ > C) com relação à C para os seguintes modelos: (a) Z � N (0; 1) (b) Z � K1Z��; K1 > 0; Z > K2 > 0; � > 2 (c) Z � �e�Z�; � > 0; Z � 0 (d) Z � U (0; 1) 8 8) Considere o modelo Tobit: y�i = x 0 i� + "i; "ijX � N � 0; �2 � I�i = x 0 i� + "i Ii = � 1 if I�i � 0 0 caso contrário Nós observamos somente Ii; xi e yi = Iiy � i + (1� Ii) 0 Mostre que @E [yijxi] @xi = �� � x0i� � � 9) Considere o seguinte modelo de dados de painel: yit = �yi;t�1 + �xit + fi + uit; i = 1; :::; I; t = 1; :::; T (1) a) Justi que a forma funcional (1) minimizando a soma do custo de ajus- tamento (quadrático, por hipótese) e do custo de se estar fora do equilíbrio (também quadrático, por hipótese). O valor de equilíbrio de longo prazo é dado por y�it; que segue a seguinte equação: y�it = xit + f � i + uit Pondere os custos igualmente. b) Considere a identi cação do modelo sob as condições abaixo. Quais parâmetros ou combinações de parâmetros são identi cados em cada caso? Ao longo de toda a análise, suponha que (xit; fi; uit) são i.i.d com relação a i, E (uit) = 0; E (fi) = 0: I !1; T xo. Caso o modelo seja identi cado, escreva as condições de ortogonalidade para um I arbitrário e o T designado. (i) T = 1 E� (uitjxi1) = 0 (ii) T = 2 E� (uitjxi1; xi2) = 0 8t (iii) T = 3 E� (uitjxi1; xi2; xi3) = 0 8t (iv) T = 1 yit = yi;t�1 = �yi; xit = �xi (estado estacionário) E� (uitjxi1; :::; xiT ) = 0 (v) T = 2 E� (ui2jyi1; xi1) = 0 (vi) T = 3 E� (uitjyi;t�1; xit; xit�1) = 0 t = 2; 3 (vii) T = 4 E� (uitjyi;t�1) = 0 8t E* denota projeção linear. Portanto, E� (uitjxi1) = 0 implica, por exemplo, que E (uitxi1) = 0: 9 10) STATA - Use os dados fringe.dta. Apresente output e comandos de Stata. a) Estime um modelo linear por OLS relacionando hrbens (benefícios, seguro saúde, por exemplo, por hora no atual emprego) a exper, age, educ, tenure, mar- ried, male, white, nrtheast, nrthcen, south, e union. Comente algum resultado que tenha chamado a sua atenção. b) Agora estime um modelo Tobit relacionando as mesmas variáveis. Por que as estimativas são parecidas com as de OLS? c) Acrescente exper2 e tenure2 ao Tobit como variáveis explicativas. Essas variáveis deveriam estar no modelo? d) Existem diferenças signi cativas em benefícios por hora entre indústrias (variáveis ind 1 a 9), controlando pelos fatores acima? Resposta: do le. 11) STATA - Use os dados em MROZ.dta. (a) Explique porque pode haver um problema de seleção amostral ao re- gredirmos o log do salário de um indivíduo (mulheres casadas nesse exemplo) contra educ, exper e exper2. Estime essa regressão por OLS. (b) Da amostra, quantas mulheres trabalham? Faça o procedimento "Heckit" de dois estágios "na mão", sem usar os comandos de Stata. Use como variáveis excluídas da equação estrutural, mas presentes na equação de seleção nwifeinc age kidslt6 kidsge6. Você rejeita a hipótese de que não existe viés de seleção? Por quê? Explique o teste que você fez. (c) Faça esse procedimento de dois passos utilizando comandosdo Stata. O que difere do item anterior, por quê? (d) Faça o Heckit, mas agora utilizando estimação por máxima verossimil- hança (nesse caso é necessário que o erro das duas equações do modelo sejam conjuntamente normalmente distribuídos). Nesse caso, você rejeita a hipótese de que não existe viés de seleção? Resposta: do le. 12) STATA - Use loan.dta (disponível no erudito). Suponha que você queira veri car se há discriminação no mercado de créditos hipotecários estimando um modelo que avalie o impacto da cor de um indivíduo sobre a aprovação de crédito bancário. Use como variável dependente approve (variável binária que assume valor igual a 1 se o indivíduo tem crédito aprovado e 0 caso contrário). Como variáveis explicativas use white (dummy que assume valor igual a 1 se o pretendente é branco e 0 caso contrário), hrat, obrat, loanprc, unem, male, married, dep, sch, cosign, chist, pubrec, mortlat1, mortlat2 e vr. a) Utilize o MPL para obter o efeito da cor sobre a aprovação de crédito (adi- cione os controles à estimação). Qual a diferença na probabilidade de aprovação entre brancos e não-brancos? Quais os problemas associados a esse tipo de modelo? 10 b) Agora, utilize o modelo probit e reporte o coe ciente de white. Existe evidência signi cante de discriminação contra não-brancos? Calcule a diferença nas probabilidades de aprovação de brancos e não brancos (considerando o cál- culo desse efeito marginal nos valores médios das demais variáveis explicativas). c) Utilize o modelo logit e reporte o coe ciente de white. Calcule a diferença nas probabilidades de aprovação de brancos e não brancos (considerando o cál- culo desse efeito marginal nos valores médios das demais variáveis explicativas). Faça as transformações necessárias para que os coe cientes de white estimados pelos modelos probit e logit sejam comparáveis. Resposta: do le. 13) STATA - Use a base de dados Painel_Estatico_Lista5.dta (disponível no erudito). Use somente as observações em que SCRAP não é um missing value. Vamos estimar o efeito de um subsídio (Grant) sobre a taxa de rejeição (scrap rates) do produto da rma (produtos defeituosos). Os dados formam um painel com T=3 e N=54. Apresente o output e os comandos do Stata em sua resposta (usem o help do Stata para obter os comandos). a) Considere um modelo em que o log(scrap) é a variável dependente que é explicada por grant (uma variável binária se a rma recebeu subsídios para treinamento de funcionários) e dummies para os anos de 1988 e 1989. Estime o modelo por Pool de OLS e por RE. Compare os resultados. Qual o efeito do subsídio sobre a taxa de rejeição? Ele é signi cante? Esse é o sinal esperado? Agora acrescente a primeira defasagem de Grant como variável explicativa (observe com quantos períodos você ca nesse caso e tome cuidado com as dummies). Isso altera os resultados da estimativa por RE? Comente-os. b) Estime o modelo com a defasagem de scrap por FE e primeiras difer- enças (nesse caso, diferencia as variáveis e faça OLS). Compare e comente os resultados. c) Estime o modelo por RE e FE, na versão com defasagens, e faça um teste de Hausman (utilize o comando do Stata). Qual o resultado do teste? Refaça o teste usando sigmamore(veja essa opção e explique). Resposta: do le. 14) STATA - Consulte as Penn World Tables versão 6.2. Escolha todos os países e os anos entre 1991 e 2000. Selecione as seguintes variáveis: Real Gross Domestic Product per Capita (cgdp), Government Share of CGDP (cg), Investment Share of CGDP (ci) e Openness in Constant Prices (openc). Aviso: Não consegui utilizar os comandos necessários para a resolução desse exercício na sala de computadores do térreo do FEA-2. (a) Considere um modelo de painel dinâmico (logo, existe um efeito xo para cada país que pode estar correlacionado com as variáveis explica- tivas) em que cgdp é explicado por sua primeira defasagem, cg, ci e openc. Faça o estimador de dois passos de Arellano-Bond, considerando cg, ci e openc 11 como variáveis exógenas (e não predeterminadas). Quantos instrumentos há nesse caso? Explique quais são esses instrumentos detalhadamente. Escreva as equações diferenciadas (o painel tem 10 períodos) para todos os períodos e quais são os instrumentos de cada equação (Dica: note que o Stata diferencia os instrumentos em GMM e Standard). (b) Faça um teste de signi cância conjunta de cg, ci e openc. Ademais, os testes de Sargan e AR(2) indicam a validade dos instrumentos. (c) Refaça o item (a) considerando cg, ci e openc como variáveis prede- terminadas (ver página 280 de Arellano-Bond). (d) Faça um teste de signi cância conjunta de cg, ci e openc. Ademais, os testes de Sargan e AR(2) indicam a validade dos instrumentos para a estimativa do item (c). Resposta: do le. item (a) - instrumentos: com as explicativas como exógenas No total temos 40 instrumentos. Como o STATA nos mostra, na equação no nível há apenas um instrumento, a constante. Instrumentos na equação em nível são utilizados por outros modelos de painéis dinâmicos (Arellano/Bover e Blundell/Bond), mas não por Arellano/Bond. Ademais, há três intrumentos do tipo "standard", que são as próprias variáveis exógenas se instrumentalizando. Isso difere do paper de Arellano/Bond, como cará mais claro ao comparar esse resultado com o gabarito do item (c). No paper, se uma variável é exógena, todas suas defasagens como valores futuros poderiam ser utilizados como instrumento do tipo GMM, aqui elas contam como instrumentos standard. Ademais, há 36 instrumentos do tipo GMM na equação diferenciada, que são as defasagens de ordem 2 ou mais da variável dependente. Isso ca claro analisando o sistema de equações abaixo, que considera os 10 períodos de tempo: �y10 = ��y9 +�x10� +�u10 �y9 = ��y8 +�x9� +�u9 � � � �y3 = ��y2 +�x3� +�u3 Na primeira equação (t=10), os instrumentos do tipo GMM são y8; y7; :::; y1: Na segunda equação (t=9), os instrumentos são y7; y6; :::; y1: Na última é apenas y1: No total temos 36 instrumentos do tipo GMM. Note que nas 8 equações o STATA conta �x como três instrumentos do tipo standard. Veja como isso difere no caso em que essas variáveis são predeterminadas. (c) No total há 169 instrumentos, muito mais que no item (a). Repare que segundo o paper de Arellano-Bond deveria haver mais instrumentos quando as variáveis explicativas são exógenas (página 280 abaixo da equação 5). Isso 12 ocorre porque agora todos os instrumentos são considerados do tipo GMM (ex- ceto a constante na equação em nível) e ca claro ao contarmos o número de instrumentos. As equações diferenciadas são novamente: �y10 = ��y9 +�x10� +�u10 �y9 = ��y8 +�x9� +�u9 � � � �y3 = ��y2 +�x3� +�u3 Mas agora note que �xt é correlacionado com �ut; pois xt pode ser cor- relacionado com ut�1; dado que a variável é predeterminada e não exógena. Dessa maneira, na primeira equação (t=10), os instrumentos do tipo GMM são y8; y7; :::; y1; x9; x8; :::; x1: Na segunda equação (t=9), os instrumentos são y7; y6; :::; y1; x8; x7; :::; x1: Na última são apenas y1 e x1: No total temos 36 + k � 44 = 36 + 3 � 44 = 168 instrumentos do tipo GMM. Esses são os 169 instrumentos desejados. 13
Compartilhar