Buscar

Lista 5 - Gabarito parcial

Prévia do material em texto

EAE 5811 - Econometria I
Prof. Dr. Ricardo Avelino
Monitores: Bruno Gasperini e Ricardo Sabbadini
Gabarito da Lista 5
Data de entrega: 23/06
1) Suponha que y é uma variável binária e d1; d2; :::; dM são variáveis
dummy para categorias mutuamente exclusivas e que formam uma partição
da população, isto é, cada observação da amostra assume apenas um valor para
uma dessas M dummies.
a) Mostre que os valores previstos da regressão (MPL –modelo de prob-
abilidade linear) de y em d1; d2; ..., dM sempre estão no intervalo unitário.
Ademais, mostre quais são os coe…cientes das dummies e os valores previstos
para cada observação. Repare que a regressão não possui constante.
b) O que acontece se y é regredido contra M combinações lineares inde-
pendentes de d1; d2, ..., dM , por exemplo 1,d2; :::; dM?
Resposta:
(a) As dummies são ortogonais, isto é dki � dmi = 0;8 k 6= m: Por isso, é
fácil perceber que pelo teorema de FWL, o coe…ciente de dm na regressão de
y em d1; d2; :::; dM é idêntico ao da regressão de de y em dm. Por FWL o
coe…ciente de dm na regressão de y em d1; d2; :::; dM é idêntico ao da regressão
de y nos resíduos da regressão de dm em d1; d2; :::; dm� 1; dm+ 1; :::; dM: mas
esses últimos resíduos são exatamente dm, pois todas as dummies são ortogonais
(não só na população, mas também na amostra).
Para explicar isso de maneira sucinta mostrarei o caso de apenas duas dum-
mies. Caso você tenha dúvida de como expandir desse caso para o geral com
M dummies cheque no capítulo do Baby Wooldridge de regressão múltipla a
fórmula do coe…ciente em regressão multipla (sem nada de matrizes).
Suponha que há duas dummies, dki e dmi: O coe…ciente de dmi na regressão
de dki em dmi (repare que como não há constante) é dado por:
�^ =
P
dki � dmiP
dm2i
=
P
0P
dmi
= 0
Logo, é fácil ver porque os resíduos da regressão de dki em dmi são a própria
dummy dki:
Voltando, então o coe…ciente de dm na regressão de y em d1; d2; :::; dM é
idêntico ao da regressão de de y em dm, que é:
�^m =
P
yi � dmiP
dm2i
=
P
yi � dmiP
dmi
Note que obviamente
P
dm2i =
P
dmi, pois se trata de uma dummy (02 =
0; 12 = 1). Então
P
yi � dmi é igual ao número de observações para as quais
y é um na categoria m. É nítido que
P
yi � dmi �
P
dmi: Então �^m sempre
1
está no intervalo unitário, o que queríamos mostrar, pois o valor previsto para
uma observação no intervalo j é simplesmente �^j � 1. Ademais �^m é a fração
de indivíduos com y = 1 para aqueles na categoria m.
(b) Pelo resultado de uma questão da primeira prova (você deveria mostrar
esse resultado nesse item, ele é omitido aqui simplesmente porque é a mesma
demostração contida no gabarito da primeira prova do curso) os valores pre-
vistos serão os mesmos, continuarão no intervalo unitário. Para os coe…cientes
(denotemos os novos coe…cientes de 
^m e a constante por �^)note que, no ex-
emplo em que se substitui d1 por uma constante, para que os valores previstos
sejam os mesmos, devemos ter que:
Para o intervalo 1:
�^1 � 1 = �^
Para outro intervalo qualquer m 6= 1 :
�^m � 1 = �^ + 
^m
2) Sejam z1 um vetor de variáveis, z2 uma variável contínua e d uma variável
binária.
a) No modelo
P (y = 1=z1; z2; d) = �(z1�1 + 
1z2 + 
2z
2
2)
encontre o efeito parcial de z2 sobre P (y = 1=z1; z2; d):Como você estimaria
esse efeito?
b) No modelo
P (y = 1=z1; z2; d) = �(z1�1 + 
1z2 + 
2d+ 
3z2d)
encontre o efeito parcial de z2 sobre P (y = 1=z1; z2; d): Como você estimaria
o efeito de d sobre essa probabilidade? Como você estimaria esses dois efeitos?
c) Descreva como você obteria erros padrões para os efeitos parciais dos itens
anteriores?
Resposta:
(a) Trata-se de um probit. É fácil ver pela regra da cadeia que:
@P (y = 1=z1; z2; d)
@z2
= �(z1�1 + 
1z2 + 
2z
2
2)� [
1 + 2
2z2]
Para um dado vetor z, pode ser estimado por:
�(z1�^1 + 
^1z2 + 
^2z
2
2)� [
^1 + 2
^2z2]
em que os parâmetros são obtidos em um probit de y em z1;z2 e z22 :
2
(b) Nesse caso:
@P (y = 1=z1; z2; d)
@z2
= �(z1�1 + 
1z2 + 
2d+ 
3z2d)� [
1 + 
3d]
Para um dado vetor z, pode ser estimado por:
�(z1�^1 + 
^1z2 + 
^2d+ 
^3z2d)� [
^1 + 
^3d]
em que os parâmetros são obtidos em um probit de y em z1;z2; d e z2d: O
efeito pode ser estimado nos valores médios de z e com d = 1 ou d = 0 ou no
no valor médio de d (que não existe para nenhuma observação na amostra).
Quanto ao efeito de d sobre esta probabilidade, ele é:
P (y = 1=z1; z2; 1)� P (y = 1=z1; z2; 0) =
= �(z1�1 + 
1z2 + 
2 + 
3z2)� �(z1�1 + 
1z2)
Novamente se substituem os parâmetros pelos coe…cientes do probit de y em
z1;z2; d e z2d: O efeito pode ser estimado nos valores médios de z:
(c) É possível aplicar o método delta. Para isso precisamos da matriz de
var-cov dos parâmetros estimados (pode ser a matriz fornecida pelo software
baseada no hessiano da função de log-verossimilhança ou na esperança condi-
cional nas variáveis explicativas do hessiano da função de log-verossimilhança ou
no produto interno dos scores, primeiras derivadas) e das derivadas das funções
de interese em relação aos parâmetros (não em relação às variáveis). Por exem-
plo, para �(z1�^1 + 
^1z2 + 
^2d+ 
^3z2d)� [
^1 + 
^3d]; precisamos encontrar:
@�(z1�1 + 
1z2 + 
2d+ 
3z2d)� [
1 + 
3d]
@�1
;
@�(z1�1 + 
1z2 + 
2d+ 
3z2d)� [
1 + 
3d]
@
1
@�(z1�1 + 
1z2 + 
2d+ 
3z2d)� [
1 + 
3d]
@
2
@�(z1�1 + 
1z2 + 
2d+ 
3z2d)� [
1 + 
3d]
@
3
3) Considere o seguinte modelo probit:
P (y = 1=z; q) = �(z1�1 + 
1z2q)
3
em que q é independente de z e distribuida como uma normal (0,1), z é
observável, mas q, não.
(a) Encontre o efeito parcial de z2 sobre P (y = 1=z; q):
(b) Mostre que:
P (y = 1=z) = �(
z1�1
(1 + 
21z
2
2)
1=2
)
(c) De…na � � 
21: Descreva sinteticamente como você testaria H0 : � = 0:
Resposta:
(a) Pela regra da cadeia:
@P (y = 1=z; q)
@z2
= �(z1�1 + 
1z2q)� [
1q]
(b) De…na y� = z1�1 + 
1z2q + e: Suponha que e é independente de z e q e
se distribui como uma normal padrão.Temos que y = 1 quando y� > 0:
P (y = 1=z; q) = P (y� > 0=z; q) =
= P (z1�1 + 
1z2q + e > 0=z; q) =
= P (e > �[z1�1 + 
1z2q]=z; q) = 1� �(�[z1�1 + 
1z2q])
= P (e < �[z1�1 + 
1z2q]=z; q) = �(z1�1 + 
1z2q)
Em que a última passagem decorre da simetria da distribuição normal.
Sabemos que e é independente de z e q e que q é independente de z e
distribuida como uma normal (0,1).
Logo:

1z2q + e=z~Normal(0; 
2
1z
2
2 + 1)
Pois note que:
E[
1z2q + e=z] = 
1z2E[q=z] + E[e=z] =
= 
1z2E[q] + E[e] = 0 + 0 = 0
V ar[
1z2q + e=z] = 
2
1z
2
2V ar[q=z] + V ar[e=z] + 2Cov(q; e=z) =
= 
21z
2
21 + 1 + 0 = 
2
1z
2
2 + 1
Pois Cov(q; e=z) = 0; dado que e é independente de z e q:
Fica óbvio que:
4

1z2q + ep

21z
2
2 + 1
=z~Normal(0; 1)
Então:
P (y = 1=z) = P (y� > 0=z) =
= P (z1�1 + 
1z2q + e > 0=z) =
= P (
1z2q + e > �[z1�1]=z) =
= P (

1z2q + ep

21z
2
2 + 1
>
�[z1�1]p

21z
2
2 + 1
=z) =
= 1� �( �[z1�1]p

21z
2
2 + 1
) = �(
z1�1p

21z
2
2 + 1
)
Isso prova o resultado.
(c) A maneira mais fácil de fazer esse teste é usar o teste LM (outras opções
seriam o teste de Wald e o teste LR) que se baseia somente no modelo restrito,
aquele com � = 0: O modelo restrito é apenas um probit simples de y em z1:
Logo, com esse teste precisamos apenas estimar esse probit e obter a primeira
derivada da função de log-verossimilhança (score) em relação à �1 e � (no caso
irrestrito, pois no restrito essa derivada não depende de �) e a matriz de infor-
mação de …sher (hessiano, também no caso irrestrito) e avaliá-las nas estimativas
restritas (�1 = �^1 e � = 0). Veja o teorema 16.7 de Greene. Então, podemos
comparar a estatística de interesse, do teste LM que pode ser calculado com as
informações acima, com sua distribuição sob a hipótese nula, uma �2 com um
grau de liberdade (pois há uma restrição).
O teste de Wald é mais complicado, pois exige a estimação do modelo ir-
restrito, que pode ser obtida por máxima verossimilhança, mas não é um probit
simples. O mesmo para o teste LR.
4) Suponha que y segue um modelo linear de probabilidade. Escreva sua
função de log-verossimilhançae explique porque pode ser difícil obter o esti-
mador de máxima verossimilhança.
Resposta:
No modelo linear:
E(y=x) = P (y = 1=x)� 1 = x�
Então para cada observação a log-verossimilhança é:
li(�=xi) = logf(x�) yi(1� x�)1�yig =
= yilog(x�) + (1� yi)log(1� x�) =
5
Mas para cada indivíduo, li(�=xi) só é de…nida se 0 < x� < 1: Esse é o
motivo porque pode ser difícil obter um estimador de MV de �:
Ademais, teríamos que a log-verossimilhança da amostra é:
L(�=xi) =
X
fyilog(x�) + (1� yi)log(1� x�)g
Como li(�=xi) só é de…nida se 0 < x� < 1, a cada iteração do algoritmo da
estimação de MV teríamos que checar essa condição para as N observações. É
provável que isso fosse violado para alguma observação.
5) Suponha que você tem um grupo de controle, A, e um de tratamento,
B, observados por dois períodos.Entre os dois períodos a política de interesse é
implementada para o grupo B.
(a) Se sua variável dependente é binária e não existem outras variáveis ex-
plicativas além de um indicador de tratamento pela política de interesse, qual a
maneira mais simples de se obter o efeito da política?
(b) Se há outras variáveis explicativas, escreva um modelo probit (note que
não é necessário um modelo probit para dados em painel, esqueça a existência de
um possível "efeito-…xo" para cada indivíduo) que lhe permita estimar o efeito
da política sobre a variável dependente binária.
Resposta:
(a) Na ausência de outras variáveis explicativas o estimador mais simples
é o de diferenças em diferenças, é a diferença entre "a diferença das médias
da variável y dos grupos B e A no período 2" e a "a diferença das médias da
variável y dos grupos B e A no período 1". Esse estimador fornece o aumento
da probabilidade da variávely assumir valor 1 em virtude do tratamento. Como
"a diferença das médias da variável y dos grupos B e A no período t" está
no intervalo [0;1], o estimador em questão …ca entre -1 e 1, representando de
diminuições de 100% a aumentos de 100%.
(b) Seja d2 uma dummy para o segundo período e dB uma dummy para o
grupo de controle. Então, usando todas as observações faríamos um probit de
y em 1;x; d2; dB e d2� dB:
P (y = 1=x; d2; dB) = �(x� + �0 + �1d2 + �2dB + �3d2� dB)
Com essas estimativas, faríamos um estimador equivalente ao de diferenças em
diferenças numa regressão linear, que é:
[�(x�^ + �^0 + �^1 + �^2 + �^3)� �(x�^ + �^0 + �^1)]�
[�(x�^ + �^0 + �^2)� �(x�^ + �^0)]
6) Seja t�i a duração de um evento (uma variável contínua). Considere o
seguinte modelo:
6
t�i = exp(xi� + ui)
ui~N(0; �
2)
ti = minft�i ; cg; c > 0
a) Encontre P (ti = c=xi); a probabilidade da observação ser censurada. O
que acontece quando c!1?
b) Qual a densidade de ln(ti), dado xi, quando ti < c? Agora escreva a
densidade completa de ti dado xi:
c) Escreva a função de log-verossimilhança para uma observação i qualquer.
d) Particione � em �1 e �2. Como você testaria �2 = 0?
e) Obtenha a função de máxima veressimilhança se a censura varia para cada
indivíduo, isto é, ti = minft�i ; cig; ci > 0; em que ci é observado para todo i.
Suponha que ui é independete de ci e xi.
Resposta:
(a)
P (ti = c=xi) = P (ln(ti) = ln(c)=xi) =
= P (ln(t�i ) > ln(c)=xi) = P (xi� + ui > ln(c)=xi) =
= P (ui > ln(c)� xi�=xi) = P (ui
�
>
ln(c)� xi�
�
=xi) =
= 1� �(ln(c)� xi�
�
)
E se c!1?) log(c)!1)
c ! 1) ln(c)!1) ln(c)� xi�
�
!1
) �(ln(c)� xi�
�
)! 1) P (ti = c=xi)! 0
(b) Quando ti < c, a densidade de ln(ti) é igual à de ln(t�i ). Veja:
P [ln(ti) � z =xi] = P [ln(minft�i ; cg) � z =xi] = P [ln(t�i ) � z =xi] =
= P [xi� + ui � z =xi] = P [ui � z � xi� =xi] =
= P [
ui
�
� z � xi�
�
=xi] = �(
z � xi�
�
) = F (z)
Como ui~N(0; �2), então, quando ti < c, ln(ti) =xi~N(xi�; �2)
7
Seja F () a fda e f() a densidade de ln(ti) para ti < c é :
F (z) = �(
z � xi�
�
)
f(z) =
�( z�xi�� )
�
; z < ln(c)
Para escrever a densidade completa de ti dado xi precisamos da densidade
quando ti = c, que é a probabilidade de ti = c, pois existe uma massa de prob-
abilidade nesse ponto, nesse ponto a probabilidade é discreta. Mas já sabemos
essa probabilidade do item anterior.
Então a densidade completa é:
f(z) =
�( z�xi�� )
�
; z < ln(c)
f(z) = 1� �(ln(c)� xi�
�
); z = ln(c)
(c) Seja 1[:] uma função indicador. Então a log-verossimilhança para uma
observação i é:
li(�) = 1[ti = c]� lnf1� �(ln(c)� xi�
�
)g+ 1[ti < c]� lnf
�( ln(ti)�xi�� )
�
g
(d) O teste mais prático a se aplicar aqui é o teste LR. Basta estimar
primeiramente o tobit usando x e depois apenas com x1. Então se calcula a
estatística LR = 2� (Lirrestrito�Lrestrito) a partir do valor das log-likelihoods
amostrais nos respectivos estimadores de MV e a comparamos a uma dis-
tribuição �2 com número de graus de liberdade igual à dimensão de �2, que
é a distribuição da estatística sob H0 : �2 = 0: Com p-valor baixo, rejeita-se
H0:
(e)Como ui é independente de ci e xi a densidade de yi dado ci e xi é a
mesma que a densidade de yi dado xi, exceto pelo fato de que c é trocado por
ci.
7) Ache o sinal da derivada de V ar (ZjZ > C) com relação à C para os
seguintes modelos:
(a) Z � N (0; 1)
(b) Z � K1Z��; K1 > 0; Z > K2 > 0; � > 2
(c) Z � �e�Z�; � > 0; Z � 0
(d) Z � U (0; 1)
8
8) Considere o modelo Tobit:
y�i = x
0
i� + "i; "ijX � N
�
0; �2
�
I�i = x
0
i� + "i
Ii =
�
1 if I�i � 0
0 caso contrário
Nós observamos somente Ii; xi e
yi = Iiy
�
i + (1� Ii) 0
Mostre que
@E [yijxi]
@xi
= ��
�
x0i�
�
�
9) Considere o seguinte modelo de dados de painel:
yit = �yi;t�1 + �xit + fi + uit; i = 1; :::; I; t = 1; :::; T (1)
a) Justi…que a forma funcional (1) minimizando a soma do custo de ajus-
tamento (quadrático, por hipótese) e do custo de se estar fora do equilíbrio
(também quadrático, por hipótese). O valor de equilíbrio de longo prazo é dado
por y�it; que segue a seguinte equação:
y�it = xit
 + f
�
i + uit
Pondere os custos igualmente.
b) Considere a identi…cação do modelo sob as condições abaixo. Quais
parâmetros ou combinações de parâmetros são identi…cados em cada caso? Ao
longo de toda a análise, suponha que (xit; fi; uit) são i.i.d com relação a i,
E (uit) = 0; E (fi) = 0: I !1; T …xo. Caso o modelo seja identi…cado, escreva
as condições de ortogonalidade para um I arbitrário e o T designado.
(i) T = 1 E� (uitjxi1) = 0
(ii) T = 2 E� (uitjxi1; xi2) = 0 8t
(iii) T = 3 E� (uitjxi1; xi2; xi3) = 0 8t
(iv) T = 1 yit = yi;t�1 = �yi; xit = �xi (estado estacionário)
E� (uitjxi1; :::; xiT ) = 0
(v) T = 2 E� (ui2jyi1; xi1) = 0
(vi) T = 3 E� (uitjyi;t�1; xit; xit�1) = 0 t = 2; 3
(vii) T = 4 E� (uitjyi;t�1) = 0 8t
E* denota projeção linear. Portanto, E� (uitjxi1) = 0 implica, por exemplo,
que E (uitxi1) = 0:
9
10) STATA - Use os dados fringe.dta. Apresente output e comandos de
Stata.
a) Estime um modelo linear por OLS relacionando hrbens (benefícios, seguro
saúde, por exemplo, por hora no atual emprego) a exper, age, educ, tenure, mar-
ried, male, white, nrtheast, nrthcen, south, e union. Comente algum resultado
que tenha chamado a sua atenção.
b) Agora estime um modelo Tobit relacionando as mesmas variáveis. Por
que as estimativas são parecidas com as de OLS?
c) Acrescente exper2 e tenure2 ao Tobit como variáveis explicativas. Essas
variáveis deveriam estar no modelo?
d) Existem diferenças signi…cativas em benefícios por hora entre indústrias
(variáveis ind 1 a 9), controlando pelos fatores acima?
Resposta: do …le.
11) STATA - Use os dados em MROZ.dta.
(a) Explique porque pode haver um problema de seleção amostral ao re-
gredirmos o log do salário de um indivíduo (mulheres casadas nesse exemplo)
contra educ, exper e exper2. Estime essa regressão por OLS.
(b) Da amostra, quantas mulheres trabalham? Faça o procedimento "Heckit"
de dois estágios "na mão", sem usar os comandos de Stata. Use como variáveis
excluídas da equação estrutural, mas presentes na equação de seleção nwifeinc
age kidslt6 kidsge6. Você rejeita a hipótese de que não existe viés de seleção?
Por quê? Explique o teste que você fez.
(c) Faça esse procedimento de dois passos utilizando comandosdo Stata. O
que difere do item anterior, por quê?
(d) Faça o Heckit, mas agora utilizando estimação por máxima verossimil-
hança (nesse caso é necessário que o erro das duas equações do modelo sejam
conjuntamente normalmente distribuídos). Nesse caso, você rejeita a hipótese
de que não existe viés de seleção?
Resposta: do …le.
12) STATA - Use loan.dta (disponível no erudito). Suponha que você queira
veri…car se há discriminação no mercado de créditos hipotecários estimando um
modelo que avalie o impacto da cor de um indivíduo sobre a aprovação de
crédito bancário. Use como variável dependente approve (variável binária que
assume valor igual a 1 se o indivíduo tem crédito aprovado e 0 caso contrário).
Como variáveis explicativas use white (dummy que assume valor igual a 1 se
o pretendente é branco e 0 caso contrário), hrat, obrat, loanprc, unem, male,
married, dep, sch, cosign, chist, pubrec, mortlat1, mortlat2 e vr.
a) Utilize o MPL para obter o efeito da cor sobre a aprovação de crédito (adi-
cione os controles à estimação). Qual a diferença na probabilidade de aprovação
entre brancos e não-brancos? Quais os problemas associados a esse tipo de
modelo?
10
b) Agora, utilize o modelo probit e reporte o coe…ciente de white. Existe
evidência signi…cante de discriminação contra não-brancos? Calcule a diferença
nas probabilidades de aprovação de brancos e não brancos (considerando o cál-
culo desse efeito marginal nos valores médios das demais variáveis explicativas).
c) Utilize o modelo logit e reporte o coe…ciente de white. Calcule a diferença
nas probabilidades de aprovação de brancos e não brancos (considerando o cál-
culo desse efeito marginal nos valores médios das demais variáveis explicativas).
Faça as transformações necessárias para que os coe…cientes de white estimados
pelos modelos probit e logit sejam comparáveis.
Resposta: do …le.
13) STATA - Use a base de dados Painel_Estatico_Lista5.dta (disponível
no erudito). Use somente as observações em que SCRAP não é um “missing
value”. Vamos estimar o efeito de um subsídio (Grant) sobre a taxa de “rejeição”
(scrap rates) do produto da …rma (produtos defeituosos). Os dados formam um
painel com T=3 e N=54. Apresente o output e os comandos do Stata em sua
resposta (usem o help do Stata para obter os comandos).
a) Considere um modelo em que o log(scrap) é a variável dependente
que é explicada por grant (uma variável binária se a …rma recebeu subsídios
para treinamento de funcionários) e dummies para os anos de 1988 e 1989.
Estime o modelo por Pool de OLS e por RE. Compare os resultados. Qual
o efeito do subsídio sobre a taxa de rejeição? Ele é signi…cante? Esse é o
sinal esperado? Agora acrescente a primeira defasagem de Grant como variável
explicativa (observe com quantos períodos você …ca nesse caso e tome cuidado
com as dummies). Isso altera os resultados da estimativa por RE? Comente-os.
b) Estime o modelo com a defasagem de scrap por FE e primeiras difer-
enças (nesse caso, diferencia as variáveis e faça OLS). Compare e comente os
resultados.
c) Estime o modelo por RE e FE, na versão com defasagens, e faça um
teste de Hausman (utilize o comando do Stata). Qual o resultado do teste?
Refaça o teste usando “sigmamore”(veja essa opção e explique).
Resposta: do …le.
14) STATA - Consulte as Penn World Tables versão 6.2. Escolha todos
os países e os anos entre 1991 e 2000. Selecione as seguintes variáveis: Real
Gross Domestic Product per Capita (cgdp), Government Share of CGDP (cg),
Investment Share of CGDP (ci) e Openness in Constant Prices (openc).
Aviso: Não consegui utilizar os comandos necessários para a resolução desse
exercício na sala de computadores do térreo do FEA-2.
(a) Considere um modelo de painel dinâmico (logo, existe um “efeito
…xo” para cada país que pode estar correlacionado com as variáveis explica-
tivas) em que cgdp é explicado por sua primeira defasagem, cg, ci e openc.
Faça o estimador de dois passos de Arellano-Bond, considerando cg, ci e openc
11
como variáveis exógenas (e não predeterminadas). Quantos instrumentos há
nesse caso? Explique quais são esses instrumentos detalhadamente. Escreva
as equações diferenciadas (o painel tem 10 períodos) para todos os períodos e
quais são os instrumentos de cada equação (Dica: note que o Stata diferencia
os instrumentos em GMM e Standard).
(b) Faça um teste de signi…cância conjunta de cg, ci e openc. Ademais,
os testes de Sargan e AR(2) indicam a validade dos instrumentos.
(c) Refaça o item (a) considerando cg, ci e openc como variáveis prede-
terminadas (ver página 280 de Arellano-Bond).
(d) Faça um teste de signi…cância conjunta de cg, ci e openc. Ademais, os
testes de Sargan e AR(2) indicam a validade dos instrumentos para a estimativa
do item (c).
Resposta: do …le.
item (a) - instrumentos: com as explicativas como exógenas
No total temos 40 instrumentos. Como o STATA nos mostra, na equação
no nível há apenas um instrumento, a constante. Instrumentos na equação em
nível são utilizados por outros modelos de painéis dinâmicos (Arellano/Bover e
Blundell/Bond), mas não por Arellano/Bond. Ademais, há três intrumentos do
tipo "standard", que são as próprias variáveis exógenas se instrumentalizando.
Isso difere do paper de Arellano/Bond, como …cará mais claro ao comparar esse
resultado com o gabarito do item (c). No paper, se uma variável é exógena, todas
suas defasagens como valores futuros poderiam ser utilizados como instrumento
do tipo GMM, aqui elas contam como instrumentos standard.
Ademais, há 36 instrumentos do tipo GMM na equação diferenciada, que
são as defasagens de ordem 2 ou mais da variável dependente. Isso …ca claro
analisando o sistema de equações abaixo, que considera os 10 períodos de tempo:
�y10 = ��y9 +�x10� +�u10
�y9 = ��y8 +�x9� +�u9
� � �
�y3 = ��y2 +�x3� +�u3
Na primeira equação (t=10), os instrumentos do tipo GMM são y8; y7; :::; y1:
Na segunda equação (t=9), os instrumentos são y7; y6; :::; y1: Na última é apenas
y1: No total temos 36 instrumentos do tipo GMM. Note que nas 8 equações o
STATA conta �x como três instrumentos do tipo standard. Veja como isso
difere no caso em que essas variáveis são predeterminadas.
(c) No total há 169 instrumentos, muito mais que no item (a). Repare que
segundo o paper de Arellano-Bond deveria haver mais instrumentos quando
as variáveis explicativas são exógenas (página 280 abaixo da equação 5). Isso
12
ocorre porque agora todos os instrumentos são considerados do tipo GMM (ex-
ceto a constante na equação em nível) e …ca claro ao contarmos o número de
instrumentos.
As equações diferenciadas são novamente:
�y10 = ��y9 +�x10� +�u10
�y9 = ��y8 +�x9� +�u9
� � �
�y3 = ��y2 +�x3� +�u3
Mas agora note que �xt é correlacionado com �ut; pois xt pode ser cor-
relacionado com ut�1; dado que a variável é predeterminada e não exógena.
Dessa maneira, na primeira equação (t=10), os instrumentos do tipo GMM
são y8; y7; :::; y1; x9; x8; :::; x1: Na segunda equação (t=9), os instrumentos são
y7; y6; :::; y1; x8; x7; :::; x1: Na última são apenas y1 e x1: No total temos 36 +
k � 44 = 36 + 3 � 44 = 168 instrumentos do tipo GMM. Esses são os 169
instrumentos desejados.
13

Continue navegando