Soluções - livro do De Losso

Econometria

•
USP-SP

Gustavo Manzotti
06.10.2014
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 91 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 91 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 91 páginas
Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados
16 milhões de materiais de várias disciplinas
Impressão de materiais
Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
E aí, curtiu este material?
Ajude a incentivar outros estudantes a melhorar o conteúdo
Gostou desse material? Compartilhe! 🧡
Econometria

6.225 Materiais compartilhados
Baixe o app para aproveitar ainda mais
Leia os materiais offline, sem usar a internet. Além de vários outros recursos!
Prévia do material em texto
Soluções para o Manual de Econometria
Rodrigo De Losso da Silveira Bueno
São Paulo – Março/2001
2
Soluções para o Manual de Econometria
Rodrigo De Losso da Silveira Bueno1
 
1 Mestre em Economia, Universidade de São Paulo. Master of Arts, The University of Chicago (Ph.D Pass).
Doutorando em Economia pela Universidade de São Paulo.
3
Nota – O parênteses abaixo representam a fonte de adaptação em alguns dos exercícios, da
seguinte forma:
1. (B&D) BROCKWELL, Peter J. & DAVIS, Richard A. Time Series: Theory and
methods. New York: Springer, 1991.
2. (J) JOHNSTON, J. Econometric Methods, 3rd. ed. New York: McGraw-Hill, 1984;
3. (K) KENNEDY, Peter. A Guide to Econometrics, 4th. ed. Cambridge, MA: MIT,
1998;
4. (E) ENDERS, Walter. Applied Econometric Time Series. New York: Wiley, 1995.
5. (C) exercícios ministrados na The University of Chicago;
6. Exercícios formulados pelo autor.
Índice
1. Metodologia da Econometria ___________________________________________ 4
2. Modelo de Regressão Linear Geral_______________________________________ 5
3. Extensões ao Modelo Básico de Regressão Linear _________________________ 12
4. Análise da Base de Dados e Utilização de Variáveis Binárias_________________ 23
5. Problemas Econométricos no Modelo Linear Geral ________________________ 33
6. Multicolinearidade___________________________________________________ 39
7. Econometria das Variáveis de Resposta Qualitativas e Limitadas _____________ 45
8. Sistemas de Equações Simultâneas______________________________________ 50
9. Análise de Séries de Tempo ____________________________________________ 59
10. Metodologia de Box-Jenkins para Modelos Univariados ____________________ 65
11. Modelos de Função de Transferência e de Análise de Intervenção ____________ 70
12. Testes de Raízes Unitárias e Co-Integração _______________________________ 77
13. Modelos GARCH ____________________________________________________ 87
4
1. Metodologia da Econometria
Não há exercícios.
5
2. Modelo de Regressão Linear Geral
2.1 Estime as regressões: Y X! " #! " " e X Y$ % &! " " e conclua que 1ˆ ˆ" %
# 2, como
intuitivamente poderíamos afirmar.
Solução: Este exercício procura mostrar que regredir Y contra X, encontrando o
parâmetro "ˆ , NÃO é o mesmo que regredir X contra Y, encontrar o parâmetro %ˆ e
inferir que 1ˆ ˆ" %
! .
Sabemos que
1
2 2
1
ˆ
n
i i
i
n
i
i
Y X nXY
X nX
" !
!
$
!
$
%
%
.
Agora, resta observar que 1ˆ ˆ" %
# . Note que
2 2
1 1
2 2
1 1
1ˆ
ˆ
n n
i i i
i i
n n
i i i
i i
Y X nXY Y nY
X nX Y X nXY
"
%
! !
! !
$ $
! # !
$ $
% %
% %
.
2.2 Suponha o seguinte modelo linear: y X" #! " , onde y e # são vetores 1n& , X <∞ é
uma matriz n k& eβ é um vetor 1k& .
a. Qual(is) a(s) hipótese(s) necessária(s) para estimar esse modelo por MQO?
b. Qual(is) a(s) hipótese(s) necessária(s) para que oβ estimado, !β , exista e seja único?
c. Qual(is) a(s) hipótese(s) necessária(s) para que !β seja não viesado?
d. Qual(is) a(s) hipótese(s) necessária(s) para que !β seja eficiente?3
 
2 O acento circunflexo denota parâmetro estimado.
3 Este item apenas tem sentido em ser perguntado se, em aula, o professor apresenta os resultados da
regressão para X estocástico.
6
e. Qual(is) a(s) hipótese(s) necessária(s) para que se possa fazer inferência estatística?
Solução: Este exercício possui dois propósitos. Primeiro, induzir o estudante a
entender onde exatamente se aplica cada hipótese do modelo de regressão linear
múltipla, fazendo-o retornar a esses conceitos. Segundo, revisar os conceitos
estatísticos de viés e eficiência, aplicados à Econometria dos Mínimos Quadrados –
uma boa referência, para o professor, seria WHITE, Halbert. Asymptotic Theory for
Econometricians, 2nd. ed. Orlando: Academic Press, 2000. Note que nada é dito sobre
o comportamento do termo aleatório, justamente porque algumas perguntas referem-
se a seu comportamento.
a. Estimar o modelo por MQO é apenas um método matemático, nada mais. Portanto,
apenas necessitamos de uma condição matemática que é ' (X k' ! , isto é, o posto da
matriz X seja pleno. Precisamos disso porque, do contrário, X’X não seria inversível e,
então, não poderíamos estimar o modelo por MQO.
b. Outra vez, apenas necessitamos que ' (X k' ! , do contrário, !β não existiria. A
unicidade é dada justamente porque o posto é pleno. Se X fosse estocástico,
precisaríamos que lim 0X Xp Q
n
)
! # .
c. Aqui precisamos de várias hipóteses.
c.1 "ˆ* ;
c.2 !β é único;
c.3 Se X é não estocástico, como assumido neste capítulo, ' ( ' (0E X E# #! ! , onde a
segunda desigualdade resulta da Lei das Expectativas Iterativas. Se X é estocástico,
precisamos que lim 0Xp
n
#) ! .
d. Aqui usamos a hipótese de homocedasticidade. Por isso, podemos concluir que, para ser
não viesado, nada precisamos impor sobre a variância dos resíduos.
d.1 "ˆ* ;
d.2 !β é único;
7
d.3 lim 0Xp
n
#) ! ;
d.4 Se ' (0,# +! , onde 2I(+! , basta estimar o modelo por MQO. Para
complementar, mesmo que o professor ainda não tenha dado heterocedasticidade, ele
poderia dizer que precisamos estimar por um outro método a ser aprendido,
denominado mínimos quadrados generalizados. Isto é dizer, formalmente, se 2I(+# ,
estime 1 1 1 ,C y C X C CC" #$ $ $ )! " +! .
e. Para inferência estatística, admitimos que o erro tenha uma distribuição Normal e sejam
independentes entre si, de onde se seguem todos os resultados do capítulo. Se forem
normais, mas não independentes, ter-se-ia que estimar os parâmetros por mínimos
quadrados generalizados, pois, do contrário, as inferências estatísticas não seriam
válidas. Esta é a única hipótese necessária. Se não admitirmos que os erros têm
distribuição Normal, podemos assumir a hipótese mais fraca de que são identicamente e
independentemente distribuídos, mas nesse caso os testes somente serão válidos
assintoticamente. Em ambos os casos, pode-se argumentar que tais hipóteses são muito
fortes, a primeira mais forte do que a segunda.
2.3 Adão Ismiti queria verificar se a produtividade do trabalho aumentava com a divisão do
trabalho. Para isso, fez a seguinte experiência: regrediu a produtividade (p) de n
trabalhadores de fábricas de alfinetes contra o número de funções exercidas pelo
trabalhador (F), anos de escolaridade (E), salário (w) e número de filhos (N).
Formalmente a regressão foi: iiiii uNwEFp +++++= 543121 βββββ . Usando o
teste t-student, Ismiti aceitou a hipótese nula de parâmetro igual a zero para 3βˆ . Retirou
a variável E da regressão e estimou o modelo restrito, observando que 5βˆ tornou-se,
também, estatisticamente não significativo. Finalmente, retirou N da regressão e
estimou o modelo de novo.
a. Por que não foi preciso fazer o teste de F em 3"ˆ , para retirar E do modelo? Ou seja,
por que apenas o teste de t–student pôde ser feito?;
b. Justifique se o procedimento adotado por Smith está correto ou equivocado, para ter
eliminado a variável N do modelo.
8
Solução: Este exercício é muito ilustrativo e traz um pouco de problemas empíricos à
tona. Quer-se testar se o estudante entendeu como usar os testes t e F corretamente, e
evitar que ele cometa o erro de retirar variáveis explicativas, estatisticamente iguais a
zero, seqüencialmente. O certo é apenas fazer um teste de hipótese conjunta e, se for o
caso, concluir que tais variáveis não explicam o modelo.
a. A razão para não usar o teste F é que, quando estamos testando apenas um parâmetro, o
teste t e F se equivalem. Ou seja, pode-se usar um ou outro. Em geral, nos pacotes
econométricos o teste t sai automaticamente,por isso podemos olhar para ele sem
problemas. Vale lembrar que, para um parâmetro apenas, t2 é equivalente a F(1,n),
como provado no corpo do texto.
b. O procedimento de Ismiti está absolutamente equivocado. O correto seria testar,
conjuntamente, por F, se 3"ˆ e 5"ˆ são, simultaneamente, iguais a zero. A razão
específica é que no segundo teste, mudou-se o número de graus de liberdade, por isso o
equívoco. Ou, em outras palavras, no segundo teste, o modelo mudou em relação ao
primeiro.
2.4 (J) Para entender melhor como funciona o R2, prove que uma regressão estimada sem a
constante não implica que os resíduos somarão, necessariamente, zero e que o R2, se
calculado como 1 2−
′
′ −
! !e e
y y ny
, pode ser negativo, onde ! !e y X= − β , em que !β é o
vetor de parâmetro estimados estimado4.
Solução: Este exercício mostra que o R2 pode ser negativo, quando a regressão por
mínimos quadrados ordinários é feita sem constante (note que, mesmo com constante,
quando estimamos um modelo não linear por máxima verossimilhança, podemos ter
um R2 negativo, mas isso é um caso raro). Seu objetivo é alertar o estudante que,
quando o R2 é negativo, na regressão por MQO, é porque ele deve acrescentar a
constante ao modelo. O motivo é muito sutil e será explicitamente apresentado na
resolução. A primeira parte do exercício procura esclarecer por que os resíduos
somam zero, quando há constante, embora isto já esteja no corpo do capítulo. O
 
4 A segunda parte deste exercício é difícil.
9
exercício também é útil para treinar e entender várias passagens feitas no corpo do
texto.
Dada a regressão y X" #! " , temos que:
' (
1 1 2 2
2
1
1 1 2 2
1
, 1,2, , .
0, 1,2, , .
i i i ik k i
n
i n
i
i i i ik k ji
ij
y X X X i n
y X X X X j k
" " " #
#
" " "
"
!
!
! " " " " !
,
! $ $ $ $ ! !
,
%
%
" #
" #
Isso não garante que o resíduos somarão zero, pois Xji pode ser diferente de 1, para todo i,
mesmo quando j = 1. Claramente, se X1i = 1, para todo i, os resíduos somarão zero. Isto
finaliza a primeira parte da questão. Sigamos para a segunda parte.
Lembremos que:
' ( ' ( ' (2 2
1
2
2
' ;
ˆ ˆ ˆ ;
ˆ ˆ ˆ .
n
i
i
SQT y y y y y y y y ny
SQE y y ny
SQR e e ne
!
) )! $ ! $ $ ! $
)! $
)! $
%
Note como nada garante que eˆ seja zero, e, no cálculo do R2, não incluímos esse termo
(retorne à fórmula dada no exercício); é por isso que o R2 pode ser negativo. Note, também,
que: ˆ ˆ ˆ ˆ ˆi i ï i i ïy y e y y e y y! " - ! " - !% % % , apenas quando ˆ 0ïe !% , o que
somente ocorre se o modelo é estimado com constante, como demonstrado na primeira
parte do exercício.
Sabemos, ainda, que ˆ ˆ ˆ ˆy y y y e e) ) )! " . Com essas informações, temos:
2 2
2 2 2 2
ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ
1 1e e y y y y y y ny y y y y ny y y
y y ny y y ny y y ny y y ny
) ) ) ) ) ) )$ $ $ " $ "$ ! $ ! !
) ) ) )$ $ $ $
.
Conseqüentemente, se 2 2ˆ ˆ 0ny y y R). - / .
Para ver por que o R2 é positivo quando existe constante, note que se ˆy y! (caso com
constante), temos que ' (22
1
ˆ ˆ ˆ 0
n
i
i
ny y y y y
!
)$ " ! $ 0% 5.
 
5 Veja a semelhança com a fórmula do SQT.
10
2.5 (J) Dadas as seguintes estimativas de MQO:
1 1
2 1 2
1 3 3
4 1 4
0,9
0,8
0,7
0,5
t t t
t t t
t t t
t t t
C K Y
C K C
C K Y
Y K C
#
#
#
#
$
$
$
1 ! " "2222 ! " "2232 ! " "222 ! " "224
, calcule as
estimativas de MQO de 2" e 3" na regressão C Y C ut t t t= + + +−β β β1 2 3 1 .
Solução: O exercício é de nível médio a difícil. Tem o objetivo de treinar os conceitos
básicos de regressão, para verificar se o aluno sabe formulá-los. A solução pode ser
avaliada em duas etapas. Na primeira etapa, o aluno deve ser capaz de oferecer as
seguintes respostas.
O modelo pode (e deve) ser formulado em relação aos desvios. O aluno deve perceber isso
pelo fato de não ser pedido o valor de 1" , ou seja
2 3 1t t ttc y c u" " $! " " .
Sendo assim, pode-se concluir que:
' (
2
12
222 2
1 13 1 1
ˆ 1
ˆ
t t t t t
t t t t tt t t t
c y c y c
y c y c cy c y c
"
"
$
$ $$ $
5 6 5 6 5 6$7 8 7 8 7 8!7 8 7 8 7 8$$ 7 8 7 87 8 9 : 9 :9 :
% % %
% % %% % %
.
 Ainda, podemos concluir o seguinte:
1 1 1
2 2 2 2
1 1
0,9 ;0,8 ;0,7 ;0,5t t t t t t t t
t t t t
y c c c y c y c
y c y c
$ $ $
$ $
! ! ! !% % % %
% % % %
.
A segunda etapa começa aqui, pois, com essas informações, torna-se tranqüilo encontrar os
parâmetros desejados.
' (
' (
' (
2
1 1 1
2 22 2
1 1
2 2 2 2
1 1
22 2 2 2
1
2
1
2 2 2
1
ˆ
0,9 0,7 0,8
0,7
0,9 0,7 0,8
.
0,7
t t t t t t t
t t t t
t t t t
t t t
t
t t
c c y c y c c
y c c y
c y y c
y c y
c
c y
" $ $ $
$ $
$ $
$
$
$
$
! !
$
$
! !
$
$ ;
!
$
% % % %
% % %
% % % %
% % %
%
% %
Mas, das duas últimas equações acima, 2 20,7 0,5t ty c!% % . Logo,
11
2
2
2 2
0,70,34
0,5ˆ 0,5231
0,7 0,7
0,5
t
t
y
y
" ! !< =>? $ >? >>?@ A
%
%
.
Aplicando o mesmo procedimento, obtemos 3ˆ 0,5385" ! .
Uma outra maneira de resolver o problema é a seguinte: seja 1 o índice da variável ct, 2 o
índice da variável y e 3 o índice de ct-1. Além disso, seja bij o coeficiente angular da
regressão que tem i como regressando e j como regressor, segue-se, então, que6:
12 13 32
2
23 32
13 12 23
3
23 32
0,9 0,8 0,7ˆ 0,5231;
1 1 0,7 0,5
0,8 0,9 0,5ˆ 0,5385.
1 1 0,7 0,5
b b b
b b
b b b
b b
"
"
$ $ ;! ! !
$ $ ;
$ $ ;! ! !
$ $ ;
.
 
6 Ver Johnston (1984), cap. 3.
12
3. Extensões ao Modelo Básico de Regressão Linear
3.1 Qual é a intuição do método de estimação por máxima verossimilhança? Este método
produz resultados necessariamente iguais ao método de mínimos quadrados ordinários?
Por que é possível obter um R2 negativo quando estimamos um modelo (com constante)
pelo método de máxima verossimilhança?
Solução: (Sugestão de leitura adicional – CUTHBERTSON, Keith; HALL, Stephen &
TAYLOR, Mark. Applied Econometrics Techniques. Ann Arbor: Michigan, 1992)
Este é um exercício que reforça a idéia de máxima verossimilhança introduzida no
texto, procurando estimular o raciocínio intuitivo do alunos.
Dada uma seqüência de observações e supondo-se uma determinada distribuição para os
erros dessa seqüência e seu processo gerador de dados, o método de máxima
verossimilhança permite obter os parâmetros que mais aproximam a distribuição amostral
da suposta distribuição populacional dos erros. Nesse sentido, não importa se o método
produz erros pequenos ou grandes, desde que esses erros tenham a configuração de uma
normal, por exemplo. Por isso, a média desses erros pode ser bem diferente de zero, de
modo que o R2 pode ser negativo (ver exercício 2.5).
Observe que, nos pacotes econométricos, o R2 é calculado supondo-se que a estimação seja
feita por MQO com constante. Daí um dos motivos para que não seja uma boa medida de
regressão, necessariamente.
3.2 (C) Uma variável aleatória X tem uma distribuição exponencial, com parâmetro
' (0" ". se X tem uma distribuição contínua pela qual a função densidade de
probabilidade, f.d.p.,
' ( , para 0,
0, para 0
xe x
f x
x
"""
$12 .2!32 B24
.
Para mais tarde, note que essa formulação implica que a função densidade acumulada,
f.d.c., é:
' ( 1 , para 0,
0, para 0
xe x
F x
x
"""
$12 $ .2!32 B24
.
13
A média e a variância de uma distribuição exponencial com parâmetro " é ' ( 1E X
"
! e
' ( 2
1Var X
"
! .
a. Suponhaque x1, x2, ..., xn formem uma amostra aleatória de uma distribuição
exponencial, cujo valor " é desconhecido. Encontre a estimativa de máxima
verossimilhança, EMV, de " .
b. Usando a propriedade de invariância da EMV, encontre a EMV de 2
1 1 e 
" "
. (A
propriedade da invariância da EMA significa que ' ( ' (ˆg g) )! ).
Solução: Este exercício serve de treino para derivar as condições de primeira ordem
da máxima verossimilhança, saindo um pouco da tão conhecida distribuição normal.
O exercício serve também para mostrar como se obtêm resultados para uma
estimativa, a partir de outra estimativa. Além disso, o exercício, apesar da enorme
formulação, é fácil.
a. Primeiro formulamos o problema na linguagem aprendida no livro.
' ( 1
1
;
n
i
i i
n x
x n
i
L X e e
"
"" " " !
$
$
!
%
! !C .
Tomando-se o log:
' ( ' ( ' (
1
log ; ; log
n
i
i
L X l X n x" " " "
!
5 6 ! ! $9 : % .
As condições de primeira ordem dão;
1
1
1ˆ ˆ0
n
i n
i
i
i
l n nx
Xx
" "
" " !
!
, ! $ ! - ! D !
, % %
.
b. A segunda parte do problema é ainda mais fácil.
' ( ' (1 1ˆ ˆg g X" "" "! - ! ! .
Da mesma forma:
' ( ' ( 22 21 1ˆ ˆg g X" "" "! - ! ! .
14
É possível mostrar isso formalmente, utilizando a mesma metodologia anterior.
3.3 (C) Suponha que X1, X2, ..., Xn são variáveis aleatórias de Bernoulli i.i.d., com:
1, com probabilidade 
0, com probabilidade 1i
x
)
)
122!32 $24
.
a. Encontre a EMV de ) e sua distribuição assintótica7.
b. Teste a hipótese 0 : 0,4H )! por Wald, LR e LM? Teste a hipótese 
2
0 : 0,5H ) !
8?
Solução: Este exercício é bastante completo e verifica se o aluno entendeu como
funcionam os testes apresentados no corpo do texto.
 a. Primeiro, vamos definir a função de Bernoulli, depois a função de verossimilhança para
achar o valor dos parâmetros e, em seguida, encontrar a distribuição assintótica.
A função de Bernoulli é dada por:
' ( ' (11 , 0,1xxiP X x x) ) ) $! ! $ ! .
Como Xi é i.i.d.:
' ( ' (11 2
1
, , , 1 ii
n
xx
n
i
P X x X x X x ) ) ) $
!
! ! ! ! $C" .
Assim,
' ( ' ( ' ( ' ( ' (1
1 1 1
; ln 1 ln ln 1 1ii
n n n
xx
i i
i i i
l x x x) ) ) ) )$
! ! !
5 6! $ ! " $ $7 89 :% % % .
As condições de primeira ordem resultam em:
' ( ' ( ' (1 0 1
1
ˆ .
i i
i i
i
x x
x n x
x
n
) )
) )
)
$
$ ! - $ ! $ -
$
!
% % % %
%
As condições de segunda ordem garantem o máximo.
Agora, tratemos da distribuição assintótica. Pelo Teorema Central do Limite de Levy-
Lindberg, sabemos que, como E F 1
n
i i
x
!
 são i.i.d., ' ( ' (
2
,E x Var x
n
(*! ! , logo:
 
7 Não é preciso resolver a parte de distribuição assintótica, embora seja simples a resposta.
8 Como se trata de uma restrição não linear, esta parte do exercício pode ser evitada.
15
' (2 0,1d
Xn N*
(
$ GGH .
' ( ' (
' ( ' ( ' ( ' (2 2
ˆ ;
1 1ˆ .
i
i
E x nE
n n
Var x n
Var
n n n
)) )
) ) ) )
)
! ! !
$ $
! ! !
%
%
A segunda igualdade da variância é resultado da variância para o caso da distribuição de
Bernoulli. Desse modo:
' ( ' (
' (
ˆ ˆ
0,1
1 1
dn N
n
) ) ) )
) ) ) )
$ $! GGH
$ $
.
A solução apresentada para distribuição assintótica, no entanto, pode ser feita usando as
propriedades do EMV. Uma delas afirma que, sob determinadas condições encontradas
neste problema, o estimador de máxima verossimilhança é assintoticamente normal.
Formalmente, isso significa;
' ( ' (
' (
1
2
2
ˆ 0, , onde
;1 .
dn N
L x
E
n
) )
)
(
$$ GGH +
5 6,7 8+!$ 7 8,7 89 :
Logo,
' (
' ( ' (
' ( ' (
' (
' ( ' (
' (
' (' (
' ( ' (
2 2
2 2 22 2 2
2 2
2 22 2
ˆ ˆ1 1ˆ ˆ11 1
1 1 1
1 1 1 1 1 .
11 1
i ix xE E E
n
) ) ) )) )
) )) ) ) )
) ) ) ) ) ) ) )
) )) ) ) )
< =5 6< = < = $ " $ >?$ $> >? ? >7 8 ?> >? ? >+! " ! " ! !?> > >7 8? ? ?> > >? ?> >> > ?? ?$ $ $7 8 >@ A @ A >?@ A9 :
< = < =$ " $ $ $ "> >? ?> >? ?+! ! !> >? ?> >? ? $> >> >? ?$ $@ A @ A
% %
Portanto,
' ( ' (' (ˆ 0, 1dn N) ) ) )$ GGH $ .
 b. O primeiro teste que devemos fazer é assim especificado:
0 1: 0,4 : 0, 4.H H) )! & #
16
Apenas para formalizar melhor a idéia de máxima verossimilhança, temos que definir os
seguintes resultados:
' ( 0, 4 0H ) )! $ ! , que a “função hipótese nula”;
' (
' ( ' ( ' (
' (
22 2
2 2
1;
ˆ ˆ ˆ; 1 1
.
ˆ ˆ1
i i
H
l x x x
)
)
) ) )
) ) ) )
,
!
,
, $ $ $ $
!
), , $
% %
Teste de Wald
Com isso, o teste de Wald é dado por:
' ( ' (
' ( ' (
' (
2 2
2
12 2
ˆ ˆ1
ˆ ˆ0, 4 1 1 0,4
ˆ ˆ1 1
d
i i
W
x x
+
) )
) ) ,
) )
!
1 I2 2$2 22 22 2! $ ; ; $ GGH3 J2 22 2$ " $2 22 24 K% %
.
Portanto, se ' (
2
1 95%W +, !. , rejeitamos H0. Note que aqui, temos apenas que estimar o
modelo não restrito, ou seja, sem impor qualquer restrição.
Teste Razão de Verossimilhança – LR
' ( ' ( ' ( ' ( ' (E F 2 1ˆ ˆ2 ln ln 0, 4 1 ln 1 ln 0,6 di iLR x x +) ) , !5 6 5 6!$ $ " $ $ $ GGH7 8 7 89 : 9 :% % .
Portanto, se ' (
2
1 95%LR +, !. , rejeitamos H0. Note que aqui temos que calcular o modelo
restrito e o não restrito.
Teste Multiplicador de Lagrange – LM
No teste LM, temos apenas que calcular a verossimilhança com o modelo restrito.
' (
' ( ' (
2 2
2
12 2
1
1 11 1
i i i i d
i i
x n x x n x
LM
x x
+
) )
,
) ) ) )) )
!
1 I) 2 2< = < =$2 2$ $> >? ?2 2> >? ?! $ $ GGH3 J> >? ?> >2 2> >$ $? ?? ?@ A @ A$ " $2 22 24 K
% % % %
% %
$ $
$ $ $ $$ $
,
onde )$ é o vetor de parâmetros estimados do modelo restrito. Assim, temos:
' (
2
2
1
0,0576
0, 4 0,6 0,36 0,16 1
i i d
i i
x n x
LM
x x +
, !
1 I< = 2 2$ >? 2 2>?! $ GGH3 J>? > 2 2> " $??@ A 2 24 K
% %
% %
.
Portanto, se ' (
2
1 95%LM +, !. , rejeitamos H0.
17
O segundo teste que devemos fazer é assim especificado:
2 2
0 1: 0,5 : 0,5H H) )! & # .
Apenas para formalizar melhor a idéia de máxima verossimilhança, temos que definir os
seguintes resultados:
' ( 2 0,5 0H ) )! $ ! ;
' (
2
H )
)
)
,
!
,
.
Teste de Wald
' ( ' (
' ( ' (
22
22 2
12 2
ˆ ˆ1
ˆ 0,5
ˆ ˆ1 1
d
i i
W
x x
+
) )
) ,
) )
!
1 I2 2$2 22 22 2! $ GGH3 J2 22 2$ " $2 22 24 K% %
.
Teste Razão de Verossimilhança – LR
' ( ' ( ' ( ' ( ' ( 2 11 1ˆ ˆ2 ln ln 0,5 1 ln 1 ln 0,52 2
d
i iLR x x +) ) , !
1 I5 6 5 62 22 27 8 7 8!$ $ " $ $ $ GGH3 J2 27 8 7 89 : 9 :2 24 K
% % .
Teste Multiplicador de Lagrange – LM
' ( ' (
' ( ' (
' (
' ( ' (
22
2
2 2
2
2
12
1
2
1 1
4 0,5 0,5 1 0,5
.
1 0,5 0,5 1
i i
d
i i
LM
x x
x x
+
) )
)
) )
, !
1 I2 2$2 22 2! !3 J2 2$ " $2 22 24 K
; ; $
GGH
$ " $
% %
% %
$ $
$ $
3.4 (C) Seja ' (21 , . . . 0, , 1t t t ty y i i d N+ # # ( +$! " /! 9.
 
9 Exercício difícil, mas importante para entender e trabalhar os conceitos de viés, consistência, EMV e MQO.
Consultar, também, capítulo 5 do livro.
18
a. Escreva a função log-verossimilhança para uma amostra com T observações (y1, y2, ...,
yT), a partir do processo acima, condicional à primeira observação. Escreva a função
de verossimilhança como:
' ( ' ( ' (
' ( ' ( ' (
' ( ' ( ' ( ' (
1 1 1 2 1 1 2 1
1 2 1 1 2 3 1 2 3 1
1 2 1 1 2 3 1 2 1 1
, , , , , , , , ,
, , , , , , , , ,
, , , , , , .
t t t t t t t
t t t t t t t t
t t t t t t
f y y y f y y y y f y y y
f y y y y f y y y y f y y y
f y y y y f y y y y f y y f y
$ $ $ $ $
$ $ $ $ $ $ $
$ $ $ $ $
! !
! !
! !
!
# # #
# # #
"
# # "Para o processo acima, os valores de (y1, y2, ..., yT-1) interessam para yT apenas através do
valor de yT-1. Assim, ' ( ' (1 2 1 1, , ,t t t t tf y y y y f y y$ $ $!# .
b. Mostre que ˆ ˆ ˆEMV MQO+ + +! ! , onde ˆMQO+ vem da regressão de yt contra yt-1 e ˆEMV+ é a
EMV (condicional em y1).
c. Mostre que +ˆ é um estimador viesado de + .
d. Mostre que +ˆ é consistente.
e. Obtenha a distribuição assintótica de +ˆ .
f. Agora, suponha que o processo seja alterado para ' (
1 1
2
, ,
. . . 0, , , 1.
t t t t t t
t
y y u u
u i i d N
+ # # )
( + )
$ $! " ! "
/!
 O
estimador de mínimos quadrados é consistente? Derive o limite de probabilidade.
Solução: No corpo do texto, usaram-se termos como consistência, viés, eficiência. Este
exercício serve para trabalhar esses termos, de modo a esclarecer seu significado. Daí
sua importância. No entanto, este exercício pode ser considerado difícil, a partir da
letra d. Note que aqui, implicitamente, estamos retirando a hipótese de que a matriz X
é não estocástica. Isto muda radicalmente os resultados. Sugerimos a seguinte
bibliografia adicional: HAMILTON, James D. Time Series Analysis. Princeton:
Princeton, p. 215, 1994.
a. Vamos primeiro definir a função de verossimilhança condicional a y1, como, aliás, já
foi ensinado no corpo do exercício.
' ( ' (
' (21
2
1
1
22 2
1 1 1, , , 2
t ty y
t t tf y y y y e
#(
#-(
$
5 6$7 8$7 8$ 7 87 89 :
$ $ !# .
Agora, seguindo a sugestão do exercício:
19
' ( ' (
' (21
2
2
1
2
1
2 2
1 1 1, , , 2
T
t t
t
y y
T
t t tf y y y y e
#(
#-(
$
!
5 6
7 8$7 8
7 8$7 8
7 8
7 8$ 7 8$ 7 87 89 :
$ $
%
!# .
Dessa forma:
' ( ' ( ' ( ' (22 2 121
2
1 1 1, ; ln 2 ln
2 2 2
T
T
t t tt
t
T Tl y y y# #
#
+ ( - ( +
( $! !
$ $5 6 !$ $ $ $7 89 : % .
 b. Agora, é fácil ver que ' ( ' (2* 2 11
2
ˆ arg max , ; arg min
T
T
t t tt
t
l y y y#+ + ( + $!
!
5 6! ! $7 89 : % . Assim,
temos que ˆ ˆEMV MQO+ +! .
De fato, tomando as condições de primeira ordem,
' (
' (
2
1
1 12
2
2
1 1
2 2
1
2
2
1
2
, ; 1 0
0
ˆ ˆ .
T
Tt t
t t t
t
T T
t t t
t t
T
t t
t
EMV MQOT
t
t
l y
y y y
y y y
y y
y
#
#
+ (
+
+ (
+
+ +
!
$ $
!
$ $
! !
$
!
$
!
5 6, 7 89 : ! $ ! -
,
$ ! -
! !
%
% %
%
%
Apenas para constar, as condições de segunda ordem dão para + :
2
1
2
2 0
T
t
t
y
#(
$
!$ /
%
.
c. Para mostrar que é viesado, temos apenas que tomar a esperança da estimativa. Ou
seja,
' (1 1 1
2 2
2 2
1 1
2 2
ˆ
T T
t t t t t
t t
T T
t t
t t
y y y
E E E
y y
+ # #
+ +
$ $ $
! !
$ $
! !
5 6 5 6
7 8 7 8"7 8 7 85 6 7 8 7 8! ! "7 89 : 7 8 7 8
7 8 7 8
7 8 7 89 : 9 :
% %
% %
.
Temos que desenvolver o numerador da segunda parcela.
20
' ( ' (
' (
2
1 2 1 1 2 3
2 2 2
1
1
1
2 1
.
T T T
t t t t t t t t t t t
t t t
j tT
j j
t t j t
t j
y y y
y
# # + # # # +# # + #
# # + + #
$ $ $ $ $ $
! ! !
! $
$
$
! !
! " ! " " !
! !
! "
% % %
%%
"
Podemos ver, a partir disso, que:
' (
1
1
1 1
2 1
0
j tT
j j
t t j t
t j
E y y# # + + #
! $
$
$
! !
5 6
7 8" !7 87 89 :
% % ,
porém,
' ( ' (
' (
' (
' (
1
1
2 1
1
2
1
2
g xg x
0, pois E
j tT
j
t t j
t j
T
t
t
E
E y
h y E h yy
# # +
! $
$
$
! !
$
!
5 6
7 8 5 65 67 8 9 :7 87 8 # #7 87 8 5 67 89 :7 8 9 :
7 87 89 :
% %
%
.
A conclusão, portanto, é que +ˆ é viesado.
A intuição básica é que o denominador, que também depende dos erros, altera a razão, ou
seja, impõe uma estrutura de ponderação, cuja esperança não é mais zero.
d. A consistência é um conceito, quando tomamos a probabilidade do limite. Como,
nesse caso, pelo Teorema de Slutsky,
' (
' (
' (
' (
lim g xg x
lim
lim
p
p
h y p h y
5 65 6 9 :7 8 !7 8 5 67 89 : 9 :
,
temos que:
' ( ' (
1 1
1 1
2 1 2 1
2 2
1 1
2 2
01
1
2 1
2
1
2
lim
ˆlim lim
lim
lim
.
lim
j t j tT T
j j
t t j t t j
t j t j
T T
t t
t t
j tT
j
t t j
t j
T
t
t
p
p p
y p y
p
p y
# # + # # +
+ + +
+ # #
+ +
! $ ! $
$ $
$ $
! ! ! !
$ $
! !
!! $
$
$
! !
$
!
! " ! " !
5 69 :
! " !
%% %%
% %
%%
%
%&&&&&'&&&&&(
Logo, +ˆ é consistente.
e. Este exercício não é difícil, mas exige atenção.
21
' (
1
2
1
2
2 2
1 1
2 2
1ˆ ˆ1
1
T
T t t
t
t t
t
T T
t t
t t
y
y
TT
y y
T
#
#
+ + + +
$
!
$
!
$ $
! !
$! " - $ $ !
$
%
%
% %
.
Pelo Teorema Central do Limite,
' (' (
1 4
2 22
1 20, 0,11
T
t t
dt
t
y
N E y N
T
#
#
#
((
+
$
!
$
< =>? >GGH ! ? >? >? $@ A$
%
.
Pela Lei dos Grandes Números,
2
1 2
2
21 1
T
t
pt
y
T
#(
+
$
! GGH
$ $
%
.
Para ver este último resultado, observe que
' ( ' (
' (
' ( ' ()
' (
22
2 2 2 2
1 1 1
2 2 2 2
1 1
0
2
2
2
2
2
.
1
p pp
t
t t t t t t t t
t t t t t
E y
t
y y y y y
E y E y E y E
E y
#(
#
+ # + # #
+ # #
(
+
$ $ $
$ $
GGH GGHGGH
! " - ! " " -
! " " -
!
$
*&&&+&&&,*&&+&&,
Ou, de outra maneira, lembrando que a esperança é sobre uma amostra infinita:
' (
2
2 2 2
2
2 2 1
T
j j
t t j t
t t
y E y ##
(+ # + (
+
L
$
! !
! - ! !
$% % .
Portanto
' ( ' (
2
2
2 2
2
1ˆ1 0, 0,1
1
1
dT N N#
#
(+ + +
( +
+
< =>? >$ $ GGH ! $? >? >? $@ A
$
.
f. Agora, como 1 1, lim 0t t t t tu u p y# ) #$ $! " # . Assim,
22
' (' (
2
1 1 2 1 2
2 2
1 2 1 2
2 2 2 2
0 0 0
2
1 2 1
22 2
0
p p p
p p
u
T T
t t t t t t t
t t
T T T T
t t t t t t t t
t t t t
T T
t t t t
t t
y u u y u u
y u y u u u u
T T T T
u y u u
T T
(
# ) )
#
)
) ) )
$ $ $ $ $
! !
$ $ $ $
! ! ! !
GGH GGH GGH
$ $ $
! !
GGH GGH
! " " " -
! " " "
" " "
% %
% % % %
% %
*&&&+&&&, *&&&+&&&, *&&&+&&&,
*&&&&+&&&&, *&&+&&,
1 2
2
0
1
22 0.
p
T
t
t
T
t t
pt
u
u
T
y
T
#
)(
$ $
!
GGH
$
!
-
GGH #
%
%
*&&&&+&&&&,
Agora, no denominador temos:
' (
2 2
2
1
2
2
22 2 2 2
1 2 1 2 2 1 2
2 22 2 2 2 2
1 2 2 2
2 2
0
2 2 2
T p p
u u
t
p t
p p
u
T T T T T
t t t t t t t
t t t t t
y
T
T T
t t t t t
t t
y y u u y u u
T T T T T
u y u y u
T T
( (
(
+ )
+ )
+ +) )
$
!
$ $ $ $ $ $ $
! ! ! ! !
GGH GGH
GGH
$ $ $ $
! !
GGH GGH
" "
! ! " " "
%
" " "
% % % % %
% %
*&&+&&, *&&+&&, *&&+&&,
*&&&&+&&&&, *&&&&+&&&&,
' (
1 2
2
0
2
21
22
2
1 2
.
1
p
T
t
t
T
t
pt
u
u
T
y
T
) )+
(
+
$ $
!
GGH
$
!
-
" "
GGH
$
%
%
*&&&&+&&&&,
Portanto,
' (
' (21 22
22 2
2
1 22
lim 1ˆlim
1 21 2lim
1
T
t t
t u
T
u
t
t
p y
p
p y
# + ))(+ + + + +
) )+) )+ (
+
$
!
$
!
$
! " ! " ! " #
" "" "
$
%
%
.
Logo, podemos concluir que ˆMQO+ é inconsistente.
23
4. Análise da Base de Dados e Utilização de Variáveis Binárias
4.1 Explique sucintamente como se faz o teste de Chow e para que ele serve. Apresente,
pelo menos, duas limitações ao teste de Chow.
Solução: O exercício pretende estimular o raciocínio do estudante quanto à
aplicabilidade do teste de Chow. O professor deve esperar que o estudante encontreduas limitações, pois a terceira é bastante sutil, tratando-se de modelos não lineares.
Para teste de apenas uma mudança estrutural, divida a amostra em antes e depois da
mudança. Estime o modelo não restrito, ou seja, estime o modelo antes e depois da
mudança separadamente, calcule a soma dos quadrados dos resíduos para cada caso e
some-as. Estime o modelo sem mudança estrutural, usando todos os dados, e obtenha a
soma dos quadrados dos resíduos restritos. Use o teste F, tomando cuidado para especificar
corretamente o número de restrições. O teste de Chow serve para verificar se houve alguma
mudança estrutural na série.
A primeira limitação trata do fato de que o teste de Chow, usado para mudanças estruturais,
não é aplicável se o número de variáveis explicativas, k, é maior do que o número de
observações de uma das subamostras, isto é, se k > ni, para algum i. Na prática isso
dificilmente ocorre, mas trata-se um problema potencial. Imagine intervenções na economia
de poucos meses, por exemplo, o que poderia acarretar esse problema.
A segunda limitação é que o teste supõe um modelo homocedástico, ou seja, mesma
variância nas diversas subamostras, o que é fortemente implausível se há mudança
estrutural.
A terceira limitação é que o teste se aplica apenas a modelos lineares, e não se aplica a
modelos não lineares. Porém, o escopo desse livro é estudar estimação apenas em modelos
lineares. Para maiores detalhes sobre isso, ver DAVIDSON, Russel & MACKINNON,
James G. Estimation and Inference in Econometrics. New York: Oxford, pág. 376, 1993.
4.2 (K) Suponha que se estime y x D! " % #! " " " , onde D é uma dummy para estado
civil (casado ou solteiro). Suponha que saibamos que a fração de casados na amostra é
duas vezes maior do que a fração de solteiros na população Que modificação, se
houver, você sugeriria.
24
Solução: Este é um exercício destinado a treinar a atenção do aluno, para evitar que,
num trabalho real, ele cometa erros primários.
Nada, pois esta informação não tem qualquer implicação sobre os valores s parâmetros.
4.3 (C) Suponha que o único determinante do consumo das famílias no Br
ai, do chefe da família. Temos dados de cross-section de famílias. Con
modelo simples:
( 1 ) 1 2i i ic a" " #! " " ,
e o modelo mais geral
( 2 ) 1 1 2 2i i i i i ic D a D a" $ " $ #! " " " " ,
onde Di é uma variável dummy indicando se o chefe é aposentado ou
seguinte forma:
1, se 60;
0, se 60.
i
i
i
a
D
a
1 022!32 /24
Assuma que todas as hipóteses padrões para pequenas amostras são 
modelo ( 2 ) e que ' ( 2iVar # (! é desconhecido.
a. De acordo com ( 2 ), qual é a esperança condicional do consumo da f
tem 40 anos de idade? E para aquela cujo chefe tem 20 anos de idade?;
Para b. e c. considere as três figuras abaixo:
ai
ci
sem pulo
sem quina
60
ci
sem pulo
quina
60
ai
ci
pulo
quina
60
do
asil, ci, é a idade,
sidere o seguinte
 não, definida da
satisfeitas para o
amília cujo chefe
ai
25
b. Que restrições devem ser impostas sobre os parâmetros do modelo ( 2 ) para evitar
mudanças descontínuas na esperança condicional do consumo na época da
aposentadoria? Como você testaria essa restrição?
c. Suponha que a restrição de b. seja verdadeira. Imponha isso sobre ( 2 ) e derive um
teste de hipótese que não haja pulo (como imposto) e não haja quina na consumo na
época da aposentadoria.
Solução: O exercício aplica os conhecimentos de variáveis dummy. Ele tem o mérito de
induzir o estudante a pensar em como se usam as variáveis dummy.
 a. O exercício é bastante simples, não demandando maiores dificuldades.
1 2
1 2
40 40;
20 20.
i i
i i
E c a
E c a
" "
" "
5 6! ! " ;9 :
5 6! ! " ;9 :
Ao passo que, por exemplo,
' (1 1 2 273 73i iE c a " $ " $5 6! ! " " " ;9 : .
 b. A restrição necessária para evitar o pulo é:
1 2 60 0$ $" ; ! .
Podemos testar,
0 1 2 1 1 2: 60 0 : 60 0H H$ $ $ $" ; ! & " ; # ,
fazendo um teste t-student da combinação linear dos coeficientes. Assim, rejeite H0 se
' (
' (
M N M N
12 2
1 1 2 2
ˆ 0 4 , onde
0,1,0,60 ; , , , .
Rt t n
s R X X R
R
!
"
" " $ " $
$
$! 0 $
5 6) )7 89 :
)! !
c. Impondo a restrição de que não haja pulo sobre ( 2 ), obtemos:
' (1 2 2 60i i i i ic a D a" " $ #! " " $ " .
A restrição adicional para evitar quina é 2 0$ ! . Podemos, então, testar:
0 2 1 2: 0 : 0H H$ $! & # ,
fazendo um teste t-student da seguinte forma:
26
' (
' (2
12 2
33
ˆ 0 3t t n
s X X
!
$
$
$! 0 $
5 6)7 89 :
.
Se a desigualdade for verdadeira, rejeitamos H0.
Apenas note o número de graus de liberdade, entre parênteses.
4.4 (J) Um conjunto de dados “cross-section” de famílias com relação a renda, y, e
consumo, c, é dividida em subconjuntos de observações, da seguinte maneira:
a. Operários;
b. Assalariados; e
c. Autônomos.
Uma regressão do log(c) contra o log(y) é computada para cada sub-amostra e para a
amostra completa (com “dummy” para cada intercepto), produzindo:
 
!β s2 T
a. Operários 1 02
0 06
,
( , )
0,24 102
b. Assalariados 0 91
0 1
,
( , )
0,46 104
c. Autônomos 0 76
0 08
,
( , )
0,30 26
d. Todas famílias 0 86
0 05
,
( , )
0,39 232
Aqui !β é o coeficiente de declividade (com os erros-padrão entre parênteses), s2 é a
variância residual, e T é o tamanho da amostra.
Teste as hipóteses de que:
a. A elasticidade de c com respeito a y é a mesma para todas as classes ocupacionais;
b. Seu valor é unitário.
Interprete os seus resultados e dê algumas possíveis explanações para as diferenças
observadas.
Solução: Este exercício é ilustrativo do uso das variáveis dummy, onde o aluno é
obrigado a raciocinar sobre sua utilização. Ao mesmo tempo, introduz-se um exemplo
27
prático, para aguçar a intuição do estudante. O exercício é muito bom, porque
esclarece muitos detalhes que em geral passam despercebidos, mesmo após uma
cuidadosa leitura do texto principal. Ao final da resolução, apresentamos uma
variante do exercício, muito ilustrativa, embora de um elevado grau de dificuldade, se
proposto aos alunos. Porém, tal variante poderia servir como um desafio, mais voltado
aos alunos aplicados.
a. Temos que fazer um teste de F para esse caso. Assim, precisamos encontrar os erros
quadrados da equação restrita e da não restrita. Não temos isso diretamente, mas
podemos calcular. Se somarmos os erros das três regressões separadas, teremos o erro
da equação não restrita, da mesma forma que é feito no corpo do texto. Vamos ver
isso, algebricamente.
2 ˆ ˆ , 1, 2,3í íi
e es i
n k
)
! !
$
,
1 representa os operários,
2 representa os assalariados,
3 representa os autônomos.
Com isso, podemos calcular o erro quadrado de cada regressão. Sabemos que o tamanho da
amostra, T, será nosso n da equação e k é o número de parâmetros estimados. Como temos
uma dummy para cada intercepto, cada equação foi estimada com duas variáveis
explicativas, e a última equação foi estimada com três dummy mais o coeficiente de
declividade. Este é o primeiro detalhe importante. Logicamente, a última equação trata do
modelo restrito, que será denotado por um asterisco, *. Assim, temos:
' (
' (
' (
' (
1 1 1 1
2 2 2 2
3 3 3 3
* * * *
ˆ ˆ ˆ ˆ0, 24 102 2 24;
ˆ ˆ ˆ ˆ0, 46 104 2 46,92;
ˆ ˆ ˆ ˆ0,30 26 2 7,2;
0,39 232 4 88,92.
e e e e
e e e e
e e e e
e e e e
) )$ ! - !
) )$ ! - !
) )$ ! - !
) )$ ! - !
A soma dos erros quadrados das três primeiras equações nos dá a soma dos quadrados dos
erros da equação não restrita. Calculando temos que 24 46,92 7,2 78,12" " ! .
Agora, vamos especificar o teste F que desejamos fazer. Este segundo detalhe é muito
importante, pois defineo número de restrições, q, para o teste de F, número esse que
freqüentemente causa confusões.
28
1 2
1 2
0 1
2 3
2 3
: : ouH H
" "
" "
" "
" "
1 #221 !2 22 2&3 32 2!24 2 #224
.
O número de restrições é melhor entendido, pensando na hipótese alternativa. Dessa forma,
calculando F, obtemos:
' (
' (
' (95%
88,92 78,12
2 15,62 2, 22678,12
232 6
F F
$
! ! .
$
.
Com esse resultados, rejeitamos H0 de que as declividades são idênticas para as três classes
laborais. Note que não sabemos se as três declividades são diferentes entres si, ou se apenas
uma delas difere das outras duas, nem qual delas seria. Apenas sabemos que são diferentes.
b. Agora temos que testar, para cada regressão, se a declividade é diferente. Basta usar
um teste t-student, bastante conhecido.
' (0 1 1 1 2,5%
1,02 1: 1 : 1: 0,333 100
0,06
H H t t" " $! & # ! ! / ,
de modo que aceitamos H0 ao nível de 5% de significância.
' (0 2 1 2 2,5%
0,91 1: 1 : 1: 0,9 102
0,1
H H t t" " $! & # ! ! / ,
de modo que aceitamos H0 ao nível de 5% de significância.
' (0 3 1 3 2,5%
0,76 1: 1 : 1: 3 24
0,08
H H t t" " $! & # ! ! . ,
de modo que rejeitamos H0 ao nível de 5% de significância.
À luz do teste que fizemos no item anterior, observamos que a diferença de declividade
encontra-se no 3" . Ou seja, temos duas declividades iguais a 1 e uma diferente de 1. Não
fizemos o teste para verificar se 3" é maior ou menor do que 1 (nosso teste foi para
verificar se era diferente de 1), mas é de se esperar que seja menor do que 1, de acordo com
as explicações a seguir.
Uma possível explicação é a percepção do que a renda representa para cada classe laboral.
Os assalariados e operários percebem aquela renda de uma perspectiva de mais longo
prazo, ou seja, entendem aquela renda como fazendo parte de seu fluxo de renda
permanente. Os autônomos não sabem se a renda percebida será igual nos períodos
29
seguintes, ou seja, se se trata de renda permanente ou transitória. Por isso, os autônomos
têm uma propensão marginal a poupar maior do que as outras classes ocupacionais. À
propósito, isto é o que Milton Friedman propôs em suas Teoria da Renda Permanente. Esta
é a razão por que a elasticidade renda dos autônomos é menor.
Isto encerra o problema proposto.
O problema comporta algumas variantes de interesse. Inicialmente, suponha que não
tivesse sido citada uma dummy para cada intercepto. Então, isso traria ambigüidades, pois
não seria possível definir se em “todas famílias” foram regredidas com apenas um
intercepto ou com uma dummy para cada intercepto. Assim, a solução dada anteriormente
testa a seguinte hipóteses:
Modelo Restrito: diferentes interceptos e uma declividade comum;
Modelo não Restrito: diferentes interceptos e diferentes declividades.
Porém, se assumimos que “todas famílias” tem apenas um intercepto, então estaríamos
testando H0: interceptos são os mesmos e declividades são as mesmas. Formalmente:
1 2 1 2
2 3 2 3
0 1
1 2 1 2
2 3 2 3
, ou
, ou
: :
, ou
.
H H
! ! ! !
! ! ! !
" " " "
" " " "
1 1! #2 22 22 22 2! #2 22 2&3 32 2! #2 22 22 2! #2 22 24 4
Nesse caso, apenas o valor dos erros quadrados restritos é que mudariam para:
' ( * * * *0,39 232 2 89,70e e e e) )$ ! - ! .
O teste de F seria dado por:
' (
' (
' (95%
89,70 78,12
4 8,38 4, 22678,12
232 6
F F
$
! ! .
$
.
De modo que rejeitaríamos a hipótese nula, sem saber se a rejeição seria causada por
interceptos diferentes, ou declividades diferentes, ou ambos.
Agora uma problema mais difícil. Supondo que a regressão “todas famílias” tenha, de fato,
um único intercepto, seria possível extrair a soma dos quadrados dos resíduos para um
30
modelo restrito com diferentes interceptos e uma declividade comum, a partir dos mesmos
dados fornecidos?
Se estimássemos os modelos a partir de seus desvios em relação à média, recuperaríamos
os betas. Isto é, a partir da média, para modelos com intercepto e declividade apenas:
ˆ y x
x x
"
)
!
)
,
onde y e x são desvios em relação à sua média. Disso, podemos deduzir que::
' (2
* *
y x
e e y y
x x
)
) )! $
)
.
Dos dados do problema, temos que:
21 1
1 1 1 1
22 2
2 2 2 2
23 3
3 3 3 3
0, 241,02 e 0,06 ;
0, 460,91 e 0,10 ;
0,300,76 e 0,08 .
y x
x x x x
y x
x x x x
y x
x x x x
)
! !
) )
)
! !
) )
)
! !
) )
Assim, obtemos:
1 1 1 1
2 2 2 2
3 3 3 3
66,67 e y 68,00;
46,00 e 41,86;
46,88 e 35,63;
159,55 e 145, 49.
x x x
x x y x
x x y x
x x y x
) ! !
) )! !
) )! !
) )! !
Assim:
145,49ˆ 0,91
159,55
" ! ! .
Isso difere da declividade de “todas famílias” de 0,86, confirmando nossa conjectura que a
regressão “todas famílias” não continha variáveis dummy que permitisse interceptos
diferentes. Quer dizer, se queremos testar para diferentes declividades apenas, devemos
estimar o " da equação restrita com dummy para os interceptos e declividade comum,
como assumimos para resolver o problema anterior.
Para estimar * *e e) , precisamos computar 1 1 2 2 3 3y y y y y y y y) ) ) )! " " . Para qualquer regressão:
31
' ( ' (
' ( ' (
2
2
2
2
ˆ ˆ , 1,2,3
.
í i
í í i i i
í i
í i
i i i
í i
y x
e e s n k y y i
x x
y x
y y s n k
x x
)
) )! $ ! $ ! -
)
)
) ! " $
)
Logo, temos;
' (
' (
' (
2
1 1
2
2 2
2
68,00 0, 24 100 93,36;
66,67
41,86 0, 46 102 85,01;
46,00
35,63 0,30 24 34, 28;
46,88
212,65.
i i
y y
y y
y y
y y
) ! " !
) ! " !
) ! " !
) !
Dessa forma, obtemos:
2
* *
145,49212,65 80,50
159,55
e e) ! $ ! .
Ou seja, se não avisássemos no enunciado do problema que “todas famílias” é calculado
com uma dummy para cada intercepto, teríamos que realizar todos os cálculos acima, para
obter a soma dos quadrados dos resíduos corretamente, a fim de testar para diferentes
declividades.
Finalmente, estamos prontos para testar que a elasticidade do consumo com relação à renda
é a mesma para todas as classes. Agora, há apenas duas restrições:
1 2 1 2
0 1
2 3 2 3
; ou
: :H H
" " " "
" " " "
1 1! #2 22 2&3 32 2! #2 24 4
.
Fazendo o teste F:
' (
' (
' (
' (95% 99%
80,50 78,12
22, 226 3,05 3,44 2,226 3,7078,12
232 6
F F F
$
/ ! ! /
$
- - .
Portanto, podemos rejeitar a hipótese de declividades comuns ao nível de 5%, mas não ao
nível de 1%.
Estas conclusões estão sujeitas a qualificações, no entanto. Se os dados disponibilizados
tiverem sido arredondados, consideráveis erros podem ter sido introduzidos. Por exemplo,
32
se 
2
ˆ 0,0501"( ! (embora reportado 0,1), então 2 2 180,37x x) ! , não 46,00, como
assumimos. Assim, este exercício deve ser visto como pedagogicamente interessante, em
vez de empiricamente útil.
Para concluir o problema, suponha que aceitemos a hipótese de que as declividades sejam
iguais. Devemos, agora, testar se elas diferem da unidade. As informações que temos são as
seguintes:
2
2 * *
ˆ
0,353ˆ 0,91; 0,353; 0,047
232 4 159,55
e e ss s
x x"
"
)
! ! ! ! ! !
)$
.
O teste t é dado por:
' (2,5%
0,91 1 1,915 226 1,97
0,047
t t$! ! / ! .
Portanto, aceitamos a hipótese nula de que os coeficientes são conjuntamente iguais a 1.
Note que isso contrasta com os resultados obtidos pelo teste individual dos coeficientes,
feitos na resposta principal. O problema de se usar este tipo de teste é que estamos fazendo
um teste sobre outro. Isto é, aceitamos a hipótese de que os coeficientes são iguais; dado
isso, testamos se são iguais a 1. Nesse processo, perdem-se precisão e informação, motivo
pelo qual não recomendamos esse procedimento freqüentemente. Além disso, não é
intuitivoque os coeficiente sejam todos iguais a 1, conforme explicamos na resolução
principal, embora possam ser todos iguais.
33
5. Problemas Econométricos no Modelo Linear Geral
6.1 Suponha o modelo y X" #! " , onde y e # são vetores 1n& , X <∞ é uma matriz
n k& eβ é um vetor 1k& , estimado por MQO com constante. Responda F(also) ou
V(erdadeiro) para cada alternativa e justifique sucintamente:
a. Heterocedasticidade nas perturbações produz estimativas consistentes deβ ;
b. Heterocedasticidade nas perturbações geram estimativas ineficientes;
c. Heterocedasticidade nas perturbações resulta numa matriz de covariância das
estimativas inconsistente;
d. Testes de hipóteses sobre os coeficientes deixam de ser válidos se há
heterocedasticidade.
Solução: Este é um exercício que tenta dirimir dúvidas, dando ao estudante a
oportunidade de voltar aos conceitos básicos e entendê-los melhor.
A resposta do exercício exige que se façam algumas hipóteses não explicitadas no
enunciados. Elas são as seguintes:
i. ' (. . . 0,i i d# O! ;
ii. X é não estocástico.
Com essas hipóteses, podemos responder a questão.
a. Verdadeiro, pois prova-se, como está no corpo do texto, que ' (ˆE " "! ;
b. Verdadeiro, pois ' ( ' ( ' ( ' ( ' (1 11ˆ ˆMQG MQOVar X X Var X X X X X X" " $ $$) ) ) )! O / ! O ;
c. Verdadeiro, decorrente de b.;
d. Verdadeiro, decorrente de b. Aqui, uma consideração. O teste de hipótese usando o
lado direito da igualdade em b. é válido. O problema é que muitos pacotes
econométricos simplesmente calculam como matriz de covariância como (X’X)-1 e não
a matriz de covariância correta.
Maiores detalhes a respeito deste exercício são encontrados em WHITE, H. A
Heteroskedasticity-Consistent Covariance Matrix and a Direct Test for Heteroskedasticity.
Econometrica, vol. 48, n.º 4, 1980.
34
6.2 Suponha um modelo de regressão linear múltiplo em que !β exista, seja não viesado e
eficiente, pois u é homocedástico. Suponha que você imponha falsas restrições sobre os
parâmetros do modelo.
a. Mostre que as estimativas nesse caso são viesadas;
b. Mostre que a variância das estimativas do modelo com restrições é menor do que a
variância das estimativas do modelo sem restrição;
c. Qual a implicação desse resultado em termos de previsão? Qual a intuição desse
resultado?
Sugestão: Lembre o que é EQM, ou seja, o erro quadrático médio.
Solução: O exercício procura ilustrar um caso que não é muito intuitivo, à primeira
vista, ou seja quando se impõem falsas restrições no modelo a variância reduz-se. Isto
é importante para se ter uma primeira intuição do erro quadrático médio, sua
importância e suas conseqüências para a previsão. Às vezes, impondo falsas restrições,
pode-se melhorar a previsão, pois reduz-se o erro de previsão, não obstante o viés
possa aumentar.
a. Primeiramente, note que
' ( ' (
' ( ' (
1 *
11 1
ˆ ˆ ˆ ˆ ˆ; ,
.
sr crX X X Y K r R
K X X R R X X R
" " " " " "$
$$ $
) )! ! ! ! " $
5 6) ) ) )! 7 89 :
10
Daqui podem-se tirar as seguintes conclusões:
' ( ' (
' ( ' (
12
*
ˆ ;
.
Var X X
E K r R
" (
" " "
$)!
! " $
Como ' (*r R E" " "# - # . Portanto, as estimativas são viesadas.
b. Há bastante álgebra neste exercício, mas, com calma, obtém-se a resposta.
 
10 Ver exercício 3.1.c.
35
' (
' ( M N ' (' (' ( ' (
' (
* ˆ ˆ ˆ ˆ
ˆ ˆ ˆ ˆ
A A
Var E Kr KR Kr KR Kr KR Kr KR
E AA
E KR A E I KR I KR
I KR B I
" " " " " " " " "
" " " " " " " "
! !
)5 6 5 6
7 8 7 8! " $ $ $ $ " $ $ $ $ !7 8 7 87 8 7 89 : 9 :
5 6)! !9 :
5 6)5 6 ) )7 8! $ $ $ ! $ $ $ $ !7 8 7 89 : 9 :
! $
*&&&&&&&&&&&&&&+&&&&&&&&&&&&&&, *&&&&&&&&&&&&&&+&&&&&&&&&&&&&&,
' (
' (
2 2
1
,
.
D
KR B BR K KRB KRBR K
B X X
( (
!
$
< =) >? ) ) ) )$ ! $ $ " >? >>?@ A
)!
*&&&+&&&,
Desenvolvendo D, temos:
' ( ' ( ' (
11 1 1
BK
D X X R R X X R R X X R K BR K
$$ $ $
!!
5 6) ) ) ) ) ) ) ) )! !7 89 : *&&&+&&&,*&&&&&&&&&&&&+&&&&&&&&&&&&,
.
Dessa forma, conseguimos:
' ( ' ( ' ( ' (' ( 1* 2 2 2Var B KRB I KR B I KR X X" ( ( ($)! $ ! $ ! $ .
Logo, se ' ( ' (* ˆ0KR Var Var" ". - / . Para ver este último fato, observe que
' ( ' (
11 1
0
T T
R L LR
KR X X R R X X R R
)
$$ $
. ) )
5 6) ) ) )! 7 89 :
*&&&+&&&,
*&&&+&&&, *&&&&&&&&&+&&&&&&&&&,
.
Agora, seja c = Tv, onde c é um vetor 1n& . Sendo assim, c’c = v’T’Tv > 0, como
queríamos demonstrar, pois c’c é um escalar.
c. Mesmo com falsas restrições, as previsões serão melhores se a diminuição da
variância for maior do que o aumento do viés. Formalmente, se EQM* < EQM. A
intuição do resultado é que impor falsos parâmetros significa que haverá menos
parâmetros variando, o que poderia reduzir o erro de previsão.
6.3 Responda:
a. Cite pelo menos dois testes para a hipótese de homocedasticidade;
b. Cite pelo menos um teste para a hipótese de autocorrelação dos resíduos;
c. Em caso de rejeição da hipótese nula em a., por que método você estimaria o modelo?
d. Em caso de rejeição da hipótese nula em b., por que método você estimaria o modelo?
36
Solução: O exercício pretende que o aluno volte ao livro-texto e verifique claramente
que testes ele pode aplicar e de que maneiras ele deve estimar o modelo, em caso de
rejeição da hipótese nula. Com isso, sistematiza-se todo o capítulo. Sugerimos
consultar, adicionalmente, Johnston e Dinardo (1998).
a. Há vários testes que podem ser usados: Breusch-Pagan, White, Goldfeld-Quandt,
Glesjer;
b. Durbin-Watson, ACF, Ljung-Box;
c. Mínimos quadrados generalizados, mínimos quadrados generalizados factíveis;
d. Pode-se usar o método de Cochrane-Orcutt, Durbin ou Variáveis instrumentais.
6.4 (C) Suponha o seguinte e verdadeiro modelo:
, 1, 2, ,t t ty x t T" #)! " ! # ,
porém um econometrista, equivocadamente, estima
, 1, 2, ,t t t ty x z t T" $ #) )! " " ! # ,
onde xt é 1k& e zt é 1m& . Assuma que ' ( ' ( 2, 0, ,E x z E x z I# ## ()! ! . Seja "ˆ o
estimador por MQO do modelo correto. Seja "$ e $$ os estimadores do modelo equivocado.
a. "$ é não viesado para " ?;
b. Compute a matriz de covariância para ' (," $$ $ . Compare o bloco da matriz de
covariância correspondente a "$ com a matriz de covariância de "ˆ . Quando elas são
as mesmas?
Solução: O exercício tem o objetivo de mostrar se variáveis omitidas causam viés.
Sabemos que não, conforme provado no corpo do texto. Por isso, o exercício apenas
busca formalizar melhor os resultados já conhecidos, aplicando-se o Teorema de
Frisch-Waugh-Lovell ou Frisch-Waugh11, entre tantas outras maneiras de resolvê-lo.
Tal teorema pode ser encontrado em livros como DAVIDSON, Russel &
MACKINNON, James G. Estimation and Inference in Econometrics. New York:
Oxford, cap. 1, 1993 ou GREENE, William H. Economic Analysis, 4th. ed. Upper
 
11 Veja exercício 6.1.c, onde se demonstra esse teorema.
37
Saddle River: Prentice Hall, 2000. À propósito, por se tratar de um teorema muito
útil, sugerimos que o mesmo seja apresentado em detalhes para os alunos.
a. Sim, "$ é não viesado. Para ver isso, reescreva o modelo como
( 3 ) 1 1, , ,T k T TY X X Y" # #& & &! " .
Reescreva o modelo equivocado como
( 4 ) 1, ,T m TY X Z Z" $ . .& &! " " .
Agora, pré-multiplique ( 4 ) por ' ( 1zM I Z Z Z Z
$) )! $ , observando que Mz é idempotente
e simétrica. Assim, obtemos,
( 5 ) z z zM Y M X M" .! " .
Pelo Teorema de Frisch-Waugh-Lovell, o " estimado usando-se ( 5 ) é idêntico àquele
usando-se ( 4 ). Agora, note que pré-multiplicando ( 3 ) por Mz, voltaríamos a ( 5 ). Isto é,
se " estimado por ( 3 ) é não viesado, então aquele estimado por ( 5 ) também não o é.
Formalmente, usandoMQO em ( 5 ), conseguimos:
' ( ' (
' ( ' ( ' (
1 1
1
.
z z z z
z z
X M X X M Y X M X X M
E X M X X M E
" " #
" " # "
$ $
$
) ) ) )! ! " -
) )! " !
$
$
Portanto, "$ é não viesado.
b. Podemos estimar o modelo da seguinte forma:
M N
1ˆ
.
ˆ
Y X Z
X X X Z X Y
Z X Z Z Z Y
"
.
$
"
$
$
5 6
7 8! " -7 89 :
5 6 5 6 5 6) ) )7 8 7 8 7 8!7 8 7 8 7 8) ) )7 8 9 : 9 :9 :
Agora, temos que relembrar uma propriedade de inversão de matrizes. Dada a seguinte
matriz:
A B
M
C D
5 6
7 8! 7 89 :
,
então
38
' (1 1 1 1 11
1 1 1
A I BE CA A BE
M
E CA E
$ $ $ $ $
$
$ $ $
5 6" $7 8! 7 8$7 89 :
,
onde E = D – CA-1B.
Então, defina
' (
' ( ' ( ' ( ' (
' ( ' ( ' (
' (
1
11 1 11 1 1
1
1 1 1
1
;
xM
E Z Z Z X X X X Z
A I BE CA X X I X Z Z Z Z X X X X Z Z X X X
X X I X Z Z I X X X X Z Z X X X
X X
$
$$ $ $$ $ $
$
$ $ $
!
$
) ) ) )! $
1 I2 25 62 2) ) ) ) ) ) ) )" ! " $ !3 J7 82 29 :2 24 K
1 I2 25 6< =2 2>?7 82 2>2 2? >) ) ) ) ) ) )! " $ !7 8?3 J>? >2 27 8? >>?2 2@ A7 82 29 :2 24 K
)!
*&&&&&&&+&&&&&&&,
' ( ' (E F1 1 .xI X Z Z M Z Z X X X$ $) ) ) )"
Na primeira regressão, em ( 3 ), ' ( ' ( 12ˆVar X X" ( $)! . Agora,
' ( ' ( ' ( ' ( ' (1 1 1 12 2 xVar X X X X X Z Z M Z Z X X X" ( ($ $ $ $) ) ) ) ) )! "$ .
Portanto, uma condição suficiente para que ' ( ' (ˆVar Var" "! $ é que X’Z = 0, isto é, que X e
Z sejam ortogonais.
39
6. Multicolinearidade
6.1 (C) Considere o modelo
1 1 2 2 , 1, 2, ,t t t ty x x t T" " #) )! " " ! # ,
onde x1t é 1k& e x2t é 1m& . Assuma que ' ( ' ( 21 2 1 2, 0, ,E X X E X X I# ## ()! ! , e
1 2 0X X) ! . Seja "ˆ o estimador por MQO do modelo correto. As variáveis estão em termos
de seus desvios em relação a sua média.
a. Mostre que a único estimador de ' (1 2," " de variância mínima, não viesado e linear
pode ser escrito na forma:
' ( ' (1 11 1 1 1 2 2 2 2,X X X y X X X y" "
$ $) ) ) )! !$ $ .
Note que estes são estimadores de MQO para os modelos 1 1 1 1t t ty x! " #)! " " e
2 2 2 2t t ty x! " #)! " " , respectivamente.
b. 1"$ e 2"$ são estimadores não viesados se 1 2 0X X) # ? Se são, compute o viés de cada
um.
c. Suponha, agora, que 1 2 0X X) # . Seja ' (
1
, 1,2i i i i iM I X X X X i
$) )! $ ! . Qual é a
interpretação de M2X1 e M2y? Mostre que a estimativa de 1" pode ser escrita como
' ( 11 1 2 1 1 2ˆ X M X X M y"
$) )! ,
e similarmente para 2"ˆ . Compute as matrizes de covariância de 1ˆ" e 2"ˆ .
d. Considere o caso onde k = 1, m = 1 e 1 2 0X X) # . Expresse a variância de 1ˆ" como
uma função do coeficiente de correlação amostral entre X1 e X2, 212r . O que acontece
quando 212 1r H ?
Solução: Este problema tem vários objetivos. O primeiro é mostrar as várias maneiras
de se obter as estimativas do modelo. O segundo é mostrar as conseqüências de não se
ter X1 e X2 ortogonais entre si, ou seja, mostrar o viés causado por variáveis omitidas.
Além disso, prova-se parte do importante Teorema de Frisch-Waugh. Finalmente,
mostram-se as conseqüências da multicolinearidade, inclusive graficamente.
a. Vamos reescrever o modelo na forma matricial
40
( 6 ) 1 1 2 2 1 2 1 1, , , ,T TT k T my X X X X y" " # #& && &! " " .
Defina
' ( 1 , 1,2i i i i iM I X X X X i
$) )! $ ! .
Pré-multiplicando ( 6 ) por M2, obtemos:
( 7 ) 2 2 1 1 2M y M X M" #! " .
Por causa do Teorema de Frisch-Waugh-Lovell 1ˆ" estimado por ( 6 ) é idêntico ao 1ˆ" por
estimado por ( 7 )12. Logo,
' ( 11 1 2 1 1 2ˆ X M X X M y"
$) )! .
Como
.
' (
0
1
1 2 1 1 2 2 2 2 1 2 1X M X X X X X X X M X
!
$) ) ) ) ) )! $ - ! ,
então,
' ( 11 1 1 1ˆ X X X y"
$) )! ,
como queríamos demonstrar.
Adotando o mesmo procedimento para 2"ˆ , obtemos
' ( 12 2 2 2ˆ X X X y"
$) )! .
b. Suponha que 1 2X X# , e que 1"$ é estimado usando o modelo 1 1y X " #! " , quando o
verdadeiro modelo é 1 1 2 2y X X" " #! " " . Então,
' ( ' ( M N
' ( ' (
1 1
1 1 1 1 1 1 1 1 1 2 2
1 1
1 1 1 1 2 2 1 1 1 .
X X X y X X X X X
X X X X X X X
" " " #
" " #
$ $
$ $
) ) ) )! ! " " !
) ) ) )! " "
$
Logo
' ( ' ( 11 1 1 1 1 2 2
vies
E X X X X" " "$) )! "$ *&&&&&&&+&&&&&&&, .
Procedendo da mesma maneira,
 
12 Ver demonstração no item c. deste exercício.
41
' ( ' ( 12 2 2 2 2 1 1
vies
E X X X X" " "$) )! "$ *&&&&&&&+&&&&&&&, .
c. Primeiro observe que ' (
2
1
2 2 2 2 2
ˆ
yX
M y y X X X X y
"
$
!
) )! $ *&&&&&&+&&&&&&, é o resíduo da regressão de y
contra X2.
Seguindo o mesmo raciocínio, observe que
' (
1 2
1
2 1 1 2 2 2 2 1
ˆ
X X
M X X X X X X X
"
$ )! $ *&&&&&&+&&&&&&, .
Ou seja, isto é como se regredíssemos cada uma das colunas de X1 contra X2, e depois
calculássemos os resíduos de cada uma da k regressões.
Agora temos que provar que 1 1ˆ ˆ
A B" "! , onde
(A) 1 1 2 2y X X" " #! " " ;
(B) 2 2 1 1 2M y M X M" #! " .
Este é o Teorema de Frisch-Waugh-Lovel que temos usado.
Tomando as condições de primeira ordem de (A), por mínimos quadrados ordinários,
obtemos:
11 1 1 2 1
2 1 2 2 22
ˆ
ˆ
X X X X X y
X X X X X y
"
"
5 65 6 5 6) ) )7 87 8 7 8!7 87 8 7 8) ) )7 89 : 9 :9 :
.
Desenvolvendo essa expressão, chegamos a
' ( ' (1 11 1 1 1 2 2 1 1 1 1 2 1 1 1 2 2
2 1 1 2 2 2 2
ˆ ˆ ˆ ˆ
ˆ ˆ .
X X X X X y X X X y X X X X
X X X X X y
" " " "
" "
$ $12 ) ) ) ) ) ) )" ! - ! $2232 ) ) )" !224
Substituindo a primeira equação na segunda, temos:
' ( ' (
' ( ' (
' (
1 1
1 1
2 1 1 1 1 2 1 1 1 1 2 2 2 2 2 2
1 1
2 1 1 1 1 2 2 2 1 1 1 1
2 1 2 2 2 1
1
2 2 1 2 2 1
ˆ ˆ
ˆ
ˆ
ˆ .
M M
X X X X X y X X X X X X X X X y
X I X X X X X X I X X X X y
X M X X M y
X M X X M y
" "
"
"
"
$ $
$ $
! !
$
) ) ) ) ) ) )$ " ! -
5 6 5 6
7 8 7 8) ) ) ) ) )$ ! $ -7 8 7 8
7 8 7 87 8 7 89 : 9 :
) )! -
) )!
*&&&&&&&&+&&&&&&&&, *&&&&&&&&+&&&&&&&&,
Procedimento análogo dá:
42
' ( 11 1 2 1 1 2ˆ X M X X M y"
$) )! .
Para calcular a variância, note que:
' ( ' ( ' (
' (
' (
' ( ' ( ' ( ' (
1 1
1 1 2 1 1 2 2 1 1 2 1 1 2 1 1 2
1
1 1 1 2 1 1 2
1 1
1 1 12
1 1 2 1 1 2 2 1 1 2 1 1 2 1
ˆ
ˆ
ˆ , e
ˆ .
X M X X M M X M X M X X M
X M X X M
E
Var E X M X X M M X X M X X M X
" " # " #
" " #
" "
" ## (
$ $
$
$ $ $
) ) ) )! " ! " -
) )$ ! -
!
5 6) ) ) ) )! !7 89 :
Analogamente,
' ( ' ( 122 2 1 2ˆVar X M X" ( $)! .
d. Primeiro, do apêndice sabemos que o coeficiente de correlação amostral é dado por:
' (
' (' (
2
1 22
12
1 1 2 2
X X
r
X X X X
)
!
) )
.
Dessa forma,
' ( ' ( ' (
' (
' (' (
' (' (
12
11 1 22 2
1 1 1 1 2 2 2 2 1 1 1
2 2
12
11 22 2 2
1 1 1 1 1 1 1 1 12
1 1 2 2
2
2
1 1 12
ˆ
.
1
X X
Var X X X X X X X X X X
X X
X X
X X X X X X X X r
X X X X
X X r
" ( (
( (
(
$
$$
$
$
5 6)7 85 6) ) ) ) )! $ ! $ !7 87 89 : )7 89 :
5 6)7 8 5 6) ) ) )! $ ! $ !7 8 7 89 :) )7 89 :
!
) $
Ou seja,
' ( ' (' ( ' (212
2
1 12 1
1 1 12
ˆ ˆlim
1 r
Var Var
X X r
(" "
H
! - !L
) $
.
Graficamente, isso significa:
43
Interpretando 1 2 1X M X) como a soma dos quadrados dos resíduos de regressão de cada
coluna de X1 contra X2, podemos ver que, quanto menor os resíduos, maior a ' (1ˆVar " . Os
resíduos serão menores, quanto maior for a colinearidade entre X1 e X2. Assim, se 212 1r H ,
' (1ˆVar " vai para o infinito, e concluímos que o modelo tem variáveis redundantes. Isso
significa que podemos excluir uma das variáveis explicativas do modelo sem perder muita
informação.
6.2 (K) Retirar um variável pode ser uma “solução” paramulticolinearidade? (explique
detalhadamente)
Solução: O exercício procura aguçar a intuição do estudante.
Note, inicialmente, que não existe uma solução para multicolinearidade. Em segundo
lugar, deve estar claro que retirar uma variável pode significar a omissão de variável
relevante, o que resulta no viés de estimação. Porém, se a variável retirada for altamente
correlacionada com outra do modelo, pouca informação se perderia, pois essa outra variável
do modelo já está incorporando a informação da outra que foi retirada. Portanto, quanto
mais correlacionadas forem duas variáveis, menos necessário é que apareçam
simultaneamente no modelo, pois uma contém a informação da outra. É nesse sentido que
retirar uma variável pode ser uma “solução” para multicolinearidade.
' (1ˆVar "
2
1 1X X
(
)
2
12r1
44
6.3 (K) Se x2 é uma função exata de x, defrontar-nos-íamos com exata multicolinearidade se
usássemos x e x2 simultaneamente como regressores. Explique.
Solução: Mais uma vez, o objetivo do exercício é aguçar a intuição do estudante.
A afirmação é falsa, pois não existe uma relação linear entre x e x2. A multicolinearidade é
causada quando há uma relação linear. O próprio nome já leva a pensar isso, pois pontos
colineares são pontos que pertencem à mesma linha (ou reta).
6.4 (K) No modelo de regressão linear clássico, a multicolinearidade poderia resultar em
viés na estimativa de suas variâncias? Explique.
Solução: Este é um exercício bastante sutil, por isso importante.
Afirmação falsa. As variâncias tornam-se grandes, mas suas estimativas também. Isso é
fácil de ser visto, pois variância e estimativas têm (X’X)-1 como fator comum, que fica cada
vez menor à medida que mais perfeita seja a multicolinearidade.
6.5 (K) Suponha um modelo de regressão linear clássico: y x w! " % #! " " " . Muitas
amostras são tais que x e w são correlacionados, porém, por sorte, você observa uma
amostra em que eles são não correlacionados. Então, você regride y contra x e um
intercepto, obtendo *" .
a. *" é não viesado?
b. A estimativa da variância de *" é não viesada?
Solução: Mais um exercício cuja sutileza lapida o conhecimento do estudante,
fazendo-o raciocinar sobre o problema.
a. *" é não viesado, haja vista que x e w são não correlacionados. Basta ver o primeiro
exercício deste capítulo.
b. A variância de *" é viesada, no entanto. Isto ocorre porque a estimativa de 2"( é
viesada para cima. Para ver isso, lembre-se de que s2 é dividido por n – k, onde k
deveria ser igual a 3, mas neste caso, por falta de uma variável, será dividido por (n – k
– 1).
45
7. Econometria das Variáveis de Resposta Qualitativas e
Limitadas
7.1 Escreva o modelo de probabilidade de escolha Probit. Interprete o impacto de uma
modificação em uma variável explicativa.
Sugestão: Consulte GRIFFTHS, William E., HILL, R Carter, JUDGE, George G. Learning
and Practicing Econometrics. New York: Wiley, 1992.
Solução: Apesar do livro texto escrever a função Probit explicitamente, esta é uma
boa oportunidade para entendermos melhor as conseqüências do uso desse modelo.
De acordo com o modelo Probit temos:
' (i iP F X ")! ,
onde ' (iF X ") é a função densidade de probabilidade acumulada, tal que
' (
21 exp
22
iX
i
zF X dz
"
"
-
)
$L
5 6
7 8) ! $7 89 :
P .
A questão agora e derivar essa função com respeito a Xj. Para isso, usamos o teorema de
Leibnitz que diz o seguinte:
' (
' (
' (
' (' ( ' ( ' (' ( ' ( ' (
' (
' (, ,
, ,
A x
A x
B x
B x
F x z dz
F x z
F A x z A x F B x z B x dz
x x
,
,) )! $ "
, ,
P
P .
Como ' (B x !$L , então ' ( 0B x) ! . Além diso, como ' ( ' (,F x z F z! , então
' (,
0
F x z
x
,
!
,
. Logo o resultado da derivada é:
' ( ' (
2
1 exp
22
i
j i j
X
f X
"
" " "
-
5 6)7 8 )$ !7 8
7 89 :
,
onde ' (if X ") é a função densidade de probabilidade.
Podemos, assim, ver que o impacto de uma modificação da variável explicativa dependerá
de ' (if X ") e j" , e não apenas de j" isoladamente, como em modelos lineares.
46
Vamos entender, intuitivamente, o que está ocorrendo. Quanto mais próximo de 1 ou 0
estiver a função densidade de probabilidade acumulada, ' (iF X ") , menores serão os valores
da f.d.p., ' (if X ") . Com isso, a mínima modificação em Xj tem poucas chances de mudar a
decisão. Se ' (iF X ") estiver ao redor de 0,5, então torna-se mais fácil modificar uma
decisão, pois a ' (if X ") estará em seu valor máximo.
Dessa discussão podemos concluir que, dado que ' (if X ") é sempre positiva, o sentido da
modificação dependerá do sinal de j" . Além disso, a magnitude da mudança na
probabilidade, dada uma variação em Xj, é determinada pela magnitude de j" e de
' (if X ") , simultaneamente.
7.2 (C) Em um modelo de escolha discreta Probit, suponha que a utilidade líquida é
' (2, 0,I X N #" # # (! " ! ,
onde
1, se 0
0, c.c.,
D I
D
1 ! 02232 !24
e
' (2, 0, VX V V N# / (! " ! .
Assuma que, na amostra à sua disposição, as observações são independentes entre as
pessoas.
O que pode ser identificado de uma grande amostra de observações de pessoas, quando (dê
as condições precisas):
a. 0/! ?;
b. 0/# ?.
Solução: Este é um exercício simples, apenas exigindo a montagem da função de
verossimilhança para fins estimação.
a. Vamos definir a função de verossimilhança primeiro, para, depois, responder as
questões.
47
I X X X V" # " /! " ! " " .
Logo,
' (
' (
1, se 0 0
0, se 0.
D I X V
D X V
" /
" /
1 ! 0 - " " 02232 ! " " /24
Dessa forma,
' ( ' (' ( ' (
' ( ' (
Pr 1 Pr 0 Pr
Pr .
V V
V V V
XVD X V
X XV
" /
" /
( (
" / " /
( ( (
< =" >? >! ! " " 0 ! 0$ !? >? >>?@ A
< = < =" "> >? ?> >B !Q? ?> >? ?> >> >? ?@ A @ A
Aqui, ' (Q ; representa a função densidade de probabilidade acumulada. É preciso dividir as
expressões pela variância de V, pois os resultados estimados sempre referem-se a uma
normal-padrão.
Então, o modelo Probit fica:
' ( ' (
1
1
1
ii DDn
i i
i V V
X X
L
" / " /
( (
$
!
5 6< = < =" "> >? ?7 8> >! Q $Q? ?> >7 8? ?> >> >? ?@ A @ A7 89 :
C ,
donde obtemos a estimativa
' (
V
" /
(
"
.
Assim, se 0/! , podemos identificar 
V
"
(
.
b. Se 0/# , identificamos ' (
V
" /
(
"
 sem, no entanto, podermos separar 
V
"
(
 de 
V
/
(
.
7.3 (C) Seja ' ( ' ( ' (1 1 2 2, , , , , ,n nY x Y x Y x5 69 :# uma amostra aleatória de n observações, onde xi é
uma variável aleatória escalar, e Yi é variável aleatória de Bernoulli, que assume apenas
dois valores, 0 e 1, com as seguintes probabilidades:
' ( ' (' (
' ( ' (
1 2
1 2
1 2
exp
Pr 1 ;
1 exp
1Pr 0 .
1 exp
i
i
i
i
i
x
Y X
x
Y X
x
) )
) )
) )
"
! !
" "
! !
" "
48
Esse modelo é conhecido como um modelo de resposta binária Logit. É uma alternativa ao
modelo Probit, como já sabemos.
a. Encontre a função esperança condicional de Yi dado X = (x1, x2, ..., xn);
b. Escreva a função log-verossimilhança para esse modelo.
Solução: Este é um exercício que requer apenas os conhecimentos de probabilidade. É
muito importante saber escrever a função log-verossimilhança, por isso a insistência
nesse conceito ao longo dos exercícios propostos.
a. Primeiro, vamos converter o problema em notação matricial, apenas para resolvê-lo de
uma maneira mais geral, mas isso não seria preciso, de fato.
' (
' (
Pr 1 ;
1
1Pr 0 .
1
i
i
i
X
i X
i X
eY X
e
Y X
e
)
)
)
! !
"
! !
"
Agora, é aplicar o operador esperança, simplesmente.
' ( ' ( ' (1 2 1 2 1 2, , , 1 Pr 1 , , , 0 Pr 0 , , ,
.
1
i
i
i n i n i nX
X
E Y x x x Y x x x Y x x x
e
e
)
)
! ; ! " ; ! !
!
$
# # #
b. Como assumimos cada observação independente da outra, temos:
' ( ' (
' ( ' ( ' (
' ( ' ( ' (
1
1 1
1
1
1 1 1
;
1
; ln ; ln 1
ii iii
i i i
ii
i
i
YY XYX
i X X Xi
YXn n
i Xi
i i
n
X
i i
i
eef Y X
e e e
e
L X f Y X
e
l X L X Y X e
))
) ) )
)
)
)
)
) ) )
$
! !
!
< = < =>? >?>! ! -? >?> >>? ?>? @ A" " "@ A
! ! -
"
5 6! ! $ "7 89 :
C C
%
Para completar, fornecemos as condições de primeira ordem.
M N ' (' (
M N ' (' (
1 2
1
1 1 1 2
1 2
2
1 1 1 2
exp
: ;
1 exp
exp
: .
1 exp
n n
i
i
i i i
n n
i i
i i
i i i
x
Y
x
x x
Y x
x
) )
)
) )
) )
)
) )
! !
! !
"
!
" "
"
!
" "
% %
% %
7.4 (K) Suponha que você deseja estimar a curva de demanda por bilhetes de futebol. Você
acredita que a demanda é determinada linearmente por uma séries de fatores, entre os
49
quais o preço do bilhete, o padrão relativo da equipe local e da equipe visitante, a renda
familiar da cidade, a renda total da cidade, etc. Você possui 10 anos de dados, durante
os quais, em várias ocasiões, os bilhetes estiveram esgotados. Qual a sua recomendação
para os dados quando os bilhetes estiveram esgotados?
Solução: Este é problema de dados censurados, em que se procura verificar se o
estudante entendeu a idéia geral para esses casos.
Um jogo cujos bilhetes estavam esgotados reflete uma demanda acima da capacidade dos
lugares. Essas observações devem ser tratadas como observações limites em um modelo
Tobit.
50
8. Sistemas de Equações Simultâneas
8.1 (C) Discuta a identificação e estimação do seguinte modelo de equações simultâneas:
1 12 2 13 3 11 1 13 3 1
2 23 3 22 2 23 3 2
31 1 3 32 2 3 .
t t t t t t
t t t t t
t t t t
y y y x x
y y x x
y y x
$ $ " " #
$ " " #
$ " #
1 " " " " !2222 " " " !3222 " " !24
Aqui não há restrições de covariância. Assegure-se de considerar as condições de ordem e
rank (ou posto, em português) e explicitar as hipóteses de que você precisa para estimar os
parâmetros do modelo.
Solução: Este é um exercício básico para verificar a compreensão do aluno a respeito
do texto principal. Ele treina fartamente as condições de ordem e posto, necessárias à
estimação e identificação do modelo.
Vamos apresentar um método de resolução do problema, não necessariamente único, mas
que entendemos que seja compreensível. Na verdade, depois de entendida técnica é que se
verifica quão fácil é o método de identificação de equações simultâneas. Primeiramente,
vamos montar uma matriz, onde na linha superior estão as variáveis do modelo, endógenas
e exógenas. Na primeira coluna, representam-se as equações. Os zeros da matriz
representam as variáveis excluídas, endógenas ou exógenas. Com isso, podemos obter a
condição de ordem.
1 2 3 1 2 3
1 12 13 11 13
2 23 22 23
3 31 32
1 0
0 1 0
0 1 0 0
y y y x x x
i y
ii y
iii y
$ $ " "
$ " "
$ "
Montada essa matriz, temos que preencher a seguinte tabela:
51
Cond. Ordem Exóg. Excl. End. Incl. – 1 Diagnóstico
i 1 < 2 não identificado
ii 1 = 1 Identificado?
iii 2 > 1 super identificado?
Note que, na matriz, separamos o bloco de endógenas do bloco de exógenas. Contamos as
exógenas excluídas olhando na linha da matriz. Para cada zero em cada linha, no bloco das
variáveis exógenas, temos uma exclusão. Com isso, preenchemos a segunda coluna da
tabela acima.
Depois contamos as endógenas incluídas. Outra vez, olhando em linha, para cada zero
temos uma endógena excluída, portanto o número de endógenas incluídas é o número total
de endógenas menos o número de zeros da linha. No nosso caso, temos três endógenas e, na
segunda linha, não há exclusões. Feito isso, preenchemos a quarta coluna da tabela, sem
esquecer de subtrair 1 do número de endógenas incluídas.
Note que as exógenas excluídas é o K00 do corpo do texto.
Depois disso, preenchemos a coluna três com o sinal apropriado, comparando as colunas 2
e 4. Se o número de endógenas incluídas menos um superar o de exógenas excluídas, não se
identificam os parâmetros daquela equação com certeza, ou seja, a equação é
subidentificada. Se são iguais ou maiores, aquela equação é candidata a identificação exata
ou superidentificação, respectivamente, dependendo da condição de posto a ser discutida a
partir de agora.
Temos que nos preocupar com as equações ii e iii. Para definir a condição de posto, temos
que olhar simultaneamente na linha, procurando os zeros para aquela equação, e a coluna,
para montar a matriz relevante para calcular o posto. Olhando na linha da equação ii o zero
aparece na terceira coluna, abaixo de 1 e acima de 31$ ; depois aparece no bloco das
exógenas, abaixo de 11" e acima de outro zero. Montam-se com esses elementos a matriz
para se calcular o posto:
(ii) 11
31
1
0
"
$
< =>? >? >? >?@ A
.
52
Esta matriz tem posto 2, assumindo que 11 31 0" $ # , ou seja, que nenhum desses parâmetros
seja zero, inclusive porque não seria lógico do contrário.
Utilizando mesmo procedimento para a equação (iii), obtemos a seguinte matriz:
(iii) 12 11 13
231 0
$ " "
"
< =>? >? >? >?@ A
.
No máximo, o posto dessa matriz é 2. Assumimos esse resultado, a menos que 11 0" ! ou
23 0" ! , o que não teria sentido como já dissemos, ou 13 12 23" $ "! . Nesse caso, a equação
iii é super identificada.
8.2 (C) Considere o seguinte modelo de oferta e demanda:
0 1 2
0 1 2
s s
d d
s d
q p w
q p y
q q
! ! ! #
" " " #
1 ! " " "2222 ! " " "3222 !24
,
onde w denota um vetor de observações 1T& a respeito do clima, y é um vetor de
observações da renda de mesma dimensão, ambos exógenos.
a. Discuta a questão de identificação sobre as equações de oferta e demanda;
b. Assumir 2 0! ! impõe alguma restrição sobre os parâmetros da forma reduzida?
Cuidadosamente esquematize um teste 0 2 1 2: 0 : 0H H! !! & # , usando a forma
reduzida dos parâmetros. (Dica: escreva H0 como 0 0:H R qR! );
c. Suponha que a primeira equação é estimada por um estimador de informação limitada,
por exemplo, variáveis instrumentais. Você pode determinar se a primeira equação é
uma curva de demanda ou oferta apenas examinando o sinal de 1! ?;
d. Suponha que uma agência do governo fixe o preço a cada ano em 0tp , o qual pode ser
diferente de ano para ano. Que efeito esta política terá sobre a identificação e
estimação do modelo?
Solução: Este é um exercício que continua o anterior, relembrando e solidificando os
principais conceitos aprendidos no texto principal. Não se trata de um exercício difícil,
embora tenha um grande enunciado.
a. Vamos proceder como no exercício anterior, sem tantas explicações detalhadas.
Primeiro montamos a matriz de coeficientes para as três equações.
53
1 0 2
1 0 2
1
1 0 0
0 1 0
1 1 0 0 0 0
s dq q p w y
i
ii
iii
! ! !
" " "
$ $ $
$ $ $
$
O detalhe aqui é que, embora não explicitamente, o vetor de 1s é uma variável explicativa
também.
Vamos agora preencher a tabela da condição de ordem.
Cond. Ordem Exóg. Excl. End. Incl. – 1 Diagnóstico
i 1 = 1 Identificado?
ii 1 = 1 Identificado?
iii 3 > 1 super identificado?
Agora vamos montar as matrizes para cada equação.
(i) 2
1
2
1 0
"
'
< =$ >? >!? >? >?$@ A
,
onde ' (' ; representa o posto da matriz entre parênteses.
Note que o posto é válido assumindo que 2 0" # . Portanto i é exatamente identificado.
(ii) 2
1
2
1 0
!
'
< =$ >? >!? >? >?$@ A
,
a menos que 2 0! ! . Portanto ii é exatamente identificado.
1 0 2
1 0 2
0
2
0
! ! !
'
" " "
< =$ $ $ >? >!?