Buscar

RESOLUÇÃO-Livro_Series_Temporais__De_Losso_Gabarito pdf

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 109 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 109 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 109 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Econometria de Séries Temporais:
Manual de Soluções
Rodrigo De Losso da Silveira Bueno Juliana Inhasz2.a edição
São Paulo, fevereiro de 2011.
 
1 INTRODUÇÃO
Exercício 1.1 Suponha o seguinte modelo linear: y = X  +", onde y e " são vetores
n  1; X < 1 é uma matriz n  k e  é um vetor k  1.
1. Qual(is) a(s) hipótese(s) necessária(s) para estimar esse modelo por MQO?
2. Qual(is) a(s) hipótese(s) necessária(s) para que o  estimado, ̂ , exista e seja
único?
3. Qual(is) a(s) hipótese(s) necessária(s) para que ̂ seja não viesado?
4. Qual(is) a(s) hipótese(s) necessária(s) para que ̂ seja e…ciente?
5. Qual(is) a(s) hipótese(s) necessária(s) para que se possa fazer inferência es-
tatística?
Solução 1.1Solução 1.1 Este exercício possui dois propósitos. Primeiro, induzir o estudante 
a entender onde exatamente se aplica cada hipótese do modelo de regressão linear 
múltipla, fazendo-o retornar a esses conceitos. Segundo, revisar os conceitos estatís-
ticos de viés e e…ciência, aplicados à Econometria dos Mínimos Quadrados – uma 
boa referência, para o professor, seria WHITE, Halbert. Asymptotic Theory for Asymptotic Theory for 
EconometriciansEconometricians, 2nd. ed. Orlando: Academic Press, 2000. Note que nada é dito
sobre o comportamento do termo aleatório, justamente porque algumas perguntas 
referem-se a seu comportamento.
1. Estimar o modelo por MQO é apenas um método matemático, nada mais. Por-
tanto, apenas necessitamos de uma condição matemática que é r (x) = k , isto
é, que o posto da matriz X seja pleno. Precisamos disso porque, do contrário,
X 0X não seria inversível e, então, não poderíamos estimar o modelo por MQO.
2. Outra vez, apenas necessitamos que r (x) = k, do contrário, não existiria ̂ . A
unicidade é dada justamente porque o posto é pleno. Se X fosse estocástico,
precisaríamos que plim X 
0
X 
n = Q 6= 01.
3. Aqui precisamos de várias hipóteses.
(a) 9̂ 
1 Este item apenas tem sentido em ser perguntado se, em aula, o professor apresentar os resultados
da regressão para X estocástico.
1
 
(b) ̂ é único;
(c) Se X é não estocástico, como assumido neste capítulo, E ("X ) = 0 = E ("),
onde a segunda desigualdade resulta da Lei das Expectativas Iterativas. Se 
X é estocástico, precisamos que plim X 
0"
n = 0.
4. Aqui usamos a hipótese de homocedasticidade. Por isso, podemos concluir que,para ser não viesado, nada precisamos impor sobre a variância dos resíduos.
(a) 9̂ 
(b) ̂ é único;
(c) plim X 
0"
n
 = 0
(d) Se "  (0; ), onde  = 2I , basta estimar o modelo por MQO. Para com-
plementar, mesmo que o professor ainda não tenha dado heterocedastici-
dade, ele poderia dizer que precisamos estimar por um outro método a ser 
aprendido, denominado mínimos quadrados generalizados. Isto é dizer,
 formalmente, que, se  6= 2I , estimamos C 1y = C 1X + C 1";  =
CC 0.
5. Para inferência estatística, admitimos que os erros tenham uma distribuição
Normal e sejam independentes entre si, de onde se seguem todos os resultados 
do capítulo. Se forem normais, mas não independentes, ter-se-ia que estimar 
os parâmetros por mínimos quadrados generalizados, pois, do contrário, as in-
 ferências estatísticas não seriam válidas. Esta é a única hipótese necessária.
Se não admitirmos que os erros têm distribuição Normal, podemos assumir a 
hipótese mais fraca de que são identicamente e independentemente distribuídos,
mas nesse caso os testes somente serão válidos assintoticamente. Em ambos os 
casos, pode-se argumentar que tais hipóteses são muito fortes, a primeira mais 
 forte do que a segunda.
Exercício 1.2 Adão Ismiti queria veri…car se a produtividade do trabalho aumen-
tava com a divisão do trabalho. Para isso, fez a seguinte experiência: regrediu a pro-dutividade ( p) de n trabalhadores de fábricas de al…netes contra o número de funções
exercidas pelo trabalhador (F ), anos de escolaridade (E ), salário (w) e número de
…lhos (N ). Formalmente a regressão foi: pi =  1 +  2F i +  3E i +  4wi +  5N i + ui .
Usando o teste t  Student, Ismiti não rejeitou a hipótese nula de parâmetro igual
a zero para ̂ 3. Retirou a variável E da regressão e estimou o modelo restrito, ob-
servando que ̂ 5 tornou-se, também, estatisticamente não signi…cativo. Finalmente,
retirou N da regressão e estimou o modelo de novo.
2
 
1. Por que não foi preciso fazer o teste de F em ̂ 3, para retirar E do modelo?
Ou seja, por que apenas o teste de t  Student pôde ser feito?
2. Justi…que se o procedimento adotado por Ismiti está correto ou equivocado,
para ter eliminado a variável N do modelo.
Solução 1.2 Solução 1.2 Este exercício é muito ilustrativo e traz um pouco de problemas em-
píricos à tona. Quer-se testar se o estudante entendeu como usar os testes t e F 
corretamente, e evitar que ele cometa o erro de retirar variáveis explicativas, estatis-
ticamente iguais a zero, sequencialmente. O certo é apenas fazer um teste de hipótese 
conjunta e, se for o caso, concluir que tais variáveis não explicam o modelo.
1. A razão para não usar o teste F é que, quando estamos testando apenas um 
parâmetro, o teste t e F se equivalem. Ou seja, pode-se usar um ou outro.
Em geral, nos pacotes econométricos o teste t sai automaticamente, por isso
podemos olhar para ele sem problemas. Vale lembrar que, para um parâmetro
apenas, t2 é equivalente a F (1; n).
2. O procedimento de Ismiti está absolutamente equivocado. O correto seria testar,
conjuntamente, por F , se ̂ 3 e ̂ 5 são, simultaneamente, iguais a zero. A razãoespecí…ca é que no segundo teste, mudou-se o número de graus de liberdade,
por isso o equívoco. Ou, em outras palavras, no segundo teste, o modelo mudou 
em relação ao primeiro.
Exercício 1.3 Suponha um modelo de regressão linear múltiplo em que ̂ exista,
seja não viesado e e…ciente, pois u é homocedástico. Suponha que você imponha
falsas restrições sobre os parâmetros do modelo.
1. Mostre que as estimativas nesse caso são viesadas.
2. Mostre que a variância das estimativas do modelo com restrições é menor do
que a variância das estimativas do modelo sem restrições.
3. Qual a implicação desse resultado em termos de previsão? Qual a intuição
desse resultado?
Sugestão: Lembre o que é EQM, ou seja, o erro quadrático médio.
Solução 1.3 Solução 1.3 O exercício procura ilustrar um caso que não é muito intuitivo, à 
primeira vista, ou seja quando se impõem falsas restrições no modelo a variância 
reduz-se. Isto é importante para se ter uma primeira intuição do erro quadrático
3
 
médio, sua importância e suas consequências para a previsão. Às vezes, impondo
 falsas restrições, pode-se melhorar a previsão, pois reduz-se o erro de previsão, não
obstante o viés possa aumentar.
1. Primeiramente, note que 
^ ^  sr= ^ ^  = (X 0X )1 X X 0Y Y 
^ ^  cr=  
= ^ ^  + K K 

r  R̂ 

K K = (X 0X )1 RR0
h
R (X 0X )1 R0
i1
Daqui podem-se tirar as seguintes conclusões:
VVar ar 

̂ 

= 2 (X 0X )
1
E E ( ) =  + K K (r  R )
Como r
6
= R 
 )
E ( )
6
=  . Portanto, as estimativas são viesadas.
2. Há bastante álgebra neste exercício, mas, com calma, obtém-se a resposta.
VVar ar ( ) =
= E E 
h
̂ + Kr  KR̂    Kr  KR 
i
 | {z } 
=A
h
̂ + Kr  KR̂    Kr  KR 
i
 | {z } 
=A
0
=
= E E [AA0] =
= E E 
h
̂    KR

̂   
i
[A]0 = E E 

(I  KR)

̂   

̂   
0
(I  KR)0

=
= (I  KR) B B (I  KR)0 2=

B  BR0K 0  KRB + KRBR 0K 0
 | {z } =D
!
2
B B = (X 0X )1
Desenvolvendo D D ; temos:
D D =(X 0X )1 R0
h
R (X 0X )1 R0
i1
 | {z } 
=K 
RR(X 0X )1 | {z } 
=B
RR 0K K 0= BR BR 0K K 0
4
 
Dessa forma, conseguimos:
VVar ar ( ) = (B  KRB) 2= (I  KR) B B 2= (I  KR) (X 0X )1 2
Logo, se KR > 0 ) V ar ( ) < V ar

̂ 

. Para ver este último fato, observe 
que 
KR= (X 0X )1 | {z } 
>0
R0
h
R (X 0X )
1 R0
i1
R
 | {z } 
R0L0LR | {z }T 0T 
Agora, seja c = T v, onde c é um vetor nx1. Sendo assim, c0c = v 0T 0T v > 0,
como queríamos demonstrar, pois c0c é um escalar.
3. Mesmo com falsas restrições, as previsões serão melhores se a diminuição da 
variância for maior do que o aumento do viés. Formalmente, se EQM  <
EQM . A intuição do resultado é que impor falsos parâmetros signi…ca que 
haverá menos parâmetros variando, o que poderia reduzir o erro de previsão.
Exercício 1.4 Responda:
1. Cite pelo menos dois testes para a hipótese de homocedasticidade.
2. Cite pelo menos um teste para a hipótese de autocorrelação dos resíduos.
3. Em caso de rejeição da hipótese nula em (1), por que método você estimaria o
modelo?
4. Em caso de rejeição da hipótese nula em (2)., por que método você estimaria
o modelo?
Solução 1.4Solução 1.4 O exercício pretende que o aluno volte ao livro-texto e veri…que clara-
mente que testes ele pode aplicar e de que maneiras ele deve estimar o modelo, em 
caso de rejeição da hipótese nula. Com isso, sistematiza-se todo o capítulo. Sugeri-
mos consultar, adicionalmente, Johnston e Dinardo (1998).
1. Há vários testes que podem ser usados: Breusch-Pagan, White, Goldfeld-Quandt,
Glesjer.
2. Durbin-Watson, ACF, Ljung-Box.
5
 
3. Mínimos quadrados generalizados, mínimos quadrados generalizados factíveis.
4. Pode-se usar o método de Cochrane-Orcutt, Durbin ou Variáveis instrumentais.
Exercício 1.5 Faça os seguintes exercícios:
1. Suponha que P
1
i=0 jxij < 1. Mostre que P
1
i=0 x2i < 1;
2. Prove (ou não) que limn!1
Pn
x=1
1
x
 = 1;
3. Prove (ou não) que limn!1
Pn
x=1
1
x2
 = 1;
4. Prove (ou não) que se
 P
1
i=0 x
2
i < 1, então
 P
1
i=0 jxij < 1.
Solução 1.5 Solução 1.5 1. Pelo enunciado, temos que 
 P
1
i=0 jxij < 1. Como a soma em 
módulo converge para um valor menor que in…nito, devemos então notar que 
cada elemento que forma essa série contribui com valor menor que 1, de forma 
que a mesma converge para algum valor menor que in…nito. Assim, já podemos 
concluir que:
lim
i!1
jxij < 1
Portanto, uma vez que todo elemento em módulo dessa série é menor que 1,
o quadrado de cada um desses elementos também vai ser menor que 1. Isso
nos indica, seguramente, que a soma de tais elementos (ou seja, a série dos 
quadrados de jxij) também é convergente. Outra maneira de provar tal resultado
é notar que:
lim
i!1
jxij < 1
lim
i
!1

x2i
xi 
 < 1
lim
i!1
x2i
jxij
 < 1
Pelo teste da razão vemos que a série converge.
6
 
2. Pelo enunciado, queremos saber limn!1
Pn
x=1
1
x
.
Mas o que é 
tX
x=1
1
x
? Primeiro observe que:
1
x
 >
x+1
Z 
x
1
s
 ds = ln sjx+1x = ln ( x + 1)  ln (x) = ln 1 + 1x
1
x
 > ln

1 +
 1
x

Por polinômio de Taylor encontra-se uma função que se aproxima a ln

1 + 1
x

ln

1 +
 1
x

 =
 1
x
  1
2!  x2 +
 1
3!x3
 
Aplicando
t
Xx=1
1
x
 ao que temos 
tX
x=1
1
x
 >
t+1Z 
1
1
x
 dx = l n (t + 1) :
3. A demonstração pode ser feita através da generalização do item anterior.
4. A demonstração desse item é, senão, apenas o raciocínio contrário ao efetuado
no primeiro item desse exercício. A prova con…rma o resultado enunciado.
1.1 EXERCÍCIOS PARA PROVAS
Exercício 1.6 Prove que uma regressão estimada sem a constante não implica que
os resíduos somarão, necessariamente, zero e que o R2, se calculado como 1  ê`ê
y`yny2
,
pode ser negativo, onde ê = y  X ̂ , em que ̂ é o vetor de parâmetros estimados.
Solução 1.6 Este exercício mostra que o Este exercício mostra que o R2 pode ser negativo, quando a pode ser negativo, quando a 
regressão por mínimos quadrados ordinários é feita sem constante (noteregressão por mínimos quadrados ordinários é feita sem constante (note
que, mesmo com constante, quando estimamos um modelo não linear por que, mesmo com constante, quando estimamos um modelo não linear por 
máxima verossimilhança, podemos ter um máxima verossimilhança, podemos ter um R2 negativo, mas isso é um casonegativo, mas isso é um caso
7
 
raro). Seu objetivo é alertar o estudante que, quando o R2 é negativo, na raro). Seu objetivo é alertar o estudante que, quando o R2 é negativo, na 
regressão por MQO, é porque ele deve acrescentar a constante ao modelo.regressão por MQO, é porque ele deve acrescentar a constante ao modelo.
O motivo é muito sutil e será explicitamente apresentado na resolução. AO motivo é muito sutil e será explicitamente apresentado na resolução. A
primeira parte do exercício procura esclarecer por que os resíduos somam primeira parte do exercício procura esclarecer por que os resíduos somam 
zero, quando há constante.zero, quando há constante.
Dada a regressão y = X  + " temos que:
yi = X i1 1 + X i2 2 + ::: + X ik k + "i; i = 1; 2;:::;n
@ 
nX
i=1
"2i
@ j
=
nX
i=1
(yi  X i1 1  X i2 2  :::  X ik k) X ji = 0; j = 1; 2:::k
Isso não garante que o resíduos somarão zero, pois X ji pode ser diferente de 1, para 
todo i, mesmo quando j = 1. Claramente, se X 1i = 1, para todo i, os resíduos 
somarão zero. Isto …naliza a primeira parte da questão. Sigamos para a segunda 
parte. Lembremos que:
SQT =
n
Xi=1
(yi  y)2 = (yi  y)
0
(yi  y) = y 0y  ny2
SQE = y0y  n
_
ŷ
2
SQR = ê0ê  n
_
ê
2
Note como nada garante que 
_
ê seja zero, e, no cálculo do R2, não incluímos esse 
termo (retorne à fórmula dada no exercício); é por isso que o R2 pode ser negativo.
Note, também, que: yi = ŷi + ê )
X
yi =
X
ŷi +
X
ê ) y =
_
ŷ, apenas quandoX
 ê = 0, o que somente ocorre se o modelo é estimado com constante, como
demonstrado na primeira parte do exercício.
Sabemos, ainda, que y0y = ŷ0ŷ + ê0ê. Com essas informações, temos:
1 
 ê
0
ê
y0y  ny2 = 1 
 y
0
y

ŷ
0
ŷ
y0y  ny2 =
 y
0
y

ny2

y
0
y + ŷ
0
ŷ
y0y  ny2 = 
ny2 + ŷ
0
ŷ
y0y  ny2
Conseqüentemente, se ny2 > ŷ0ŷ ) R2 < 0.
Para ver por que o R2 é positivo quando existe constante, note que se y =
_
ŷ (caso
com constante), temos que -nȳ 2+ŷ’ŷ= 
nX
i=1
(ŷi  y)2  02.
2 Veja a semelhança com a fórmula do SQT.
8
 
Exercício 1.7 Considere o modelo heterocedástico: yij =  +  X i + uij , onde,
X i < 1 é uma matriz ni  k e  é um vetor k  1; ui  N (0; 2i ) , E (uiu j) = 0, j 6= i
, i = 1; 2;:::;m (m > 1), j = 1; 2;:::;n i (ni > 2). Um estimador amostral de 2i é:
s2i =
Pni
j=1(yij y)
2
ni1
 , onde yi =
Pni
j=1 yij
ni
. Determine E (s2i ).
Solução 1.7 O problema é interessante para que o estudante possa começar O problema é interessante para que o estudante possa começar a ver onde a heterocedasticidade se encaixa com relação ao modelo lin-a ver onde a heterocedasticidade se encaixa com relação ao modelo lin-
ear geral. Além disso, o problema não apresenta maiores di…culdades. O ear geral. Além disso, o problema não apresenta maiores di…culdades. O 
propósito do exercício é mostrar uma metodologia para calcular a correçãopropósito do exercício é mostrar uma metodologia para calcular a correção
da variância, quando há heterocedasticidade.da variância, quando há heterocedasticidade.
Solução 1.8 Exercício 1.8 Solução 1.9 Solução 1.8 Exercício 1.8 Solução 1.9 Comecemos com os cálculos básicos. Se 
ui~N (0; 2I ), então E (uij) = 0, 8i; j e E 

u2ij

 = 2i . Assim, de…na 
ui=
niX
j=1
uij
Assim 
yi =  + X i + ui
e 
s2i =
 1
ni  1
niX
 j=1
(uij  ui)2 =
 1
ni  1

 niX
 j=1
u2ij  ni u2i
!
Logo,
E 

s2i

 =
 1
ni  1

E 
"
 niX
 j=1
u2ij
#
 niE 

u2i

!
 =
 1
ni  1

ni
2
i  ni
2i
ni

 = 2i
Exercício 1.9 Exercício 1.9 Suponha o modelo y = X  +", onde y e " são vetores n1, X < 1 é
uma matriz nk, e  é um vetor k1, estimado por MQO com constante. Responda
F(also) ou V(erdadeiro) para cada alternativa e justi…que sucintamente:
1. Heterocedasticidade nas perturbações produz estimativas consistentes de  ;
2. Heterocedasticidade nas perturbaçõesgeram estimativas ine…cientes;
3. Heterocedasticidade nas perturbações resulta numa matriz de covariância das
estimativas inconsistente;
9
 
4. Testes de hipóteses sobre os coe…cientes deixam de ser válidos se há hetero-
cedasticidade.
SolSoluçãução 1.10 Este o 1.10 Este é é um um exeexerrcíccício io que que tententa ta dirdirimiimir r dúvdúvidasidas, , dandando do aoao
estudante a oportunidade de voltar aos conceitos básicos e entendê-losestudante a oportunidade de voltar aos conceitos básicos e entendê-los
memelholhor. r. A A rrespespostosta a do do exexerercíccício io exexige ige que que se se façfaçam am algalgumumas as hiphipóteótesesses
não explicitadas no enunciado. Elas são as seguintes:não explicitadas no enunciado. Elas são as seguintes:
 "  i:i:d:(0; );;
 X é não estocástico. é não estocástico.
Com essas hipóteses, podemos responder a questão.Com essas hipóteses, podemos responder a questão.
1. Verdadeiro, pois prova-se que E 

̂ 

 =  ;
2. Verdadeiro, pois V ar

̂ M QG

 = (X 01X ) < V ar

̂ M QO

 = (X 0X )1 X 0X (X 0X )1;
3. Verdadeiro, decorrente de b.;
4. Verdadeiro, decorrente de b. Aqui, uma consideração. O teste de hipótese 
usando o lado direito da igua ldade em b. é válido. O problema é que 
muitos pacotes econométricos simplesmente calculam como matriz de co-
variância como (X 0X )1 e não a matriz de covariância correta. ( MaioresMaiores
detalhes a respeito deste exercício são encontrados em WHITE,detalhes a respeito deste exercício são encontrados em WHITE,
H. H. A A HeterHeteroskeoskedasticdasticity-City-Consisonsistent tent CovaCovarianriancce e MatrMatrix ix and and a a 
DirDirecect t TTest est for for HeterHeteroskeoskedasticity.Ecdasticity.Econometriconometrica, a, vol. vol. 48, 48, n.n.o 4,4,
1980.)1980.)
Exercício 1.10 Suponha um modelo de regressão linear múltiplo em que ̂ exista,
seja não viesado e e…ciente, pois u é homocedástico. Suponha que você imponha
falsas restrições sobre os parâmetros do modelo.
1. Mostre que as estimativas nesse caso são viesadas.
2. Mostre que a variância das estimativas do modelo com restrições é menor do
que a variância das estimativas do modelo sem restrição.
3. Qual a implicação desse resultado em termos de previsão? Qual a intuição
desse resultado? Sugestão: Lembre o que é EQM, ou seja, o erro quadrático
médio.
10
 
Solução 1.11 O exercício procura ilustrar um caso que não é muito in- O exercício procura ilustrar um caso que não é muito in-
tuitivo, à primeira vista, ou seja quando se impõem falsas restrições notuitivo, à primeira vista, ou seja quando se impõem falsas restrições no
momodelo delo a a varivariância reância reduz-sduz-se. e. Isto é Isto é impimportaortante nte pparara a se se ter ter uma primeiruma primeira a 
intuição do erro quadrático médio, sua importância e suas conseqüênciasintuição do erro quadrático médio, sua importância e suas conseqüências
pparara a a a prprevisãevisão. o. Às Às vezesvezes, , impimpondo falsas ondo falsas rrestrestriçõições, es, ppoode-sde-se e melhmelhororar ar 
a previsão, pois reduz-se o erro de previsão, não obstante o viés possa a previsão, pois reduz-se o erro de previsão, não obstante o viés possa 
aumentar.aumentar.
1. Primeiramente, note que 
̂ sr = ̂ = (X 
0X )1 X 0Y 
̂ cr =  
 = ̂ + K 

r  R̂ 

K = (X 0X )1 R0
h
R (X 0X )1 R0
i1
Daqui podem-se tirar as seguintes conclusões:
V ar

̂ 

 = 2 (X 0X )1
E ( ) =  + K (r  R )
Como r 6= R ) E ( ) 6=  . Portanto, as estimativas são viesadas.
2. Há bastante álgebra neste exercício, mas, com calma, obtém-se a resposta.

V ar ( ) = E 
h
̂ + Kr  KR̂    Kr  KR 
i
 | {z } 
=A
h
̂ + Kr  KR̂    Kr  KR 
i
 | {z } 
=A
0
= E [AA0] =
= E h
^
    KR
^
   i [A]
0
= E (I  KR)
^
   
^
   
0
(I  KR)
0
 =
= (I  KR) B (I  KR)0 2 =

B  BR 0K 0  KRB + KRBR 0K 0 | {z } 
=D
!
2
B = (X 0X )
1
11
 
Desenvolvendo D temos:
D = (X 0X )1 R0
h
R (X 0X )1 R0
i1
 | {z } 
=K 
R(X 0X )1 | {z } 
=B
R0K 0 = BR0K 0
Dessa forma, conseguimos:
V ar ( ) = (B  KRB) 2 = (I  KR) B2 = (I  KR) (X 0X )1 2
Logo, se KR > 0 ) V ar ( ) < V ar

̂ 

. Para ver este último fato, observe 
que 
KR = (X 0X )1 | {z } 
>0
R0
h
R (X 0X )1 R0
i1
R
 | {z } 
R0L0LR | {z } 
T 0T 
Agora, seja c = T v, onde c é um vetor nx1. Sendo assim, c0c = v 0T 0T v > 0,
como queríamos demonstrar, pois c
0
c é um escalar.
3. Mesmo com falsas restrições, as previsões serão melhores se a diminuição da 
variância for maior do que o aumento do viés. Formalmente, se EQM  <
EQM . A intuição do resultado é que impor falsos parâmetros signi…ca que 
haverá menos parâmetros variando, o que poderia reduzir o erro de previsão.
Exercício 1.11 Responda:
1. Cite pelo menos dois testes para a hipótese de homocedasticidade.
2. Cite pelo menos um teste para a hipótese de autocorrelação dos resíduos.
3. Em caso de rejeição da hipótese nula em a., por que método você estimaria o
modelo?
4. Em caso de rejeição da hipótese nula em b., por que método você estimaria o
modelo?
Solução 1.12 O exercício pretende que o aluno volte ao livro-texto e ver- O exercício pretende que o aluno volte ao livro-texto e ver-
i…que claramente que testes ele pode aplicar e de que maneiras ele devei…que claramente que testes ele pode aplicar e de que maneiras ele deve
esestimtimar ar o o momodedelolo, , em em ccasaso o de de rrejeejeiçãição o da da hihippótótesese e nunula. la. CoCom m isissoso,,
sistematiza-se todo o capítulo. Sugerimos consultar, adicionalmente, John-sistematiza-se todo o capítulo. Sugerimos consultar, adicionalmente, John-
ston e Dinardo (1998).ston e Dinardo (1998).
12
 
1. Há vários testes que podem ser usados: Breusch-Pagan, White, Goldfeld-Quandt,
Glesjer;
2. Durbin-Watson, ACF, Ljung-Box;
3. Mínimos quadrados generalizados, mínimos quadrados generalizados factíveis;
4. Pode-se usar o método de Cochrane-Orcutt, Durbin ou Variáveis instrumentais.
2 FUNDAMENTOS ESTATÍSTICOS
Exercício 2.1 Considere verdadeira a seguinte a…rmação: Seja fZ tg uma sequência
de variáveis aleatórias i.i.d N (0; 1), então fZ tg é (estritamente) estacionária.
1. Qual a hipótese básica do resultado acima? Por quê?
2. Pode-se a…rmar que estacionaridade é um reforço à hipótese de distribuição
idêntica?
3. Pode-se a…rmar que a hipótese de estacionaridade sobre uma série qualquer émais fraca do que a hipótese i.i.d.? Por quê?
Solução 2.1Solução 2.1 Este é um exercício para veri…car se o aluno entendeu o uso e a ne-
cessidade do conceito de estacionaridade, fundamental no tratamento de séries tem-
porais.
1. A hipótese de independência é crucial. Se fZ tg é simplesmente identicamente 
distribuída como normal-padrão, a sequência não é, necessariamente, esta-
cionária, pois é possível construir diferentes distribuições conjuntas com dis-
tribuições marginais normal. Se a distribuição conjunta muda com o tempo,
poderíamos violar a condição de estacionaridade, preservando a normalidade 
marginal.
2. Assim, estacionaridade é uma hipótese mais forte à distribuição idêntica, já 
que ela se aplica a distribuições conjuntas e marginais simultaneamente.
3. Por outro lado, estacionaridade é uma hipótese mais fraca do que a hipótese 
i.i.d., já que sequências i.i.d. são estacionárias, mas sequências estacionárias 
não precisam ser independentes necessariamente.
13
 
Exercício 2.2 De…na Processo Estocástico e ilustre gra…camente. Explique o que
é a realização de um processo estocástico e por que as séries econômicas podem ser
entendidas como sendo geradas por processos estocásticos.
Solução 2.2 Solução 2.2 Este é um exercício para reforçar os conceitos introdutórios apresen-
tados em aula. Aqui, somos mais formais e detalhistas que o texto, pois esperamos 
que o estudante tenha curiosidade su…ciente para consultar outras fontes sobre este 
assunto.
Seja uma sequência temporal de valoresque não podem ser previstos, mas com 
probabilidades que podem ser associadas a cada um dos diferentes valores a qualquer 
tempo particular, temos então um processo estocástico.
Formalmente: suponha-se um determinado espaço amostral de um dado exper-
imento. Considere-se, também, os possíveis subconjuntos desse espaço amostral.
Além disso, associe-se a cada um desses eventos uma probabilidade. De…nindo-se 
a função X (; ) : S  T ! <, onde S representa o espaço amostral e T , o tempo,
ter-se-á um processo estocástico.
Para cada t 2 T , X (; t), tem-se uma variável aleatória no espaço amostral, isto
é, no tempo de…nido, existe uma distribuição de probabilidade para aquela variável.
Para cada s 2 S , X (s; ), tem-se uma função de t que se chama realização de um processo X (s; t), para dado s e t, é apenas um número real.
O problema prático que nos defrontamos é termos apenas a realização de um 
processo estocástico para cada período de tempo, dos quais teríamos que deduzir os 
valores da média e variância em cada instante de tempo, bem como das covariâncias.
Mas, obviamente, dado que temos menos observações do que o número de informação
que gostaríamos de obter, temos que impor restrições razoáveis que nos permitam 
trabalhar com a série disponível.
As séries de tempo podem ser decompostas em quatro elementos: tendência, ci-
clo, sazonalidade e componentes irregulares. Tendência, ciclo e sazonalidade não
serão simples funções determinadas do tempo. Ao contrário, é típico encontrar-se 
elementos estocásticos nesses componentes. Por isso, séries econômicas podem ser 
entendidas como sendo geradas por processos estocásticos. É por isso, também, que 
se pode dizer que uma série de tempo é uma coleção de observações geradas sequen-cialmente no tempo.
Exercício 2.3 Por que se impõem restrições sobre a heterogeneidade temporal e
sobre a memória de um processo estocástico?
Solução 2.3 Solução 2.3 Este exercício veri…ca se o aluno compreendeu o problema que existe 
em estimar séries temporais, indo aos pontos fundamentais da questão. Um processo
14
 
estocástico é temporalmente heterogêneo, o que signi…ca que possui momentos distin-
tos a cada instante de tempo (pois o processo gerador daquele evento pode ser diferente 
a cada instante de tempo, como já se viu). Disso, surge uma grande di…culdade para 
modelar fenômenos reais porque, usualmente, temos apenas uma observação para 
cada t.
Em outras palavras, temos que estimar um número de parâmetros maior que 
o número de observações, o que é impossível. Por isso, temos que impor certas 
restrições para reduzir o número de parâmetros a serem estimados. Essas recaem 
sobre a heterogeneidade temporal e sobre a memória do processo.
i. Restrições sobre a heterogeneidade temporal – reduz o número de parâmetros 
a serem estimados. Implica estacionaridade fraca ou restrita. Por exemplo,
estabiliza num mesmo nível a média e a variância, assumindo que todas as 
observações têm mesma média e mesma variância;
ii. Restrições sobre a memória – espera-se que a dependência entre x (t1) e x (t2)
enfraqueça conforme a distância t2  t1 cresça. Para isso, usamos a seguinte 
de…nição:
Um processo estocásticofu (t) ; t 2 T g é dito assintoticamente não correlacionado
se existe uma sequência de constante f ( ) ;   1g, de…nidas por 

Cov [u ( ) ; u ( + t)]p 
V ar [u ( )] V ar [u ( + t)]
   ( ) ; 8t 2 T 
tal que 
i. 0   ( )  1
ii.
1X
 =1
 ( ) < 1 ) lim
 !1
 ( ) = 0
Com isso, podemos fazer inferências estatísticas, a partir de nossas estimativas.
Exercício 2.4 Qual a diferença entre estacionaridade forte (ou estrita) e estacionar-
idade (fraca)? Construa exemplos mostrando quando uma implica a outra, e quando
uma não implica a outra.
15
 
Solução 2.4Solução 2.4 Neste exercício, o resultado mais importante é mostrar que estacionar-
idade forte não implica estacionaridade fraca, como o nome poderia sugerir. Esta-
cionaridade forte (ou estrita) implica que a função de probabilidade acumulada con-
 junta da série é igual para qualquer instante de tempo. Formalmente isso signi…ca:
F X (t1);X (t2);:::;X (tn) (x1; x2;:::;x n) = F X (t1+k);X (t2+k);:::;X (tn+k) (x1; x2;:::;x n)
onde 
F () é a função densidade de probabilidade acumulada,
X () é uma variável aleatória,
x () é a realização dessa variável.
Estacionaridade fraca implica que os momentos da série até ordem m são coin-
cidentes a cada instante, isto é:
E E [fX (t1)gm1 ; fX (t2)gm2 ;:::; fX (tn)gmn ]
= E E [fX (t1 + k)gm1 ; fX (t2 + k)gm2 ;:::; fX (tn + k)gmn ]
Se, por exemplo, x (ti) tem uma distribuição de Cauchy, não terá momentos 
 …nitos, porque logo o primeiro momento, m1 não existe. Mas a função densidade 
de probabilidade conjunta é invariante com relação ao tempo. Neste caso, então,
estacionaridade forte (ou estrita) não implica estacionaridade fraca.
Por outro lado, se x (ti)
d
6= x (ts), s 6= i onde 
d
6= signi…ca distribuição diferente,
os momentos de x (ti) são iguais aos de x (ts), então existe estacionaridade, mas 
não haverá estacionaridade forte se a distribuição conjunta não for invariante com 
relação a t.
Se os momentos de xt existem até ordem 1, estacionaridade estrita implica esta-
cionaridade fraca até ordem 1. Para ver isso, note que:
E E [fX (t1)g ; fX (t2)g ;:::; fX (tn)g]
= E E [fX (t1 + k)g ; fX (t2 + k)g ;:::; fX (tn + k)g]
logo para n = 1 e k = 1, temos 
E [X (t1)] = E [X (t2)] ) E [X (t2)] = E [X (t3)]
Assim, por indução:
E [X (t1)] = E [X (t2)] =    = E [X (tn)]
Para n = 2 e k = 1, temos 
E [X (t1) ; X (t2)] = E [X (t2) ; X (t3)]
16
 
e por indução, concluímos que pela estacionaridade fraca.
Para n = 2 e k = 2, temos 
E [X (t1) ; X (t2)] = E [X (t3) ; X (t4)] = E [X (t2) ; X (t3)]
e por indução, concluímos pela estacionaridade fraca.
Repetindo sucessivamente esse procedimento, provamos a a…rmação.Se fxtg é um processo gaussiano (= normal), então essa sequência é estritamente 
estacionária, pois é completamente caracterizada pelos dois primeiros momentos.
Exercício 2.5 Responda:
a. Mostre algebricamente como um processo AR(2), com raízes fora do círculo
unitário, é expresso como um M A(1).
b. Escreva um M A (1) sob a forma de um AR(1)
c. Por que as raízes do processo M A devem estar fora do círculo unitário?
Solução 2.5 Solução 2.5 O exercício treina, algebricamente os conceitos estudados. Trata-se de 
entender que toda série de tempo, se inversível ou estacionária, pode ser reduzida a 
um processo com coe…cientes …nitos, mesmo que o número de termos seja, inicial-
mente e aparentemente, in…nito.
a. Seja yt = 1yt1 + 2yt2 + "t, então temos:
yt

1  1L  2L2

 = "t ) yt =
 "t
(1  b1L) (1  b2L)
; em que 
1 = b1 + b2
2 = b1b2
Notando que 
(1  biL)1 = 1 + biL + biL2 + :::
por se tratar de uma progressão geométrica in…nita de razão, em módulo, menor 
do que um,
temos:
yt =
1X
 j=1
b j1"t j
(1  b2L)
Logo yt é um MA (1).
17
 
b. Seja yt = "t1 + "t
yt
1  L = "t ) yt =

1 + L + 2L2 + :::

"t )
yt = 
1
Xi=1
iLi + "t ) yt = AR (1)
c. As raízes do processo de médias móveis devem estar fora do círculo unitário
para que o processo yt seja unicamente identi…cado e inversível.
Exercício 2.6 Considere o modelo M A(1)
yt =  + "t + "t1; jj > 1.
Inverta-o e mostre ser um AR (1) do tipo:
yt   = 
1X
 j=1
() j (yt+ j  ) + "t1:
Interprete.
Solução 2.6 Solução 2.6 Seja yt = "t1 + "t . Então,
yt
1  L = "t ) yt =

1 + L + 2L2 + :::

"t )
yt = 
1X
i=1
iLi + "t ) yt = AR (1)
Exercício 2.7 Considere o seguinte modelo ARMA (1; 1):
yt = yt1 + "t  "t1;
"t  i:i:d: 0; 
2
 :
Determine as condições de estacionaridade e invertibilidade. De…na as condições
para obter um ruído branco temporalmente dependente.
Solução 2.7 Solução 2.7 Estacionaridade: jj < 1. Invertibilidade jj <1. Ruído branco tem-
poralmente dependente:  =  e jj < 1 (se jj > 1, então o modelo não poderá ser 
estacionário).
18
 
Exercício 2.8 Considere o seguinte modelo ARMA (1; 1):
yt = yt1 + "t  "t1;
"t  i:i:d:

0; 2

:
Se  =  e
 j

j
 > 1, então yt é instável ou não estacionário. Explique. (Dica:
desenvolva o modelo recursivamente).
Solução 2.8 Solução 2.8 
yt = yt1 + "t  "t1 =
=  (yt2 + "t1  "t2) + "t  "t1 =
= 2yt2 + "t + (  ) "t1  "t2 =
=    =
= t+ j y j + (  )
t+ jX
s=1
s1"ts + "t:
Se j
 ! 1
; o termo (

)
P
t+ j
s=1 
s1"ts
 !
 0. Porém, qualquer pequena pertur-
bação em y j+1 faz a série explodir. Isso necessariamente ocorre, porque o termo "t
 …ca solto. Assim, suponha o momento em que t =  j + 1, com y j = 0, nesse caso
temos:
y j+1 = 
1y j + " j+1 = " j+1:
Portanto, se " j+1 6= 0, e como
yt = 
t+ j1y j+1 + (  )
t+ j1X
s=1
s1"ts + "t;
a série será explosiva.
Claro é que se jj < 1, então o modelo converge para um ruído branco, pois,
nesse caso, t+ j1y j+1 ! 0.
Exercício 2.9 Veri…que se os modelos abaixo são estacionários e/ou inversíveis, em
que L é o operador defasagem.
a. (1  L) yt = (1  0; 5) "t
b. (1 + 0; 8L) yt = (1  1; 2L) "t
c. (1  0; 7L + 0; 4L2) = (1  0; 5L) "t
19
 
d. (1  0; 7L  0; 4L2) = (1  1; 6L + 0; 7L2) "t
e. (1 + 0; 9L) yt = (1 + 0 ; 5L + 0; 4L2 + 0; 3L3) "t
Solução 2.9 Solução 2.9 Este é um exercício numérico para veri…car se o aluno compreendeu os 
conceitos de estacionaridade e inversão. O principal é entender as expressões fora e 
dentro do círculo unitário, pois devem ser cuidadosamente entendidas. Às vezes fora 
e dentro do círculo unitário representam a mesma coisa, conforme esteja de…nida a 
polinomial, pela qual se calculam as raízes da equação a diferenças.
a. Primeiro é preciso entender que L é um operador, logo não se podem fazer 
contas usando L. Nesse caso, o truque é simples: troque L por uma variável 
qualquer, digamos, z. Assim temos,
1  z = 0 ) z = 1, logo não é estacionário.
1  0; 5z = 0 ) z = 2, logo como z está fora do circulo unitário, o processo é 
inversível.
b. 1 + 0; 8z = 0 ) z = 1; 25, outra vez, por ser, em módulo, maior que 1, o
processo é estacionário.
1  1; 2z = 0 ) z = 5
6
 < 1, logo não inversível 
c. 1  0; 7z + 0; 4z2 = 0: Fazendo z = 1
x
, temos x2  0; 7x + 0; 5 = 0 o que nos 
dá as seguintes raízes:

 x1 =
 0;7+1;05i
2
x2 =
 0;71:05i
2

. O módulo de um número complexo
a + bi é dado por 
 p 
a2 + b2. Ambas as raízes terão o mesmo módulo, dado por:p 
0; 72 + 1; 052 = 1; 262 > 1. Assim, estando o módulo fora do círculo unitário
(como invertemos as variáveis, temos que inverter o raciocínio), o processo é 
estacionário.
1  0; 5z = 0 ) z = 2 > 1, então o processo é inversível.
d. 1
 
 0; 7z
 
 0; 4z2 = 0. Adotando o mesmo procedimento do item anterior,
encontramos  x1 = 1; 0728x2 = 0; 3728
 :Ora, a segunda raiz está dentro do círculo
unitário, logo o processo é não estacionário.
1  1; 6z + 0; 7z2 = 0. A inversa das raízes é x = 1;61;05i
2
 ;cujo módulo é dado
por 
 p 
1; 62 + 1; 052 = 1; 914 > 1, ou seja, o processo é inversível.
20
 
e. 1 + 0; 9z = 0 ) z =  10
9
 > 1 ) estacionaridade
1 + 0; 5z + 0; 4z2 + 0; 3z3 = 0:As raízes perfazem 
(
 z1 = 1; 597
z2 = 0; 132 + 1; 438i
z3 = 0; 132  1; 438i
)
:
Essas raízes estão obviamente fora do círculo unitário, logo a condição de in-
versibilidade está satisfeita 3.
Exercício 2.10 Calcule as autocorrelações dos modelosMA(2), AR(2) e ARMA(1; 1).
Solução 2.10 Solução 2.10 Seja um processo MAMA(2 2 ) dado por yt = 1"t1 + 2"t2 + "t
 j =
8
>>>>>>>>><
>>>>>>>
>>:
E [(1"t1 + 2"t2 + "t) (1"t1 + 2"t2 + "t)]
= 2

1 + 21 + 
2
2

; j = 0
E [(1"t1 + 2"t2 + "t) (1"t2 + 2"t3 + "t1)]
= 2 (1 + 12) ; j = 1
E [(1"t1 + 2"t2 + "t) (1"t3 + 2"t4 + "t2)]
= 22; j = 2
E [(1"t1 + 2"t2 + "t) (1"t j1 + 2"t j2 + "t j)]
= 0; j > 2:
Consequentemente, a função de autocorrelação é dada por:
 j =
8
>>>><
>>>>:
 0
 0
= 1; j = 0
 1
 0
= (1+12)
(1+21+22)
; j = 1
 2
 0
= 2
(1+21+22)
; j = 2
 j
 0
= 0; j > 2:
Seja um processo ARAR(2 2 ) dado por yt = c + 1yt1 + 2yt2 + "t
Pode-se calcular a esperança não condicional de yt:
E (yt) = c + 1E (yt1) + 2E (yt2) + E ("t) =)
E (yt)   =
 c
1  1  2 :
Dada a esperança não condicional do processo, é conveniente reescrevê-lo de outra 
 forma, a …m de tornar alguns cálculos mais fáceis:
yt   = 1 (yt1  ) + 2 (yt2  ) + "t:
3 O cálculo de um p olinômio do terceiro grau não é simples. Sugiro usar um programa como
Mathematica ou Matlab para obter o resultado.
21
 
Multiplicando ambos os lados dessa equação por (yt j  ) e tomando a esper-
ança, e como (yt j  ) não contém qualquer elemento correlacionado com "t, se 
 j > 0, tem-se que:
E (yt  ) (yt j  ) = 1E (yt1  ) (yt j  ) +
+
2
E (y
t

2 
) (y
t

 j 
) + E ["
t
 (y
t

 j 
)] :
Logo, por de…nição, encontra-se:
 j = 1 j1 + 2 j2; j = 1; 2;:::
Ou seja, a autocovariância segue um processo auto-regressivo de ordem 2 2 . Para 
calcular a função de autocorrelação, é preciso apenas dividir a equação anterior por 
 0:
 j = 1 j1 + 2 j2; j = 1; 2;:::
Esse conjunto de equações está contido na família mais geral, conhecida como
equações de Yule-Walker.
Pode-se usar a equação anterior para calcular a função de autocorrelação desse 
processo:
 j = 1 : 1 = 1 + 21 =) 1 =
 1
1  2
;
 j = 2 : 2 = 11 + 2 =
 21
1  2
+ 2;
 j = s : s = 1s1 + 2s2:
Seja um processo ARMA (1; 1):
yt = 1yt1 + "t  1"t1:
O problema é calcular a autocovariância desse processo.
 0 = E (1yt1yt + "tyt + 1"t1yt) = 1 1 + 
2 + 1 (1 + 1) 
2;
 1 = E (1yt1yt1 + "tyt1 + 1"t1yt1) = 1 0 + 1
2;
 2 = E (1yt1yt2 + "tyt2 + 1"t1yt2) = 1 1;
...
 h = E (1yt1yth + "tyth  1"t1yth) = 1 h1:
22
 
Resolvendo as duas primeiras equações simultaneamente resulta:
 0 =
 1 + 21 + 211
1  21
2;
 1 =
 (1 + 11) (1 + 1)
1  
2
1
2;
 2 = 1 1;
...
 h = 
h1
1  1:
Consequentemente obteremos as autocorrelações:
0 =
  0
 0
= 1
1 =
  1
 0
=
 1 + 21 + 211
(1 + 11) (1 + 1)
;
2 =
  2
 0
= 11;
...
h =
  h
 0
= h11 1:
Exercício 2.11 Considere o seguinte processo estocástico:
Y t = Y t1 + "t; "t  i:i:N (0; 1) ; Y 0 = 0 (1)
onde  pode assumir os seguintes valores: 1; 0; 0; 9; 0; 5. Simule 1000 séries (com
100 observações cada) para cada um dos parâmetros teóricos de , estime-os em
seguida por MQO. Comente as propriedades do estimador.
Solução 2.11Solução 2.11 Sugestões:
Gere 150 observações aleatórias e elimine os 50 primeiros valores da série simu-lada.
Altere o valor inicial Y 0 de 0 para 10 e observe como os valores críticos se alteram 
(a 1%, 5% e 10%).
Utilizando os mil parâmetros estimados, faça o histograma de ̂1 para 1; 0; 0; 9;
0; 5.
O objetivo deste exercício é fazer com que o aluno perceba como o grau de assime-
tria do estimador de  varia a medida que seu valor teórico se aproximda de 1. Um 
23
 
segundo objetivo é habituar o aluno à programação de experimentos de Monte Carlo.
Quanto ao valor inicial, resultados (i.e., grau de assimetria) não deveriam se alterar 
signi…cativamente (possíveis diferenças devido ao gerador de números aleatórios).
Vários softwares podem ser utilizados; a seguir apresentamos uma forma de fazê-
lo no E-Views 5.1.
’CRIA work…le 
wfcreate u 10000 
’DEFINE número de séries simuladas (!s)
!s = 10000 
series pp_test = 0 
’LOOP 
 for !i =1 to !s 
’CRIA termo aleatório
smpl @…rst @…rst+150 
series eps = nrnd 
series y = 0 
’CRIA séries AR(1), neste caso phi=1
smpl @…rst+1 @…rst+150 
y = y(-1)+ eps 
’DESCARTA as 50 primeiras observações 
smpl @…rst+50 @…rst+150 
’ESTIMA phi 
equation temp.ls d(y) y(-1)
smpl @all 
’OBTENHO a estatística t do parâmetro
pp_test(!i) = (temp.@tstat)(1)
’OUTRA possibilidade para visualizar a assimetria 
’pp_test(!i) = 150*c(1)
’LOOP ends 
24
 
next 
’MOSTRA resultados em histograma 
smpl @…rst @…rst+ !s 
pp_test.hist 
2.1 EXERCÍCIOS PARA PROVAS
Exercício 2.12 Qual a razão de se impor restrições sobre a heterogeneidade tem-
poral e sobre a memória de um processo estocástico?
Solução 2.12 Este exercício veri…ca se o aluno compreendeu o problema Este exercício veri…ca se o aluno compreendeu o problema 
que que exiexiste ste em em estestimaimar r sérséries ies temtemppororaisais, , indindo o aos aos ppontontos os funfundamdamententaisais
da da questão. questão. Um proUm proccesso esso estoestocáscástico é tico é temptempororalmente almente heterheteroogênegêneo, o, o o queque
signi…ca que possui momentos distintos a cada instante de tempo (pois,signi…ca que possui momentos distintos a cada instante de tempo (pois,
o processo gerador daquele evento pode ser diferente a cada instante deo processo gerador daquele evento pode ser diferente a cada instante de
tempo, como já se viu). Disso surge uma grande di…culdade para modelar tempo, como já se viu). Disso surge uma grande di…culdade para modelar 
 fenô fenômenmenos os rreeais, ais, ppororque, que, usuausualmenlmente, te, temotemos s apapenas uma enas uma obserobservação vação pparara a 
cada t.cada t.Em outras palavras, temos que estimar uma número de parâmetros maior que 
o número de observações, o que é impossível. Por isso, temos que impor certas 
restrições para reduzir o número de parâmetros a serem estimados. Essas recaem 
sobre a heterogeneidade temporal e sobre a memória do processo.
i. Restrições sobre a heterogeneidade temporal – reduz o número de parâmetros a 
serem estimados. Implica estacionaridade fraca ou estrita. Por exemplo, estabiliza 
num mesmo nível a média e a variância, assumindo que todas as observações têm 
mesma média e mesma variância;
ii. Restrições sobre a memória – espera-se que a dependência entre x (t1) e 
x (t2) enfraqueça conforme a distância t2  t1 cresça. Para isso, usamos a seguinte 
de…nição:
Um processo estocásticofu (t) ; t 2 T g é dito assintoticamente não correlacionado
se existe uma seqüência de constante f ( ) ;   1g, de…nidas por 
Cov [u ( ) ; u ( + t)]p 
V ar [u ( )] V ar [u ( + t)]
   ( ) ; 8t 2 T 
tal que 
a.) 0   ( )  1
25
 
b.)
1X
 =1
 ( ) < 1 ) lim
 !1
 ( ) = 0
Com isso, podemos fazer inferências estatísticas, a partir de nossas estimativas.
Exercício 2.13 Suponha quefX tg é um processo de média móvel dos dois lados:
X t =
1
P j=1  j "t j, "t  i:i:d(0; 
2
), onde
1
P j=1  j < 1. Mostre que
1
Pk=1 j (k)j <
1, em que  (k) é a função de autocovariância de fX tg.
Solução 2.13 Solução 2.13 As autocovariâncias de X t são:
 (k) = E (X tX t+k) = E 

 1X
 j=1
 j"t j
1X
i=1
i"t+ki
!
=
1X
 j=1
1X
i=1
 jiE ("t j"t+ki) = 
2
1X
 j=1
1X
i=1
 ji+k
Por outro lado, temos que 
1
X
k=1
j (k)j = 
2
1
X
k=1

1
X
 j=1
 j  j+k  
2
1
X
k=1
1
X
 j=1
 j j+k
= 2
1X
k=1
1X
 j=1
 j
  j+k
 = 2
1X
 j=1
 j

1X
k=1
 j+k

Uma vez que 
1P
i=1
jij < 1. Fazendo m = j + k
1X
k=1
j (k)j  2
1X
 j=1
 j

1X
m=1
jmj  1
Exercício 2.14 Se fX tg e fY tg são seqüências estacionárias não correlacionadas,
isto é, se X s e Y t são não correlacionados para todo s e t, mostre que
 f
X t + Y t
gé estacionário com a função de autocovariância equivalente à soma das funções deautocovariância de fX tg e fY tg.
Solução 2.14 Como fX tg e fY tg são seqüências estacionárias, podemos de…nir 
E [X t] = x, E [Y t] = y, V ar (X t) = 
2
x, V ar (Y t) = 
2
y, Cov (X t;X tk) = x (k),
Cov (Y t;Y tk) = y (k).Por outro lado, como as seqüências são não correlacionadas,
então E (X ts  x)

Y t  y

 = 0, para todo s e t.Temos que mostrar que Cov [X t + Y t; X tk + Y tk]
k (k) + y (k).
26
 
1. E (X t + Y t) = x + y para todo t
2. V ar (X t + Y t) = 2x + 
2
y pois as séries são não correlacionadas.
Cov (X t + Y t; X tk + Y tk) = E 

(X t  x) +

Y t  y
 
(X tk  x) +

Y tk  y

= E [(X t

x) (X tk

x)] + E 

Y t

y
 
Y tk

y

+
+E (X t  x) Y tk  y + E Y t  y (X tk  x)
=  k (k) +  y (k)
3 PROCESSOS ESTACIONÁRIOS
Exercício 3.1 Considere o processo AR(1) a seguir:
yt = 0 + 1yt1 + "t
a. De…na os estimadores por OLS de 0 e 1.
b. Assuma que "t
 
i:i:N (0; 2). Suponha que observamos
 f
y1; y2;:::;y T 
g
. Tome
a primeira observação y1 como dada e obtenha a função de log-verossimilhança
condicional das observações restantes (ou seja, de p (y2; y3;:::;y T jy1 )).
c. Mostre que o estimador por ML condicional resultado de (b) é equivalente ao
estimador por OLS de (a).
d. O que aconteceria se tivéssemos média móvel, ou seja, se quiséssemos estimar
um ARMA (discorra em linha gerais).
Solução 3.1Solução 3.1 a. Seja X a matriz (T  1)2 tal que a linha t é (1; yt1), e seja Y 
o vetor (T  1)1 tal que seu elemento t seja yt para t = 2;:::;T . O estimador 
por OLS é portanto ̂ = (X 0X )1 X 0Y , onde  = (0; 1).
b. A função de densidade conjunta condicional é:
 p (y2;y3;:::;y T jy1 ) =
T Y
t=2
 p (yt jyt1 )
=
T Y
t=2
1p 
22
exp

 1
22
 (yt  0  1yt1)2

27
 
Aplicando o logaritmo natural, temos a função de log-verossimilhança condi-
cional 
Lc () = 
T  1
2
 log

22


T X
t=2
1
22
 (yt  0  1yt1)2
onde  = (0; 1; 
2)
c. É fácil observar que maximizando a função de log-verossimilhança condicional 
obteremos os mesmos estimadores para os parâmetros 0 e 1.
d. No caso de presença de um termo de média móvel, os estimadores não coin-
cidiriam. De fato, o problema torna-se não linear, sendo impossível estimá-los 
por MQO.
Exercício 3.2 Calcule (manualmente) as primeiras 5 autocorrelações para cada um
dos seguintes processos:
a. Y t = "t + "t1, com  =

0; 5
b. (1  L) Y t = "t, com  = 0; 9
c. (1  L) Y t = "t + "t1, com  = 0; 9 e  = 0; 5
Solução 3.2 Solução 3.2 Nesse exercício, os três itens serão resolvidos conjuntamente, em 
4 etapas:
(a) Como E (Y t) = 0, temos que  k = E (Y tY tk). Multiplicando os dois lados 
por Y tk obtemos:
E (Y tY tk) = E ("tY tk + "t1Y tk)
= E ("t"tk + "t"tk1) + E ("t1"tk + "t1"tk1)
=
8<
:
1 + 2 2 para k = 0
2 para k = 1
0 para k  2
Portanto, temos que k =

 
1+2
 para k = 1
0 para k  2
28
 
(b) Multiplicando os dois lados por Y tk e aplicando o operador esperança 
temos E (Y tY tk) = E (Y t1Y tk)+E ("tY tk), ou expresso de outra maneira 
 k =  k1. Resolvendo recursivamente temos que  k = 
k 0, e em ter-
mos de correlação temos k = 
k
E (Y tY tk) = E (Y t1Y tk) + E ("tY tk) + E ["t1 (Y tk1 + "tk + "tk1)]
=
8<
:
 1 + 1 +  + 2 2 para k = 0
 0 + 
2 para k = 1
 k1 para k  2.
(c) Resolvendo para  0 e  1 obtemos que  0 = (1 + 2  + 
2)2=

1  2

 .
Assim temos que:
k = 
k1  1
 0
= k1


1 + 2 + 2

+ 

1  2

1 + 2 + 2
= k1
 (1 + ) +  (1 + )
1 + 2 + 2
 = k1
( + ) (1 + )
1 + 2 + 2
(d) Substituindo  e , obtemos as cinco primeiras autocorrelações das três 
séries.
Y t = "t  0; 5"t1 (1  0; 9L) Y t = "t (1  0; 9L) Y t = "t + 0; 5"t1
1 0; 40 0; 90 0; 63
2 0; 00 0; 81 0; 57
3 0; 00 0; 73 0; 51
4 0; 00 0; 66 0; 46
5 0; 00 0; 59 0; 41
Exercício 3.3 Considere o processo AR(2) a seguir:
yt = 0 + 1yt1 + 2yt2 + "t
onde 0 = 0, 1 = 0; 4 e 2 = 0; 5. Calcule (manualmente)os primeiros valores
da função de autocorrelação parcial.
Solução 3.3 Solução 3.3 Resolvemos primeiro as autocovariâncias do processo algebricamente.
 0 = 1 1 + 2 2 + 
2
 1 = 1 0 + 2 1
 2 = 1 1 + 2 0;
29
 
a solução deste sistema é:
2
6
64
 0 = 
2 12
32
2
1
2
22
2
12+1
;
 1 = 
2 1
32
2
1
2
22
2
12+1
;
 2 = 
2 2+
2
1
2
2
32
2
1
2
22
2
12+1
3
7
75
A função de autocorrelação parcial nada mais é do que os parâmetros i;k, quando
k = i; obtidos das equações yt;k =
kP
i=1
i;kyti + "t. Assim, a autocorrelação parcial 
será ̂1 =
P
yt1ytP
y2t1
=  1
 0
= 1 obtido por MQO aplicados ao AR(1), visto no exercício
anterior. ̂2 resulta diretamente da especi…cação do modelo, sem a necessidade de 
conta alguma. Note também que FAC e FACP coincidem na primeira defasagem.
Substituindo os valores, temos:
̂1;1 =
  1
 0
=
 1
1  2
=
 0; 4
1; 5
 ~=0; 27
̂2;2 =
 
0; 5
̂k;k = 0 para k > 2
Exercício 3.4 No livro, simulou-se um processo M A(2). Apesar de gerado um
M A(2), o correlograma, assim como os crítérios de informação, indicam que o processo
que melhor se ajustaria seria um M A(2) degenerado, ou seja, yt = "t+2"t2. Discuta
sobre possíveis explicações para este fenômeno.
Solução 3.4Solução 3.4 Algumas explicações possíveis.
A fácil seria culpar o gerador de números aleatórios do E-views. No entanto,
não é razoável supor que esse fenômeno ocorra na maioria das vezes em que ele 
é estimado. De fato, o mesmo fenômeno ocorre quando utilizamos outro gerador 
de números aleatórios. A equação yt = "t + 0:5"t1  0:9"t2 foi simulada várias 
vezes no Matlab e o correlograma sempre indicou uma MA(2) degenerado. Neste 
caso é importante notar que as raízes do polinômio z2 + 0:5z  0:9 são 1; 23 e 
0; 73, ou seja, o MA não é invertível. No entanto, conforme visto em classe, pode-se 
obter uma representação invertível deste polinômio invertendo-se a raíz e corrigindo-
se a variância estimada do processo. Desta forma, as raízes do processo seriam 
aproximadamente 0; 73 e 0; 81 (o recíproco de 1; 23). Daqui é fácil perceber porque 
o correlograma geralmente acusa uma M A(2) degenerado. Os termos do M A(1) se 
anulam quando expandimos o polinômio ( (1  1L)(1 + 2L) ' 1  12L2).
30
 
É verdade também que se tivéssemos uma amostra maior, a raízes deveriam estar 
mais próximas umas das outras (em valores absolutos) para que isto ocorra. No
entanto quando idênticas, o problema persistirá.
Outra forma de ver a solução do problema é a seguinte. A primeira autocorrelação
do MA(2) é muito baixa. Como a variância não é ajustada para o verdadeiro valor 
dos coe…cientes, parece que a autocorrelação é nula.
2 =
 1 + 12
1 + 21 + 
2
2
=
 0; 5  0; 5  0; 9
1 + 0; 52 + 0; 92
 =
 0; 05
2; 06
:
Exercício 3.5 Existem pelo menos 3 formas distintas de se calcular os critérios de
informação AIC e BIC. Apresente pelo menos duas para cada critério e mostre que
elas indicarão o mesmo modelo. Qual o critério que tenderia a selecionar modelos
menos parcimoniosos? Por quê?
Solução 3.5 Solução 3.5 Estas são algumas formas presentes na literatura de cálculo dos critérios 
de informação AIC e BIC.
AIC = T ln (SQR) + 2n
BI C = T ln (SQR) + n ln (T )
AIC = 2ln( Lvalue) =T + 2n=T 
BI C = 2ln( Lvalue) =T + n ln (T ) =T 
AIC = exp (2 n=T ) SQR=T 
BI C = T n=T SQR=T 
Ambas indicarão o mesmo modelo. Note que as 3 distintas formas de cálculos 
de cada índice são apenas transformações monotônicas, ou seja, quando efetuada a 
minimização indicaram mesmo n. Quando comparamos AIC e BIC no primeiro caso,
estes serão iguais quando 2n = n ln (T ). Quando T for maior que e2 ( 7; 3), ou seja,
na maior parte dos casos, o critério BIC "punirá" mais a inclusão de novas variáveis 
( n) e tenderá a escolher modelos mais parcimoniosos que AIC. É importante notar 
que para compararmos modelos corretamente (qual o melhor n), devemos manter T 
constante.
Exercício 3.6 Especi…que um ruído branco com dependência temporal.
Solução 3.6 Solução 3.6 Um possível solução é a seguinte modelo ARMA (1; 1):
"t = "t1 + t  t1;
31
 
em que t é um ruído branco ou mesmo i:i:d:
Claramente trata-se de um modelo temporalmente dependente. Restringindo o
modelo de modo que  = , o modelo simpli…ca para "t = t.
Para ver analiticamente, considere:
 0 =
 1 + 21

211
1  21 
2
;
 1 =
 (1  11) (1  1)
1  21
2;
 2 = 1 1;
...
 h = 
h1
1  1:
Se  = , temos:
 0 = 
2;
 1 = 0;
 2 = 1 1 = 0;
...
 h = 
h1
1  1 = 0:
Exercício 3.7 Considere um modelo AR(2):
yt =  + 1yt1 + 2yt2 + "t; "t  i:i:N 

0; 2

:
Monte a função de verossimilhança condicional, dados (y1; y2). Derive as condições
de primeira ordem.
Solução 3.7 Solução 3.7 Seja  = (; 1; 2) e Y = (yT ; yT 1;:::;y 3)
0 : Então, a função de 
verossimilhança é:
L ; 
2
; Y  = 2
2


T 2
2
exp"
 1
22
T 
X
t=3
(yt    1yt1  2yt2)
2
# :
De…nindo a matriz:
X (T 2)3 =
2
664
1 y2 y1
1 y3 y2
...
 ...
 ...
1 yT 1 yT 2
3
775 ;
32
 
esse modelo pode ser log-linearizado e reescrito da seguinte forma:
l

; 2; Y 

 = T  2
2
 ln

22

+  1
22
 (Y  X )0 (Y  X ) :
As condições de primeira ordem são dadas por:
[] : b = (X 0X )1 X 0Y ;

2

 : T  2
2 b2 +
 (Y  X )0 (Y  X )
2 b4 = 0 =)
 b2 = (Y  X )
0 (Y  X )
T  2 :
Exercício 3.8 Considere o seguinte modelo:
ŷt =
^
0; 2969
(0;159843)
+
^
0; 803458
(0;04252)
yt1 + "̂t
Amostra de 200 observações
(:::) = desvio-padrão
Calcule ̂ = ĉ
1̂
 e mostre que ̂ = 0; 7588. Use o método delta, considerando
que cov (c; ) = 0:002460549.
Solução 3.8 Solução 3.8 Pelo método delta, se x  N (; ), então f (x)  N 

f () ; @f 
@x
0
 @f 
@x

.
Então b = 1; 510619:
Exercício 3.9 Considere a curva de aprendizagem generalizada:
C t = KN 

R
t Y 
( 1RR )
t e
"t ;
"t  i:i:d

0; 2

;
R < 1:
em que
C t é o custo real unitário no período t;
N t é a produção acumulada até o período t;
Y t é a produção no período t;
"t é a perturbação estocástica;
 é a elasticidade do custo unitário com respeito à produção acumulada repre-
sentando o parâmetro de aprendizagem, portanto tipicamente negativo;
33
 
R é o parâmetro representando os retornos de escala. Se R = 1, os retornos
são constantes, se R < 1 os retornos são decrescentes e, se R > 1, os retornos são
crescentes.
Uma forma de estimar o modelo é log-linearizando. Chamando xt = ln X t, o
modelo se torna:
ct =  0 +  1nt +  2yt + "t;
em que
 0  ln K;  1  R ;  2  1RR . Indique a forma de obter a distribuição de K;  e
R.
Solução 3.9 Solução 3.9 A aprendizagem é representada pela produção acumulada. Se o efeito
aprendizagem está presente, então conforme a produção acumulada aumenta, os cus-
tos unitários devem cair. Se a tecnologia de produção exibe retornos constantes de 
escala, então os custos reais de produção não devem variar com o nível de produto.
Se os retornos de escala são crescentes, então os custos unitários reais devem cair 
conforme o nível de produção aumente.
Pelo teorema de Slutsky b P !  . Então, podemos usar o método delta para en-
contrar a distribuição dos parâmetros estimados. Chame  = ( 0;  1;  2)
0 :
No modelo linearizado, temos que 
 b  N 

 ; (X 0X )
1 2

:
Logo
g

 b 

 N 
0
@g ( ) ;
@g

 b 

@ 0
 (X 0X )1 b2
1
A
0
@
@g

 b 

@ 0
1
A
0
:
De…na g ( ) = (K;;R )0 =

e0; 1
1+2
; 1
1+2

0
. Consequentemente:
@g

 b 

@ 0
 =
2
6664
e b0 0 0
0 1
1+ b2
 b1
(1+ b2)
2
0  b1
(1+ b2)
2  1
(1+ b2)
2
3
7775 :
Aplicando as fórmulas, pode-se construir intervalos de con…ança assintoticamente 
válidos para as estimativas de g ( ).
34Exercício 3.10 Considere um modelo MA(1) : yt = "t + "t1, "t  N (0; 2).
Usando a metodologia de Box, Jenkins e Reinsel (1994) de "backforecasting", de-
termine E ("tjY; ) de forma a obter a verossimilhança exata, isto é, determine sua
formulação recursiva.
Solução 3.10 Solução 3.10 O modelo com polinomial avanço num M A(1):
yt = (1 + F ) et = et + 1et+1; e 
E (ytjY; ) = E (etjY; ) + E (et+1jY; ) ; t = 1; 2;:::;T:
Para simpli…car a notação, de…na E (etjY; ) = vt. Usando vT +1 = 0, então:
yT = vT ;
yt = vt + vt+1; t = 1; 2;:::;T  1 =)
vt = yt  vt+1:
Ou seja,
vT = yT ;
vT 1 = yT 1  yT ;
vT 2 = yT 2   (yT 1  yT ) =
= yT 2  yT 1 + 2yT ;
vT 3 = yT 3  yT 2 + 2yT 1  3yT ;
...
vT  j = yT  j 
 jX
i=1
(1)i+1 iyT  j+i
...
v1 = y1

T 1
Xi=1
(

1)i+1 iyi+1:
Fazendo v0 = 0, resulta que E (y0jY; ) = 1v1. Com isso, podemos voltar ao
modelo inicial:
E (ytjY; ) = E ("tjY; ) + E ("t1jY; ) ; t = 1; 2;:::T =)
E ("tjY; ) = E (ytjY; )  E ("t1jY; )
35
 
De…nindo E ("tjY; )  ut, inicie com E (y0jY; ) = u0, sabendo que E (y0jY; ) =
v1. Dessa forma:
u0 = y1 
T 1X
i=1
(1)i+1 i+1yi+1 = y1 
T X
i=2
(1)i iyi =
=
T X
i=1
(1)i+1 iyi
u1 = y1  u0 = y1  
T X
i=1
(1)i+1 iyi;
u2 = y2  u1 = y2  y1 + 2
T X
i=1
(1)i+1 iyi;
u3 = y3  u2 = y3  y2 + 2y1  3
T X
i=1
(1)i+1 iyi;
...
ut =
t1
X
 j=0
(1) j jyt j + (1)tt
T 
X
i=1
(1)i+1 iyi:
Exercício 3.11 Por que o processo de construção de Modelos ARIMA pode ser
considerado um ciclo iterativo, como a…rmam Granger e Newbold?
Solução 3.11Solução 3.11 O processo de construção de Modelos ARIMA constitui-se de 4 partes:
identi…cação, estimação, veri…cação e previsão. Se na veri…cação há problemas,
volta-se à identi…cação.
Exercício 3.12 Quais os principais instrumentos utilizados na identi…cação de um
modelo ARIMA? Por que essa é a etapa mais difícil para o pesquisador?
Solução 3.12 Solução 3.12 Testes de raiz unitária, FAC e FACP, complementado pelo teste de 
Ljung-Box. Esta etapa é difícil, porque se trabalha com resultados amostrais, o que 
di…culta a análise. Pode-se usar o critério AIC e BIC para a identi…cação, tomando-
se aquele modelo que gerar o menor valor para essas estatísticas.
Exercício 3.13 Considere o seguinte modelo
yt = 1yt1 + 2yt1 + "t + 1"t1.
36
 
Transforme esse modelo num AR(1) do tipo:
Y t = Y t1 + C"t;
em que Y t e C são vetores de dimensões apropriadas. Obs.: Há várias respostas
possíveis.
a. De…na os vetores Y t e C e a matriz ;
b. Calcule @Y t+j
@t
.
c. Especialize para o caso em que j = 3.
Solução 3.13 Solução 3.13 Uma solução possível é:
Y t 
"
 yt
yt1
"t
#
 =
"
 1 2 1
1 0 0
0 0 0
#
 | {z } 

"
 yt1
yt2
"t1
#
+
"
 1
0
1
#
"t
 | {z } 
c
:
Substituição recursiva resulta:
Y t+ j = 
 j+1Y t +
 jX
s=0
 jC"t+ js:
@Y t+ j
@t
=  jC:
@Y t+3
@"t
= 3C =
"
 1 2 1
1 0 0
0 0 0
#"
 1 2 1
1 0 0
0 0 0
#
C =
=
2
4
21 + 2 12 11
1 2 1
0 0 0
3
5"
 1 2 1
1 0 0
0 0 0 #
C =
=
2
4

21 + 2

1 + 12

21 + 2

2

21 + 2

1
21 + 2 12 11
0 0 0
3
5
"
 1
0
1
#
 =
=
2
4

21 + 2

(1 + 1) + 12
1 (1 + 1) + 2
0
3
5 :
37
 
Exercício 3.14 Considere o seguinte modelo
yt = yt1 + "t + "t1.
Transforme esse modelo num AR(1) do tipo:
Y t = Y t1 + C"t;
em que Y t e C são vetores de dimensões apropriadas. Obs.: Há várias respostas
possíveis.
De…na os vetores Y t e C e a matriz ;
Calcule @Y t+j
@t
.
Especialize para o caso em que j = 2.
Solução 3.14Solução 3.14 Uma solução possível é:
Y t 
"
 yt
yt1
"t
#
 =
"
  0 
1 0 0
0 0 0
#
 | {z } 

"
 yt1
yt2
"t1
#
+
"
 1
0
1
#
"t
 | {z } 
c
:
Outra possibilidade, mais elegante é:

 yt
"t

 =

  
0 0

 | {z } 


 yt1
"t1

+

 1
1

"t
 | {z } 
c
:
Substituição recursiva resulta:
Y t+ j = 
 j+1Y t +
 jX
s=0
 jC"t+ js:
@Y t+ j
@t
=  jC:
@Y t+2
@"t
= 2C =
"
  0 
1 0 0
0 0 0
#"
  0 
1 0 0
0 0 0
#"
 1 0 0
0 0 0
1 0 0
#
 =
=
2
4
2 0 
 0 
0 0 0
3
5
"
 1 0 0
0 0 0
1 0 0
#
 =
2
4
2 +  0 0
 +  0 0
0 0 0
3
5 :
38
 
Ou, no segundo caso:
@Y t+2
@"t
= 2C =

  
0 0
 
  
0 0
 
 1
1

 =
=

 2 
0 0
 
 1
1

 =

 2 + 
0

:
Exercício 3.15 Considere o seguinte modelo
yt = yt4 + "t:
Transforme esse modelo num AR(1) do tipo:
Y t = Y t1 + C"t:
Solução 3.15 Solução 3.15 
2
64
yt
yt1
yt2
yt3
3
75 =
2
64
0 0 0 
1 0 0 0
0 1 0 0
0 0 1 0
3
75
2
64
yt1
yt2
yt3
yt4
3
75+
2
64
1
0
0
0
3
75 "t:
Exercício 3.16 Considere o seguinte modelo:
yt =  + xt + zt
xt = "t + "t1; "t  i:i:d:

0; 2

zt = zt1 + ut; ut  i:i:d:

0; 2u

uts ? "t j; 8s;j:
Qual processo segue yt?
Que condição é su…ciente para que o processo seja estacionário?
Sob a condição anterior, encontre a previsão de longo prazo.
Solução 3.16 Solução 3.16 Primeiro note que 
zt1 = yt1    xt1.
Em seguida, substitua xt e zt em yt:
yt =  + "t + "t1 + zt1 + ut =)
yt =  + "t + "t1 +  (yt1    xt1) + ut =)
yt =  (1   ) + yt1 + "t + "t1   ("t1 + "t2) + ut =)
yt =  (1   ) + yt1 + "t + (   ) "t1  "t2 + ut =
=  (1   ) + yt1 + (1 + L) (1  L) "t + ut:
39
 
Portanto, yt é um ARMA (1; 2).
A condição su…ciente para estacionaridade é que j j < 1. Associada a essa 
condição, a condição de invertibilidade é jj < 1.
A previsão de longo prazo é a esperança não condicional do modelo.
E (yt) = .
Exercício 3.17 Suponha que xt seja um AR ( p) e vt um ruído branco, independente
de xt j, 8 j. Mostre que o modelo yt = xt + vt é um ARMA ( p; p).
Solução 3.17 Solução 3.17 Estabeleça 
 (L) xt = "t;
"t  RB:
em que  (L) é uma polinomial de grau p e L é o operador defasagem.
Logo multiplicando ambos os lados de yt por  (L), tem-se:
 (L) yt = "t +  (L) vt
3.1 EXERCÍCIOS PARA PROVAS
Exercício 3.18 Seja yt = 1; 5yt1  0; 56yt2 + "t, onde "t  i:i:d: N (0; 2). Re-
sponda:
1. Esse processo é fracamente estacionário? Explique.
2. Esse processo é estritamente estacionário? Explique.
Solução 3.18 Esse exercício tem o objetivo de complementar o exercício Esse exercício tem o objetivo de complementar o exercício
anterior, veri…cando se o aluno entendeu como determinar a estacionar-anterior, veri…cando se o aluno entendeu como determinar a estacionar-
idade fraca e estrita de séries temporais na prática.idade fraca e estrita de séries temporais na prática.
1. Um processo AR(2) será fracamente estacionário caso as raízes da polinomial 
1  1z  2z2 = 0 estejam fora do círculo unitário. Nesse caso em especí…co:
z1 =
 1; 5 +
p 
1; 52  4(0; 56)
2(0; 56)
 =
 1; 5 + 0; 1
1; 12
 =
 10
7
 > 1
z2 =
 1; 5 
p 
1; 52  4(0; 56)
2(0; 56)
 =
 1; 5  0; 1
1; 12
 =
 5
4
 > 1
40
 
Como as duas raízes são maiores do que 1 em valor absoluto, temos que o
processo é fracamente estacionário.
Também é possível mostrar que um processo AR(2) é fracamente estacionário
caso as seguintes condições sejam observadas: j2j < 1; 1 + 2 < 1 e 2 1 <
1.
Note que essas condições são satisfeitas pelo processo aqui apresentado.
2. O processo é estritamente estacionário. Esse resultado é decorrente da pre-
missa de que os erros seguem um distribuição normal. Já que a distribuição
conjunta dos erros é normal, a distribuição conjunta dos y0ts também é nor-
mal (a combinação linear de distribuições normais é normal). A distribuição
normal, em conjunto com o resultado de que o processo é fracamente esta-
cionário encontrado no item anterior, garante que o processo é estritamente 
estacionário.
Exercício 3.19 Suponha que fX tg é um processo MA(2): X t = "t + 1"t1 + 2"t2,
"t  i:i:d (0; 2). Se o processoAR(1), (1  L) X t = vt é equivocadamente estimado,
determine a função de autocorrelação de
 f
vt
g
.
Solução 3.19 Note que, assistoticamente, ̂ é 
P
X tX t1P
X 2t1
=  1 0
.
41
 
Substituindo ̂, temos vt =

1   1
 0
L

(1 + 1L +2L2)"t
gv = 
2
"

1   1
 0
z

1   1
 0
z1

1 + 1z + 2z
2
 
1 + 1z
1 + 2z
2

g
v
 = 2
" 
1

  1
 0 
z + z1

+
  21
 20
1 + 2
1
 + 2
2
 + (
1
 + 
1

2
)

z + z1

+ 
2 
z2 + z2

gv = 
2
"

1 +
  21
 20
  1
 0

z + z1
 
 0 +  1

z + z1

+  2

z2 + z2

gv = 
2
"

1 +
  21
 20

 0 +  1

z + z1

+  2

z2 + z2

2"
 1
 0

z + z1
 
 0 +  1

z + z1

+  2

z2 + z2

gv = 
2
"

 0 +
  21
 0

+

 1 +
  31
 20

z + z1

+

 2 +
  21 2
 20

z2 + z2

2"

 1 +
  1 2
 0

z + z1

  
2
1
 0

z + z1
2   1 2
 0

z3 + z3

gv = 2"  0 +  
2
1
 0
 2  
2
1
 0
+  
3
1
 20
  1 2 0 z + z
1
+2"

 2 +
  21 2
 20
  
2
1
 0

z2 + z2

  1 2
 0

z3 + z3

Portanto, da função geradora de autocovariâncias, obtemos as relativas ao processo
"estimado" equivocadamente:
~ 0 = 
2
"

 0 
  21
 0

 = 2"

 20   21
 0

~ 1 = 
2
"

 31   0 1 2
 20

~ 2 = 
2
"  2 +  2
 21
 20 
  21
 0 = 
2
" 
 2 
2
0 +  2 
2
1

 0 
2
1
 20 
~ 3 = 2"
 1 2
 0
42
 
Resolvemos agora para o cálculo das autocorrelações:
~0 = 1
~1 =
  31   0 1 2
 0 ( 
2
0   21)
~2 =  2 
2
0 +  2 
2
1   0 
2
1
 0 ( 
2
0   21)
~3 = 
  1 2
 20   21
Explicitamente, temos que  0 = 1 + 
2
1 + 
2
2,  1 = 1 + 12,  2 = 2, portanto:
~0 = 1
~1 =
 (1 + 12)
3 

1 + 21 + 
2
2

(1 + 12) 2

1 + 21 + 
2
2
 
1 + 21 + 
2
2
2  (1 + 12)2

~2 =
 2

1 + 21 + 
2
2

 (1 + 12)2

1 + 21 + 
2
2

2

(1 + 12)
2
 +
 22 (1 + 12)

1 + 21 + 
2
2
 
1 + 21 + 
2
2

2

(1 + 12)
2

~3 = 
 2 (1 + 12)
1 + 21 + 
2
2
2  (1 + 12)2
~k = 0 para k > 3 e k < 3
4 PROCESSOS NÃO ESTACIONÁRIOS
Exercício 4.1 Por que não se pode diferenciar uma série tendência determinística
para estacionarizá-la?
Solução 4.1Solução 4.1 Porque a diferenciação em uma série tendência deterministística im-
põe perda de informações, além de introduzir ruído à série, tornando as raízes de 
médias móveis não invertíveis.
Exercício 4.2 João M. Queines possuía uma série com tendência quadrática, pela
forma como ele estimou a série. Ele queria veri…car se tal série possuía uma única
raiz unitária, segundo Phillips e Perron (1988), mas não tinha disponível a tabela
apropriada para esse teste. No entanto, observou que a estatística t calculada era
maior do que o valor crítico da tabela com tendência apenas. A série possui, ou não,
uma raiz unitária? Por quê?
43
 
Solução 4.2 Solução 4.2 Esta é uma questão para testar a intuição econométrica do aluno.
A série possui raiz unitária. A intuição nos diz que, com tendência quadrática,
os valores críticos sob a hipótese nula devem ser maiores, em módulo, que os valores 
apenas com tendência.
Exercício 4.3 Identi…que e estime um processo ARMA para as séries a seguir. Pro-
ceda o teste de raiz unitária ADF, ADF-GLS, PP, KPSS, ERS, NP e indique possíveisdiscrepâncias entres esses testes. Explicite os passos efetuados (por exemplo: "Ob-
servando as FAC e FACP, a série pode ser um ARMA (1; 1), ARMA (2; 1), AR(1)
..."). (lembre dos passos: estacionariedade, identi…cação, estimação e veri…cação).
a. IPCA (aplicar o ln() ao número índice).
b. Produção Industrial Mensal do IBGE, (aplicar o ln() ao número índice).
c. Exportações brasileiras (aplicar o ln() à série) em US$ fob (código BCB: 2946).
Solução 4.3 Solução 4.3 Para a solução desse exercício, utilizamos o período de janeiro de 1996 
a novembro de 2010.
IPCA
Todos os testes de raiz unitária indicam que a série possui raiz unitária, sendo não
estacionária. Esse resultado é corroborado por todos os testes sugeridos no enunci-
ado. Em primeira diferença, os testes indicam para a não existência de raiz unitária,
em nível de signi…cância mínimo de 5%. Logo, a série é estacionária em primeira 
diferença. Procedendo à identi…cação do processo ARIMA para a série, o correl-
ograma nos indica para uma estrutura ARIMA (1,1,4). A estimação con…rma a 
estrutura sugerida pela análise do correlograma.
Produção Industrial 
Os testes de raiz unitária da série em nível indicam que a mesma possui raiz 
unitária, sendo não estacionária. O resultado é corroborado por todos os testes.
Em primeira diferença, os testes indicam que a série diferenciada não possui raiz 
unitária. Procedendo à identi…cação, o correolograma indica uma estrutura ARIMA
(1,1,0). Este resultado é corroborado pela estimação da série.
Exportações Os testes de raiz unitária indicam não estacionariedade da série em nível. Quando
tratamos a série na primeira diferença, apenas o teste de Ng-Perron indica não esta-
cionariedade. No que diz respeito à identi…cação, a análise do correlograma nos 
indica um modelo ARIMA (12,1,16) degenerado. A estimação, porém, indicou que 
o melhor modelo seria um ARIMA (12,1,12) degenerado, considerando apenas a 
primeira e última defasagens para a parte auto-regressiva, e a última defasagem para 
a parte de médias móveis, além de um ajuste sazonal 
44
 
Exercício 4.4 Simule o seguinte modelo ARMA com 300 observações: yt = yt1 +
"t + "t1. Faça o teste de raiz unitária para
 = [0; 98; 0; 95; 0; 90; 0; 85; 0; 80; 0; 50;0 ; 90;0 ; 95;0 ; 98].
Você aceita a hipótese de raiz unitária para todos os valores de  ? Se não, para
quais valores você rejeita usando DF e usando PP? Interprete o resultado.
Solução 4.4Solução 4.4 O resultado deve mostrar que o poder dos testes é baixo quando a raíz 
do processo MA se aproxima de 1. Isto ocorre porque os polinômios se cancelam 
a medida que  se aproxima de 1. Este é um problema de difícil solução caso nos 
encontremos com alguma série deste tipo.
Exercício 4.5 Utilizando a série do Ibovespa mensal aplique os testes de raiz unitária
e avalie a presença de raiz unitária. A inferência estatística difere se utilizarmos testes
distintos? A forma de cálculo da variância de longo prazo é relevante neste caso?
Solução 4.5 Solução 4.5 Em todos os testes não se rejeita a presença de raiz unitária.
Exercício 4.6 Quais as diferenças entre o teste de raiz unitária de Dickey-Fuller
(1979, 1981) e de Phillips-Perron (1988)? Quais as diferenças entre os testes de
raízes unitárias de Phillips-Perron (1988) e de Ng-Perron (2001)?
Solução 4.6 Solução 4.6 O teste de Dickey-Fuller é paramétrico, sendo necessário "branquear 
os resíduos". O teste de Phillips-Perron é semi-paramétrico, sendo desnecessário
branquear os resíduos.
O teste de Ng-Perron (2001) pode ser um teste paramétrico ou semiparamétrico,
dependendo de como se encontra variância de longo prazo. É um teste baseado em 
Perron e Ng (1996) que propuseram modi…cações aos testes convencionais pela forma 
de calcular a matriz de covariância, preocupados com o tamanho do teste. De qual-
quer forma, é necessário expurgar a tendência da série segundo o procedimento de 
Elliot, Rothemberg e Stock (1996), cuja preocupação principal era com a potência do
teste. Expurgada a tendência da série, é preciso calcular a variância de longo prazo
dessa série. O método paramétrico estima o modelo com tantas defasagens quantas são necessárias, segundo o critério de Akaike modi…cado por Ng e Perron (2001).
Estimados os parâmetros do processo auto-regressivo, estima-se a variância de longo
prazo. Uma variante do teste é estimar a variância de longo prazo de modo semi-
parámetrico, usando uma função de Parzen, por exemplo, cuja janela de truncagempode ser …xada segundo o critério de Newey-West (1994) ou Andrews (1991).
45
 
4.1 EXERCÍCIOS PARA PROVAS
Exercício 4.7 Considere o seguinte modelo:
yt = 5; 168 + 1; 294yt1  0; 375yt2 + "t  0; 244"t1 + 0; 487"t2:
Encontre pt e ct, segundo a decomposição de Beveridge-Nelson.
Solução 4.7 Solução 4.7 Trata-se de um modelo ARIMA(2; 1; 2). Os componentes pt e ct foram,
respectivamente, obtidos calculando-se:
 pt = pt1 +  +  (1) "t =)
 b p t = b pt1 + 5; 168 +
 1  0; 244 + 0; 487
1  1; 294 + 0; 375 b"t =
= b pt1 + 5; 168 + 15; 276 b"t:
A …gura a seguir mostra exatamente que pt é mais volátil de yt.
Sabemos que  (L) é 
 (L) =
 1

0:244L + 0:487L2
1  1:294L + 0:375L2 =
= 1:0 + 1: 05L + 1: 4707 L2 + 1: 5093 L3 +
+1: 4016 L4 + 1: 2476 L5 + 1: 0888 L6 + 0:9411 L7 + O

L8

Portanto, como  (L) =
 P
1
k=0 

kL
k e k = 
P
1
 j=k+1  j, sendo 0 = 1, temos 
que 
1 = 
1X
 j=2
 j = 1: 470 7 + 1: 509 3 + 1: 401 6 + 1: 247 6 + 1: 088 8 + 0:941 1 +    =
= 7: 659 1 +    ;
2 = 
1
X
 j=3
 j = 1: 509 3 + 1: 401 6 + 1: 247 6 + 1: 088 8 + 0:941 1 = 6 : 188 4 +   
3 = 
1X
 j=4
 j = 1: 401 6 + 1: 247 6 + 1: 088 8 + 0:941 1 +    = 4: 679 1 +   
4 = 
1X
 j=5
 j = 1: 247 6 + 1: 088 8 + 0:941 1 +    = 3: 277 5 +   
...
46
 
Com isso, pode-se calcular 
ct = yt  pt;
cujo grá…co é o seguinte:
Exercício 4.8 Mostre que o processo “passeio aleatório” é um movimento browni-
ano em tempo discreto quando tem distribuição normal. Sugestão: Consulte Spanos(1986).
Solução 4.8 Solução 4.8 A compreensão da resolução deste exercício pressupõe conhecimento
de processos brownianos.
Um processo estocástico fu (t) ; t 2 T g é dito ser um processo ruído branco se:
i. E [u (t)] = 0
ii. E [u (t) ; u ( )] =

 2; se t =  
0; se t 6=  

Com isso, yt = yt1+"t será um passeio aleatório (“random walk”) e ytyt1 = "t
, um ruído branco, facilmente demonstrável.
E 

y2
t 
 = E 
"
 t
X j=1
" j
#
 = t2
E [ytym] = E 
"
 tX
 j=1
" j
m<tX
i=1
"i
#
 = m2
Em particular, para m = t  s
E [ytyts] = E 
"
 tX
 j=1
" j
mX
i=1
"i
#
 = (t  s) 2
Ou seja, o processo é estacionário com incrementos independentes. Além disso,
os incrementos são normalmente distribuídos, pois "t  N (0; 2). Logo, passeio
aleatório é um movimento browniano, cuja distribuição é N (0; t), dada por quando"t  N (0; 2).
Exercício 4.9 Seja fS t; t = 0; 1; 2;::: g um passeio aleatório com "drift", de…nido por
S 0 = 0 e S t =  + X t, t = 1; 2;::: , onde X 1;X 2;::: são i.i.d com média zero e variância
2.
1. Calcule a média e a esperança de S t;
47
 
2. Calcule a função de autocovariância do processo fS tg;
3. Mostre que fS t  S t1g é estacionário;
4. Compute a média e a função de autocovariância de fS t  S t1g.
Solução 4.9 Solução 4.9 O exercício treina a de…nição de estacionaridade. É bom, também,
para treinar os conceitos de média e esperança, às vezes confundidos como sinônimos.
1. Este é um exercício simples, bastando a aplicação da fórmula recursivamente.
S 1 =  + S 0 + X 1
S 2 =  + S 1 + X 2 = 2 + S 0 + X 1 + X 2
...
S t =  + S t1 + X t = t + S 0 |{z} 
=0
+
tX
i=1
X i = t +
tX
i=1
X i
Agora podemos calcular a média como
S t =
t
Xi=1
S i
t
 = 1
t

t
X
i=1
i +
t
X
i=1
t
X
 j=1
X j! =
=
 1
t
0
BBBBB@

tX
i=1
i +
tX
i=1
 j
tX
 j=1
X j
 j
1
CCCCCA
=
 1
t


t (t + 1)
2
 +
tX
i=1
 j X j
!
 =
= 
(t + 1)
2
 +
tX
i=1
 j X j
t
Se por um acaso do destino X 
 j
 = X 
m
 = X , j
 6
= m, j; m = 1; 2;:::;t , temos 
que:
S t = 
(t + 1)
2
 + X 
t + 1
2
Note como a média depende de t de modo que a seqüência de médias de S t é não
estacionária. A esperança de S t é ainda mais fácil calcular, pois E (xi) = 0,
para todo i:
E (S t) = t
48
 
2. Apenas cálculos e um pouco de atenção
Cov (S t; S tk) = E f[S t  E (S t)] [S tk  E (S tk)]g =
= E 
"
t +
t
X
i=1
X i  t
!
 (t  k) +
tk
X
i=1
X i   (t  k)
!#
 =
= E 
" tX
i=1
X i
tkX
i=1
X i
#
 = 2 min( t; t  k) ; pois 
suponha k > 0: Cov (S t; S tk) = (t  k) 2;
suponha k < 0: Cov (S t; S tk) = t2.
3. Podemos veri…car que 
S t  S tk = S t =  + X t
A média é dada por 
t
X j=1
S j
t
 =
 t
t
 +
t
X j=1
X j
t
 =  + X t
independente de t se a média de X for constante.
A esperança é dada por:
E (S t) = 
A variância é dada por 
E 

(S t)
2 = E 

2 + 2X t + X 
2
t

 = 2 + 2 ) V ar (S t) = 2
A covariância pode ser assim calculada, k 6= 0:
Cov (S t; S tk) = E [( + X t  ) ( + X tk  )] = E (X tX tk) = 0
4. Como a covariância e a variância não dependem do tempo, o processo é esta-
cionário.
Exercício 4.10 Qual é a utilidade dos testes de raízes unitárias quando se trabalha
com abordagem de Box-Jenkins? Pode-se regredir uma série de tempo não esta-
cionária contra outra série de tempo não estacionária? No caso de se poder regredir,
os testes sobre os coe…cientes são válidos?
49
 
SolSoluçãução 4.10 o 4.10 SoSoluçlução: ão: O O exeexerrcíccício io avaavalia lia a a ccomomprpreeenensão são do do alualuno no ccom om 
rrelaelação ção aos aos momodeldelos os de de sérséries ies temtemppororaisais. . LLevaeva-o -o a a ccomompparará-lá-lo o ccom om oo
ccaso tradaso tradicionaicional, l, nos quais nos quais a a sérisérie e ppoode de ser qualquer coser qualquer coisa. isa. AlAlerta parerta para a a a 
possibilidade de se estimar modelos, cujas séries são não estacionárias,possibilidade de se estimar modelos, cujas séries são não estacionárias,
evitando-se que se esqueça dessa possibilidade.evitando-se que se esqueça dessa possibilidade.
A abordagem de Box-Jenkins pressupõe que a série seja estacionária, de tal sorte 
que inferências estatísticas sejam válidas de acordo com as distribuições estatísti-
cas tradicionais. Caso a série não seja estacionária, testes estatísticos tradicionais 
deixam de ser válidos. Assim, o teste de raiz unitária permite identi…car uma série 
não estacionária, bem com descobrir quantas diferenças devem ser empregadas para 
“estacionarizar” a série, de modo que se possam fazer inferências sobre os parâmet-
ros estimados. Pode-se regredir uma série não estacionária contra outra, se tiverem 
mesma ordem de integração, de tal sorte que o resíduo obtido seja integrado de ordem 
zero. Caso contrário, o que se está a fazer é uma regressão espúria. Os dois grá…cos 
abaixo, mostram a diferença de uma regressão espúria de outra não espúria.
O primeiro mostra uma regressão espúria, pois a diferença entre as séries, con-
 forme o tempo passa, cresce. Em regressões espúrias é comum encontrar coe…cientes 
signi…cantes estatisticamente. Esta é mais uma razão de ser fazer o teste de cointe-
gração, para evitar tais problemas. A segunda série poderia apresentar uma regressãolegítima, pois os erros não crescem com o tempo. Nesse caso, os estimadores são su-
perconsistentes, de modo que os testes estatísticos continuam válidos.
Exercício 4.11 Considere o seguinte modelo:
yt = dt + ut;
ut = ut1 + t;
t =  (L) "t; "t  i:i:d:

0; 2

;
em que dt são termos determinísticos.
De…na  (L) de tal forma a discutir as condições que o teste de raiz unitária sofra
do problema de poder, quando  < 1, e de tamanho, quando  = 1:
Solução 4.11Solução 4.11 A forma mais simples de fazer isso é de…nindo
 (L) =
 1 + L
1  L:
50
 
Em seguida, proceda as substituições devidas no modelo.
yt = dt +  (yt1  dt1) +
 (1 + L)
(1  L) "t =)
(1  L) yt = (1  L) dt +
 (1 + L)
(1

L)
"t =)
(1  L) (1  L) yt = (1  L) (1  L) dt + (1 + L) "t =)
1  ( + ) L + L2

yt = (1  L) (1  L) dt + (1 + L) "t:
O problema de tamanho, considere  = 0. Nesse caso, se  ! 1, então ambos 
os lados da equação tendem a cancelar-se, parecendo que yt é uma série estacionária,

Continue navegando