Baixe o app para aproveitar ainda mais
Prévia do material em texto
Econometria de Séries Temporais: Manual de Soluções Rodrigo De Losso da Silveira Bueno Juliana Inhasz2.a edição São Paulo, fevereiro de 2011. 1 INTRODUÇÃO Exercício 1.1 Suponha o seguinte modelo linear: y = X +", onde y e " são vetores n 1; X < 1 é uma matriz n k e é um vetor k 1. 1. Qual(is) a(s) hipótese(s) necessária(s) para estimar esse modelo por MQO? 2. Qual(is) a(s) hipótese(s) necessária(s) para que o estimado, ̂ , exista e seja único? 3. Qual(is) a(s) hipótese(s) necessária(s) para que ̂ seja não viesado? 4. Qual(is) a(s) hipótese(s) necessária(s) para que ̂ seja e…ciente? 5. Qual(is) a(s) hipótese(s) necessária(s) para que se possa fazer inferência es- tatística? Solução 1.1Solução 1.1 Este exercício possui dois propósitos. Primeiro, induzir o estudante a entender onde exatamente se aplica cada hipótese do modelo de regressão linear múltipla, fazendo-o retornar a esses conceitos. Segundo, revisar os conceitos estatís- ticos de viés e e…ciência, aplicados à Econometria dos Mínimos Quadrados – uma boa referência, para o professor, seria WHITE, Halbert. Asymptotic Theory for Asymptotic Theory for EconometriciansEconometricians, 2nd. ed. Orlando: Academic Press, 2000. Note que nada é dito sobre o comportamento do termo aleatório, justamente porque algumas perguntas referem-se a seu comportamento. 1. Estimar o modelo por MQO é apenas um método matemático, nada mais. Por- tanto, apenas necessitamos de uma condição matemática que é r (x) = k , isto é, que o posto da matriz X seja pleno. Precisamos disso porque, do contrário, X 0X não seria inversível e, então, não poderíamos estimar o modelo por MQO. 2. Outra vez, apenas necessitamos que r (x) = k, do contrário, não existiria ̂ . A unicidade é dada justamente porque o posto é pleno. Se X fosse estocástico, precisaríamos que plim X 0 X n = Q 6= 01. 3. Aqui precisamos de várias hipóteses. (a) 9̂ 1 Este item apenas tem sentido em ser perguntado se, em aula, o professor apresentar os resultados da regressão para X estocástico. 1 (b) ̂ é único; (c) Se X é não estocástico, como assumido neste capítulo, E ("X ) = 0 = E ("), onde a segunda desigualdade resulta da Lei das Expectativas Iterativas. Se X é estocástico, precisamos que plim X 0" n = 0. 4. Aqui usamos a hipótese de homocedasticidade. Por isso, podemos concluir que,para ser não viesado, nada precisamos impor sobre a variância dos resíduos. (a) 9̂ (b) ̂ é único; (c) plim X 0" n = 0 (d) Se " (0; ), onde = 2I , basta estimar o modelo por MQO. Para com- plementar, mesmo que o professor ainda não tenha dado heterocedastici- dade, ele poderia dizer que precisamos estimar por um outro método a ser aprendido, denominado mínimos quadrados generalizados. Isto é dizer, formalmente, que, se 6= 2I , estimamos C 1y = C 1X + C 1"; = CC 0. 5. Para inferência estatística, admitimos que os erros tenham uma distribuição Normal e sejam independentes entre si, de onde se seguem todos os resultados do capítulo. Se forem normais, mas não independentes, ter-se-ia que estimar os parâmetros por mínimos quadrados generalizados, pois, do contrário, as in- ferências estatísticas não seriam válidas. Esta é a única hipótese necessária. Se não admitirmos que os erros têm distribuição Normal, podemos assumir a hipótese mais fraca de que são identicamente e independentemente distribuídos, mas nesse caso os testes somente serão válidos assintoticamente. Em ambos os casos, pode-se argumentar que tais hipóteses são muito fortes, a primeira mais forte do que a segunda. Exercício 1.2 Adão Ismiti queria veri…car se a produtividade do trabalho aumen- tava com a divisão do trabalho. Para isso, fez a seguinte experiência: regrediu a pro-dutividade ( p) de n trabalhadores de fábricas de al…netes contra o número de funções exercidas pelo trabalhador (F ), anos de escolaridade (E ), salário (w) e número de …lhos (N ). Formalmente a regressão foi: pi = 1 + 2F i + 3E i + 4wi + 5N i + ui . Usando o teste t Student, Ismiti não rejeitou a hipótese nula de parâmetro igual a zero para ̂ 3. Retirou a variável E da regressão e estimou o modelo restrito, ob- servando que ̂ 5 tornou-se, também, estatisticamente não signi…cativo. Finalmente, retirou N da regressão e estimou o modelo de novo. 2 1. Por que não foi preciso fazer o teste de F em ̂ 3, para retirar E do modelo? Ou seja, por que apenas o teste de t Student pôde ser feito? 2. Justi…que se o procedimento adotado por Ismiti está correto ou equivocado, para ter eliminado a variável N do modelo. Solução 1.2 Solução 1.2 Este exercício é muito ilustrativo e traz um pouco de problemas em- píricos à tona. Quer-se testar se o estudante entendeu como usar os testes t e F corretamente, e evitar que ele cometa o erro de retirar variáveis explicativas, estatis- ticamente iguais a zero, sequencialmente. O certo é apenas fazer um teste de hipótese conjunta e, se for o caso, concluir que tais variáveis não explicam o modelo. 1. A razão para não usar o teste F é que, quando estamos testando apenas um parâmetro, o teste t e F se equivalem. Ou seja, pode-se usar um ou outro. Em geral, nos pacotes econométricos o teste t sai automaticamente, por isso podemos olhar para ele sem problemas. Vale lembrar que, para um parâmetro apenas, t2 é equivalente a F (1; n). 2. O procedimento de Ismiti está absolutamente equivocado. O correto seria testar, conjuntamente, por F , se ̂ 3 e ̂ 5 são, simultaneamente, iguais a zero. A razãoespecí…ca é que no segundo teste, mudou-se o número de graus de liberdade, por isso o equívoco. Ou, em outras palavras, no segundo teste, o modelo mudou em relação ao primeiro. Exercício 1.3 Suponha um modelo de regressão linear múltiplo em que ̂ exista, seja não viesado e e…ciente, pois u é homocedástico. Suponha que você imponha falsas restrições sobre os parâmetros do modelo. 1. Mostre que as estimativas nesse caso são viesadas. 2. Mostre que a variância das estimativas do modelo com restrições é menor do que a variância das estimativas do modelo sem restrições. 3. Qual a implicação desse resultado em termos de previsão? Qual a intuição desse resultado? Sugestão: Lembre o que é EQM, ou seja, o erro quadrático médio. Solução 1.3 Solução 1.3 O exercício procura ilustrar um caso que não é muito intuitivo, à primeira vista, ou seja quando se impõem falsas restrições no modelo a variância reduz-se. Isto é importante para se ter uma primeira intuição do erro quadrático 3 médio, sua importância e suas consequências para a previsão. Às vezes, impondo falsas restrições, pode-se melhorar a previsão, pois reduz-se o erro de previsão, não obstante o viés possa aumentar. 1. Primeiramente, note que ^ ^ sr= ^ ^ = (X 0X )1 X X 0Y Y ^ ^ cr= = ^ ^ + K K r R̂ K K = (X 0X )1 RR0 h R (X 0X )1 R0 i1 Daqui podem-se tirar as seguintes conclusões: VVar ar ̂ = 2 (X 0X ) 1 E E ( ) = + K K (r R ) Como r 6 = R ) E ( ) 6 = . Portanto, as estimativas são viesadas. 2. Há bastante álgebra neste exercício, mas, com calma, obtém-se a resposta. VVar ar ( ) = = E E h ̂ + Kr KR̂ Kr KR i | {z } =A h ̂ + Kr KR̂ Kr KR i | {z } =A 0 = = E E [AA0] = = E E h ̂ KR ̂ i [A]0 = E E (I KR) ̂ ̂ 0 (I KR)0 = = (I KR) B B (I KR)0 2= B BR0K 0 KRB + KRBR 0K 0 | {z } =D ! 2 B B = (X 0X )1 Desenvolvendo D D ; temos: D D =(X 0X )1 R0 h R (X 0X )1 R0 i1 | {z } =K RR(X 0X )1 | {z } =B RR 0K K 0= BR BR 0K K 0 4 Dessa forma, conseguimos: VVar ar ( ) = (B KRB) 2= (I KR) B B 2= (I KR) (X 0X )1 2 Logo, se KR > 0 ) V ar ( ) < V ar ̂ . Para ver este último fato, observe que KR= (X 0X )1 | {z } >0 R0 h R (X 0X ) 1 R0 i1 R | {z } R0L0LR | {z }T 0T Agora, seja c = T v, onde c é um vetor nx1. Sendo assim, c0c = v 0T 0T v > 0, como queríamos demonstrar, pois c0c é um escalar. 3. Mesmo com falsas restrições, as previsões serão melhores se a diminuição da variância for maior do que o aumento do viés. Formalmente, se EQM < EQM . A intuição do resultado é que impor falsos parâmetros signi…ca que haverá menos parâmetros variando, o que poderia reduzir o erro de previsão. Exercício 1.4 Responda: 1. Cite pelo menos dois testes para a hipótese de homocedasticidade. 2. Cite pelo menos um teste para a hipótese de autocorrelação dos resíduos. 3. Em caso de rejeição da hipótese nula em (1), por que método você estimaria o modelo? 4. Em caso de rejeição da hipótese nula em (2)., por que método você estimaria o modelo? Solução 1.4Solução 1.4 O exercício pretende que o aluno volte ao livro-texto e veri…que clara- mente que testes ele pode aplicar e de que maneiras ele deve estimar o modelo, em caso de rejeição da hipótese nula. Com isso, sistematiza-se todo o capítulo. Sugeri- mos consultar, adicionalmente, Johnston e Dinardo (1998). 1. Há vários testes que podem ser usados: Breusch-Pagan, White, Goldfeld-Quandt, Glesjer. 2. Durbin-Watson, ACF, Ljung-Box. 5 3. Mínimos quadrados generalizados, mínimos quadrados generalizados factíveis. 4. Pode-se usar o método de Cochrane-Orcutt, Durbin ou Variáveis instrumentais. Exercício 1.5 Faça os seguintes exercícios: 1. Suponha que P 1 i=0 jxij < 1. Mostre que P 1 i=0 x2i < 1; 2. Prove (ou não) que limn!1 Pn x=1 1 x = 1; 3. Prove (ou não) que limn!1 Pn x=1 1 x2 = 1; 4. Prove (ou não) que se P 1 i=0 x 2 i < 1, então P 1 i=0 jxij < 1. Solução 1.5 Solução 1.5 1. Pelo enunciado, temos que P 1 i=0 jxij < 1. Como a soma em módulo converge para um valor menor que in…nito, devemos então notar que cada elemento que forma essa série contribui com valor menor que 1, de forma que a mesma converge para algum valor menor que in…nito. Assim, já podemos concluir que: lim i!1 jxij < 1 Portanto, uma vez que todo elemento em módulo dessa série é menor que 1, o quadrado de cada um desses elementos também vai ser menor que 1. Isso nos indica, seguramente, que a soma de tais elementos (ou seja, a série dos quadrados de jxij) também é convergente. Outra maneira de provar tal resultado é notar que: lim i!1 jxij < 1 lim i !1 x2i xi < 1 lim i!1 x2i jxij < 1 Pelo teste da razão vemos que a série converge. 6 2. Pelo enunciado, queremos saber limn!1 Pn x=1 1 x . Mas o que é tX x=1 1 x ? Primeiro observe que: 1 x > x+1 Z x 1 s ds = ln sjx+1x = ln ( x + 1) ln (x) = ln 1 + 1x 1 x > ln 1 + 1 x Por polinômio de Taylor encontra-se uma função que se aproxima a ln 1 + 1 x ln 1 + 1 x = 1 x 1 2! x2 + 1 3!x3 Aplicando t Xx=1 1 x ao que temos tX x=1 1 x > t+1Z 1 1 x dx = l n (t + 1) : 3. A demonstração pode ser feita através da generalização do item anterior. 4. A demonstração desse item é, senão, apenas o raciocínio contrário ao efetuado no primeiro item desse exercício. A prova con…rma o resultado enunciado. 1.1 EXERCÍCIOS PARA PROVAS Exercício 1.6 Prove que uma regressão estimada sem a constante não implica que os resíduos somarão, necessariamente, zero e que o R2, se calculado como 1 ê`ê y`yny2 , pode ser negativo, onde ê = y X ̂ , em que ̂ é o vetor de parâmetros estimados. Solução 1.6 Este exercício mostra que o Este exercício mostra que o R2 pode ser negativo, quando a pode ser negativo, quando a regressão por mínimos quadrados ordinários é feita sem constante (noteregressão por mínimos quadrados ordinários é feita sem constante (note que, mesmo com constante, quando estimamos um modelo não linear por que, mesmo com constante, quando estimamos um modelo não linear por máxima verossimilhança, podemos ter um máxima verossimilhança, podemos ter um R2 negativo, mas isso é um casonegativo, mas isso é um caso 7 raro). Seu objetivo é alertar o estudante que, quando o R2 é negativo, na raro). Seu objetivo é alertar o estudante que, quando o R2 é negativo, na regressão por MQO, é porque ele deve acrescentar a constante ao modelo.regressão por MQO, é porque ele deve acrescentar a constante ao modelo. O motivo é muito sutil e será explicitamente apresentado na resolução. AO motivo é muito sutil e será explicitamente apresentado na resolução. A primeira parte do exercício procura esclarecer por que os resíduos somam primeira parte do exercício procura esclarecer por que os resíduos somam zero, quando há constante.zero, quando há constante. Dada a regressão y = X + " temos que: yi = X i1 1 + X i2 2 + ::: + X ik k + "i; i = 1; 2;:::;n @ nX i=1 "2i @ j = nX i=1 (yi X i1 1 X i2 2 ::: X ik k) X ji = 0; j = 1; 2:::k Isso não garante que o resíduos somarão zero, pois X ji pode ser diferente de 1, para todo i, mesmo quando j = 1. Claramente, se X 1i = 1, para todo i, os resíduos somarão zero. Isto …naliza a primeira parte da questão. Sigamos para a segunda parte. Lembremos que: SQT = n Xi=1 (yi y)2 = (yi y) 0 (yi y) = y 0y ny2 SQE = y0y n _ ŷ 2 SQR = ê0ê n _ ê 2 Note como nada garante que _ ê seja zero, e, no cálculo do R2, não incluímos esse termo (retorne à fórmula dada no exercício); é por isso que o R2 pode ser negativo. Note, também, que: yi = ŷi + ê ) X yi = X ŷi + X ê ) y = _ ŷ, apenas quandoX ê = 0, o que somente ocorre se o modelo é estimado com constante, como demonstrado na primeira parte do exercício. Sabemos, ainda, que y0y = ŷ0ŷ + ê0ê. Com essas informações, temos: 1 ê 0 ê y0y ny2 = 1 y 0 y ŷ 0 ŷ y0y ny2 = y 0 y ny2 y 0 y + ŷ 0 ŷ y0y ny2 = ny2 + ŷ 0 ŷ y0y ny2 Conseqüentemente, se ny2 > ŷ0ŷ ) R2 < 0. Para ver por que o R2 é positivo quando existe constante, note que se y = _ ŷ (caso com constante), temos que -nȳ 2+ŷ’ŷ= nX i=1 (ŷi y)2 02. 2 Veja a semelhança com a fórmula do SQT. 8 Exercício 1.7 Considere o modelo heterocedástico: yij = + X i + uij , onde, X i < 1 é uma matriz ni k e é um vetor k 1; ui N (0; 2i ) , E (uiu j) = 0, j 6= i , i = 1; 2;:::;m (m > 1), j = 1; 2;:::;n i (ni > 2). Um estimador amostral de 2i é: s2i = Pni j=1(yij y) 2 ni1 , onde yi = Pni j=1 yij ni . Determine E (s2i ). Solução 1.7 O problema é interessante para que o estudante possa começar O problema é interessante para que o estudante possa começar a ver onde a heterocedasticidade se encaixa com relação ao modelo lin-a ver onde a heterocedasticidade se encaixa com relação ao modelo lin- ear geral. Além disso, o problema não apresenta maiores di…culdades. O ear geral. Além disso, o problema não apresenta maiores di…culdades. O propósito do exercício é mostrar uma metodologia para calcular a correçãopropósito do exercício é mostrar uma metodologia para calcular a correção da variância, quando há heterocedasticidade.da variância, quando há heterocedasticidade. Solução 1.8 Exercício 1.8 Solução 1.9 Solução 1.8 Exercício 1.8 Solução 1.9 Comecemos com os cálculos básicos. Se ui~N (0; 2I ), então E (uij) = 0, 8i; j e E u2ij = 2i . Assim, de…na ui= niX j=1 uij Assim yi = + X i + ui e s2i = 1 ni 1 niX j=1 (uij ui)2 = 1 ni 1 niX j=1 u2ij ni u2i ! Logo, E s2i = 1 ni 1 E " niX j=1 u2ij # niE u2i ! = 1 ni 1 ni 2 i ni 2i ni = 2i Exercício 1.9 Exercício 1.9 Suponha o modelo y = X +", onde y e " são vetores n1, X < 1 é uma matriz nk, e é um vetor k1, estimado por MQO com constante. Responda F(also) ou V(erdadeiro) para cada alternativa e justi…que sucintamente: 1. Heterocedasticidade nas perturbações produz estimativas consistentes de ; 2. Heterocedasticidade nas perturbaçõesgeram estimativas ine…cientes; 3. Heterocedasticidade nas perturbações resulta numa matriz de covariância das estimativas inconsistente; 9 4. Testes de hipóteses sobre os coe…cientes deixam de ser válidos se há hetero- cedasticidade. SolSoluçãução 1.10 Este o 1.10 Este é é um um exeexerrcíccício io que que tententa ta dirdirimiimir r dúvdúvidasidas, , dandando do aoao estudante a oportunidade de voltar aos conceitos básicos e entendê-losestudante a oportunidade de voltar aos conceitos básicos e entendê-los memelholhor. r. A A rrespespostosta a do do exexerercíccício io exexige ige que que se se façfaçam am algalgumumas as hiphipóteótesesses não explicitadas no enunciado. Elas são as seguintes:não explicitadas no enunciado. Elas são as seguintes: " i:i:d:(0; );; X é não estocástico. é não estocástico. Com essas hipóteses, podemos responder a questão.Com essas hipóteses, podemos responder a questão. 1. Verdadeiro, pois prova-se que E ̂ = ; 2. Verdadeiro, pois V ar ̂ M QG = (X 01X ) < V ar ̂ M QO = (X 0X )1 X 0X (X 0X )1; 3. Verdadeiro, decorrente de b.; 4. Verdadeiro, decorrente de b. Aqui, uma consideração. O teste de hipótese usando o lado direito da igua ldade em b. é válido. O problema é que muitos pacotes econométricos simplesmente calculam como matriz de co- variância como (X 0X )1 e não a matriz de covariância correta. ( MaioresMaiores detalhes a respeito deste exercício são encontrados em WHITE,detalhes a respeito deste exercício são encontrados em WHITE, H. H. A A HeterHeteroskeoskedasticdasticity-City-Consisonsistent tent CovaCovarianriancce e MatrMatrix ix and and a a DirDirecect t TTest est for for HeterHeteroskeoskedasticity.Ecdasticity.Econometriconometrica, a, vol. vol. 48, 48, n.n.o 4,4, 1980.)1980.) Exercício 1.10 Suponha um modelo de regressão linear múltiplo em que ̂ exista, seja não viesado e e…ciente, pois u é homocedástico. Suponha que você imponha falsas restrições sobre os parâmetros do modelo. 1. Mostre que as estimativas nesse caso são viesadas. 2. Mostre que a variância das estimativas do modelo com restrições é menor do que a variância das estimativas do modelo sem restrição. 3. Qual a implicação desse resultado em termos de previsão? Qual a intuição desse resultado? Sugestão: Lembre o que é EQM, ou seja, o erro quadrático médio. 10 Solução 1.11 O exercício procura ilustrar um caso que não é muito in- O exercício procura ilustrar um caso que não é muito in- tuitivo, à primeira vista, ou seja quando se impõem falsas restrições notuitivo, à primeira vista, ou seja quando se impõem falsas restrições no momodelo delo a a varivariância reância reduz-sduz-se. e. Isto é Isto é impimportaortante nte pparara a se se ter ter uma primeiruma primeira a intuição do erro quadrático médio, sua importância e suas conseqüênciasintuição do erro quadrático médio, sua importância e suas conseqüências pparara a a a prprevisãevisão. o. Às Às vezesvezes, , impimpondo falsas ondo falsas rrestrestriçõições, es, ppoode-sde-se e melhmelhororar ar a previsão, pois reduz-se o erro de previsão, não obstante o viés possa a previsão, pois reduz-se o erro de previsão, não obstante o viés possa aumentar.aumentar. 1. Primeiramente, note que ̂ sr = ̂ = (X 0X )1 X 0Y ̂ cr = = ̂ + K r R̂ K = (X 0X )1 R0 h R (X 0X )1 R0 i1 Daqui podem-se tirar as seguintes conclusões: V ar ̂ = 2 (X 0X )1 E ( ) = + K (r R ) Como r 6= R ) E ( ) 6= . Portanto, as estimativas são viesadas. 2. Há bastante álgebra neste exercício, mas, com calma, obtém-se a resposta. V ar ( ) = E h ̂ + Kr KR̂ Kr KR i | {z } =A h ̂ + Kr KR̂ Kr KR i | {z } =A 0 = E [AA0] = = E h ^ KR ^ i [A] 0 = E (I KR) ^ ^ 0 (I KR) 0 = = (I KR) B (I KR)0 2 = B BR 0K 0 KRB + KRBR 0K 0 | {z } =D ! 2 B = (X 0X ) 1 11 Desenvolvendo D temos: D = (X 0X )1 R0 h R (X 0X )1 R0 i1 | {z } =K R(X 0X )1 | {z } =B R0K 0 = BR0K 0 Dessa forma, conseguimos: V ar ( ) = (B KRB) 2 = (I KR) B2 = (I KR) (X 0X )1 2 Logo, se KR > 0 ) V ar ( ) < V ar ̂ . Para ver este último fato, observe que KR = (X 0X )1 | {z } >0 R0 h R (X 0X )1 R0 i1 R | {z } R0L0LR | {z } T 0T Agora, seja c = T v, onde c é um vetor nx1. Sendo assim, c0c = v 0T 0T v > 0, como queríamos demonstrar, pois c 0 c é um escalar. 3. Mesmo com falsas restrições, as previsões serão melhores se a diminuição da variância for maior do que o aumento do viés. Formalmente, se EQM < EQM . A intuição do resultado é que impor falsos parâmetros signi…ca que haverá menos parâmetros variando, o que poderia reduzir o erro de previsão. Exercício 1.11 Responda: 1. Cite pelo menos dois testes para a hipótese de homocedasticidade. 2. Cite pelo menos um teste para a hipótese de autocorrelação dos resíduos. 3. Em caso de rejeição da hipótese nula em a., por que método você estimaria o modelo? 4. Em caso de rejeição da hipótese nula em b., por que método você estimaria o modelo? Solução 1.12 O exercício pretende que o aluno volte ao livro-texto e ver- O exercício pretende que o aluno volte ao livro-texto e ver- i…que claramente que testes ele pode aplicar e de que maneiras ele devei…que claramente que testes ele pode aplicar e de que maneiras ele deve esestimtimar ar o o momodedelolo, , em em ccasaso o de de rrejeejeiçãição o da da hihippótótesese e nunula. la. CoCom m isissoso,, sistematiza-se todo o capítulo. Sugerimos consultar, adicionalmente, John-sistematiza-se todo o capítulo. Sugerimos consultar, adicionalmente, John- ston e Dinardo (1998).ston e Dinardo (1998). 12 1. Há vários testes que podem ser usados: Breusch-Pagan, White, Goldfeld-Quandt, Glesjer; 2. Durbin-Watson, ACF, Ljung-Box; 3. Mínimos quadrados generalizados, mínimos quadrados generalizados factíveis; 4. Pode-se usar o método de Cochrane-Orcutt, Durbin ou Variáveis instrumentais. 2 FUNDAMENTOS ESTATÍSTICOS Exercício 2.1 Considere verdadeira a seguinte a…rmação: Seja fZ tg uma sequência de variáveis aleatórias i.i.d N (0; 1), então fZ tg é (estritamente) estacionária. 1. Qual a hipótese básica do resultado acima? Por quê? 2. Pode-se a…rmar que estacionaridade é um reforço à hipótese de distribuição idêntica? 3. Pode-se a…rmar que a hipótese de estacionaridade sobre uma série qualquer émais fraca do que a hipótese i.i.d.? Por quê? Solução 2.1Solução 2.1 Este é um exercício para veri…car se o aluno entendeu o uso e a ne- cessidade do conceito de estacionaridade, fundamental no tratamento de séries tem- porais. 1. A hipótese de independência é crucial. Se fZ tg é simplesmente identicamente distribuída como normal-padrão, a sequência não é, necessariamente, esta- cionária, pois é possível construir diferentes distribuições conjuntas com dis- tribuições marginais normal. Se a distribuição conjunta muda com o tempo, poderíamos violar a condição de estacionaridade, preservando a normalidade marginal. 2. Assim, estacionaridade é uma hipótese mais forte à distribuição idêntica, já que ela se aplica a distribuições conjuntas e marginais simultaneamente. 3. Por outro lado, estacionaridade é uma hipótese mais fraca do que a hipótese i.i.d., já que sequências i.i.d. são estacionárias, mas sequências estacionárias não precisam ser independentes necessariamente. 13 Exercício 2.2 De…na Processo Estocástico e ilustre gra…camente. Explique o que é a realização de um processo estocástico e por que as séries econômicas podem ser entendidas como sendo geradas por processos estocásticos. Solução 2.2 Solução 2.2 Este é um exercício para reforçar os conceitos introdutórios apresen- tados em aula. Aqui, somos mais formais e detalhistas que o texto, pois esperamos que o estudante tenha curiosidade su…ciente para consultar outras fontes sobre este assunto. Seja uma sequência temporal de valoresque não podem ser previstos, mas com probabilidades que podem ser associadas a cada um dos diferentes valores a qualquer tempo particular, temos então um processo estocástico. Formalmente: suponha-se um determinado espaço amostral de um dado exper- imento. Considere-se, também, os possíveis subconjuntos desse espaço amostral. Além disso, associe-se a cada um desses eventos uma probabilidade. De…nindo-se a função X (; ) : S T ! <, onde S representa o espaço amostral e T , o tempo, ter-se-á um processo estocástico. Para cada t 2 T , X (; t), tem-se uma variável aleatória no espaço amostral, isto é, no tempo de…nido, existe uma distribuição de probabilidade para aquela variável. Para cada s 2 S , X (s; ), tem-se uma função de t que se chama realização de um processo X (s; t), para dado s e t, é apenas um número real. O problema prático que nos defrontamos é termos apenas a realização de um processo estocástico para cada período de tempo, dos quais teríamos que deduzir os valores da média e variância em cada instante de tempo, bem como das covariâncias. Mas, obviamente, dado que temos menos observações do que o número de informação que gostaríamos de obter, temos que impor restrições razoáveis que nos permitam trabalhar com a série disponível. As séries de tempo podem ser decompostas em quatro elementos: tendência, ci- clo, sazonalidade e componentes irregulares. Tendência, ciclo e sazonalidade não serão simples funções determinadas do tempo. Ao contrário, é típico encontrar-se elementos estocásticos nesses componentes. Por isso, séries econômicas podem ser entendidas como sendo geradas por processos estocásticos. É por isso, também, que se pode dizer que uma série de tempo é uma coleção de observações geradas sequen-cialmente no tempo. Exercício 2.3 Por que se impõem restrições sobre a heterogeneidade temporal e sobre a memória de um processo estocástico? Solução 2.3 Solução 2.3 Este exercício veri…ca se o aluno compreendeu o problema que existe em estimar séries temporais, indo aos pontos fundamentais da questão. Um processo 14 estocástico é temporalmente heterogêneo, o que signi…ca que possui momentos distin- tos a cada instante de tempo (pois o processo gerador daquele evento pode ser diferente a cada instante de tempo, como já se viu). Disso, surge uma grande di…culdade para modelar fenômenos reais porque, usualmente, temos apenas uma observação para cada t. Em outras palavras, temos que estimar um número de parâmetros maior que o número de observações, o que é impossível. Por isso, temos que impor certas restrições para reduzir o número de parâmetros a serem estimados. Essas recaem sobre a heterogeneidade temporal e sobre a memória do processo. i. Restrições sobre a heterogeneidade temporal – reduz o número de parâmetros a serem estimados. Implica estacionaridade fraca ou restrita. Por exemplo, estabiliza num mesmo nível a média e a variância, assumindo que todas as observações têm mesma média e mesma variância; ii. Restrições sobre a memória – espera-se que a dependência entre x (t1) e x (t2) enfraqueça conforme a distância t2 t1 cresça. Para isso, usamos a seguinte de…nição: Um processo estocásticofu (t) ; t 2 T g é dito assintoticamente não correlacionado se existe uma sequência de constante f ( ) ; 1g, de…nidas por Cov [u ( ) ; u ( + t)]p V ar [u ( )] V ar [u ( + t)] ( ) ; 8t 2 T tal que i. 0 ( ) 1 ii. 1X =1 ( ) < 1 ) lim !1 ( ) = 0 Com isso, podemos fazer inferências estatísticas, a partir de nossas estimativas. Exercício 2.4 Qual a diferença entre estacionaridade forte (ou estrita) e estacionar- idade (fraca)? Construa exemplos mostrando quando uma implica a outra, e quando uma não implica a outra. 15 Solução 2.4Solução 2.4 Neste exercício, o resultado mais importante é mostrar que estacionar- idade forte não implica estacionaridade fraca, como o nome poderia sugerir. Esta- cionaridade forte (ou estrita) implica que a função de probabilidade acumulada con- junta da série é igual para qualquer instante de tempo. Formalmente isso signi…ca: F X (t1);X (t2);:::;X (tn) (x1; x2;:::;x n) = F X (t1+k);X (t2+k);:::;X (tn+k) (x1; x2;:::;x n) onde F () é a função densidade de probabilidade acumulada, X () é uma variável aleatória, x () é a realização dessa variável. Estacionaridade fraca implica que os momentos da série até ordem m são coin- cidentes a cada instante, isto é: E E [fX (t1)gm1 ; fX (t2)gm2 ;:::; fX (tn)gmn ] = E E [fX (t1 + k)gm1 ; fX (t2 + k)gm2 ;:::; fX (tn + k)gmn ] Se, por exemplo, x (ti) tem uma distribuição de Cauchy, não terá momentos …nitos, porque logo o primeiro momento, m1 não existe. Mas a função densidade de probabilidade conjunta é invariante com relação ao tempo. Neste caso, então, estacionaridade forte (ou estrita) não implica estacionaridade fraca. Por outro lado, se x (ti) d 6= x (ts), s 6= i onde d 6= signi…ca distribuição diferente, os momentos de x (ti) são iguais aos de x (ts), então existe estacionaridade, mas não haverá estacionaridade forte se a distribuição conjunta não for invariante com relação a t. Se os momentos de xt existem até ordem 1, estacionaridade estrita implica esta- cionaridade fraca até ordem 1. Para ver isso, note que: E E [fX (t1)g ; fX (t2)g ;:::; fX (tn)g] = E E [fX (t1 + k)g ; fX (t2 + k)g ;:::; fX (tn + k)g] logo para n = 1 e k = 1, temos E [X (t1)] = E [X (t2)] ) E [X (t2)] = E [X (t3)] Assim, por indução: E [X (t1)] = E [X (t2)] = = E [X (tn)] Para n = 2 e k = 1, temos E [X (t1) ; X (t2)] = E [X (t2) ; X (t3)] 16 e por indução, concluímos que pela estacionaridade fraca. Para n = 2 e k = 2, temos E [X (t1) ; X (t2)] = E [X (t3) ; X (t4)] = E [X (t2) ; X (t3)] e por indução, concluímos pela estacionaridade fraca. Repetindo sucessivamente esse procedimento, provamos a a…rmação.Se fxtg é um processo gaussiano (= normal), então essa sequência é estritamente estacionária, pois é completamente caracterizada pelos dois primeiros momentos. Exercício 2.5 Responda: a. Mostre algebricamente como um processo AR(2), com raízes fora do círculo unitário, é expresso como um M A(1). b. Escreva um M A (1) sob a forma de um AR(1) c. Por que as raízes do processo M A devem estar fora do círculo unitário? Solução 2.5 Solução 2.5 O exercício treina, algebricamente os conceitos estudados. Trata-se de entender que toda série de tempo, se inversível ou estacionária, pode ser reduzida a um processo com coe…cientes …nitos, mesmo que o número de termos seja, inicial- mente e aparentemente, in…nito. a. Seja yt = 1yt1 + 2yt2 + "t, então temos: yt 1 1L 2L2 = "t ) yt = "t (1 b1L) (1 b2L) ; em que 1 = b1 + b2 2 = b1b2 Notando que (1 biL)1 = 1 + biL + biL2 + ::: por se tratar de uma progressão geométrica in…nita de razão, em módulo, menor do que um, temos: yt = 1X j=1 b j1"t j (1 b2L) Logo yt é um MA (1). 17 b. Seja yt = "t1 + "t yt 1 L = "t ) yt = 1 + L + 2L2 + ::: "t ) yt = 1 Xi=1 iLi + "t ) yt = AR (1) c. As raízes do processo de médias móveis devem estar fora do círculo unitário para que o processo yt seja unicamente identi…cado e inversível. Exercício 2.6 Considere o modelo M A(1) yt = + "t + "t1; jj > 1. Inverta-o e mostre ser um AR (1) do tipo: yt = 1X j=1 () j (yt+ j ) + "t1: Interprete. Solução 2.6 Solução 2.6 Seja yt = "t1 + "t . Então, yt 1 L = "t ) yt = 1 + L + 2L2 + ::: "t ) yt = 1X i=1 iLi + "t ) yt = AR (1) Exercício 2.7 Considere o seguinte modelo ARMA (1; 1): yt = yt1 + "t "t1; "t i:i:d: 0; 2 : Determine as condições de estacionaridade e invertibilidade. De…na as condições para obter um ruído branco temporalmente dependente. Solução 2.7 Solução 2.7 Estacionaridade: jj < 1. Invertibilidade jj <1. Ruído branco tem- poralmente dependente: = e jj < 1 (se jj > 1, então o modelo não poderá ser estacionário). 18 Exercício 2.8 Considere o seguinte modelo ARMA (1; 1): yt = yt1 + "t "t1; "t i:i:d: 0; 2 : Se = e j j > 1, então yt é instável ou não estacionário. Explique. (Dica: desenvolva o modelo recursivamente). Solução 2.8 Solução 2.8 yt = yt1 + "t "t1 = = (yt2 + "t1 "t2) + "t "t1 = = 2yt2 + "t + ( ) "t1 "t2 = = = = t+ j y j + ( ) t+ jX s=1 s1"ts + "t: Se j ! 1 ; o termo ( ) P t+ j s=1 s1"ts ! 0. Porém, qualquer pequena pertur- bação em y j+1 faz a série explodir. Isso necessariamente ocorre, porque o termo "t …ca solto. Assim, suponha o momento em que t = j + 1, com y j = 0, nesse caso temos: y j+1 = 1y j + " j+1 = " j+1: Portanto, se " j+1 6= 0, e como yt = t+ j1y j+1 + ( ) t+ j1X s=1 s1"ts + "t; a série será explosiva. Claro é que se jj < 1, então o modelo converge para um ruído branco, pois, nesse caso, t+ j1y j+1 ! 0. Exercício 2.9 Veri…que se os modelos abaixo são estacionários e/ou inversíveis, em que L é o operador defasagem. a. (1 L) yt = (1 0; 5) "t b. (1 + 0; 8L) yt = (1 1; 2L) "t c. (1 0; 7L + 0; 4L2) = (1 0; 5L) "t 19 d. (1 0; 7L 0; 4L2) = (1 1; 6L + 0; 7L2) "t e. (1 + 0; 9L) yt = (1 + 0 ; 5L + 0; 4L2 + 0; 3L3) "t Solução 2.9 Solução 2.9 Este é um exercício numérico para veri…car se o aluno compreendeu os conceitos de estacionaridade e inversão. O principal é entender as expressões fora e dentro do círculo unitário, pois devem ser cuidadosamente entendidas. Às vezes fora e dentro do círculo unitário representam a mesma coisa, conforme esteja de…nida a polinomial, pela qual se calculam as raízes da equação a diferenças. a. Primeiro é preciso entender que L é um operador, logo não se podem fazer contas usando L. Nesse caso, o truque é simples: troque L por uma variável qualquer, digamos, z. Assim temos, 1 z = 0 ) z = 1, logo não é estacionário. 1 0; 5z = 0 ) z = 2, logo como z está fora do circulo unitário, o processo é inversível. b. 1 + 0; 8z = 0 ) z = 1; 25, outra vez, por ser, em módulo, maior que 1, o processo é estacionário. 1 1; 2z = 0 ) z = 5 6 < 1, logo não inversível c. 1 0; 7z + 0; 4z2 = 0: Fazendo z = 1 x , temos x2 0; 7x + 0; 5 = 0 o que nos dá as seguintes raízes: x1 = 0;7+1;05i 2 x2 = 0;71:05i 2 . O módulo de um número complexo a + bi é dado por p a2 + b2. Ambas as raízes terão o mesmo módulo, dado por:p 0; 72 + 1; 052 = 1; 262 > 1. Assim, estando o módulo fora do círculo unitário (como invertemos as variáveis, temos que inverter o raciocínio), o processo é estacionário. 1 0; 5z = 0 ) z = 2 > 1, então o processo é inversível. d. 1 0; 7z 0; 4z2 = 0. Adotando o mesmo procedimento do item anterior, encontramos x1 = 1; 0728x2 = 0; 3728 :Ora, a segunda raiz está dentro do círculo unitário, logo o processo é não estacionário. 1 1; 6z + 0; 7z2 = 0. A inversa das raízes é x = 1;61;05i 2 ;cujo módulo é dado por p 1; 62 + 1; 052 = 1; 914 > 1, ou seja, o processo é inversível. 20 e. 1 + 0; 9z = 0 ) z = 10 9 > 1 ) estacionaridade 1 + 0; 5z + 0; 4z2 + 0; 3z3 = 0:As raízes perfazem ( z1 = 1; 597 z2 = 0; 132 + 1; 438i z3 = 0; 132 1; 438i ) : Essas raízes estão obviamente fora do círculo unitário, logo a condição de in- versibilidade está satisfeita 3. Exercício 2.10 Calcule as autocorrelações dos modelosMA(2), AR(2) e ARMA(1; 1). Solução 2.10 Solução 2.10 Seja um processo MAMA(2 2 ) dado por yt = 1"t1 + 2"t2 + "t j = 8 >>>>>>>>>< >>>>>>> >>: E [(1"t1 + 2"t2 + "t) (1"t1 + 2"t2 + "t)] = 2 1 + 21 + 2 2 ; j = 0 E [(1"t1 + 2"t2 + "t) (1"t2 + 2"t3 + "t1)] = 2 (1 + 12) ; j = 1 E [(1"t1 + 2"t2 + "t) (1"t3 + 2"t4 + "t2)] = 22; j = 2 E [(1"t1 + 2"t2 + "t) (1"t j1 + 2"t j2 + "t j)] = 0; j > 2: Consequentemente, a função de autocorrelação é dada por: j = 8 >>>>< >>>>: 0 0 = 1; j = 0 1 0 = (1+12) (1+21+22) ; j = 1 2 0 = 2 (1+21+22) ; j = 2 j 0 = 0; j > 2: Seja um processo ARAR(2 2 ) dado por yt = c + 1yt1 + 2yt2 + "t Pode-se calcular a esperança não condicional de yt: E (yt) = c + 1E (yt1) + 2E (yt2) + E ("t) =) E (yt) = c 1 1 2 : Dada a esperança não condicional do processo, é conveniente reescrevê-lo de outra forma, a …m de tornar alguns cálculos mais fáceis: yt = 1 (yt1 ) + 2 (yt2 ) + "t: 3 O cálculo de um p olinômio do terceiro grau não é simples. Sugiro usar um programa como Mathematica ou Matlab para obter o resultado. 21 Multiplicando ambos os lados dessa equação por (yt j ) e tomando a esper- ança, e como (yt j ) não contém qualquer elemento correlacionado com "t, se j > 0, tem-se que: E (yt ) (yt j ) = 1E (yt1 ) (yt j ) + + 2 E (y t 2 ) (y t j ) + E [" t (y t j )] : Logo, por de…nição, encontra-se: j = 1 j1 + 2 j2; j = 1; 2;::: Ou seja, a autocovariância segue um processo auto-regressivo de ordem 2 2 . Para calcular a função de autocorrelação, é preciso apenas dividir a equação anterior por 0: j = 1 j1 + 2 j2; j = 1; 2;::: Esse conjunto de equações está contido na família mais geral, conhecida como equações de Yule-Walker. Pode-se usar a equação anterior para calcular a função de autocorrelação desse processo: j = 1 : 1 = 1 + 21 =) 1 = 1 1 2 ; j = 2 : 2 = 11 + 2 = 21 1 2 + 2; j = s : s = 1s1 + 2s2: Seja um processo ARMA (1; 1): yt = 1yt1 + "t 1"t1: O problema é calcular a autocovariância desse processo. 0 = E (1yt1yt + "tyt + 1"t1yt) = 1 1 + 2 + 1 (1 + 1) 2; 1 = E (1yt1yt1 + "tyt1 + 1"t1yt1) = 1 0 + 1 2; 2 = E (1yt1yt2 + "tyt2 + 1"t1yt2) = 1 1; ... h = E (1yt1yth + "tyth 1"t1yth) = 1 h1: 22 Resolvendo as duas primeiras equações simultaneamente resulta: 0 = 1 + 21 + 211 1 21 2; 1 = (1 + 11) (1 + 1) 1 2 1 2; 2 = 1 1; ... h = h1 1 1: Consequentemente obteremos as autocorrelações: 0 = 0 0 = 1 1 = 1 0 = 1 + 21 + 211 (1 + 11) (1 + 1) ; 2 = 2 0 = 11; ... h = h 0 = h11 1: Exercício 2.11 Considere o seguinte processo estocástico: Y t = Y t1 + "t; "t i:i:N (0; 1) ; Y 0 = 0 (1) onde pode assumir os seguintes valores: 1; 0; 0; 9; 0; 5. Simule 1000 séries (com 100 observações cada) para cada um dos parâmetros teóricos de , estime-os em seguida por MQO. Comente as propriedades do estimador. Solução 2.11Solução 2.11 Sugestões: Gere 150 observações aleatórias e elimine os 50 primeiros valores da série simu-lada. Altere o valor inicial Y 0 de 0 para 10 e observe como os valores críticos se alteram (a 1%, 5% e 10%). Utilizando os mil parâmetros estimados, faça o histograma de ̂1 para 1; 0; 0; 9; 0; 5. O objetivo deste exercício é fazer com que o aluno perceba como o grau de assime- tria do estimador de varia a medida que seu valor teórico se aproximda de 1. Um 23 segundo objetivo é habituar o aluno à programação de experimentos de Monte Carlo. Quanto ao valor inicial, resultados (i.e., grau de assimetria) não deveriam se alterar signi…cativamente (possíveis diferenças devido ao gerador de números aleatórios). Vários softwares podem ser utilizados; a seguir apresentamos uma forma de fazê- lo no E-Views 5.1. ’CRIA work…le wfcreate u 10000 ’DEFINE número de séries simuladas (!s) !s = 10000 series pp_test = 0 ’LOOP for !i =1 to !s ’CRIA termo aleatório smpl @…rst @…rst+150 series eps = nrnd series y = 0 ’CRIA séries AR(1), neste caso phi=1 smpl @…rst+1 @…rst+150 y = y(-1)+ eps ’DESCARTA as 50 primeiras observações smpl @…rst+50 @…rst+150 ’ESTIMA phi equation temp.ls d(y) y(-1) smpl @all ’OBTENHO a estatística t do parâmetro pp_test(!i) = (temp.@tstat)(1) ’OUTRA possibilidade para visualizar a assimetria ’pp_test(!i) = 150*c(1) ’LOOP ends 24 next ’MOSTRA resultados em histograma smpl @…rst @…rst+ !s pp_test.hist 2.1 EXERCÍCIOS PARA PROVAS Exercício 2.12 Qual a razão de se impor restrições sobre a heterogeneidade tem- poral e sobre a memória de um processo estocástico? Solução 2.12 Este exercício veri…ca se o aluno compreendeu o problema Este exercício veri…ca se o aluno compreendeu o problema que que exiexiste ste em em estestimaimar r sérséries ies temtemppororaisais, , indindo o aos aos ppontontos os funfundamdamententaisais da da questão. questão. Um proUm proccesso esso estoestocáscástico é tico é temptempororalmente almente heterheteroogênegêneo, o, o o queque signi…ca que possui momentos distintos a cada instante de tempo (pois,signi…ca que possui momentos distintos a cada instante de tempo (pois, o processo gerador daquele evento pode ser diferente a cada instante deo processo gerador daquele evento pode ser diferente a cada instante de tempo, como já se viu). Disso surge uma grande di…culdade para modelar tempo, como já se viu). Disso surge uma grande di…culdade para modelar fenô fenômenmenos os rreeais, ais, ppororque, que, usuausualmenlmente, te, temotemos s apapenas uma enas uma obserobservação vação pparara a cada t.cada t.Em outras palavras, temos que estimar uma número de parâmetros maior que o número de observações, o que é impossível. Por isso, temos que impor certas restrições para reduzir o número de parâmetros a serem estimados. Essas recaem sobre a heterogeneidade temporal e sobre a memória do processo. i. Restrições sobre a heterogeneidade temporal – reduz o número de parâmetros a serem estimados. Implica estacionaridade fraca ou estrita. Por exemplo, estabiliza num mesmo nível a média e a variância, assumindo que todas as observações têm mesma média e mesma variância; ii. Restrições sobre a memória – espera-se que a dependência entre x (t1) e x (t2) enfraqueça conforme a distância t2 t1 cresça. Para isso, usamos a seguinte de…nição: Um processo estocásticofu (t) ; t 2 T g é dito assintoticamente não correlacionado se existe uma seqüência de constante f ( ) ; 1g, de…nidas por Cov [u ( ) ; u ( + t)]p V ar [u ( )] V ar [u ( + t)] ( ) ; 8t 2 T tal que a.) 0 ( ) 1 25 b.) 1X =1 ( ) < 1 ) lim !1 ( ) = 0 Com isso, podemos fazer inferências estatísticas, a partir de nossas estimativas. Exercício 2.13 Suponha quefX tg é um processo de média móvel dos dois lados: X t = 1 P j=1 j "t j, "t i:i:d(0; 2 ), onde 1 P j=1 j < 1. Mostre que 1 Pk=1 j (k)j < 1, em que (k) é a função de autocovariância de fX tg. Solução 2.13 Solução 2.13 As autocovariâncias de X t são: (k) = E (X tX t+k) = E 1X j=1 j"t j 1X i=1 i"t+ki ! = 1X j=1 1X i=1 jiE ("t j"t+ki) = 2 1X j=1 1X i=1 ji+k Por outro lado, temos que 1 X k=1 j (k)j = 2 1 X k=1 1 X j=1 j j+k 2 1 X k=1 1 X j=1 j j+k = 2 1X k=1 1X j=1 j j+k = 2 1X j=1 j 1X k=1 j+k Uma vez que 1P i=1 jij < 1. Fazendo m = j + k 1X k=1 j (k)j 2 1X j=1 j 1X m=1 jmj 1 Exercício 2.14 Se fX tg e fY tg são seqüências estacionárias não correlacionadas, isto é, se X s e Y t são não correlacionados para todo s e t, mostre que f X t + Y t gé estacionário com a função de autocovariância equivalente à soma das funções deautocovariância de fX tg e fY tg. Solução 2.14 Como fX tg e fY tg são seqüências estacionárias, podemos de…nir E [X t] = x, E [Y t] = y, V ar (X t) = 2 x, V ar (Y t) = 2 y, Cov (X t;X tk) = x (k), Cov (Y t;Y tk) = y (k).Por outro lado, como as seqüências são não correlacionadas, então E (X ts x) Y t y = 0, para todo s e t.Temos que mostrar que Cov [X t + Y t; X tk + Y tk] k (k) + y (k). 26 1. E (X t + Y t) = x + y para todo t 2. V ar (X t + Y t) = 2x + 2 y pois as séries são não correlacionadas. Cov (X t + Y t; X tk + Y tk) = E (X t x) + Y t y (X tk x) + Y tk y = E [(X t x) (X tk x)] + E Y t y Y tk y + +E (X t x) Y tk y + E Y t y (X tk x) = k (k) + y (k) 3 PROCESSOS ESTACIONÁRIOS Exercício 3.1 Considere o processo AR(1) a seguir: yt = 0 + 1yt1 + "t a. De…na os estimadores por OLS de 0 e 1. b. Assuma que "t i:i:N (0; 2). Suponha que observamos f y1; y2;:::;y T g . Tome a primeira observação y1 como dada e obtenha a função de log-verossimilhança condicional das observações restantes (ou seja, de p (y2; y3;:::;y T jy1 )). c. Mostre que o estimador por ML condicional resultado de (b) é equivalente ao estimador por OLS de (a). d. O que aconteceria se tivéssemos média móvel, ou seja, se quiséssemos estimar um ARMA (discorra em linha gerais). Solução 3.1Solução 3.1 a. Seja X a matriz (T 1)2 tal que a linha t é (1; yt1), e seja Y o vetor (T 1)1 tal que seu elemento t seja yt para t = 2;:::;T . O estimador por OLS é portanto ̂ = (X 0X )1 X 0Y , onde = (0; 1). b. A função de densidade conjunta condicional é: p (y2;y3;:::;y T jy1 ) = T Y t=2 p (yt jyt1 ) = T Y t=2 1p 22 exp 1 22 (yt 0 1yt1)2 27 Aplicando o logaritmo natural, temos a função de log-verossimilhança condi- cional Lc () = T 1 2 log 22 T X t=2 1 22 (yt 0 1yt1)2 onde = (0; 1; 2) c. É fácil observar que maximizando a função de log-verossimilhança condicional obteremos os mesmos estimadores para os parâmetros 0 e 1. d. No caso de presença de um termo de média móvel, os estimadores não coin- cidiriam. De fato, o problema torna-se não linear, sendo impossível estimá-los por MQO. Exercício 3.2 Calcule (manualmente) as primeiras 5 autocorrelações para cada um dos seguintes processos: a. Y t = "t + "t1, com = 0; 5 b. (1 L) Y t = "t, com = 0; 9 c. (1 L) Y t = "t + "t1, com = 0; 9 e = 0; 5 Solução 3.2 Solução 3.2 Nesse exercício, os três itens serão resolvidos conjuntamente, em 4 etapas: (a) Como E (Y t) = 0, temos que k = E (Y tY tk). Multiplicando os dois lados por Y tk obtemos: E (Y tY tk) = E ("tY tk + "t1Y tk) = E ("t"tk + "t"tk1) + E ("t1"tk + "t1"tk1) = 8< : 1 + 2 2 para k = 0 2 para k = 1 0 para k 2 Portanto, temos que k = 1+2 para k = 1 0 para k 2 28 (b) Multiplicando os dois lados por Y tk e aplicando o operador esperança temos E (Y tY tk) = E (Y t1Y tk)+E ("tY tk), ou expresso de outra maneira k = k1. Resolvendo recursivamente temos que k = k 0, e em ter- mos de correlação temos k = k E (Y tY tk) = E (Y t1Y tk) + E ("tY tk) + E ["t1 (Y tk1 + "tk + "tk1)] = 8< : 1 + 1 + + 2 2 para k = 0 0 + 2 para k = 1 k1 para k 2. (c) Resolvendo para 0 e 1 obtemos que 0 = (1 + 2 + 2)2= 1 2 . Assim temos que: k = k1 1 0 = k1 1 + 2 + 2 + 1 2 1 + 2 + 2 = k1 (1 + ) + (1 + ) 1 + 2 + 2 = k1 ( + ) (1 + ) 1 + 2 + 2 (d) Substituindo e , obtemos as cinco primeiras autocorrelações das três séries. Y t = "t 0; 5"t1 (1 0; 9L) Y t = "t (1 0; 9L) Y t = "t + 0; 5"t1 1 0; 40 0; 90 0; 63 2 0; 00 0; 81 0; 57 3 0; 00 0; 73 0; 51 4 0; 00 0; 66 0; 46 5 0; 00 0; 59 0; 41 Exercício 3.3 Considere o processo AR(2) a seguir: yt = 0 + 1yt1 + 2yt2 + "t onde 0 = 0, 1 = 0; 4 e 2 = 0; 5. Calcule (manualmente)os primeiros valores da função de autocorrelação parcial. Solução 3.3 Solução 3.3 Resolvemos primeiro as autocovariâncias do processo algebricamente. 0 = 1 1 + 2 2 + 2 1 = 1 0 + 2 1 2 = 1 1 + 2 0; 29 a solução deste sistema é: 2 6 64 0 = 2 12 32 2 1 2 22 2 12+1 ; 1 = 2 1 32 2 1 2 22 2 12+1 ; 2 = 2 2+ 2 1 2 2 32 2 1 2 22 2 12+1 3 7 75 A função de autocorrelação parcial nada mais é do que os parâmetros i;k, quando k = i; obtidos das equações yt;k = kP i=1 i;kyti + "t. Assim, a autocorrelação parcial será ̂1 = P yt1ytP y2t1 = 1 0 = 1 obtido por MQO aplicados ao AR(1), visto no exercício anterior. ̂2 resulta diretamente da especi…cação do modelo, sem a necessidade de conta alguma. Note também que FAC e FACP coincidem na primeira defasagem. Substituindo os valores, temos: ̂1;1 = 1 0 = 1 1 2 = 0; 4 1; 5 ~=0; 27 ̂2;2 = 0; 5 ̂k;k = 0 para k > 2 Exercício 3.4 No livro, simulou-se um processo M A(2). Apesar de gerado um M A(2), o correlograma, assim como os crítérios de informação, indicam que o processo que melhor se ajustaria seria um M A(2) degenerado, ou seja, yt = "t+2"t2. Discuta sobre possíveis explicações para este fenômeno. Solução 3.4Solução 3.4 Algumas explicações possíveis. A fácil seria culpar o gerador de números aleatórios do E-views. No entanto, não é razoável supor que esse fenômeno ocorra na maioria das vezes em que ele é estimado. De fato, o mesmo fenômeno ocorre quando utilizamos outro gerador de números aleatórios. A equação yt = "t + 0:5"t1 0:9"t2 foi simulada várias vezes no Matlab e o correlograma sempre indicou uma MA(2) degenerado. Neste caso é importante notar que as raízes do polinômio z2 + 0:5z 0:9 são 1; 23 e 0; 73, ou seja, o MA não é invertível. No entanto, conforme visto em classe, pode-se obter uma representação invertível deste polinômio invertendo-se a raíz e corrigindo- se a variância estimada do processo. Desta forma, as raízes do processo seriam aproximadamente 0; 73 e 0; 81 (o recíproco de 1; 23). Daqui é fácil perceber porque o correlograma geralmente acusa uma M A(2) degenerado. Os termos do M A(1) se anulam quando expandimos o polinômio ( (1 1L)(1 + 2L) ' 1 12L2). 30 É verdade também que se tivéssemos uma amostra maior, a raízes deveriam estar mais próximas umas das outras (em valores absolutos) para que isto ocorra. No entanto quando idênticas, o problema persistirá. Outra forma de ver a solução do problema é a seguinte. A primeira autocorrelação do MA(2) é muito baixa. Como a variância não é ajustada para o verdadeiro valor dos coe…cientes, parece que a autocorrelação é nula. 2 = 1 + 12 1 + 21 + 2 2 = 0; 5 0; 5 0; 9 1 + 0; 52 + 0; 92 = 0; 05 2; 06 : Exercício 3.5 Existem pelo menos 3 formas distintas de se calcular os critérios de informação AIC e BIC. Apresente pelo menos duas para cada critério e mostre que elas indicarão o mesmo modelo. Qual o critério que tenderia a selecionar modelos menos parcimoniosos? Por quê? Solução 3.5 Solução 3.5 Estas são algumas formas presentes na literatura de cálculo dos critérios de informação AIC e BIC. AIC = T ln (SQR) + 2n BI C = T ln (SQR) + n ln (T ) AIC = 2ln( Lvalue) =T + 2n=T BI C = 2ln( Lvalue) =T + n ln (T ) =T AIC = exp (2 n=T ) SQR=T BI C = T n=T SQR=T Ambas indicarão o mesmo modelo. Note que as 3 distintas formas de cálculos de cada índice são apenas transformações monotônicas, ou seja, quando efetuada a minimização indicaram mesmo n. Quando comparamos AIC e BIC no primeiro caso, estes serão iguais quando 2n = n ln (T ). Quando T for maior que e2 ( 7; 3), ou seja, na maior parte dos casos, o critério BIC "punirá" mais a inclusão de novas variáveis ( n) e tenderá a escolher modelos mais parcimoniosos que AIC. É importante notar que para compararmos modelos corretamente (qual o melhor n), devemos manter T constante. Exercício 3.6 Especi…que um ruído branco com dependência temporal. Solução 3.6 Solução 3.6 Um possível solução é a seguinte modelo ARMA (1; 1): "t = "t1 + t t1; 31 em que t é um ruído branco ou mesmo i:i:d: Claramente trata-se de um modelo temporalmente dependente. Restringindo o modelo de modo que = , o modelo simpli…ca para "t = t. Para ver analiticamente, considere: 0 = 1 + 21 211 1 21 2 ; 1 = (1 11) (1 1) 1 21 2; 2 = 1 1; ... h = h1 1 1: Se = , temos: 0 = 2; 1 = 0; 2 = 1 1 = 0; ... h = h1 1 1 = 0: Exercício 3.7 Considere um modelo AR(2): yt = + 1yt1 + 2yt2 + "t; "t i:i:N 0; 2 : Monte a função de verossimilhança condicional, dados (y1; y2). Derive as condições de primeira ordem. Solução 3.7 Solução 3.7 Seja = (; 1; 2) e Y = (yT ; yT 1;:::;y 3) 0 : Então, a função de verossimilhança é: L ; 2 ; Y = 2 2 T 2 2 exp" 1 22 T X t=3 (yt 1yt1 2yt2) 2 # : De…nindo a matriz: X (T 2)3 = 2 664 1 y2 y1 1 y3 y2 ... ... ... 1 yT 1 yT 2 3 775 ; 32 esse modelo pode ser log-linearizado e reescrito da seguinte forma: l ; 2; Y = T 2 2 ln 22 + 1 22 (Y X )0 (Y X ) : As condições de primeira ordem são dadas por: [] : b = (X 0X )1 X 0Y ; 2 : T 2 2 b2 + (Y X )0 (Y X ) 2 b4 = 0 =) b2 = (Y X ) 0 (Y X ) T 2 : Exercício 3.8 Considere o seguinte modelo: ŷt = ^ 0; 2969 (0;159843) + ^ 0; 803458 (0;04252) yt1 + "̂t Amostra de 200 observações (:::) = desvio-padrão Calcule ̂ = ĉ 1̂ e mostre que ̂ = 0; 7588. Use o método delta, considerando que cov (c; ) = 0:002460549. Solução 3.8 Solução 3.8 Pelo método delta, se x N (; ), então f (x) N f () ; @f @x 0 @f @x . Então b = 1; 510619: Exercício 3.9 Considere a curva de aprendizagem generalizada: C t = KN R t Y ( 1RR ) t e "t ; "t i:i:d 0; 2 ; R < 1: em que C t é o custo real unitário no período t; N t é a produção acumulada até o período t; Y t é a produção no período t; "t é a perturbação estocástica; é a elasticidade do custo unitário com respeito à produção acumulada repre- sentando o parâmetro de aprendizagem, portanto tipicamente negativo; 33 R é o parâmetro representando os retornos de escala. Se R = 1, os retornos são constantes, se R < 1 os retornos são decrescentes e, se R > 1, os retornos são crescentes. Uma forma de estimar o modelo é log-linearizando. Chamando xt = ln X t, o modelo se torna: ct = 0 + 1nt + 2yt + "t; em que 0 ln K; 1 R ; 2 1RR . Indique a forma de obter a distribuição de K; e R. Solução 3.9 Solução 3.9 A aprendizagem é representada pela produção acumulada. Se o efeito aprendizagem está presente, então conforme a produção acumulada aumenta, os cus- tos unitários devem cair. Se a tecnologia de produção exibe retornos constantes de escala, então os custos reais de produção não devem variar com o nível de produto. Se os retornos de escala são crescentes, então os custos unitários reais devem cair conforme o nível de produção aumente. Pelo teorema de Slutsky b P ! . Então, podemos usar o método delta para en- contrar a distribuição dos parâmetros estimados. Chame = ( 0; 1; 2) 0 : No modelo linearizado, temos que b N ; (X 0X ) 1 2 : Logo g b N 0 @g ( ) ; @g b @ 0 (X 0X )1 b2 1 A 0 @ @g b @ 0 1 A 0 : De…na g ( ) = (K;;R )0 = e0; 1 1+2 ; 1 1+2 0 . Consequentemente: @g b @ 0 = 2 6664 e b0 0 0 0 1 1+ b2 b1 (1+ b2) 2 0 b1 (1+ b2) 2 1 (1+ b2) 2 3 7775 : Aplicando as fórmulas, pode-se construir intervalos de con…ança assintoticamente válidos para as estimativas de g ( ). 34Exercício 3.10 Considere um modelo MA(1) : yt = "t + "t1, "t N (0; 2). Usando a metodologia de Box, Jenkins e Reinsel (1994) de "backforecasting", de- termine E ("tjY; ) de forma a obter a verossimilhança exata, isto é, determine sua formulação recursiva. Solução 3.10 Solução 3.10 O modelo com polinomial avanço num M A(1): yt = (1 + F ) et = et + 1et+1; e E (ytjY; ) = E (etjY; ) + E (et+1jY; ) ; t = 1; 2;:::;T: Para simpli…car a notação, de…na E (etjY; ) = vt. Usando vT +1 = 0, então: yT = vT ; yt = vt + vt+1; t = 1; 2;:::;T 1 =) vt = yt vt+1: Ou seja, vT = yT ; vT 1 = yT 1 yT ; vT 2 = yT 2 (yT 1 yT ) = = yT 2 yT 1 + 2yT ; vT 3 = yT 3 yT 2 + 2yT 1 3yT ; ... vT j = yT j jX i=1 (1)i+1 iyT j+i ... v1 = y1 T 1 Xi=1 ( 1)i+1 iyi+1: Fazendo v0 = 0, resulta que E (y0jY; ) = 1v1. Com isso, podemos voltar ao modelo inicial: E (ytjY; ) = E ("tjY; ) + E ("t1jY; ) ; t = 1; 2;:::T =) E ("tjY; ) = E (ytjY; ) E ("t1jY; ) 35 De…nindo E ("tjY; ) ut, inicie com E (y0jY; ) = u0, sabendo que E (y0jY; ) = v1. Dessa forma: u0 = y1 T 1X i=1 (1)i+1 i+1yi+1 = y1 T X i=2 (1)i iyi = = T X i=1 (1)i+1 iyi u1 = y1 u0 = y1 T X i=1 (1)i+1 iyi; u2 = y2 u1 = y2 y1 + 2 T X i=1 (1)i+1 iyi; u3 = y3 u2 = y3 y2 + 2y1 3 T X i=1 (1)i+1 iyi; ... ut = t1 X j=0 (1) j jyt j + (1)tt T X i=1 (1)i+1 iyi: Exercício 3.11 Por que o processo de construção de Modelos ARIMA pode ser considerado um ciclo iterativo, como a…rmam Granger e Newbold? Solução 3.11Solução 3.11 O processo de construção de Modelos ARIMA constitui-se de 4 partes: identi…cação, estimação, veri…cação e previsão. Se na veri…cação há problemas, volta-se à identi…cação. Exercício 3.12 Quais os principais instrumentos utilizados na identi…cação de um modelo ARIMA? Por que essa é a etapa mais difícil para o pesquisador? Solução 3.12 Solução 3.12 Testes de raiz unitária, FAC e FACP, complementado pelo teste de Ljung-Box. Esta etapa é difícil, porque se trabalha com resultados amostrais, o que di…culta a análise. Pode-se usar o critério AIC e BIC para a identi…cação, tomando- se aquele modelo que gerar o menor valor para essas estatísticas. Exercício 3.13 Considere o seguinte modelo yt = 1yt1 + 2yt1 + "t + 1"t1. 36 Transforme esse modelo num AR(1) do tipo: Y t = Y t1 + C"t; em que Y t e C são vetores de dimensões apropriadas. Obs.: Há várias respostas possíveis. a. De…na os vetores Y t e C e a matriz ; b. Calcule @Y t+j @t . c. Especialize para o caso em que j = 3. Solução 3.13 Solução 3.13 Uma solução possível é: Y t " yt yt1 "t # = " 1 2 1 1 0 0 0 0 0 # | {z } " yt1 yt2 "t1 # + " 1 0 1 # "t | {z } c : Substituição recursiva resulta: Y t+ j = j+1Y t + jX s=0 jC"t+ js: @Y t+ j @t = jC: @Y t+3 @"t = 3C = " 1 2 1 1 0 0 0 0 0 #" 1 2 1 1 0 0 0 0 0 # C = = 2 4 21 + 2 12 11 1 2 1 0 0 0 3 5" 1 2 1 1 0 0 0 0 0 # C = = 2 4 21 + 2 1 + 12 21 + 2 2 21 + 2 1 21 + 2 12 11 0 0 0 3 5 " 1 0 1 # = = 2 4 21 + 2 (1 + 1) + 12 1 (1 + 1) + 2 0 3 5 : 37 Exercício 3.14 Considere o seguinte modelo yt = yt1 + "t + "t1. Transforme esse modelo num AR(1) do tipo: Y t = Y t1 + C"t; em que Y t e C são vetores de dimensões apropriadas. Obs.: Há várias respostas possíveis. De…na os vetores Y t e C e a matriz ; Calcule @Y t+j @t . Especialize para o caso em que j = 2. Solução 3.14Solução 3.14 Uma solução possível é: Y t " yt yt1 "t # = " 0 1 0 0 0 0 0 # | {z } " yt1 yt2 "t1 # + " 1 0 1 # "t | {z } c : Outra possibilidade, mais elegante é: yt "t = 0 0 | {z } yt1 "t1 + 1 1 "t | {z } c : Substituição recursiva resulta: Y t+ j = j+1Y t + jX s=0 jC"t+ js: @Y t+ j @t = jC: @Y t+2 @"t = 2C = " 0 1 0 0 0 0 0 #" 0 1 0 0 0 0 0 #" 1 0 0 0 0 0 1 0 0 # = = 2 4 2 0 0 0 0 0 3 5 " 1 0 0 0 0 0 1 0 0 # = 2 4 2 + 0 0 + 0 0 0 0 0 3 5 : 38 Ou, no segundo caso: @Y t+2 @"t = 2C = 0 0 0 0 1 1 = = 2 0 0 1 1 = 2 + 0 : Exercício 3.15 Considere o seguinte modelo yt = yt4 + "t: Transforme esse modelo num AR(1) do tipo: Y t = Y t1 + C"t: Solução 3.15 Solução 3.15 2 64 yt yt1 yt2 yt3 3 75 = 2 64 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 3 75 2 64 yt1 yt2 yt3 yt4 3 75+ 2 64 1 0 0 0 3 75 "t: Exercício 3.16 Considere o seguinte modelo: yt = + xt + zt xt = "t + "t1; "t i:i:d: 0; 2 zt = zt1 + ut; ut i:i:d: 0; 2u uts ? "t j; 8s;j: Qual processo segue yt? Que condição é su…ciente para que o processo seja estacionário? Sob a condição anterior, encontre a previsão de longo prazo. Solução 3.16 Solução 3.16 Primeiro note que zt1 = yt1 xt1. Em seguida, substitua xt e zt em yt: yt = + "t + "t1 + zt1 + ut =) yt = + "t + "t1 + (yt1 xt1) + ut =) yt = (1 ) + yt1 + "t + "t1 ("t1 + "t2) + ut =) yt = (1 ) + yt1 + "t + ( ) "t1 "t2 + ut = = (1 ) + yt1 + (1 + L) (1 L) "t + ut: 39 Portanto, yt é um ARMA (1; 2). A condição su…ciente para estacionaridade é que j j < 1. Associada a essa condição, a condição de invertibilidade é jj < 1. A previsão de longo prazo é a esperança não condicional do modelo. E (yt) = . Exercício 3.17 Suponha que xt seja um AR ( p) e vt um ruído branco, independente de xt j, 8 j. Mostre que o modelo yt = xt + vt é um ARMA ( p; p). Solução 3.17 Solução 3.17 Estabeleça (L) xt = "t; "t RB: em que (L) é uma polinomial de grau p e L é o operador defasagem. Logo multiplicando ambos os lados de yt por (L), tem-se: (L) yt = "t + (L) vt 3.1 EXERCÍCIOS PARA PROVAS Exercício 3.18 Seja yt = 1; 5yt1 0; 56yt2 + "t, onde "t i:i:d: N (0; 2). Re- sponda: 1. Esse processo é fracamente estacionário? Explique. 2. Esse processo é estritamente estacionário? Explique. Solução 3.18 Esse exercício tem o objetivo de complementar o exercício Esse exercício tem o objetivo de complementar o exercício anterior, veri…cando se o aluno entendeu como determinar a estacionar-anterior, veri…cando se o aluno entendeu como determinar a estacionar- idade fraca e estrita de séries temporais na prática.idade fraca e estrita de séries temporais na prática. 1. Um processo AR(2) será fracamente estacionário caso as raízes da polinomial 1 1z 2z2 = 0 estejam fora do círculo unitário. Nesse caso em especí…co: z1 = 1; 5 + p 1; 52 4(0; 56) 2(0; 56) = 1; 5 + 0; 1 1; 12 = 10 7 > 1 z2 = 1; 5 p 1; 52 4(0; 56) 2(0; 56) = 1; 5 0; 1 1; 12 = 5 4 > 1 40 Como as duas raízes são maiores do que 1 em valor absoluto, temos que o processo é fracamente estacionário. Também é possível mostrar que um processo AR(2) é fracamente estacionário caso as seguintes condições sejam observadas: j2j < 1; 1 + 2 < 1 e 2 1 < 1. Note que essas condições são satisfeitas pelo processo aqui apresentado. 2. O processo é estritamente estacionário. Esse resultado é decorrente da pre- missa de que os erros seguem um distribuição normal. Já que a distribuição conjunta dos erros é normal, a distribuição conjunta dos y0ts também é nor- mal (a combinação linear de distribuições normais é normal). A distribuição normal, em conjunto com o resultado de que o processo é fracamente esta- cionário encontrado no item anterior, garante que o processo é estritamente estacionário. Exercício 3.19 Suponha que fX tg é um processo MA(2): X t = "t + 1"t1 + 2"t2, "t i:i:d (0; 2). Se o processoAR(1), (1 L) X t = vt é equivocadamente estimado, determine a função de autocorrelação de f vt g . Solução 3.19 Note que, assistoticamente, ̂ é P X tX t1P X 2t1 = 1 0 . 41 Substituindo ̂, temos vt = 1 1 0 L (1 + 1L +2L2)"t gv = 2 " 1 1 0 z 1 1 0 z1 1 + 1z + 2z 2 1 + 1z 1 + 2z 2 g v = 2 " 1 1 0 z + z1 + 21 20 1 + 2 1 + 2 2 + ( 1 + 1 2 ) z + z1 + 2 z2 + z2 gv = 2 " 1 + 21 20 1 0 z + z1 0 + 1 z + z1 + 2 z2 + z2 gv = 2 " 1 + 21 20 0 + 1 z + z1 + 2 z2 + z2 2" 1 0 z + z1 0 + 1 z + z1 + 2 z2 + z2 gv = 2 " 0 + 21 0 + 1 + 31 20 z + z1 + 2 + 21 2 20 z2 + z2 2" 1 + 1 2 0 z + z1 2 1 0 z + z1 2 1 2 0 z3 + z3 gv = 2" 0 + 2 1 0 2 2 1 0 + 3 1 20 1 2 0 z + z 1 +2" 2 + 21 2 20 2 1 0 z2 + z2 1 2 0 z3 + z3 Portanto, da função geradora de autocovariâncias, obtemos as relativas ao processo "estimado" equivocadamente: ~ 0 = 2 " 0 21 0 = 2" 20 21 0 ~ 1 = 2 " 31 0 1 2 20 ~ 2 = 2 " 2 + 2 21 20 21 0 = 2 " 2 2 0 + 2 2 1 0 2 1 20 ~ 3 = 2" 1 2 0 42 Resolvemos agora para o cálculo das autocorrelações: ~0 = 1 ~1 = 31 0 1 2 0 ( 2 0 21) ~2 = 2 2 0 + 2 2 1 0 2 1 0 ( 2 0 21) ~3 = 1 2 20 21 Explicitamente, temos que 0 = 1 + 2 1 + 2 2, 1 = 1 + 12, 2 = 2, portanto: ~0 = 1 ~1 = (1 + 12) 3 1 + 21 + 2 2 (1 + 12) 2 1 + 21 + 2 2 1 + 21 + 2 2 2 (1 + 12)2 ~2 = 2 1 + 21 + 2 2 (1 + 12)2 1 + 21 + 2 2 2 (1 + 12) 2 + 22 (1 + 12) 1 + 21 + 2 2 1 + 21 + 2 2 2 (1 + 12) 2 ~3 = 2 (1 + 12) 1 + 21 + 2 2 2 (1 + 12)2 ~k = 0 para k > 3 e k < 3 4 PROCESSOS NÃO ESTACIONÁRIOS Exercício 4.1 Por que não se pode diferenciar uma série tendência determinística para estacionarizá-la? Solução 4.1Solução 4.1 Porque a diferenciação em uma série tendência deterministística im- põe perda de informações, além de introduzir ruído à série, tornando as raízes de médias móveis não invertíveis. Exercício 4.2 João M. Queines possuía uma série com tendência quadrática, pela forma como ele estimou a série. Ele queria veri…car se tal série possuía uma única raiz unitária, segundo Phillips e Perron (1988), mas não tinha disponível a tabela apropriada para esse teste. No entanto, observou que a estatística t calculada era maior do que o valor crítico da tabela com tendência apenas. A série possui, ou não, uma raiz unitária? Por quê? 43 Solução 4.2 Solução 4.2 Esta é uma questão para testar a intuição econométrica do aluno. A série possui raiz unitária. A intuição nos diz que, com tendência quadrática, os valores críticos sob a hipótese nula devem ser maiores, em módulo, que os valores apenas com tendência. Exercício 4.3 Identi…que e estime um processo ARMA para as séries a seguir. Pro- ceda o teste de raiz unitária ADF, ADF-GLS, PP, KPSS, ERS, NP e indique possíveisdiscrepâncias entres esses testes. Explicite os passos efetuados (por exemplo: "Ob- servando as FAC e FACP, a série pode ser um ARMA (1; 1), ARMA (2; 1), AR(1) ..."). (lembre dos passos: estacionariedade, identi…cação, estimação e veri…cação). a. IPCA (aplicar o ln() ao número índice). b. Produção Industrial Mensal do IBGE, (aplicar o ln() ao número índice). c. Exportações brasileiras (aplicar o ln() à série) em US$ fob (código BCB: 2946). Solução 4.3 Solução 4.3 Para a solução desse exercício, utilizamos o período de janeiro de 1996 a novembro de 2010. IPCA Todos os testes de raiz unitária indicam que a série possui raiz unitária, sendo não estacionária. Esse resultado é corroborado por todos os testes sugeridos no enunci- ado. Em primeira diferença, os testes indicam para a não existência de raiz unitária, em nível de signi…cância mínimo de 5%. Logo, a série é estacionária em primeira diferença. Procedendo à identi…cação do processo ARIMA para a série, o correl- ograma nos indica para uma estrutura ARIMA (1,1,4). A estimação con…rma a estrutura sugerida pela análise do correlograma. Produção Industrial Os testes de raiz unitária da série em nível indicam que a mesma possui raiz unitária, sendo não estacionária. O resultado é corroborado por todos os testes. Em primeira diferença, os testes indicam que a série diferenciada não possui raiz unitária. Procedendo à identi…cação, o correolograma indica uma estrutura ARIMA (1,1,0). Este resultado é corroborado pela estimação da série. Exportações Os testes de raiz unitária indicam não estacionariedade da série em nível. Quando tratamos a série na primeira diferença, apenas o teste de Ng-Perron indica não esta- cionariedade. No que diz respeito à identi…cação, a análise do correlograma nos indica um modelo ARIMA (12,1,16) degenerado. A estimação, porém, indicou que o melhor modelo seria um ARIMA (12,1,12) degenerado, considerando apenas a primeira e última defasagens para a parte auto-regressiva, e a última defasagem para a parte de médias móveis, além de um ajuste sazonal 44 Exercício 4.4 Simule o seguinte modelo ARMA com 300 observações: yt = yt1 + "t + "t1. Faça o teste de raiz unitária para = [0; 98; 0; 95; 0; 90; 0; 85; 0; 80; 0; 50;0 ; 90;0 ; 95;0 ; 98]. Você aceita a hipótese de raiz unitária para todos os valores de ? Se não, para quais valores você rejeita usando DF e usando PP? Interprete o resultado. Solução 4.4Solução 4.4 O resultado deve mostrar que o poder dos testes é baixo quando a raíz do processo MA se aproxima de 1. Isto ocorre porque os polinômios se cancelam a medida que se aproxima de 1. Este é um problema de difícil solução caso nos encontremos com alguma série deste tipo. Exercício 4.5 Utilizando a série do Ibovespa mensal aplique os testes de raiz unitária e avalie a presença de raiz unitária. A inferência estatística difere se utilizarmos testes distintos? A forma de cálculo da variância de longo prazo é relevante neste caso? Solução 4.5 Solução 4.5 Em todos os testes não se rejeita a presença de raiz unitária. Exercício 4.6 Quais as diferenças entre o teste de raiz unitária de Dickey-Fuller (1979, 1981) e de Phillips-Perron (1988)? Quais as diferenças entre os testes de raízes unitárias de Phillips-Perron (1988) e de Ng-Perron (2001)? Solução 4.6 Solução 4.6 O teste de Dickey-Fuller é paramétrico, sendo necessário "branquear os resíduos". O teste de Phillips-Perron é semi-paramétrico, sendo desnecessário branquear os resíduos. O teste de Ng-Perron (2001) pode ser um teste paramétrico ou semiparamétrico, dependendo de como se encontra variância de longo prazo. É um teste baseado em Perron e Ng (1996) que propuseram modi…cações aos testes convencionais pela forma de calcular a matriz de covariância, preocupados com o tamanho do teste. De qual- quer forma, é necessário expurgar a tendência da série segundo o procedimento de Elliot, Rothemberg e Stock (1996), cuja preocupação principal era com a potência do teste. Expurgada a tendência da série, é preciso calcular a variância de longo prazo dessa série. O método paramétrico estima o modelo com tantas defasagens quantas são necessárias, segundo o critério de Akaike modi…cado por Ng e Perron (2001). Estimados os parâmetros do processo auto-regressivo, estima-se a variância de longo prazo. Uma variante do teste é estimar a variância de longo prazo de modo semi- parámetrico, usando uma função de Parzen, por exemplo, cuja janela de truncagempode ser …xada segundo o critério de Newey-West (1994) ou Andrews (1991). 45 4.1 EXERCÍCIOS PARA PROVAS Exercício 4.7 Considere o seguinte modelo: yt = 5; 168 + 1; 294yt1 0; 375yt2 + "t 0; 244"t1 + 0; 487"t2: Encontre pt e ct, segundo a decomposição de Beveridge-Nelson. Solução 4.7 Solução 4.7 Trata-se de um modelo ARIMA(2; 1; 2). Os componentes pt e ct foram, respectivamente, obtidos calculando-se: pt = pt1 + + (1) "t =) b p t = b pt1 + 5; 168 + 1 0; 244 + 0; 487 1 1; 294 + 0; 375 b"t = = b pt1 + 5; 168 + 15; 276 b"t: A …gura a seguir mostra exatamente que pt é mais volátil de yt. Sabemos que (L) é (L) = 1 0:244L + 0:487L2 1 1:294L + 0:375L2 = = 1:0 + 1: 05L + 1: 4707 L2 + 1: 5093 L3 + +1: 4016 L4 + 1: 2476 L5 + 1: 0888 L6 + 0:9411 L7 + O L8 Portanto, como (L) = P 1 k=0 kL k e k = P 1 j=k+1 j, sendo 0 = 1, temos que 1 = 1X j=2 j = 1: 470 7 + 1: 509 3 + 1: 401 6 + 1: 247 6 + 1: 088 8 + 0:941 1 + = = 7: 659 1 + ; 2 = 1 X j=3 j = 1: 509 3 + 1: 401 6 + 1: 247 6 + 1: 088 8 + 0:941 1 = 6 : 188 4 + 3 = 1X j=4 j = 1: 401 6 + 1: 247 6 + 1: 088 8 + 0:941 1 + = 4: 679 1 + 4 = 1X j=5 j = 1: 247 6 + 1: 088 8 + 0:941 1 + = 3: 277 5 + ... 46 Com isso, pode-se calcular ct = yt pt; cujo grá…co é o seguinte: Exercício 4.8 Mostre que o processo “passeio aleatório” é um movimento browni- ano em tempo discreto quando tem distribuição normal. Sugestão: Consulte Spanos(1986). Solução 4.8 Solução 4.8 A compreensão da resolução deste exercício pressupõe conhecimento de processos brownianos. Um processo estocástico fu (t) ; t 2 T g é dito ser um processo ruído branco se: i. E [u (t)] = 0 ii. E [u (t) ; u ( )] = 2; se t = 0; se t 6= Com isso, yt = yt1+"t será um passeio aleatório (“random walk”) e ytyt1 = "t , um ruído branco, facilmente demonstrável. E y2 t = E " t X j=1 " j # = t2 E [ytym] = E " tX j=1 " j m<tX i=1 "i # = m2 Em particular, para m = t s E [ytyts] = E " tX j=1 " j mX i=1 "i # = (t s) 2 Ou seja, o processo é estacionário com incrementos independentes. Além disso, os incrementos são normalmente distribuídos, pois "t N (0; 2). Logo, passeio aleatório é um movimento browniano, cuja distribuição é N (0; t), dada por quando"t N (0; 2). Exercício 4.9 Seja fS t; t = 0; 1; 2;::: g um passeio aleatório com "drift", de…nido por S 0 = 0 e S t = + X t, t = 1; 2;::: , onde X 1;X 2;::: são i.i.d com média zero e variância 2. 1. Calcule a média e a esperança de S t; 47 2. Calcule a função de autocovariância do processo fS tg; 3. Mostre que fS t S t1g é estacionário; 4. Compute a média e a função de autocovariância de fS t S t1g. Solução 4.9 Solução 4.9 O exercício treina a de…nição de estacionaridade. É bom, também, para treinar os conceitos de média e esperança, às vezes confundidos como sinônimos. 1. Este é um exercício simples, bastando a aplicação da fórmula recursivamente. S 1 = + S 0 + X 1 S 2 = + S 1 + X 2 = 2 + S 0 + X 1 + X 2 ... S t = + S t1 + X t = t + S 0 |{z} =0 + tX i=1 X i = t + tX i=1 X i Agora podemos calcular a média como S t = t Xi=1 S i t = 1 t t X i=1 i + t X i=1 t X j=1 X j! = = 1 t 0 BBBBB@ tX i=1 i + tX i=1 j tX j=1 X j j 1 CCCCCA = 1 t t (t + 1) 2 + tX i=1 j X j ! = = (t + 1) 2 + tX i=1 j X j t Se por um acaso do destino X j = X m = X , j 6 = m, j; m = 1; 2;:::;t , temos que: S t = (t + 1) 2 + X t + 1 2 Note como a média depende de t de modo que a seqüência de médias de S t é não estacionária. A esperança de S t é ainda mais fácil calcular, pois E (xi) = 0, para todo i: E (S t) = t 48 2. Apenas cálculos e um pouco de atenção Cov (S t; S tk) = E f[S t E (S t)] [S tk E (S tk)]g = = E " t + t X i=1 X i t ! (t k) + tk X i=1 X i (t k) !# = = E " tX i=1 X i tkX i=1 X i # = 2 min( t; t k) ; pois suponha k > 0: Cov (S t; S tk) = (t k) 2; suponha k < 0: Cov (S t; S tk) = t2. 3. Podemos veri…car que S t S tk = S t = + X t A média é dada por t X j=1 S j t = t t + t X j=1 X j t = + X t independente de t se a média de X for constante. A esperança é dada por: E (S t) = A variância é dada por E (S t) 2 = E 2 + 2X t + X 2 t = 2 + 2 ) V ar (S t) = 2 A covariância pode ser assim calculada, k 6= 0: Cov (S t; S tk) = E [( + X t ) ( + X tk )] = E (X tX tk) = 0 4. Como a covariância e a variância não dependem do tempo, o processo é esta- cionário. Exercício 4.10 Qual é a utilidade dos testes de raízes unitárias quando se trabalha com abordagem de Box-Jenkins? Pode-se regredir uma série de tempo não esta- cionária contra outra série de tempo não estacionária? No caso de se poder regredir, os testes sobre os coe…cientes são válidos? 49 SolSoluçãução 4.10 o 4.10 SoSoluçlução: ão: O O exeexerrcíccício io avaavalia lia a a ccomomprpreeenensão são do do alualuno no ccom om rrelaelação ção aos aos momodeldelos os de de sérséries ies temtemppororaisais. . LLevaeva-o -o a a ccomompparará-lá-lo o ccom om oo ccaso tradaso tradicionaicional, l, nos quais nos quais a a sérisérie e ppoode de ser qualquer coser qualquer coisa. isa. AlAlerta parerta para a a a possibilidade de se estimar modelos, cujas séries são não estacionárias,possibilidade de se estimar modelos, cujas séries são não estacionárias, evitando-se que se esqueça dessa possibilidade.evitando-se que se esqueça dessa possibilidade. A abordagem de Box-Jenkins pressupõe que a série seja estacionária, de tal sorte que inferências estatísticas sejam válidas de acordo com as distribuições estatísti- cas tradicionais. Caso a série não seja estacionária, testes estatísticos tradicionais deixam de ser válidos. Assim, o teste de raiz unitária permite identi…car uma série não estacionária, bem com descobrir quantas diferenças devem ser empregadas para “estacionarizar” a série, de modo que se possam fazer inferências sobre os parâmet- ros estimados. Pode-se regredir uma série não estacionária contra outra, se tiverem mesma ordem de integração, de tal sorte que o resíduo obtido seja integrado de ordem zero. Caso contrário, o que se está a fazer é uma regressão espúria. Os dois grá…cos abaixo, mostram a diferença de uma regressão espúria de outra não espúria. O primeiro mostra uma regressão espúria, pois a diferença entre as séries, con- forme o tempo passa, cresce. Em regressões espúrias é comum encontrar coe…cientes signi…cantes estatisticamente. Esta é mais uma razão de ser fazer o teste de cointe- gração, para evitar tais problemas. A segunda série poderia apresentar uma regressãolegítima, pois os erros não crescem com o tempo. Nesse caso, os estimadores são su- perconsistentes, de modo que os testes estatísticos continuam válidos. Exercício 4.11 Considere o seguinte modelo: yt = dt + ut; ut = ut1 + t; t = (L) "t; "t i:i:d: 0; 2 ; em que dt são termos determinísticos. De…na (L) de tal forma a discutir as condições que o teste de raiz unitária sofra do problema de poder, quando < 1, e de tamanho, quando = 1: Solução 4.11Solução 4.11 A forma mais simples de fazer isso é de…nindo (L) = 1 + L 1 L: 50 Em seguida, proceda as substituições devidas no modelo. yt = dt + (yt1 dt1) + (1 + L) (1 L) "t =) (1 L) yt = (1 L) dt + (1 + L) (1 L) "t =) (1 L) (1 L) yt = (1 L) (1 L) dt + (1 + L) "t =) 1 ( + ) L + L2 yt = (1 L) (1 L) dt + (1 + L) "t: O problema de tamanho, considere = 0. Nesse caso, se ! 1, então ambos os lados da equação tendem a cancelar-se, parecendo que yt é uma série estacionária,
Compartilhar