Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Pontifícia Universidade Católica do Rio de Janeiro 09/10/2009 Departamento de Economia ECO1800 - TÉCNICAS DE PESQUISA EM ECONOMIA – 2009.2 1ª. PROVA - GABARITO · Prova sem consulta. Duração: 1h45min. · Permitido o uso de calculadora.Pode ser feita a lápis. · Todas as respostas devem ser justificadas adequadamente. · Caso o enunciado da questão seja ambíguo, interpretações razoáveis serão consideradas. · Boa sorte! Questão 1 (3 pontos) – Seja ity a taxa de desemprego no município i no período t. Você está interessado em estudar os efeitos de um programa federal de treinamento e qualificação profissional sobre o desemprego dos municípios. Seja iz um vetor de k características observáveis que variem entre municípios mas sejam constantes no tempo (o Estado em que o município se localiza, por exemplo). Seja itx um vetor de p características observáveis que variem entre municípios e no tempo. A variável itprog é a dummy indicadora da participação no programa: itprog =1 se o município i participa do programa no período t. Qualquer seqüência de participação é possível, ou seja, certo município pode participar em um período mas não em outro. a) (0,5 ponto) Considere o seguinte modelo estimado por MQO: itititiit uprogxzy ++++= 1dbga , i=1,2,...,N; t=1,2,...,T onde o erro do modelo é dado por: itiit vcu += . Avalie a seguinte afirmativa: “Esse modelo é de utilidade limitada porque os estimadores de MQO serão inconsistentes se os erros { itu } forem autocorrelacionados”. [Concorda? Discorda? Por quê?] b) (0,75 ponto) Suponha que 0),|( =itiit xzuE e 0)|( =itit progvE , mas você suspeite que a participação no programa dependa de características não observáveis das cidades constantes no tempo – isto é, que 0)|( ¹iti progcE . Como você testaria essa hipótese? Explique detalhadamente. c) (0,75 ponto) Suponha que suas suspeitas no item anterior tenham sido confirmadas – isto é, que o teste proposto no item anterior indique que 0)|( ¹iti progcE . Que método de estimação você usaria para estimar a regressão de interesse? Justifique! d) (0,5 ponto) Você consegue estimar todos os parâmetros 1 e ,, dbga a partir do método proposto no item anterior? Explique. e) (0,5 ponto) Suponha agora que, em vez de depender das características não observáveis das cidades constantes no tempo, a participação no programa dependa de efeitos temporais não observados tq (por exemplo, fatores macroeconômicos que variem no tempo mas afetem todos os municípios da mesma forma). Logo, o modelo apropriado é agora: ittititiit vprogxzy +++++= qdbga 1 , i=1,2,...,N; t=1,2,...,T Uma forma de controlar para tais efeitos temporais seria através da introdução de variáveis dummy para cada período. Suponha, porém, que você não queira introduzir dummies para cada período. Que transformação do modelo acima pode ajudar a resolver a omissão do efeito temporal e tornar o modelo transformado estimável consistentemente por MQO? (Mostre algebricamente a transformação utilizada). Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 2 RESPOSTA a) A afirmação não é correta, pois a presença de autocorrelação nos erros implica a ineficiência, e não a inconsistência do estimador de MQO. b) Essa hipótese pode ser testada através do Teste de Hausman, que consiste em estimar o modelo por efeitos fixos e efeitos aleatórios e testar se a diferença entre as respectivas estimativas é estatisticamente significativa. O teste baseia-se na idéia de que, sob a hipótese de que o fator não observado c não tem correlação com os regressores, ambos os estimadores de efeitos fixos e efeitos aleatórios são consistentes – de modo que seria razoável esperar estimativas semelhantes a partir dos dois métodos –; mas, caso c seja correlacionado com algum regressor, apenas o estimador de efeitos fixos é consistente – de modo que seria razoável esperar estimativas diferentes a partir dos dois métodos. Logo, se as estimativas obtidas pelos dois métodos forem “significativamente” diferentes, isso é um indício contra a hipótese de ausência de correlação entre c e os regressores – e, portanto, a favor do uso do estimador de efeitos fixos (ou do estimador de primeira diferença). No teste de Hausman, a hipótese nula é que o estimador de efeitos aleatórios é consistente, e a hipótese alternativa é que esse estimador é inconsistente: Ho: 0)|( =iti progcE H1: 0)|( ¹iti progcE Se a estatística de teste superar o valor crítico da distribuição qui-quadrado (com p+1 graus de liberdade) ao nível de significância desejado, deve-se rejeitar H0. c) A rejeição da hipótese nula do teste de Hausman implica que a diferença entre as estimativas obtidas por efeitos fixos e por efeitos aleatórios é estatisticamente significativa. Logo, conforme explicado no item anterior, o correto seria estimar por efeitos fixos (ou primeira diferença, que também elimina o fator não observado c da regressão). d) Não. Na estimação por efeitos fixos (ou primeira diferença), qualquer variável constante no tempo é eliminada da regressão, da mesma forma que o efeito não observado c. Logo, esses métodos não permitem identificar o efeito sobre a variável dependente das características incluídas no vetor iz . e) Devemos procurar uma transformação do modelo que elimine o fator tq da regressão – assim como a transformação de efeitos fixos eliminava o fator c do modelo original. Uma possibilidade é trabalhar com os desvios em relação à média de cada variável para o conjunto dos indivíduos em cada ponto do tempo: . 1 1 )()()()( 1 1 1 etc z N z y N y onde vvpprogxxzzyy N i i N i itt tittittititit å å = = ÷ ø ö ç è æ= ÷ ø ö ç è æ= -+-+-+-=- dbg Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 3 Questão 2 (3,75 pontos) – O economista Pedro deseja realizar previsões da taxa de inadimplência nos empréstimos a pessoa física para outubro e novembro/2009. A partir de 400 observações mensais da taxa de inadimplência (y), ele estima o seguinte modelo AR(1): ttt uyy ˆ8.02 1 ++= - , 36.0)ˆvar( =tu A tabela abaixo apresenta as últimas informações disponíveis da taxa de inadmplência (y) e do resíduo da regressão acima ( tuˆ ): Período ty tuˆ Julho/09 8.6 0.2 Agosto/09 8.4 -0.48 Setembro/09 8 -0.72 a) (0,75 ponto) Calcule as previsões para outubro e novembro/2009, com seus respectivos intervalos de confiança a 95%. Explicite quaisquer hipóteses necessárias para realizar tal tarefa. b) (0,75 ponto) Qual seria uma previsão razoável, com seu respectivo intervalo de confiança, para a taxa de inadimplência em dezembro de 2011? A economista Paula decide investigar se o modelo AR(1) proposto por Pedro é realmente adequado para representar a dinâmica da taxa de inadimplência. Para tanto, ela calcula a FAC e FACP amostrais para a taxa de inadimplência a partir das 400 observações disponíveis, obtendo os seguintes resultados para as primeiras 12 defasagens: Defasagem 1 2 3 4 5 6 7 8 9 10 11 12 FAC 0.8792 0.6578 0.4592 0.2837 0.16 0.08 0.02 -0.007 -0.003 -0.006 -0.039 -0.069 FACP 0.8792 -0.507 0.32 -0.25 0.1628 -0.1 0.0502 0.002 0.042 -0.08 -0.048 0.075 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1 2 3 4 5 6 7 8 9 10 11 12 Defasagem FAC -0.6 -0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1 2 3 4 5 6 7 8 9 10 11 12 Defasagem FACP c) (1 ponto) Com base na análise da FAC e FACP acima, indique, dentre os processos abaixo, aquele que parece mais adequado para representar a série em questão: (a) ttt uyy ++= -18.02 (b) tttt uyyy +++= -- 21 1.07.02 (c) 11 8.08.02 -- +++= tttt uuyy (d) 11 8.08.02 -- -++= tttt uuyy (e) ttt uyy += -1 (f) 18.02 -++= ttt uuy Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 4 d) (0,5 ponto) Após selecionarum dos processos acima, Paula estima o modelo correspondente. A FAC, FACP e a estatística Q de Ljung-Box para várias defasagens dos resíduos do modelo estimado estão apresentadas abaixo. Você diria que o modelo estimado por Paula parece adequado? DEF FAC FACP Q-stat. [p-valor] 1 0.0721 0.0721 1.0455 [0.307] 2 0.0070 0.0018 1.0553 [0.590] 3 0.0066 0.0060 1.0641 [0.786] 4 -0.0236 -0.0247 1.1782 [0.882] 5 -0.0851 -0.0835 5.0685 [0.408] 6 -0.0266 -0.0074 5.2141 [0.517] 7 -0.0482 -0.0455 5.6967 [0.576] 8 -0.0791 -0.0729 6.9994 [0.537] 9 0.0139 0.0196 7.0401 [0.633] 10 0.0935 0.0854 9.2948 [0.504] 11 -0.0033 -0.0218 9.2972 [0.594] 12 -0.0819 -0.0903 11.5067 [0.486] e) (0,75 ponto) Vimos acima que Pedro e Paula propõem aproximar o processo gerador da série de inadimplência a partir de dois processos estocásticos distintos. Suponha que o VERDADEIRO processo econômico gerador da taxa de inadimplência seja descrito pelo sistema de equações abaixo: I. 1200 -++= ttt DJy bbb II. tt JD 10 gg += III. ttt eJJ += -11d 10 1 << d Onde y é a taxa de inadimplência, J é o desvio da taxa de juros real sobre os empréstimos em relação a seu nível de equilíbrio e D é a taxa de desemprego, e todos os parâmetros do modelo são positivos. Mostre que a trajetória da taxa de inadimplência segue um processo ARMA(p,q), definindo adequadamente o erro do modelo ARMA e especificando a relação entre os coeficientes desse modelo e os parâmetros do “verdadeiro” modelo econômico acima. [Dica: a forma mais fácil de resolver essa questão é usando o operador de defasagem L de forma “esperta”.] RESPOSTA a) Podemos escrever os valores a serem observados em t+1 e t+2 como: 12 2 212 11 ˆ8.0ˆ8.0)8.01(2ˆ8.02 ˆ8.02 +++++ ++ ++++=++= ++= tttttt ttt uuyuyy uyy Logo, as previsões são: 72.88*64.06.3)ˆ8.0ˆ(8.0)8.01(2)(~ 4.88*8.028.02)ˆ(8.02)(~ 12 2 22 111 =+=++++== =+=+=++== ++++ +++ ttttt ttttt uuEyyEy yuEyyEy E a variância do erro de previsão, supondo que não haja incerteza sobre os coeficientes estimados do modelo, é : 59.0)36.0(8.036.0)ˆ8.0ˆ()~( 36.0)ˆ()~( 2 1222 111 =+=+=- ==- ++++ +++ tttt ttt uuVaryyVar uVaryyVar Supondo normalidade dos erros, um intervalo de confiança aproximado a 95% das previsões para t+1 e t+2 é dado por: · t+1: )6.0(24.8)~(2~ 111 ±=-± +++ ttt yyVary · t+2: )768.0(272.8)~(2~ 222 ±=-± +++ ttt yyVary Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 5 b) Dado que o horizonte de previsão é bastante longo e o processo é estacionário, uma previsão razoável é a média do processo = 2/(1-0.8) = 10. Da mesma forma, a variância do erro de previsão pode ser aproximada pela variância do processo = 0.36/(1-0.8^2)=1. Logo, o intervalo de confiança para a previsão seria [8,12]. c) Inicialmente, note que o intervalo de confiança aproximado para a FAC e FACP é dado por 10.0400/2 ±=± . Ambas a FAC e a FACP apresentam decaimento gradual (para a FACP isso se verifica em módulo), o que sugere um processo misto ARMA(p,q) com p>0 e q>0. Logo, os candidatos são (c) e (d). Mas note que o processo (d) contém uma raiz comum nas partes autorregressiva e média móvel; de fato, o processo pode ser escrito como: tt uLyL )8.01(2)8.01( -+=- Se cancelarmos (1-0.8L) dos dois lados, obtemos: tt uy +-= )8.01/(2 e fica claro que o processo não deve apresentar nenhum padrão de autocorrelação, pois é equivalente a um processo i.i.d. O processo adequado é, portanto, (c). d) O modelo parece adequado, pois não há evidência de autocorrelação nos resíduos. De fato, todas as autocorrelações encontram-se dentro do intervalo de confiança ( 10.0400/2 ±=± ) e o teste Ljung-Box não rejeita a hipótese nula de não-significância das autocorrelações conjuntas para qualquer ordem considerada (note que os p-valores elevados não permitem rejeitar H0). e) Reescreva III como: )1( 1L e J tt d- = (IV) Usando (IV) em II: )1( 1 10 L e D tt d gg - += (V) (IV) e (V) em I: )1()1( )1()1( 1 1 12 1 0020 1 1 102 1 00 L e L e L e L e y tt tt t d gb d bgbb d ggb d bb - + - ++= ú û ù ê ë é - ++ - += - - Multiplicando os dois lados por )1( 1Ld- : 112002011 ))(1()1( -+++-=- ttt eeLyL gbbgbbdd Rearrumando: 1111 -- +++= tttt uuyy qdm Onde 012 0201 0 / ))(1( bgbq gbbdm b = +-= = tt eu Logo, trata-se de um ARMA(1,1). Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 6 Questão 3 (3,25 pontos) –O gráfico abaixo apresenta a evolução da série trimestral de gastos reais do setor público brasileiro, dessazonalizada e em logaritmo, G, para o período 1995-2008. 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 4.0 95 96 97 98 99 00 01 02 03 04 05 06 07 08 G A economista Paula deseja estimar um modelo para captar a evolução dessa série. Ele está em dúvida entre qual dos seguintes modelos utilizar: ),0(~ , ),0(~ 0, 0, , 10 onde G (IV) G (III) G (II) G (I) 22 1 1 1 etut ttttt tt ttt ttt iideiidu eXXXt ut uG uG ssamf fam am m fm ³³<< +=++= ++= ++= ++= - - - a) (0,5 ponto) Quais dos processos acima são estacionários (de 2ª.ordem) e quais não-estacionários? b) (1,25 ponto) Quais são as diferenças fundamentais entre os processos acima? Ou seja, quais são as diferenças entre as séries temporais “típicas” geradas por cada um desses processos? Qual (ou quais) dos processos acima parece(m) constituir uma boa aproximação para o processo gerador da série de interesse, G? Justifique cuidadosamente. c) (0,5 ponto) Com base em sua resposta ao item anterior, qual seria um processo adequado para representar o processo gerador da taxa de crescimento dos gastos (DG)? d) (0,5 ponto) O economista Pedro afirma: “Olhando para o período completo (1995-2008), realmente fica-se em dúvida sobre o melhor modelo para representar a evolução de G. Mas se analisarmos apenas o período 2000-2008, não há dúvida sobre qual é o melhor modelo”. Concorda? Discorda? Por quê? e) (0,5 ponto) A fim de verificar a validade da afirmação de Pedro, Paula estima regressões de G em uma constante e em uma tendência determinística linear para o período completo e para o subperíodo 2000-2008, obtendo as seguintes séries de resíduos: Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 7 -.16 -.12 -.08 -.04 .00 .04 .08 .12 .16 .20 1994 1996 1998 2000 2002 2004 2006 2008 RES_1995_2008 RES_2000_2008 onde RES_1995_2008 é a série de resíduos para o período completo e RES_2000_2008 é a série de resíduos para o subperíodo 2000-2008. Esse gráfico realmente parece corroborar a afirmação de Pedro? Ou não? RESPOSTA a) I é um AR(1) estacionário, pois 10 << f (de modo que a raiz da equação característica do processo é maior que 1). II não é estacionário, pois 1=f (de modo que a raiz da equação característica do processo é igual a 1); trata-se de um passeio aleatório com deslocamento (se 0>m ). A resposta para III e IV depende do valor de a ; se 0>a , trata-se de processos com tendência determinística e, portanto, não-estacionários: sua média depende do tempo; por outro lado, se 0=a , tais processos são estacionários. b) O processo I tende a flutuar em torno de uma média constante, apresentando algum grau de autocorrelação (“inércia”) que depende da magnitude de f . O processo II é muito persistente (o valor em t é altamente correlacionado com o valor em t-1) e não tende a voltar para algum nível constante. Além disso, se 0>m , o processo apresenta um componente determinístico de crescimento notempo. O processo III apresenta uma tendência determinística de crescimento. As séries temporais por ele geradas são desvios i.i.d. em torno dessa tendência determinística. O processo IV também apresenta uma tendência determinística de crescimento, mas as séries temporais por ele geradas são desvios autocorrelacionados (e não desvios i.i.d.) em torno dessa tendência determinística. Dependendo da magnitude de f , tais desvios podem ser mais ou menos persistentes, mas a série sempre converge para a tendência. (isso contrasta com o caso II, em que as séries também apresentam tendência determinística mas não tendem a convergir para essa tendência devido à raiz unitária do processo). O gráfico de G mostra uma clara tendência de crescimento no tempo, de modo que o processo I não é adequado. Dentre os processos que apresentam tendência de crescimento, podemos descartar III, pois claramente os desvios em torno da tendência de crescimento não são i.i.d (se traçarmos uma reta de tendência, os desvios apresentam-se claramente autocorrelacionados). Poderíamos, assim, ficar na dúvida entre II e IV, pois ambos permitem uma tendência de crescimento e desvios persistentes em torno da tendência; dada a curta extensão amostral, não é possível diferenciar adequadamente entre tais processos, pois não se sabe se há (ou não) tendência da série sempre convergir para uma reta. Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 8 c) Se supusermos que o processo adequado para G é II, então o processo para DG é: tt u+=D mG que é um processo i.i.d. com média maior que zero. Se supusermos que o processo adequado para G é IV, então o processo para DG é: tt XD+=D aG d) O raciocínio de Pedro é o seguinte: “Se traçarmos uma reta de tendência para o período como um todo, observaremos alguns desvios muito persistentes em torno dessa reta, pelo fato de que o crescimento de G ao longo do tempo não é uniforme (em particular, na primeira parte da amostra a série apresenta pouco ou nenhum crescimento). Logo, ficamos na dúvida entre o processo II (passeio aleatório com deslocamento) e o processo IV com f relativamente alto (digamos, acima de 0,8), que também poderia gerar séries com desvios muito persistentes em torno da tendência. Mas se olharmos apenas para o período pós-2000, a tendência de crescimento da série é aproximadamente constante e os desvios em torno de uma reta de tendência devem apresentar-se relativamente pouco persistentes (apesar de ainda autocorrelacionados), indicando que o processo IV deve ser mais adequado para representar a evolução de G nesse período”. Cabe ressaltar que, implícita no raciocínio de Pedro, está a idéia de que pode ter havido alguma “quebra estrutural” no comportamento de G, de modo que faria sentido analisar apenas o subperíodo mais recente a fim de identificar o processo gerador dessa variável. Se, por outro lado, não tiver havido nenhuma “quebra”, trabalhar com um período amostral mais reduzido não deveria ajudar a identificar adequadamente o processo. e) Paula realiza exatamente o exercício que Pedro havia imaginado acima, e os resultados parecem consistentes com a hipótese de Pedro: os resíduos para o período completo apresentam elevado grau de persistência, sendo compatíveis com um processo com raiz unitária ou com um AR(1) estacionário com f bastante elevado; enquanto que os resíduos para o período 2000-2008 apresentam-se muito menos persistentes, tendo mais “cara” de um AR(1) estacionário. Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio
Compartilhar