Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Departamento de Economia ECO 1800 - Técnicas de Pesquisa em Economia – 2011.2 Lista prática 1 Entrega: até 30/09/2011, em sala de aula Parte I: Dados em Painel Nesta parte da lista, analisaremos os determinantes da “taxa de fecundidade” (isto é, do número médio de filhos por mulher) observada nos municípios brasileiros. O objetivo da lista é contribuir para que você aprenda a: (i) Analisar dados em painel, implementando os métodos básicos de estimação vistos em sala de aula; (ii) Usar o IPEADATA, que é uma excelente ferramenta para quem trabalha com dados econômicos. Software Para seguir os procedimentos descritos abaixo, você precisará de algum software. Recomendamos usar o GRETL para Windows disponível gratuitamente na internet em: http://gretl.sourceforge.net/win32/. Note que abaixo serão feitas referências a comandos do GRETL tendo como base a versão 1.8.7, com tamanho de cerca de 11MB. Note também que o menu do Gretl pode estar em português ou inglês, dependendo de seu sistema operacional. Caso as instruções e dicas a seguir não sejam suficientes para a realização dos exercícios propostos, recorra ao manual do GRETL disponível na “Ajuda” do programa. Para instalar o Gretl (versão Windows), clique no link “gretl-1.8.7.exe” e execute o arquivo como você faria com qualquer arquivo no ambiente Windows e siga as instruções do programa de instalação. Caso você tenha uma versão anterior do Gretl instalada no seu computador, é recomendável desinstalá-la antes de proceder à instalação da nova versão. Dados Cada aluno deverá analisar os municípios localizados no Estado, ou Região, que lhe é atribuído na Tabela abaixo. Caso dois alunos desejem fazer o trabalho em dupla, eles devem escolher um dos Estados ou Regiões a eles atribuídos. Todas as listas devem especificar claramente, no início do trabalho, o Estado/Região escolhido. Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 2 Aluno Abrangência Aluno Abrangência (localização dos municípios): (localização dos municípios): ALESSANDRO TOLOMIOTTE RIVELLO Brasil PEDRO PINHEIRO DE LIMA F D AMOED Bahia: 1-209 ALLAIN GILSON COSTA PINHEIRO PIRES Centro-Oeste PEDRO VILLELA ABREU DOS SANTOS Bahia: 210-418 ANA CAROLINA TRINDADE RIBEIRO Nordeste POLIANA CAROLINA P C B M DA ROCHA Goiás: 1-123 ANTONIO WEHRS FLEICHMAN Norte RAFAEL RAMOS RONDINELLI Goiás: 124-246 BERNARDO HERINGER COELHO Sudeste RAFAEL ROSA CAMPOS Minas Gerais: 1-427 BRAWNER RAMOS DA SILVA Sul RAFAELA DE MARSILLAC GARCIA Minas Gerais: 428-853 BRUNA MONTEIRO DE MATTOS BOYD Acre RAFAELLA FREITAS PANAJOTTI Paraná: 1-202 BRUNA RAMOS SILVEIRA Alagoas RENATO LANDIM DE VASCONCELLOS Paraná: 203-403 BRUNO AUTRAN DOURADO DANIELIAN Amapá RICARDO DAHIS Rio Grande do Sul: 1-248 BRUNO GONCALVES SIQUEIRA Amazonas RODRIGO BERGMAN BITTENCOURT Rio Grande do Sul: 249-496 BRUNO LAZARO MEYER Bahia RODRIGO DE SOUZA EMERY Santa Catarina: 1-147 CAMILLE VALVERDE SERRA DA FONSECA Ceará RONALDO EDUARDO RODRIGUES POMBO Santa Catarina: 148-293 CARLOS DE CARVALHO MACEDO NETO Espírito Santo THIAGO DE LUCENA COELHO São Paulo: 1-323 CARLOS HUMBERTO T D DA COSTA FILHO Goiás THIAGO DE MELLO PAURA MASCARENHAS São Paulo: 324-646 CESAR DE AVILA TROTTE Maranhão THIAGO NEME SILVA Maranhão: 1-100 DANUBIA CRISTINA FREITAS Mato Grosso VITOR FONSECA FERREIRA Maranhão: 101-217 DEREK VAN BRUSSEL MACHADO Mato Grosso do Sul VITORIA RABELLO DE CASTRO Paraíba: 1-110 EDUARDO LIMA COUTINHO Minas Gerais WILLIAM SILVA DE ARAUJO Paraíba: 111-223 FELIPE NASCIMENTO RUPERTI Pará Piauí: 1-110 FRANCISCO EDUARDO C DO R BARROS Paraíba Piauí: 111-222 GABRIEL RENAULT DE OLIVEIRA SLOMP Paraná Ceará: 1-95 IGOR HARTZ RESTUM Pernambuco Ceará: 96-187 ISABELA FREIRE DE ANDRADE PINTO Piauí Pernambuco: 1-95 JULIA MATTA DE LUCA Rio de Janeiro Pernambuco: 96-185 JULIANA TREJOS VARGAS Rio Grande do Norte Sudeste: 1-200 LUCAS HENRIQUES DOURADO TEIXEIRA Rio Grande do Sul Sudeste: 201-400 LUISA CARNEIRO ALVES Rondônia Sudeste: 401-600 LUIZ FERNANDO M DE ALMEIDA NETO Roraima Sudeste: 601-800 LUIZ GUILHERME RAMALHO DE SOUZA Santa Catarina Sudeste: 801-1000 MARCELO MAGALHAES RIO TORTO São Paulo Sudeste: 1001-1200 MARCELO TORRES FALCON Sergipe Sudeste: 1201-1400 MARCOS VIANNA DA COSTA LEITE Tocantins Sudeste: 1401-1672 MARCUS MOREIRA NOVELLO Nordeste: 1-200 Sul: 1-200 MARCUS VINICIUS MEDEIROS C SIMOES Nordeste: 201-400 Sul: 201-400 MARIA CLARA LAGO FERRER Nordeste: 401-600 Sul: 401-600 MARIA LUISA DE ABREU RIBEIRO Nordeste: 601-800 Sul: 601-800 MARIANA BARROSO FINHOLDT Nordeste: 801-1000 Sul: 801-1000 MICHELLE CRISTINA FERREIRA Nordeste: 1001-1200 Sul: 1001-1196 OTAVIO MERCON Nordeste: 1201-1400 Norte: 1-200 PATRICK BUSSINGER Nordeste: 1401-1600 Norte: 201-451 PEDRO FILIPE CARNEIRO DE CARVALHO Nordeste: 1601-1805 Centro-Oeste: 1-200 (*) Alguns alunos trabalharão com subconjuntos dos municípios de certos Estados ou Regiões; por exemplo, onde aparece “Bahia: 1-209”, o aluno deverá analisar os primeiros (segundo ordem alfabética) 209 municípios da Bahia, e assim por diante. Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 3 Exercício 1 Neste exercício, você deverá: (i) baixar do IPEADATA, na internet, os dados referentes ao Estado ou região que lhe foi atribuída em sala de aula; (ii) importar esses dados para o Gretl; (iii) calcular e analisar estatísticas descritivas referentes a esses dados. 1. Baixando os dados do IPEADATA Para baixar as séries, acesse www.ipeadata.gov.br. A seguinte página se abrirá: Vá com o cursor sobre a aba “social”, no centro da tela, e em seguida em Nível geográfico/Municípios/Temas, conforme tela abaixo: Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 4 Em seguida, clique no tema “Demografia”: A seguinte tela se abrirá, mostrando todas as variáveis econômicas referentes ao tema “demografia” para as quais há dados: A clicar em “Taxa de fecundidade” (última série da lista), se abrirá nova tela solicitando uma “Definição da consulta”, na qual você deverá especificar o Estado/região que você deve analisar, selecionando a opção apropriada na caixa “Abrangência geográfica”. Se, por exemplo, você é o aluno número 11 (que deve analisar os municípios da Bahia), a tela deveria ser a seguinte: Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 5 Clique no ícone “Excel”, localizado no alto à direita, para baixar a série para seu computador no formato Excel, e salve o arquivo no seu computador. Note que seu arquivo deveria ter o aspecto abaixo, apresentando, em diferentes colunas, a sigla do Estado em questão, o nome e código de cada município, e os dados da taxa de fecundidade referentes a 1991 e 2000 (anos do Censo Demográfico no Brasil): Agora, repita os procedimentos acima para baixar os dados referentes às seguintes variáveis: · Professores do fundamental residentes com curso superior (%) (seguindo o caminho Social/Nível geográfico/Municípios/Temas/Educação) · Enfermeiros residentes com curso superior (%) (seguindo o caminho Social/Nível geográfico/Municípios/Temas/Saúde) · Analfabetos – pessoas 15 anos e mais (seguindo o caminho Social/Nível geográfico/Municípios/Temas/Educação) [Obs.: note que há duas variáveis homônimas (que se diferenciam pela fonte dos dados); você deve selecionar a que inclui dados para 1991 e 2000] Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 6 · Anos de estudo – média – pessoas 25 anos e mais (seguindo o caminho Social/Nível geográfico/Municípios/Temas/Educação) [Obs.: note que há duas variáveis homônimas (que se diferenciam pela fonte dos dados); você deve selecionar a que inclui dados para 1991 e 2000]· Renda per capita – R$ de 2000 (seguindo o caminho Social/Nível geográfico/Municípios/Temas/Renda) Observações para os alunos a partir do número 33: após baixarem os dados, vocês deverão eliminar as linhas com observações referentes aos municípios que vocês não devem analisar. Lembrem que vocês devem apagar, para cada variável, as observações desses municípios referentes a 1991 e a 2000. 2. Preparando os dados para importação para o Gretl Você deverá criar uma planilha com todos os dados acima em um formato apropriado para a importação de dados em painel. Há dois formatos básicos para dados desse tipo; no primeiro, os dados correspondem a “cross-sections (seções transversais) empilhadas” e estão estruturados da seguinte forma (supondo que haja N “unidades observacionais” – indivíduos, municípios etc. – observadas ao longo de T períodos): Unidade de observação (no nosso caso, município) Ano da observação Variável Y Variável X 1 1 Y11 X11 2 1 Y21 X21 : : : : N 1 YN1 XN1 1 2 Y12 X12 2 2 Y22 X22 : : : : N 2 YN2 XN2 : : : : : : : : 1 T Y1T X1T 2 T Y2T X2T : : N T YNT XNT Cross-section 1 (referente ao ano 1) Cross-section 2 (referente ao ano 2) Cross-section T (referente ao ano T) Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 7 No segundo formato, os dados correspondem a “séries temporais empilhadas” e estão estruturados da seguinte forma Unidade de observação (no nosso caso, município) Ano da observação Variável Y Variável X 1 1 Y11 X11 1 2 Y12 X12 : : : : 1 T Y1T X1T 2 1 Y21 X21 2 2 Y22 X22 : : : : 2 T Y2T X2T : : : : : : : : N 1 YN1 XN1 N 2 YN2 XN2 : : N T YNT XNT Vamos focar no formato de “cross-sections empilhadas”, pois é mais fácil colocar os dados baixados do IPEADATA nesse formato. Para tanto, faça o seguinte: (a) Abra um novo arquivo de Excel. (b) Nas células A1 e B1 digite, respectivamente, CODIGO e ANO. (c) Cole os códigos dos municípios a serem analisados na coluna A, a partir da célula A2 (lembre que os códigos dos municípios aparecem nos arquivos importados do IPEADATA). Se seu Estado tem 400 municípios, o último código deveria estar, portanto, na célula A401. (d) Preencha as células da coluna B, desde a B2 até a célula referente ao último município, com o número “1991” (sem aspas). (e) Digite, nas células C1, D1, E1, F1, G1 e H1: FECUND, PROF, ENFER, ANALF, ESTUDO e RENDA, respectivamente [evidentemente, FECUND = taxa de fecundidade, PROF = proporção de professores com curso superior, ENFER = proporção de enfermeiros com curso superior, etc.] (f) Cole, nas colunas C, D, E, F, G e H, a partir da segunda célula, os dados referentes ao ano de 1991 para cada uma das variáveis acima (que você baixou do IPEADATA). (g) Finalizada a tarefa anterior, você dispõe da primeira “cross-section” de municípios, referente ao ano de 1991. Resta, agora, colar os dados da segunda “cross-section”, referente a 2000, imediatamente abaixo da primeira. Para tanto, cole, nas colunas C, D, E, F, G e H, a partir da última linha com dados de 1991, os dados referentes ao ano de 2000 para cada uma das variáveis relevantes. As células correspondentes da coluna A devem ser preenchidas com os códigos de municípios apropriados, e as células da coluna B devem ser preenchidas com “2000” (sem aspas). Séries temporais referentes ao município 1 Séries temporais referentes ao município 2 Séries temporais referentes ao município N Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 8 Ao final desse processo, sua planilha deveria estar com aspecto semelhante ao seguinte: · No topo da planilha: · No meio da planilha (no ponto de contato entre as duas cross-sections): [Note que, no exemplo acima (referente à Bahia), há 418 municípios, de modo que as linhas 2 a 419 referem-se à primeira cross-section (1991), e as linhas 420 a 837 à segunda cross- section (2000)] Antes de finalizar, apague todos os sinais “-“, referentes a observações faltantes. [Você pode usar o comando Editar/Substituir]. Se você não fizer isso, não conseguirá importar os dados corretamente! 3. Importando os dados para o Gretl Para importar os dados da planilha criada acima para o Gretl, abra o Gretl e clique sucessivamente em Arquivo/Abrir Dados/Importar/Excel. Procure, no seu computador, o arquivo em questão e clique em Abrir. Especifique a coluna 1 e a linha 1 como início da importação e clique em OK. Talvez apareça uma mensagem de atenção, dizendo que havia valores ausentes. Nenhum problema, prossiga! Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 9 Deverá aparecer uma mensagem dizendo que os dados foram interpretados como “não datados” e perguntando se você deseja interpretá-los como séries temporais ou dados em painel. Clique em SIM. Em seguida, clique em Painel/Avançar e Secções cruzadas empilhadas/Avançar. Especifique o “número de unidades de secção cruzada”, isto é, o número de municípios analisados (no exemplo da Bahia acima, seriam 418) - ou, alternativamente, especifique o número de períodos (2). Atenção para não interpretar a estrutura de dados de forma equivocada, trocando o número de períodos pelo número de municípios! Aparecerá uma mensagem confirmando a estrutura de dados. Verifique se o número de “unidades de secção cruzada” é igual a seu número de municípios, e se o número de períodos é 2. Caso positivo, clique em OK. Se a janela do Gretl estiver parecida com a figura abaixo, estamos prontos para a ação! Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 10 4. Cálculo e análise de estatísticas básicas (a) Selecione todas as variáveis de interesse (FECUND, PROF, ENFER, ANALF, ESTUDO e RENDA), clicando na primeira e na última, mantendo pressionada a tecla SHIFT. Em seguida, clique sobre elas com o botão direito do mouse e selecione “Estatísticas descritivas”. Mostre a tabela com as estatísticas obtidas. [Você pode copiar a tabela para o Word usando a tecla “Copiar” do Menu da janela correspondente] (b) Agora calcule a matriz de correlação simples entre essas variáveis: após selecioná-las (como acima), clique sobre elas com o botão direito do mouse e selecione “matriz de correlação”. Mostre a tabela com as correlações obtidas. (c) Produza e mostre gráficos de dispersão entre FECUND e cada uma das seguintes variáveis: ANALF, ESTUDO e RENDA. [Após selecionar cada par de variáveis, clique com o botão direito do mouse e selecione “Gráfico de dispersão”] (d) Comente os resultados dos itens (b) e (c) acima. Ainda que correlações simples possam ser enganosas, as correlações obtidas correspondem ao que você esperaria do ponto de vista teórico? Exercício 2 Neste exercício, você estimará algumas regressões, através de diversos métodos, com o objetivo de analisar a relação entre FECUND e as demais variáveis. Partiremos do seguinte modelo de interesse: iti k itkitit uaxxy +++++= bba ... 1 1 (1) onde y é a variável dependente (no nosso caso, trata-se de FECUND) e os x são as variáveis explicativas. Temos N unidades observacionais (municípios) observados ao longo de T períodos. Note que, dentre as variáveis explicativas, podemos ter: (i) variáveis cujos valores variam entre indivíduos e no tempo (por exemplo, a média de anos de estudo, ESTUDO, é diferente para diferentes municípios e também varia para o mesmo município quando observado em dois anos distintos); (ii) variáveis cujos valores variam entre indivíduos mas são constantes no tempo (por exemplo, poderíamos incluir características geográficas de cada município, como uma dummy para municípios localizados no litoral, etc.); (iii) variáveis cujos valores variam no tempo, mas são idênticos para todos os municípios (por exemplo,o nível do PIB do país, ou qualquer outra variável macroeconômica, que varie entre 1991 e 2000 mas seja a mesma para todos os municípios; note que o efeito agregado de todas essas variáveis “macro” sobre a variável dependente poderia ser captada pela inclusão de uma tendência temporal no modelo, isto é, uma variável que atribua valor 1 para as observações do primeiro período de observação, valor 2 para as observações do segundo período, e assim por diante), ou pela inclusão de dummies de ano. O termo ai representa um “efeito individual não-observado”, isto é, o efeito de diversos fatores omitidos da regressão que variam entre indivíduos mas são constantes no tempo. O termo u representa os demais fatores omitidos da regressão. Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 11 Definindo vit = ai + uit, podemos ter os seguintes estimadores dos parâmetros de (1): - MQO “agrupado” (“pooled”): estima-se por MQO a regressão it k itkitit vxxy ++++= bba ... 1 1 (2) onde i = 1,...,N t = 1,..., T - Estimador de primeira diferença: estima-se por MQO a regressão it k itkitit uxxy D+D++D=D bb ... 1 1 (3) onde i = 1,...,N t = 2,..., T e D representa o operador de primeira diferença, tal que 1, --=D tiitit yyy . - Estimador de efeitos fixos: estima-se por MQO a regressão ( ) ( ) ( ) ( )iitkikitkiitiit uuxxxxyy -+-++-=- bb ...111 (4) onde i = 1,...,N t = 1,..., T e å = = T t iti yy 1 , ou seja, o valor médio da variável y observada no município i ao longo dos T períodos analisados. - Estimador de efeitos aleatórios: estima-se por MQO a regressão ( ) ( ) ( ) ( )iitkikitkiitiit vvxxxxyy llblblal -+-++-+-=- ...)1( 111 (5) onde i = 1,...,N t = 1,..., T e l = 1-[ su2/( su2 + T sa2)]1/2. Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 12 Dependendo da existência, ou não, de correlação entre os regressores e os fatores omitidos da regressão, tais estimadores podem, ou não, ser consistentes. Em particular: I. Se houver correlação entre u e algum regressor, todos os estimadores acima são inconsistentes. II. Se não houver correlação entre u e algum regressor, então: a. Se houver correlação entre a e algum regressor, então os estimadores de MQO e de efeitos aleatórios são inconsistentes, mas os estimadores de primeira diferença e de efeitos fixos são consistentes. b. Se não houver correlação entre a e algum regressor, todos os estimadores acima são consistentes. Entretanto, o estimador de efeitos aleatórios seria mais eficiente do que os demais, pois: (i) utiliza todos os dados da amostra (enquanto que os estimadores de efeitos fixos e primeira diferença perdem N graus de liberdade); (ii) leva em consideração a existência de autocorrelação em vit, devida ao fato de que todas as observações referentes ao mesmo município apresentam um elemento comum no erro, dado pelo efeito não- observado ai (o que é ignorado pelo estimador de MQO). Mas, como saber se há correlação entre os regressores e os fatores omitidos da regressão? Na verdade, não há como responder com certeza. Contudo, podemos tentar avaliar a probabilidade de que algum fator omitido da regressão seja significantemente correlacionado com algum regressor, com base em: · argumentos teóricos; · testes estatísticos. Um dos testes usados com tal objetivo é o chamado “teste de Hausman”. No contexto de dados de painel, o teste baseia-se na idéia de que, sob a hipótese de que o fator não observado a não tem correlação com os regressores, ambos os estimadores de efeitos fixos e efeitos aleatórios são consistentes – de modo que seria razoável esperar estimativas semelhantes a partir dos dois métodos –; mas, caso a seja correlacionado com algum regressor, apenas o estimador de efeitos fixos é consistente – de modo que seria razoável esperar estimativas diferentes a partir dos dois métodos. Logo, se as estimativas obtidas pelos dois métodos forem “significativamente” diferentes, isso é um indício contra a hipótese de ausência de correlação entre a e os regressores – e, portanto, a favor do uso do estimador de efeitos fixos (ou do estimador de primeira diferença). No teste de Hausman, a hipótese nula é que o estimador de efeitos aleatórios é consistente, e a hipótese alternativa é que esse estimador é inconsistente. A estatística de teste tem uma distribuição qui-quadrado com k graus de liberdade; logo, valores “elevados” dessa estatística (ou seja, p-valores baixos) fornecem indícios da inadequação do estimador de efeitos aleatórios. Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 13 OK, vamos à ação. (a) Vamos começar com a estimação por MQO. Clique sucessivamente em Modelo/Mínimos Quadrados, defina FECUND como variável dependente e, como variáveis explicativas (além da constante): PROF, ENFER, ANALF, ESTUDO e RENDA; clique em OK. Mostre e interprete os resultados obtidos. (b) Estime a mesma equação anterior por MQO, mas dessa vez inclua, como variável explicativa adicional, uma “tendência temporal” – isto é, uma variável que atribui valor 1 para as observações do primeiro período de observação (1991), e valor 2 para as observações do segundo período (2000). Mostre e interprete os resultados obtidos. [Para criar a variável de tendência temporal, clique em Acrescentar/Tendência temporal; feito isso, a nova variável aparecerá com o nome “time”.] (c) Se você tivesse incluído a variável ANO, em vez da variável “time”, na regressão do item anterior, seus resultados teriam sido diferentes? Explique. (d) Estime a mesma equação do item (b) por MQO, mas dessa vez inclua, como variável explicativa adicional, uma variável de interação entre “time” e ESTUDO, que podemos chamar de “EST_time”. Mostre e interprete os resultados obtidos. [Para criar a variável de interação, clique em Acrescentar/Definir nova variável e digite, na janela que se abrirá (sem aspas): “EST_time=ESTUDO*time”.] (e) Agora, vamos usar o estimador de primeira diferença. Para criar as primeiras diferenças de FECUND, PROF, ENFER, ANALF, ESTUDO e RENDA, selecione essas variáveis e clique em Acrescentar/Primeiras diferenças das variáveis selecionadas. As novas variáveis aparecerão com nomes como “d_FECUND”, “d_PROF” etc. Estime por MQO, então, a regressão de d_FECUND em d_PROF, d_ ENFER, d_ANALF, d_ESTUDO e d_RENDA, sem incluir uma constante. Mostre e interprete os resultados obtidos. (f) Estime a mesma equação acima, com as variáveis em primeira diferença, mas desta vez inclua uma constante. Qual é a interpretação do intercepto estimado? Compare os resultados com os obtidos no item (b). (g) Agora, vamos usar o estimador de efeitos fixos. Clique em Modelo/Painel/Efeitos fixos ou aleatórios, especifique a variável dependente (FECUND) e as explicativas (PROF, ENFER, ANALF, ESTUDO e RENDA, além de uma constante), selecione a opção “Efeitos fixos” e clique em OK. [Obs.: note que essa especificação da equação a ser estimada refere-se à equação de interesse na forma original, ANTES da transformação de efeitos fixos, que inclui uma constante a: iti k itkitit uaxxy +++++= bba ... 1 1 Sabemos, porém, que ao aplicarmos a transformação de efeitos fixos, a constante será eliminada da regressão: ( ) ( ) ( ) ( )iitkikitkiitiit uuxxxxyy -+-++-=- bb ...111 O que significa, então, o coeficiente estimado da constante (“const”) que aparece no resultado da estimação do gretl? Trata-se da média de ˆia para a totalidade dos municípios, onde: Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 14 1 1ˆ ˆˆ ... ki i i k ia y x xb b= - - - i=1,...,N Ver a discussão a respeito desse ponto no livro do Wooldridge, p.438.] (h) Compare os resultados do item anterior com os obtidos no item (e), através doestimador de primeira diferença. Você nota alguma coisa interessante? (i) Estime a mesma equação do item g (efeitos fixos), mas desta vez inclua a variável “time” como explicativa. Compare os resultados com os obtidos no item (f), através do estimador de primeira diferença. Você nota alguma coisa interessante? (j) Sob que condições os estimadores de primeira diferença e efeitos fixos seriam mais adequados do que o estimador de MQO em uma estimação com dados de painel? No caso em questão, há razões teóricas para acreditar que tais condições sejam satisfeitas – de modo que MQO seja realmente inadequado? (k) Agora, vamos usar o estimador de efeitos aleatórios. Clique em Modelo/Painel/Efeitos fixos ou aleatórios, especifique a variável dependente (FECUND) e as explicativas (PROF, ENFER, ANALF, ESTUDO e RENDA, além de uma constante), selecione a opção “Efeitos aleatórios” e clique em OK. Compare os resultados com os obtidos anteriormente com os estimadores de MQO, primeira diferença e efeitos fixos. (l) Com base no resultado do “teste de Hausman”, que aparece na janela correspondente à regressão do item anterior (efeitos aleatórios), qual parece ser o melhor estimador do modelo de interesse, dentre todos os testados acima (MQO/primeira diferença/efeitos fixos/efeitos aleatórios)? Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 15 Parte II: Séries Temporais Nesta parte da lista, você vai inicialmente realizar duas atividades: · Criar e simular “mecanismos geradores de dados” correspondentes a vários processos estocásticos, analisando as características das séries temporais geradas. · Em seguida, você deverá tentar identificar, dentre os processos considerados, aqueles que parecem constituir as melhores aproximações aos processos geradores das séries econômicas que lhe forem atribuídas (e que você deverá baixar do IPEADATA, na internet). O objetivo desses exercícios iniciais é contribuir para que você: (iii) entenda a diferença entre um processo estocástico e a série temporal por ele gerada; (iv) entenda e compare as características dos processos estocásticos em questão; (v) perceba a utilidade desses processos estocásticos na análise de séries econômicas. Em seguida, você vai aplicar, às suas séries econômicas, métodos de: · Decomposição de séries temporais em componentes de “tendência” e “ciclo”; · Dessazonalização de séries temporais; Cada aluno (ou dupla) deverá analisar séries temporais referentes às exportações ou importações de um setor produtivo específico, conforme tabela a seguir. Notem que algumas séries são mensais, e as demais são trimestrais. Cada aluno (ou dupla) deverá analisar séries temporais referentes às exportações ou importações de um setor produtivo específico, conforme tabela a seguir. [As instruções detalhadas para baixar os dados do IPEADATA encontram-se no Exercício 4 abaixo] Obs.: Não esqueçam de explicitar o nome do setor analisado na Lista. Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 16 Aluno Atividade Setor ALESSANDRO TOLOMIOTTE RIVELLO Exportações Bens de capital ALLAIN GILSON COSTA PINHEIRO PIRES Exportações Bens de consumo duráveis ANA CAROLINA TRINDADE RIBEIRO Exportações Bens de consumo não duráveis ANTONIO WEHRS FLEICHMAN Exportações Bens intermediários BERNARDO HERINGER COELHO Exportações Produtos básicos BRAWNER RAMOS DA SILVA Exportações Produtos semimanufaturados BRUNA MONTEIRO DE MATTOS BOYD Exportações Produtos manufaturados BRUNA RAMOS SILVEIRA Exportações setor: abate de animais BRUNO AUTRAN DOURADO DANIELIAN Exportações setor: açúcar BRUNO GONCALVES SIQUEIRA Exportações setor: agropecuária BRUNO LAZARO MEYER Exportações setor: beneficiamento de produtos vegetais CAMILLE VALVERDE SERRA DA FONSECA Exportações setor: borracha CARLOS DE CARVALHO MACEDO NETO Exportações setor: café CARLOS HUMBERTO T D DA COSTA FILHO Exportações setor: calçados CESAR DE AVILA TROTTE Exportações setor: celulose, papel e gráfica DANUBIA CRISTINA FREITAS Exportações setor: elementos químicos DEREK VAN BRUSSEL MACHADO Exportações setor: equipamentos eletrônicos EDUARDO LIMA COUTINHO Exportações setor: extrativa mineral FELIPE NASCIMENTO RUPERTI Exportações setor: indústrias diversas FRANCISCO EDUARDO C DO R BARROS Exportações setor: madeira e mobiliário GABRIEL RENAULT DE OLIVEIRA SLOMP Exportações setor: máquinas e tratores IGOR HARTZ RESTUM Exportações setor: material elétrico ISABELA FREIRE DE ANDRADE PINTO Exportações setor: metalurgia não ferrosos JULIA MATTA DE LUCA Exportações setor: minerais não metálicos JULIANA TREJOS VARGAS Exportações setor: óleos vegetais LUCAS HENRIQUES DOURADO TEIXEIRA Exportações setor: outros produtos alimentares LUISA CARNEIRO ALVES Exportações setor: outros produtos metalúrgicos LUIZ FERNANDO M DE ALMEIDA NETO Exportações setor: peças e outros veículos LUIZ GUILHERME RAMALHO DE SOUZA Exportações setor: químicos diversos MARCELO MAGALHAES RIO TORTO Exportações setor: refino de petróleo MARCELO TORRES FALCON Exportações setor: siderurgia MARCOS VIANNA DA COSTA LEITE Exportações setor: têxtil MARCUS MOREIRA NOVELLO Exportações setor: veículos automotores MARCUS VINICIUS MEDEIROS C SIMOES Importações Bens de capital MARIA CLARA LAGO FERRER Importações Bens de consumo duráveis MARIA LUISA DE ABREU RIBEIRO Importações Bens de consumo não duráveis MARIANA BARROSO FINHOLDT Importações Bens intermediários MICHELLE CRISTINA FERREIRA Importações setor: abate de animais OTAVIO MERCON Importações setor: agropecuária PATRICK BUSSINGER Importações setor: artigos de vestuário PEDRO FILIPE CARNEIRO DE CARVALHO Importações setor: beneficiamento de produtos vegetais PEDRO PINHEIRO DE LIMA F D AMOED Importações setor: borracha PEDRO VILLELA ABREU DOS SANTOS Importações setor: calçados POLIANA CAROLINA P C B M DA ROCHA Importações setor: celulose, papel e gráfica RAFAEL RAMOS RONDINELLI Importações setor: elementos químicos RAFAEL ROSA CAMPOS Importações setor: equipamentos eletrônicos RAFAELA DE MARSILLAC GARCIA Importações setor: extrativa mineral RAFAELLA FREITAS PANAJOTTI Importações setor: farmacêutica e perfumaria RENATO LANDIM DE VASCONCELLOS Importações setor: indústrias diversas RICARDO DAHIS Importações setor: laticínios RODRIGO BERGMAN BITTENCOURT Importações setor: madeira e mobiliário RODRIGO DE SOUZA EMERY Importações setor: máquinas e tratores RONALDO EDUARDO RODRIGUES POMBO Importações setor: material elétrico THIAGO DE LUCENA COELHO Importações setor: metalurgia não ferrosos THIAGO DE MELLO PAURA MASCARENHAS Importações setor: minerais não metálicos THIAGO NEME SILVA Importações setor: óleos vegetais Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 17 VITOR FONSECA FERREIRA Importações setor: outros produtos alimentares VITORIA RABELLO DE CASTRO Importações setor: outros produtos metalúrgicos Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 18 Aluno Atividade Setor WILLIAM SILVA DE ARAUJO Importações setor: peças e outros veículos Importações setor: químicos diversos Importações setor: siderurgia Importações setor: têxtil Importações setor: veículos automotores Exportações(*) Bens de capital Exportações(*) Bens de consumo duráveis Exportações(*) Bens de consumo não duráveis Exportações(*) Bens intermediários Exportações(*) Produtos básicos Exportações(*) Produtos semimanufaturados Exportações(*) Produtos manufaturados Importações(*) Bens de capital Importações(*) Bens de consumo duráveis Importações(*) Bens de consumo não duráveis Importações(*) Bens intermediáriosImportações(*) setor: abate de animais Importações(*) setor: agropecuária Importações(*) setor: artigos de vestuário Importações(*) setor: beneficiamento de produtos vegetais Importações(*) setor: borracha Importações(*) setor: calçados Importações(*) setor: celulose, papel e gráfica Importações(*) setor: elementos químicos Importações(*) setor: equipamentos eletrônicos Importações(*) setor: extrativa mineral Importações(*) setor: farmacêutica e perfumaria Importações(*) setor: indústrias diversas Importações(*) setor: laticínios Importações(*) setor: madeira e mobiliário Importações(*) setor: máquinas e tratores (*) Para as atividades marcadas com (*), o aluno deverá trabalhar apenas com dados até o final de 2006. Para tanto, o aluno pode importar para o gretl as séries completas (conforme instruções mais adiante) e, no gretl, definir a subamostra a ser usada nos exercícios (clicando em Amostra/Definir intervalo e selecionando o fim da amostra em 2006:4, no caso de séries trimestrais, ou 2006:12, para dados mensais); ou, então, “eliminar” os dados após 2006:4 (ou 2006:12) no Excel antes de importar as séries para o gretl. Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 19 Exercício 3 Um mecanismo gerador de dados (MGD) é um conjunto de regras/fórmulas através do qual é possível gerar um número arbitrário de séries temporais. Por exemplo, um MGD possível é o processo estocástico conhecido como ruído branco gaussiano: ... 2, 1, t)1,0N(~ =te Através deste MGD, é possível gerar infinitas séries temporais de tamanho T para e. Para tanto, basta gerar aleatoriamente, a partir da distribuição normal padrão, uma seqüência de tamanho T de valores. Outros MGD’s possíveis são os processos estocásticos MA(1) e AR(1): )1,0N(~,)5,0( 1 ttttY eee -+= 0),1,0N(~,)5.0( 01 =+= - YYY tttt ee Através desses MGD, é possível gerar infinitas séries temporais de tamanho T para Y. Para tanto, basta gerar aleatoriamente, a partir da distribuição normal padrão, uma seqüência de tamanho T de valores para o ruído branco e, e então usar as fórmulas acima (e, no caso do AR(1), o valor inicial Y0=0) para gerar as seqüências correspondentes de valores de Y. Repetindo esse processo N vezes, geram-se N diferentes séries temporais. Note que, ao especificar um MGD, devemos explicitar todos os detalhes necessários para a geração de uma série temporal. No caso do AR(1), por exemplo, a omissão do valor inicial Y0 impediria a geração das séries temporais de Y. A seguir, vamos gerar séries temporais a partir de vários processos estocásticos distintos. Para tanto, você deve inicialmente seguir os passos abaixo: 1. Primeiro, você deve abrir um “arquivo de comando” [“script file”] do Gretl, onde os comandos referentes à simulação serão digitados. Um arquivo de comando do Gretl é simplesmente um arquivo texto com terminação “.inp” em que podemos digitar vários comandos, um por linha; quando desejarmos executar todos os comandos digitados, basta ordenar ao Gretl para “executar” o conjunto de comandos. No menu principal do Gretl, clique em Arquivo/Arquivos de Comandos/Novo Arquivo de Comandos/comandos gretl. Uma nova janela se abrirá (“gretl: seqüência de comandos”), onde os comandos de seu “programa” serão digitados. Note que nenhum comando será executado até que você ordene ao Gretl para que o faça. 2. Digite os comandos para gerar a base de dados a ser usada na simulação: nulldata 100 setobs 4 1:1 --time-series Ao ser executado, o primeiro comando cria uma base de dados vazia, na qual as variáveis criadas poderão conter até 100 observações. O segundo comando determina uma estrutura temporal para os dados – sendo que o “4” indica tratar-se de dados trimestrais (4 observações dentro do ano) e “1:1” indica a data da observação inicial (totalmente arbitrária neste caso, pois significa “ano 1: trimestre 1”). Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 20 3. Na linha seguinte, digite: genr u=normal() que, ao ser executado, vai gerar (“genr” significa “generate”) uma série temporal composta por sorteios “aleatórios” independentes a partir da distribuição normal padrão – ou seja, uma realização do ruído branco gaussiano. (“aleatórios” está entre aspas porque, na verdade, o sorteio não é exatamente aleatório, pois está baseado em um algoritmo que gera sequências de números que “parecem” aleatórios, mas não o são... Mas não se preocupe com isso – para nossos fins, podemos supor que os valores de u são realmente sorteados de modo totalmente aleatório.) 4. Na linha seguinte, digite: series y=u+0.9*u(-1) que gera séries temporais a partir de um processo MA(1) com coeficiente 0,9. 5. Na linha seguinte, digite: smpl 1 series x=0 smpl 2 100 series x=0.9*x(-1)+u Essa série de comandos gera séries temporais a partir de um processo AR(1). A primeira linha indica que você está restringindo a amostra “ativa” à observação 1 da base de dados (“smpl” refere-se a “sample”), de modo que qualquer comando que venha a seguir atuará apenas sobre essa observação. A segunda linha, portanto, atribui o valor “0” para a observação inicial do processo x. A terceira linha indica que os comandos subsequentes valerão para as observações 2 a 100 da base de dados. Finalmente, a quarta linha gera a série temporal de x a partir da fórmula do processo AR(1), com coeficiente auto-regressivo igual a 0,9. OK, estamos prontos para rodar nosso primeiro programa de Gretl! Antes, porém, é conveniente salvar o arquivo de comando com os comandos acima, clicando no ícone “Gravar” [Save] da janela correspondente. Agora, vamos em frente: (a) Execute seu programa, clicando no ícone “Executar” [Run] da janela “gretl: seqüência de comandos” [gretl: command script]. O Gretl abrirá uma nova janela (“gretl: saída da sequência de comandos” [gretl: script output]) em que aparecerão os comandos executados. Imprima essa janela. Na janela principal do Gretl, deverão aparecer as variáveis u, y e x, correspondentes às séries temporais geradas pelo programa. Note que podem ocorrer alguns problemas (“bugs”) ao rodar o programa, como o uso equivocado de vírgulas/pontos para as casas decimais etc. Nesse caso, aparecerá uma mensagem de erro na janela de saída, e você deverá tentar descobrir e corrigir o erro. (b) Mostre as estatísticas descritivas das séries geradas de u, y e x. Para tanto, selecione as variáveis u, y e x (clique sobre elas com o mouse mantendo a tecla SHIFT pressionada), clique no botão direito do mouse e selecione “Estatísticas Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 21 descritivas” [Descriptive statistics]. Note que você pode copiar a tabela de estatísticas descritivas para seu editor de texto clicando no ícone “Copiar” [Copy] da janela correspondente. (c) Gere um gráfico com as séries de u, x e y. Para tanto, selecione as variáveis u, y e x (clique sobre elas com o mouse mantendo a tecla SHIFT pressionada), clique no botão direito do mouse e selecione “Gráfico de série temporal” [Time series plot]. Copie e cole esse gráfico para seu editor de texto clicando com o botão direito sobre o gráfico e selecionando “Copiar para a memória de edição” [Copy to clipboard]. (d) Execute seu arquivo de comando mais 3 vezes. Em cada caso, mostre as estatísticas descritivas e gráficos das séries geradas, como nos itens (b) e (c) acima. (e) Apesar de termos apenas 4 realizações de cada processo, já é possível ter uma idéia de algumas características das séries temporais geradas por cada um desses processos. Quais parecem ser as diferenças e semelhanças entre as séries geradas por cada processo – em particular, no que se refere à média, variância e padrão de autocorrelação dos processos?[O nível médio das séries de cada processo é semelhante? Parece constante ao longo do tempo? A variância das séries em torno da média é semelhante entre processos? Parece constante ao longo do tempo? Existe algum “padrão de autocorrelação” discernível nos gráficos – por exemplo, um valor positivo elevado tende a ser seguido por outro valor positivo elevado etc.?] (f) Modifique seu programa (arquivo de comando [script]) de modo a gerar três processos estocásticos adicionais, x2, x3 e x4, dados por: 104),1,0N(~,4)9.0(4 03),1,0N(~,3)9.0(2.03 02),1,0N(~,2)5.0(2 01 01 01 =+= =++= =+= - - - XuuXX XuuXX XuuXX tttt tttt tttt Apresente o programa modificado. (g) Execute o programa modificado algumas vezes, calculando e apresentando as estatísticas descritivas e os gráficos das séries x, x2, x3 e x4 (para cada repetição do exercício, coloque todas as séries no mesmo gráfico). De que forma o comportamento “típico” das séries x2, x3 e x4 difere de x? Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 22 Muitas séries econômicas – a maioria delas, na verdade – não é estacionária. Logo, é provável que processos AR e MA estacionários, como os que vimos acima, não sejam boas aproximações para explicar o comportamento dessas séries, sendo necessário recorrer ao uso de processos estocásticos não-estacionários. Existem dois tipos básicos de não estacionariedade, associados à presença de uma tendência determinística ou estocástica no processo. Um exemplo de processo com tendência determinística é: )1,0N(~,)3.0(1 ttt uutW += onde t é uma simples “tendência temporal” (isto é, uma variável que assume valor 1 no período 1, valor 2 no período 2 e assim por diante). De acordo com esse processo, o valor esperado de W1 aumenta no tempo de forma determinística (no caso, linearmente). O valor observado de W1 em t desvia do valor esperado (0,3 t) devido à presença do ruído branco u. Outro exemplo de processo com tendência determinística é: tt xtW += )3.0(2 onde 0),1,0N(~,)9.0( 01 =+= - xuuxx tttt Nesse caso, o valor esperado de W2 também aumenta linearmente com o tempo. Aqui, porém, os desvios de W2 em relação a seu valor esperado são um AR(1), e não um ruído branco. Ou seja, os desvios em relação à “tendência de longo prazo” da série serão mais persistentes do que no caso anterior. Os exemplos mais simples de processos com tendência estocástica (isto é, de processo com “raiz unitária”) são o passeio aleatório simples: 01),1,0N(~,11 01 =+= - ZuuZZ tttt e o passeio aleatório “com deslocamento” (“drift”): 02),1,0N(~,22.02 01 =++= - ZuuZZ tttt . Vamos simular esses processos, a fim de aprender um pouco sobre suas características. (h) Escreva um novo “arquivo de comando” do Gretl que gere os processos W1, W2, Z1 e Z2 descritos acima. Note que a tendência linear “t” é automaticamente criada pelo Gretl, sob o nome “index”. Note também que muitos dos comandos serão os mesmos do programa anterior – por exemplo, na geração da base de dados e da série de ruído branco; logo, pode ser interessante salvar o programa anterior sob outro nome e fazer as modificações necessárias. Apresente o programa completo. (i) Execute esse novo programa algumas vezes, calculando e apresentando as estatísticas descritivas e os gráficos das séries W1, W2, Z1 e Z2 (para cada repetição do exercício, coloque todas as séries no mesmo gráfico). Quais são as semelhanças e diferenças no comportamento “típico” dessas séries? Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 23 Por fim, vamos simular três processos simples que apresentem “sazonalidade” – isto é, ciclos com freqüência sazonal, que é uma característica presente em diversas séries econômicas: 01111),1,0N(~,1*8.01 32104 ====+= - YYYYuuYY tttt 02222),1,0N(~,2*4.02*4.02 321041 ====++= -- YYYYuuYYY ttttt 03333),1,0N(~,3*6.03*4.03.03 321041 ====+++= -- YYYYuuYYY ttttt Nesses processos, a sazonalidade é captada simplesmente pela presença dos termos defasados de 4 trimestres (pois estamos trabalhando com dados trimestrais). Note que isso implica a necessidade de valores iniciais para as primeiras 4 observações de cada série!! (j) Escreva um novo “arquivo de comando” do Gretl que gere os processos Y1, Y2 e Y3 descritos acima. Apresente o programa completo. (k) Execute esse novo programa algumas vezes, apresentando os gráficos das séries Y1, Y2 e Y3 (para cada repetição do exercício, coloque as séries no mesmo gráfico). Quais são as semelhanças e diferenças no comportamento “típico” dessas séries? (Observação: os processos em questão são estacionários?) Resumindo... Em suma, ao final do exercício você deverá ser capaz de elencar as principais características de séries temporais geradas pelos seguintes processos estocásticos: · Ruído branco · MA(1) · AR(1) estacionário (com coeficiente autoregressivo baixo/alto e presença/ausência de intercepto) · Passeio aleatório simples · Passeio aleatório com deslocamento · Processos com tendência determinística · Processos sazonais estacionários/não-estacionários Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 24 Exercício 4 Neste exercício, você deverá: 1. Baixar do IPEADATA, na internet, as séries econômicas referentes à atividade (exportação ou importação) e ao setor produtivo que lhe foi atribuído. 2. Analisar as principais características dessas séries e opinar sobre quais processos estocásticos, dentre os processos analisados no exercício anterior, parecem constituir as melhores aproximações aos processos geradores das séries em questão. 1. Baixando as séries do IPEADATA Para cada setor, as séries econômicas a serem analisadas são: · Índice de preço das exportações (ou importações) setoriais · Índice de quantum das exportações (ou importações) setoriais Para baixar as séries, você deve acessar, como na Lista 1-a, www.ipeadata.gov.br. Vá então em Macroeconômico/Fontes/Funcex, conforme abaixo (obs.: algumas séries podem estar em “FUNCEX”, outras em “FUNCEX-SÉRIES ANTIGAS”) Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 25 No meio da tela serão, então, listadas as séries referentes à fonte escolhida (Funcex). Agora é só descer até localizar as séries referentes ao setor de interesse, que estarão descritas da seguinte forma: · Exportações – setor: XXX – preços – índice (média 2006 = 100) · Exportações – setor: XXX – quantum – índice (média 2006 = 100) · Importações – setor: XXX – preços – índice (média 2006 = 100) · Importações – setor: XXX – quantum – índice (média 2006 = 100) onde XXX, evidentemente, é o nome do setor em questão. Marque, nas caixinhas ao lado do nome de cada variável, as séries mensais ou trimestrais disponíveis e, em seguida, clique no botão “Exportar para Excel”, localizado no canto superior da tela, do lado direito. O arquivo salvo deve ter o formato abaixo, incluindo a planilha “Séries” com os dados e a planilha “Comentários” com detalhes/comentários sobre as séries exportadas. Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 26 Apague o conteúdo das células B1 e C1, substituindo-o por Q para a série de quantum e P para a série de preço. Apague também os sinais “-“, caso faltem dados referentes a alguns períodos. Salve o arquivo modificado. Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 27 2. Análise das principais características das séries Para a análise das principais características das séries, você deve simplesmente: (a) Criar um gráfico para cada série (e mostrar esses gráficos!). (b) Comentar sobre as principais características de cada série. Em particular: a série aparenta ser estacionária? Caso pareça nãoestacionária, parece caracterizar-se por tendência determinística de crescimento? Ou parece mais com um passeio aleatório? Apresenta sazonalidade? Apresenta “quebras estruturais” – isto é, subperíodos em que parece comportar-se de forma muito distinta de outros subperíodos? (c) Com base em seus comentários no item anterior, qual dos processos analisados no Exercício 3 parece mais adequado para retratar o comportamento de cada uma dessas séries econômicas? Seja o mais específico possível, procurando indicar não apenas o processo mais adequado (por exemplo, “um AR(1)”), mas também valores possíveis para os coeficientes do processo (por exemplo, “um AR(1) com coeficiente autoregressivo elevado mas menor do que 1”). Justifique sua resposta adequadamente. Instruções para importação dos dados do Excel para o Gretl (caso opte em usar o Gretl neste exercício) · Clique sucessivamente em: Arquivo/Abrir dados/Importar/Excel, selecione o arquivo de interesse em seu computador, e clique em Abrir. · Especifique, na janela Gretl: importação de folha de cálculo, a coluna 1 e linha 1 da planilha como a célula inicial para a importação. Deverá aparecer uma mensagem dizendo que os dados importados foram interpretados como “não datados” e perguntando se você deseja interpretá-los como séries temporais. Clique em SIM. Em seguida, selecione “Série temporal”, clique em AVANÇAR, selecione “Trimestral”, clique novamente em AVANÇAR, especifique a observação inicial de suas séries (1977:1 ou 1978:1), clique uma vez mais em AVANÇAR, e finalmente clique em OK. Observação importante: Para realizar alguns dos exercícios abaixo, você deve instalar o aplicativo “X12-ARIMA”, que realiza um popular método de dessazonalização. Para tanto, vá até a página web do Gretl para Windows (http://gretl.sourceforge.net/win32/) e baixe o arquivo executável x12a_install.exe. Note que você precisa ter instalado o Gretl previamente. Após a instalação do X12-ARIMA, será possível rodar o programa através do caminho Variable/X12- ARIMA analysis do Gretl. Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 28 Exercício 5 a) Crie os logaritmos das variáveis P e Q e as primeiras diferenças dos logaritmos das mesmas. Chame as novas variáveis de “l_P”, “l_Q”, “ld_P” e “ld_Q”, respectivamente. Note que o uso de variáveis em logaritmo é muito comum em economia, pois permite “suavizar” o comportamento das séries e/ou torná-las mais adequadas a métodos lineares de estimação. Além disso, note que ld_X = l_X – l_X(-1) pode ser interpretada como a taxa de crescimento da variável X (sendo que um valor igual a 0,01 equivale, aproximadamente, a um crescimento de 1%). [No Gretl, selecione a variável de interesse e clique em Acrescentar/ Logaritmos das variáveis selecionadas e Acrescentar/ Diferenças de logaritmos das variáveis selecionadas] b) Crie dois gráficos, o primeiro com as variáveis l_P e ld_P, e o segundo com l_Q e ld_Q. Quais são as características mais marcantes de cada série? Elas parecem apresentar sazonalidade (isto é, um padrão cíclico em freqüência anual)? Tendência de crescimento? “Quebras estruturais” (mudanças de nível ou tendência entre subperíodos da amostra)? Parecem estacionárias (de segunda ordem)? Quais características parecem ser mais afetadas quando a variável é especificada em primeira diferença? [No Gretl, para visualizar o gráfico de duas séries, selecione-as mantendo a tecla CTRL pressionada, clique sobre uma delas com o botão direito e selecione Gráfico de série temporal] c) Rode a regressão de l_P em uma tendência determinística (e uma constante). Interprete os coeficientes estimados. [No Gretl, para adicionar uma tendência determinística linear à base de dados (de modo a poder incluí-la como regressor na equação acima), clique em Acrescentar/ tendência temporal.] d) Salve a série de valores ajustados sob o nome “l_P_t” e a série de resíduos da regressão sob o nome “l_P_r”. Analise graficamente essa série de resíduos, que pode ser interpretada como uma medida grosseira do desvio (percentual) do preço de exportação em relação a seu “nível de longo prazo” (isto é, sua “tendência”, dada, no caso, por l_P_t). De que forma ela se diferencia da série l_P? [No Gretl, para salvar os resíduos da sua regressão, clique, na janela do modelo estimado, em Gravar/resíduos.] e) Repita os procedimentos dos itens (c) e (d) para a série l_Q (chamando os resíduos correspondentes de l_Q_r). f) Nos itens anteriores, você analisou dois tipos de “transformação” das variáveis l_P e l_Q: (i) a operação de tomar a primeira diferença dessas variáveis; (ii) a operação de regredir essas variáveis em uma tendência determinística e pegar os resíduos dessas regressões. O que essas operações parecem ter em comum, em termos das mudanças que causam nas propriedades das séries originais? Por exemplo, essas operações parecem alterar (ou mesmo eliminar) a tendência presente nas séries originais? Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 29 Exercício 6 Vimos acima que, ao regredir l_P em uma tendência determinística (e uma constante), podemos interpretar os resíduos da regressão como uma medida grosseira do desvio (percentual) do preço de exportação em relação a seu “nível de longo prazo” (isto é, sua “tendência”) – que seria dado, por sua vez, pelo valor ajustado da regressão. Ou seja, esse é um método simples de “decompor” uma série temporal em um componente de “tendência” e um componente “sem tendência” (associado a ciclos ou elementos irregulares). A principal limitação desse método de decomposição é que ele impõe a restrição de que a tendência de crescimento da variável é constante (afinal, a tendência é dada pela reta de regressão). Um método alternativo, bastante popular entre os economistas (apesar de suas deficiências), que não impões essa restrição é o chamado “filtro de Hodrick-Prescott” – ou, simplesmente, “filtro HP”. Nesta questão, vamos ilustrar esse procedimento. (a) Use o filtro de Hodrick-Prescott para criar novas séries de tendência do log do preço exportado (sob o nome l_P_t2) e de desvios do log do preço exportado observado em relação a essa tendência (sob o nome l_P_r2). [No Gretl, clique em Variavel/Filtro/Hodrick-Prescott e marque as opções para gravar a “série alisada”(que será l_P_t2) e o “componente cíclico” (que será l_P_r2).] (c) Crie dois gráficos: no primeiro, coloque as séries l_P, l_P_t e l_P_t2; no segundo gráfico, coloque as séries l_P_r e l_P_r2. Analise os resultados e diga qual dos dois métodos de “decomposição em tendência-ciclo” você julga mais adequado para a série em questão. Exercício 7 Agora vejamos alguns métodos para decompor uma série temporal em um “componente sazonal” e um componente “sem sazonalidade”. a) Estime uma regressão pelo método de MQO usando l_Q_r como variável dependente e 4 dummies sazonais (uma para cada trimestre) como regressores [OBS.: no caso de séries mensais, a regressão requer 12 dummies sazonais, uma para cada mês]. Não inclua a constante na regressão! (Explique por que não podemos incluir a constante). Como os coeficientes dessas dummies podem ser interpretados? [No Gretl, para criar dummies periódicas clique em Acrescentar/ Variáveis auxiliares periódicas.] b) Salve a série de resíduos da regressão anterior sob o nome “l_Q_rd”; esta nova série é uma medida (“grosseira”) do quantum exportado (em log) “dessazonalizado e sem tendência” (a série l_Q_r era a série de quantum “sem tendência”, conforme você verificou no Exercício 5; agora, acabamos de “dessazonalizá-la). Apresente no mesmo gráfico l_Q_r e l_Q_rd, comentando as principais diferenças e semelhanças entre as séries. (c) Dessazonalize a série l_Q através do método X-12, salvando a série dessazonalizada sob o nome l_Q_d. Em seguida, rode a regressão de l_Q_d em uma tendência determinística e umaconstante, e salve os resíduos dessa segunda regressão sob o nome l_Q_rd2. Note que, ao realizar esses dois procedimentos, você acaba de obter uma nova estimativa da variável “dessazonalizada” (através do método X-12) e “sem tendência” (através da regressão na tendência determinística). Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 30 [No Gretl, para dessazonalizar uma série pelo método X-12 você deve selecionar a variável de interesse e clicar em Variável/Análise X-12 ARIMA. Marque a opção “Série sazonalmente ajustada” para salvar a série dessazonalizada. Ao fazer isso, a série é salva automaticamente sob um nome do tipo “l_Q_d11”. Para mudar esse nome, clique com o botão direito sobre a série e depois em Edit attributes, editando em seguida o campo apropriado] (d) Crie um gráfico das séries sem tendência dessazonalizadas pelo método X-12 e pelo método da regressão em variáveis dummy (l_Q_rd2 e l_Q_rd) e analise o resultado. Parece fazer muita diferença usar o método X-12 ou a regressão em variáveis dummy nesse caso? [No Gretl, para criar dummies mensais é suficiente clicar em Data/Add variables/Periodic dummies. Para salvar resultados da sua estimação (por exemplo, a variável dependente “ajustada” ou os resíduos da regressão) clique, na janela do modelo estimado, em Model data/Add to dataset e selecione o resultado a ser salvo.] Exercício 8 a) Estime um modelo AR(1) , com intercepto, para cada uma das variáveis l_Q_rd e l_P_r. Estime esses modelos por Mínimos Quadrados Ordinários (MQO). Pelos resultados das estimações, podemos dizer que essas séries parecem ser estacionárias e fracamente dependentes? [No Gretl, a forma mais fácil de estimar um modelo ARMA é clicando em Model/série temporal/ARIMA (Model/Time series/ARIMA). Na janela que se abre, você deve especificar a variável dependente e a ordem de defasagens do modelo ARIMA(p,d,q), onde p é a maior defasagem dos termos autoregressivos, d é o número de vezes que a série modelada deve ser diferenciada, e q é maior defasagem dos erros. Note que um modelo ARMA(p,q) é equivalente a um modelo ARIMA(p,0,q). No caso em questão, pede-se para estimar um AR(1), que é o mesmo que um ARMA(1,0), que é equivalente a um ARIMA(1,0,0) – ou seja, na linha “Non Seasonal” você deve especificar “1” no “AR order” e “0” nos campos “Difference” e “MA order”. Não inclua nenhuma variável independente além da constante, e não modifique nenhuma das outras opções default.] b) Agora estime um modelo AR(4) , com intercepto, para cada uma das variáveis l_Q_rd e l_P_r. Note que um modelo AR(4) pode ser escrito como: tttttt uYYYYY +++++= ---- 443322110 fffff ou, usando o operador de defasagem: ( ) tt uYLLLL +=---- 044332211 fffff Lembre também que o processo será estacionário se todas as raízes da equação característica: 01 44 3 3 2 21 =---- LLLL ffff forem, em módulo, maiores do que 1. No caso do modelo AR(4) que você estimou, quais são os valores das raízes características (em módulo)? O que isso sugere acerca da estacionariedade do processo)? [No Gretl, ao estimar um modelo ARMA pelo procedimento descrito acima, as raízes características das partes AR e MA aparecem na parte de baixo da janela com os resultados da estimação. Outros softwares, como o Eviews, fazem o mesmo.] Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 31 Exercício 9 (a) Restrinja o intervalo de dados do arquivo que estamos usando, de modo que as últimas 8 observações fiquem fora do intervalo – pois essas observações serão usadas para avaliar a capacidade preditiva dos modelos estimados. [Clique em Amostra/Definir intervalo e especifique o período relevante] (b) Identifique e estime o melhor modelo ARMA(p,q) para a série l_Q_rd e realize projeções dessa variável para os 8 trimestres que você excluiu da amostra no item anterior. Você deve justificar adequadamente a escolha do modelo ARMA, mostrando e analisando a FAC/FACP da série, testes de diagnóstico do modelo estimado etc. [Na janela do modelo estimado, clique em Análise/Previsões e selecione “previsão automática”] (c) Agora estime modelos AR(1) e MA(1) para l_Q_rd e gere previsões da série para os 8 trimestres finais da amostra a partir de cada modelo, conforme feito no item (b). [Obs.: se o modelo ARMA selecionado no item anterior for uma AR(1) ou um MA(1), estime um AR(2) ou MA(2) em seu lugar] (d) Compare a capacidade preditiva do modelo ARMA(p,q) selecionado no item (b) e dos modelos AR(1) e MA(1) (ou AR(2)/MA(2)) do item (c), com base nos critérios do MAPE (“erro percentual absoluto médio”) e do RMSE (“raiz do erro quadrático médio”) – veja Apêndice a seguir. Mostre suas contas. [Dica: você pode colar os resultados para o Excel e fazer a conta ali] (e) Suponha que você esteja interessado em prever quais serão as importações (ou exportações, dependendo da sua base de dados) daqui a 1 mês, 2 meses, 3 meses, 4 meses, 5 meses e 6 meses. Para fazer tais previsões, você está interessado em descobrir o melhor modelo para cada previsão para cada horizonte de tempo diferente. Como você alteraria o teste da questão (d) para descobrir o melhor modelo para previsão para daqui a um mês, o melhor modelo para daqui a dois meses, e assim por diante? [Dica.: Perceba que para fazer uma avaliação pouco sujeita a sorte, precisaremos observar várias previsões um mês a frente, várias previsões dois meses a frente, e assim por diante] Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 32 APÊNDICE · Avaliação da capacidade preditiva A avaliação da capacidade preditiva de um modelo deve estar baseada em observações fora da amostra. Suponha que você disponha de N observações da variável de interesse. (1) Estima-se o modelo até determinado período T, deixando de lado as últimas N – T observações (2) Realizam-se previsões para as últimas N – T observações (3) Comparam-se os valores previstos com os observados As medidas de capacidade preditiva estão baseadas no erro de previsão ttt YYe ˆ-= . Algumas medidas usuais: · Erro percentual absoluto médio: å÷ ø ö ç è æ - = += N Tt t t Y e TN MAPE 1 1 · Raiz do erro quadrático médio: å÷ ø ö ç è æ - = += N Tt teTN RMSE 1 21 Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio
Compartilhar