Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Departamento de Economia ECO 1800 - Técnicas de Pesquisa em Economia – 2011.1 Lista prática 2 Data de entrega: até 16/06/2011 (em sala de aula) Nessa lista, você vai trabalhar, uma vez mais, com as séries econômicas referentes ao setor que lhe foi atribuído anteriormente, e que você baixou do IPEADATA conforme instruções das listas práticas anteriores: • P = Índice de preço das exportações (ou importações) setoriais • Q = Índice de quantum das exportações (ou importações) setoriais Além dessas séries, você deverá baixar duas séries adicionais do IPEADATA: • PT = Índice de preço das exportações totais (ou das importações totais, caso a sua série setorial se refira à importação) • QT = Índice de quantum das exportações totais (ou das importações totais, caso a sua série setorial se refira à importação) Para baixar essas séries adicionais, você deverá: i. Acessar www.ipeadata.gov.br. ii. Clicar na aba “Macroeconômico”, depois em “Fontes” e, em seguida, na opção “Funcex/Funcex” (que é a fonte dos dados). iii. No meio da tela, onde estão listadas as séries referentes ao tema (comércio exterior) e fonte (Funcex) escolhidos, localize as séries de interesse, que estarão descritas da seguinte forma: - Exportações – preços – índice (média 2006 = 100) - Exportações – quantum – índice (média 2006 = 100) Ou, caso suas séries se refiram à importação: - Importações – preços – índice (média 2006 = 100) - Importações – quantum – índice (média 2006 = 100) iv. Caso os dados referentes a seu setor sejam mensais, simplesmente marque, nas caixinhas ao lado do nome de cada variável, as séries mensais e passe para o passo (v) a seguir. Caso os dados referentes a seu setor sejam trimestrais, após marcar as séries mensais você deve clicar no botão “Operar”, localizado no canto superior da tela, do lado direito. Na tela que se abrirá, especifique, no campo referente à operação “Mudar periodicidade”, a nova periodicidade “Trimestral”, conforme Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 2 abaixo. Não mude o método de agregação pela “média” – que determina que cada observação das novas séries corresponderá à média dos valores observados em cada trimestre. v. Clique em “Exportar”, localizado no canto inferior da tela, do lado direito. Quando perguntado sobre o método de exportação, clique em “Planilha Excel” e salve o arquivo em seu computador. O arquivo salvo deve ter o formato abaixo, incluindo a planilha “Séries” com os dados e a planilha “Comentários” com detalhes/comentários sobre as séries exportadas. vi. Apague o conteúdo das células B1 e C1, substituindo-o por QT para a série de quantum e PT para a série de preço. Salve o arquivo modificado. Em seguida, é só importar as séries de interesse para o Gretl. OBS.1: Note que o procedimento descrito acima se refere às séries de exportação (ou importação) TOTAIS. As séries SETORIAIS já devem ter sido baixadas para a realização da Lista anterior. OBS.2: Nos exercícios a seguir, onde se lê “exportações”, “quantum exportado”etc., leia- se “importações”, “quantum importado”etc., caso suas séries se refiram à importação. OBS.3: A seguir, repetimos os setores com que cada aluno deve trabalhar. Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 3 Aluno Atividade Setor ALEXANDRE BEVILAQUA BARBUR Exportações Bens de capital BRAWNER RAMOS DA SILVA Exportações Bens de consumo duráveis BRUNA DUTRA ALVARENGA Exportações Bens de consumo não duráveis BRUNO BONI DE OLIVEIRA Exportações Bens intermediários CAROLINA COELHO GOMES CAMOES Exportações Produtos básicos CHRISTIANE SZERMAN Exportações Produtos semimanufaturados DAVID SERGIO HAIM NIGRI Exportações Produtos manufaturados FELIPE NASCIMENTO RUPERTI Exportações setor: abate de animais FERNANDO MENDONCA DOMINGUES Exportações setor: açúcar FERNANDO ORMONDE TEIXEIRA Exportações setor: agropecuária GABRIELA MENDONCA FONSECA Exportações setor: beneficiamento de produtos vegetais GUSTAVO BICHARRA PINTO Exportações setor: borracha IGOR HARTZ RESTUM Exportações setor: café ILAN SAMPAIO PARNES Exportações setor: calçados JULIA VILLAS BOAS LEMOS Exportações setor: celulose, papel e gráfica JULIO MENDES LIBERGOTT Exportações setor: elementos químicos KAMILA LIU Exportações setor: equipamentos eletrônicos LEONARDO DE PAOLI CARDOSO DE CASTRO Exportações setor: extrativa mineral LUIZ EDUARDO WERNECK DE A T KESSLER Exportações setor: indústrias diversas LUIZ FELIPE TEIXEIRA BRANDAO Exportações setor: madeira e mobiliário MARIANA BELOTTI DE LEMOS Exportações setor: máquinas e tratores MICHELLE CRISTINA FERREIRA Exportações setor: material elétrico PATRICK BUSSINGER Exportações setor: metalurgia não ferrosos PEDRO PAULO DIRENE LOUREIRO Exportações setor: minerais não metálicos POLIANA CAROLINA P C B M DA ROCHA Exportações setor: óleos vegetais RAFAEL D ALMEIDA L DE ALBQUERQUE Exportações setor: outros produtos alimentares RICARDO SPONFELDNER BERMUDES Exportações setor: outros produtos metalúrgicos RODRIGO BERGMAN BITTENCOURT Exportações setor: peças e outros veículos RODRIGO DE SOUZA EMERY Exportações setor: químicos diversos RODRIGO FISZMAN IGREJAS LOPES Exportações setor: refino de petróleo RODRIGO MACHADO SANTOS Exportações setor: siderurgia RONALDO ESTEVES BORGERTH TEIXEIRA Exportações setor: têxtil TOMAS URANI Exportações setor: veículos automotores VANESSA TAVARES JESUS DE OLIVEIRA Importações Bens de capital VITOR CABRAL PONTES DE CARVALHO Importações Bens de consumo duráveis YLAN ADLER Importações Bens de consumo não duráveis André Marchetti Pinheiro Importações Bens intermediários Bruna Monteiro de Mattos Boyd Importações setor: abate de animais Bruno Autran Dourado Danielian Importações setor: agropecuária Bruno Cani Stussi Neves Importações setor: artigos de vestuário Bruno Gonçalves Siqueira Importações setor: beneficiamento de produtos vegetais Camila Siqueira Benelli Importações setor: borracha Dante Rodrigo Delibero Tatsch Importações setor: calçados Eduardo de Araujo Pinheiro Silveira Importações setor: celulose, papel e gráfica Felipe Eduardo Sydio de Souza Thomé Importações setor: elementos químicos Frederico Nogueira de Resende Bessa Importações setor: equipamentos eletrônicos Isabel Amaral de Souza Importações setor: extrativa mineral Isadora Vianna Sento Sé Importações setor: farmacêutica e perfumaria José Roberto Miller Melo Importações setor: indústrias diversas Julia Cuptchik Importações setor: laticínios Juliana Portella de Aguiar Vieira Importações setor: madeira e mobiliário Karen Sampaio Roxo Importações setor: máquinas e tratores Lucas Costa Santos Importações setor: material elétrico Luiz Guilherme Ramalho de Souza Importações setor: metalurgia não ferrosos Marcela Loures Bueno de Moraes Importações setor: minerais não metálicos Marcelo Magalhães Rio Torto Importações setor: óleos vegetais Maria Carolina Rocha de Faria Importações setor: outros produtos alimentares Maria Clara Lago Ferrer Importações setor: outros produtos metalúrgicos Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 4 Aluno Atividade Setor Pedro Alberto Freire de Carvalho Importações setor: peças e outros veículos Pedro de Souza Dantas Importações setor: químicos diversos Pedro Filipe Carneiro de Carvalho Importações setor: siderurgia Pedro Neri Cannabrava Importações setor: têxtil Pedro Pinheiro de Lima F. D. Amoedo Importações setor: veículos automotores Tania Maria de Siqueira Exportações(*) Bens de capital Thiago Alves Simões Exportações(*) Bens de consumo duráveis Thiago de MelloPaura Mascarenhas Exportações(*) Bens de consumo não duráveis Thiago Rodrigues Bessa Mattos Exportações(*) Bens intermediários William Silva de Araujo Exportações(*) Produtos básicos Exportações(*) Produtos semimanufaturados Exportações(*) Produtos manufaturados Importações(*) Bens de capital Importações(*) Bens de consumo duráveis Importações(*) Bens de consumo não duráveis Importações(*) Bens intermediários Importações(*) setor: abate de animais Importações(*) setor: agropecuária Importações(*) setor: artigos de vestuário Importações(*) setor: beneficiamento de produtos vegetais Importações(*) setor: borracha Importações(*) setor: calçados Importações(*) setor: celulose, papel e gráfica Importações(*) setor: elementos químicos Importações(*) setor: equipamentos eletrônicos Importações(*) setor: extrativa mineral Importações(*) setor: farmacêutica e perfumaria Importações(*) setor: indústrias diversas Importações(*) setor: laticínios Importações(*) setor: madeira e mobiliário Importações(*) setor: máquinas e tratores (*) Para as atividades marcadas com (*), o aluno deverá trabalhar apenas com dados até o final de 2006. Para tanto, o aluno pode importar para o gretl as séries completas (conforme instruções mais adiante) e, no gretl, definir a subamostra a ser usada nos exercícios (clicando em Amostra/Definir intervalo e selecionando o fim da amostra em 2006:4, no caso de séries trimestrais, ou 2006:12, para dados mensais); ou, então, “eliminar” os dados após 2006:4 (ou 2006:12) no Excel antes de importar as séries para o gretl. Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 5 Exercício 1 (“Regressão com dados estacionários”) Exercício 1.1 Inicialmente, crie os logaritmos das variáveis P e Q e as primeiras diferenças dos logaritmos das mesmas. Chame as novas variáveis de “l_P”, “l_Q”, “ld_P” e “ld_Q”, respectivamente. Note que o uso de variáveis em logaritmo é muito comum em economia, pois permite “suavizar” o comportamento das séries e/ou torná-las mais adequadas a métodos lineares de estimação. Além disso, note que ld_X = l_X – l_X(-1) pode ser interpretada como a taxa de crescimento da variável X (sendo que um valor igual a 0,01 equivale, aproximadamente, a um crescimento de 1%). [No Gretl, selecione a variável de interesse e clique em Acrescentar/ Logaritmos das variáveis selecionadas e Acrescentar/ Diferenças de logaritmos das variáveis selecionadas (Add /Logs of selected variables e Add/ Log differences of selected variables)] a) Estime uma regressão de ld_Q em ld_P, além de uma constante e , possivelmente, dummies sazonais (caso a série ld_Q apresente sazonalidade – justifique sua decisão a esse respeito!). b) Agora estime uma regressão de ld_Q em ld_P e ld_Q defasada de um período, além de uma constante e , possivelmente, dummies sazonais. Este é o chamado “modelo de ajustamento parcial”. [No Gretl, para incluir a primeira defasagem da variável dependente como regressor você deve, após clicar em Modelo/OLS e selecionar a variável dependente e as explicativas, clicar em “defasagens”, ativar “defasagens da variável dependente” e especificar quais defasagens deseja incluir – no caso, apenas uma] c) Os coeficientes estimados nas duas regressões anteriores apresentam os sinais esperados? São estatisticamente significativos? Nessas equações, você espera que o estimador de MQO seja não-viesado? Consistente? d) O que o valor das estatísticas DW obtidas nos itens (a) e (b) sugerem acerca da presença (ou não) de correlação serial dos respectivos erros? Levando em consideração que o teste DW só é válido no caso de regressores estritamente exógenos, você diria que o uso dessa estatística é válido para as equações sob análise? e) Realize o teste de Breusch-Godfrey para auto-correlação de primeira ordem dos erros das equações dos itens (a) e (b). Esse procedimento implica estimar uma regressão dos resíduos da equação original, êt, nos regressores da equação original e no resíduo defasado de um período, êt-1. Indique explicitamente se o resultado do teste indica ou não a presença de autocorrelação residual! [No Gretl: na janela do modelo estimado, clique em Testes/autocorrelação (Tests/Autocorrelation) e selecione 1 defasagem para o teste. São apresentadas as duas versões do teste: teste-F para exclusão conjunta dos resíduos defasados (no caso, trata-se de um teste-t por tratar-se de apenas uma restrição) e teste baseado na estatística T*R2. Lembre que a hipótese nula é a ausência de auto-correlação; logo, valores elevados da estatística de teste indicam a presença de auto-correlação.] f) Generalize o teste para auto-correlação realizado no item anterior, permitindo que a série de erros siga um processo AR(4). Para tanto, você deve estimar a regressão de êt nos regressores da equação original e nos resíduos defasados até 4 períodos (isto é, de êt-1 a êt-4), e testar a Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 6 validade da exclusão conjunta de todos os resíduos defasados através de um teste-F ou, novamente, pelo cálculo da estatística T*R2. [No Gretl: na janela do modelo estimado, clique em Tests/Autocorrelation e selecione 4 defasagens para o teste.] h) Quais são as possíveis implicações da presença de correlação serial dos erros para os estimadores de MQO? A partir dos testes realizados nos itens anteriores, o que você conclui acerca das propriedades das estimações dos modelos estimados nos itens (a) e (b)? Exercício 1.2 a) Em um modelo ADL (“autoregressive distributed-lag”), a variável dependente é explicada por suas próprias defasagens (a parte “autoregressiva” do modelo) e por valores contemporâneos e defasados de outras variáveis explicativas (a parte de “defasagens distribuídas”): tntnttktktt uXXXYYY ++++++++= −−−− βββααµ ...... 11011 Estime um modelo ADL tendo como variável dependente ld_Q e como regressores as primeiras 3 defasagens de ld_Q (isto é, de t-1 a t-3) e ld_P (contemporâneo e defasado também até a terceira defasagem), além de um intercepto (µ na equação acima) e, possivelmente, dummies sazonais. [No Gretl, para criar as defasagens requeridas você deve selecionar as variáveis de interesse e clicar em Data/ Add variables/Lags of selected variables e, então, especificar quantas defasagens você deseja gerar (no caso, 3). Depois, é só estimar o modelo por MQO incluindo todas as defasagens como regressores] b) No modelo ADL, o multiplicador de longo prazo de Y em relação a X é dado por: k n ααα ββββδ −−−− ++++ = ...1 ... 21 210 Calcule o multiplicador de longo prazo de ld_Q em relação a ld_P a partir do ADL estimado no item anterior. O valor calculado faz sentido do ponto de vista econômico? c) Realize o teste de Breusch-Godfrey para auto-correlação dos erros da equação acima, permitindo que a série de erros siga um processo AR(4). Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 7 Exercício 2 (“Regressão espúria”) Em sala de aula, você aprendeu que, ao rodarmos uma regressão entre variáveis não- estacionárias, estamos sujeito ao risco de gerar uma “regressão espúria”. Neste exercício, você realizará uma “simulação de Monte Carlo” com o objetivo de verificar, na prática, o problema da regressão espúria. Uma simulação de Monte Carlo é um experimento composto pelos seguintes estágios: (1) Criação de um “mecanismo gerador de dados (MGD)”; isto é, de um conjunto de regras/fórmulas através do qual seja possível gerar um número arbitrário de “pseudo- amostras”. Por exemplo, um MGD possível é: 0),1,0N(~,)5.0( 01 =+= − YYY tttt εε Através deste MGD, é possível gerar uma série temporal de tamanho T para Y (ou seja, uma pseudo-amostra de Y).Para tanto, basta gerar aleatoriamente, a partir da distribuição normal acima, uma seqüência de tamanho T de valores para o termo ε, e então usar a fórmula e o valor inicial (Y0=0) especificados acima para gerar a seqüência correspondente de valores de Y. Repetindo esse processo N vezes, geram-se N diferentes séries temporais para Y. Note que, ao especificar um MGD, devemos explicitar todos os detalhes necessários para a geração das pseudo-amostras. No caso acima, por exemplo, a omissão do valor inicial Y0 impediria a geração das séries temporais de Y. (2) Geração, a partir do MGD, de uma “pseudo-amostra” de tamanho T. (3) Cálculo de alguma estatística de interesse a partir da pseudo-amostra; por exemplo: a média amostral de Y, sua variância amostral, suas auto-covariâncias amostrais, o coeficiente φˆ na regressão ttt YY εφ ˆˆ 1 += − , etc. (4) Repetição dos passos (2) e (3) acima N vezes - de modo a gerar N diferentes pseudo- amostras e, consequentemente, N diferentes valores da estatística de interesse. (5) Construção e análise da distribuição de freqüência da estatística de interesse observada nas N repetições - o que nos fornece uma estimativa da distribuição amostral dessa estatística para amostras de tamanho T obtidas a partir do MGD em questão. Para que essa distribuição amostral esteja bem estimada, é necessário que o experimento seja repetido muitas vezes – isto é, que N seja um número grande. Note que, muitas vezes, estamos preocupados apenas com alguns momentos dessa distribuição, como a média e variância; por exemplo, quando queremos comparar dois estimadores alternativos em termos de viés (“Supondo certo processo gerador de dados, qual estimador apresenta o menor viés em amostras pequenas, com cerca de 100 observações?”). Outras vezes, desejamos conhecer toda a distribuição amostral da estatística analisada; por exemplo, quando queremos construir testes de hipótese para situações em que não Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 8 valem as distribuições usuais (normal, t-Student etc.). Um ótimo exemplo disso é dado no livro do Enders, Seção 4.4 (da 2a.edição), onde ele mostra como derivar a distribuição para o teste Dickey-Fuller. Uma simulação de Monte Carlo permite, assim, inferir as propriedades “médias” de certo procedimento estatístico sob determinadas circunstâncias – isto é, dado certo MGD e certo tamanho da amostra. No nosso caso, estamos interessados em responder à seguinte pergunta: “Em uma regressão envolvendo duas variáveis não-estacionárias independentes Y e X, qual é a probabilidade de concluirmos equivocadamente que há uma relação significativa entre elas? Em particular, usando o teste-t usual ao nível de significância de 5%, qual é a probabilidade de rejeitarmos equivocadamente a hipótese nula de que o coeficiente de X na regressão de Y em X é zero?” A simulação de Monte Carlo a seguir visa responder essa pergunta. Nosso MGD será o seguinte: 0),1,0N(~, 0),1,0N(~, 01 01 =+= =+= − − XvvXX YuuYY tttt tttt ou seja, dois passeios aleatórios independentes. Geraremos 1000 amostras com 100 observações de Y e X; para cada amostra, rodaremos a seguinte regressão: ttt XY εβα ++= (*) e realizaremos o teste-t, ao nível de significância de 5%, para testar a hipótese nula: H0: 0=β . Anotaremos o número de vezes em que essa hipótese nula for rejeitada, a fim de comparar com o número esperado de rejeições. Note que, se estamos realizando um teste de hipótese ao nível de significância de 5%, deveríamos esperar que uma hipótese nula verdadeira fosse rejeitada apenas em 5% dos casos. Logo, caso os resultados do experimento indiquem que a probabilidade de rejeitar equivocadamente a hipótese (verdadeira) de que não há relação entre Y e X seja significativamente maior do que 5%, estaremos diante do famoso problema da regressão espúria. Então, vamos lá. Siga cuidadosamente os passos abaixo. 1. Primeiro, você deve abrir um “arquivo de comando” (“command file”) do Gretl, onde os comandos referentes à simulação serão digitados. Um arquivo de comando do Gretl é simplesmente um arquivo texto com terminação “.inp” em que podemos digitar vários comandos, um por linha; quando desejarmos executar todos os comandos digitados, basta ordenar ao Gretl para “executar” (“run”) o conjunto de comandos. No menu principal do Gretl, clique em Arquivo/Arquivos de Comandos/Novo arquivo de comandos (File/New command file/Regular script). Uma nova janela se abrirá Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 9 (“gretl: sequência de comandos”), onde os comandos de seu “programa” (“script”) serão digitados. Note que nenhum comando será executado até que você ordene ao Gretl para fazê-lo. 2. Inicialmente, você deve digitar o comando para gerar a base de dados a ser usada na simulação. Para tanto, digite: nulldata 101 setobs 1 1 --time-series Ao ser executado, o primeiro comando criará uma base de dados vazia, na qual as variáveis criadas poderão conter até 101 observações. (Por que 101 e não 100? Você verá a seguir...). O segundo comando determina uma estrutura temporal para os dados – sendo que o primeiro “1” indica tratar-se de dados anuais (1 observação dentro do ano) e o segundo “1” indica a data da observação inicial (que é totalmente arbitrária). Note que o fato dos dados serem definidos como anuais não tem qualquer implicação para os resultados a seguir. 3. Nas linhas seguintes, você deve “inicializar” as variáveis a serem usadas na simulação - isto é, atribuir um valor inicial a essas variáveis. Digite: smpl 1 1 series y=0 series x=0 series u=0 series v=0 smpl 2 101 A primeira linha indica que você está restringindo a amostra “ativa” ao intervalo entre as observações 1 e 1 (ou seja, apenas à observação 1) da base de dados, de modo que qualquer comando que venha a seguir atuará apenas sobre essa observação. As linhas seguintes, portanto, atribuem o valor “0” para a observação 1 das séries temporais y, x, u e v. A última linha indica que os comandos subsequentes valerão para as observações 2 a 101 da base de dados. Assim, quando criarmos as séries temporais de Y e X, estas conterão 100 observações, excluindo a observação inicial – daí estarmos trabalhando com uma base de dados com 101 observações! 4. Você também deve inicializar a variável que permitirá calcular a porcentagem de rejeições “equivocadas” da hipótese nula de que não há relação entre Y e X. Denominando tal variável “rej” (abreviação para “rejeição”), digite: scalar rej = 0 Este comando cria um escalar sob o nome “rej”, cujo valor é zero. Cada vez que registrarmos uma rejeição de H0 durante as 1000 repetições do experimento, aumentaremos o valor de rej em uma unidade (usando uma regra do tipo rej=rej+1, como você verá a seguir). Ao final das 1000 repetições, poderemos então calcular a proporção de casos em que H0 foi rejeitada, simplesmente dividindo rej por 1000. Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 10 5. Também pode ser útil inicializar uma variável (que chamaremos de “somacoef”) que corresponda à soma acumulada das 1000 estimativas do coeficiente β obtidas ao longo das 1000 repetições. Ao final das 1000 repetições, poderemos então calcular o valor médio de βˆ , simplesmente dividindo somacoef por 1000. A fim de inicializar tal variável, você deve digitar: scalar somacoef = 0 6. Finalizada a etapa de inicialização das variáveis, podemos passar à etapa principal de nossa simulação, referente à geração das 1000 “pseudo-amostras” de Y e X e à estimação, para cada amostra, da regressão de Y em X. Para tanto, criaremos um “loop”, isto é, um procedimento que se repete certo número de vezes no programa. No Gretl, definimos um loop através de dois comandos: “loop N” e “endloop”,que marcam o começo e o fim do loop, respectivamente; todos os comandos contidos entre esses dois comandos serão executados N vezes. Assim, você deve digitar: loop 1000 --quiet de modo a marcar o início do “loop” e indicar que os comandos a seguir serão repetidos 1000 vezes (a expressão “--quiet” evita a apresentação dos resultados para cada repetição). 7. Agora devemos digitar os comandos que ficam dentro do “loop” – e, portanto, serão repetidos 1000 vezes. Primeiro, digite os comandos que geram as séries de u e v e, a partir destas, as séries de Y e X: genr u=normal() genr v=normal() genr y=y(-1)+u genr x=x(-1)+v As primeiras duas linhas geram (“genr” significa “generate”) as sequências u e v, compostas de valores sorteados “aleatoriamente” da distribuição normal padrão, e as duas linhas seguintes geram as séries de Y e X. (“aleatoriamente” está entre aspas porque, na verdade, o sorteio não é exatamente aleatório, pois está baseado em um algoritmo que gera sequências de números que “parecem” aleatórios, mas não são... Mas não se preocupe com isso – para nossos fins, podemos supor que u e v foram realmente sorteados de modo totalmente aleatório.) 8. Uma vez criadas as séries acima, podemos rodar a regressão (*) de Y em X. Digite: ols y const x --quiet Este comando estima por MQO (“OLS”) a regressão de Y em uma constante e X. O termo “--quiet" indica que os resultados da regressão (coeficientes estimados, R2 etc.) não devem ser apresentados; caso contrário, teríamos ao final de nossa simulação 1000 tabelas com os resultados de cada estimação! 9. Após a estimação, precisamos “guardar” as informações que nos interessam. Primeiro, digite: Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 11 genr somacoef=somacoef+$coeff(x) Este comando adiciona ao valor corrente da variável somacoef o valor do coeficiente de X obtido na última equação estimada. Assim, suponha que na primeira das 1000 repetições o valor estimado de βˆ tenha sido 0,5; logo, o comando acima atribuirá à variável somacoef o valor 0,5 (igual à soma do valor inicial de somacoef, 0, e o valor do coeficiente estimado, 0,5). Se, na segunda repetição, o valor do coeficiente estimado for 1, o valor da variável somacoef passará a ser 1,5 (= 0,5 + 1). E assim por diante. Ao final das 1000 repetições, o valor de somacoef corresponderá à soma acumulada de todos os coeficientes obtidos nas 1000 amostras, conforme desejado. 10. Agora, digite: genr est_t=abs($coeff(x)/$stderr(x)) genr p_valor=pvalue(t,98,est_t) O primeiro comando calcula o valor absoluto da estatística-t associada ao coeficiente de X na última equação estimada, através da divisão do coeficiente estimado [$coeff(x)] pelo seu erro padrão [$stderr(x)]. O segundo comando calcula o p-valor associado a essa estatística-t usando a função “pvalue” do Gretl [a sintaxe “pvalue(t,98,est_t)” indica que queremos calcular o p-valor da estatística est_t usando a distribuição t com 98 graus de liberdade. Note que 98 = número de observações (100) – número de parâmetros estimados (2)]. Note que esse p-valor refere-se a uma probabilidade unicaudal: trata-se da probabilidade que sobra à direita da estatística de teste (est_t) se esta for positiva, e à esquerda se esta for negativa. Logo, como desejamos testar a hipótese nula H0: 0=β ao nível de significância de 5%, rejeitaremos H0 se o p-valor calculado for menor do que 2,5%, e não rejeitaremos H0 em caso contrário. 11. Lembre que um de nossos objetivos é calcular a proporção de rejeições de H0 nas 1000 repetições. Logo, caso a hipótese nula seja rejeitada em certa repetição, devemos contabilizar essa rejeição na nossa variável “rej”; para tanto, digite: if p_valor < 0.025 genr rej = rej+1 endif A primeira linha especifica uma condição (p_valor < 0,025) que pode ou não ser satisfeita. Se essa condição for satisfeita, todos os comandos localizados antes do comando “endif” serão executados; se a condição não for satisfeita, esses comandos serão ignorados. Assim, esse conjunto de comandos significa, em palavras: “se o p- valor for menor do que 0,025, adicione uma unidade à variável rej; caso contrário, não faça nada”. Por exemplo, suponha que na primeira das 1000 repetições H0 tenha sido rejeitada; isso significa que o número de rejeições registradas até aquele momento deve passar de zero (valor inicial de rej) para 1. Se, na segunda repetição, H0 não for rejeitada (isto é, p_valor > 0,025), o valor de rej não mudará. E assim por diante. Ao final das 1000 repetições, o valor de rej corresponderá ao número de rejeições registradas nas 1000 amostras, conforme desejado. Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 12 12. Podemos, agora, fechar o “loop”, digitando: endloop Assim, os comandos que deverão ser repetidos 1000 vezes são aqueles descritos nos itens 7 a 11 acima. 13. Finalizadas as 1000 repetições, podemos calcular a porcentagem de rejeições de H0 através do comando: genr rej_pct = rej/1000 e o valor médio dos coeficientes βˆ estimados através do comando: genr mediacoef=somacoef/1000 OK. Nossa simulação de Monte Carlo está pronta para rodar. 14. Antes de rodar a simulação, é conveniente salvar o arquivo de comando com todos os comandos acima, clicando no ícone “Save” da janela correspondente. Para rodar a simulação, clique no ícone “Executar” (“Run”) dessa janela. O Gretl levará alguns segundos para executar todos os comandos e, ao final do processo, abrirá uma nova janela em que aparecem os comandos executados. Pronto, a simulação terminou. Agora, você deve mostrar a seu professor que entendeu tudo que fez. (a) Apresente o programa (“script”) completo utilizado na simulação acima. (b) Apresente a saída completa do programa (“saída da seqüência de comandos”/“script output”). (c) Qual foi a proporção de casos em que H0 foi rejeitada? Essa proporção é alta ou baixa (em relação ao que se esperaria a partir de um teste de hipótese ao nível de significância de 5%)? Comente. (d) O valor médio dos coeficientes estimados parece próximo de zero? Isso faz sentido? (e) Modifique o programa acima de modo que o tamanho das “pseudo-amostras” geradas a partir do MGD passe a ser 200, em vez de 100 (ou seja, as séries temporais de Y e X passam a ter 200 observações). Execute o programa modificado e compare com os resultados da primeira simulação. (f) Modifique e rode novamente o programa, com “pseudo-amostras” de tamanhos 500 e 1000. Compare com os resultados das simulações anteriores. O problema da regressão espúria parece ser atenuado ou agravado pelo uso de amostras maiores? Comente sobre as possíveis razões desse fenômeno. Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 13 (g) Agora, modifique o programa de modo que o MGD passe a ser: 0),1,0N(~,)5,0( 0),1,0N(~,)5,0( 01 01 =+= =+= − − XvvXX YuuYY tttt tttt Execute o programa modificado para pseudo-amostras de tamanhos 100, 200, 500 e 1000. Apresente e compare os resultados obtidos em cada caso. O que muda em relação à situação em que o MGD envolvia variáveis não- estacionárias? A proporção de casos em que H0 foi rejeitada ainda é “elevada” (em relação ao que se esperaria a partir de um teste de hipótese ao nível de significância de 5%)? Comente sobre as possíveis razões desse fenômeno, levando em consideração que, sob H0, o erro da equação (*) é auto- correlacionado (pois, sob H0, Y = erro da equação). [Quais são as conseqüências de erros autocorrelacionados para a estimação por MQO??] (h) Repita os procedimentos do item (g), para pseudo-amostras de tamanhos 100, 200, 500 e 1000, mas dessa vez estime a regressão de Y em X com um estimador robusto da matriz de variância-covariância dos coeficientes estimados – de modo a levar em consideraçãoa auto-correlação nos erros citada no item anterior. Para tanto, adicione “--robust” ao comando referente à regressão de Y em X, que deve passar a ser: ols y const x --quiet --robust O uso da opção “robust” significa que o teste-t para testar H0 estará baseado em um estimador “correto” do erro padrão do coeficiente de interesse. Apresente e compare os resultados obtidos para as pseudo-amostras de diferentes tamanhos. A proporção de casos em que H0 foi rejeitada ainda é “elevada”? Como essa proporção parece variar com o tamanho da amostra? (i) Quais são as lições que você extrai desse exercício para a análise econométrica de séries temporais? Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 14 Exercício 3 (“Regressão com dados não estacionários”) Neste exercício, você vai trabalhar com as séries importadas para o Gretl conforme instruções no topo da lista. 3.1 a) Crie os logaritmos de todas as variáveis e as primeiras diferenças dos logaritmos das mesmas. [No Gretl, selecione a variável de interesse e clique em Acrescentar/ Logaritmos das variáveis selecionadas e Acrescentar/ Diferenças de logaritmos das variáveis selecionadas (Add /Logs of selected variables e Add/ Log differences of selected variables)] b) Dessazonalize as séries dos logaritmos do quantum exportado (setorial, l_Q, e total, l_QT) pelo método da regressão em 4 dummies sazonais. Isto é, estime a regressão de cada uma dessas variáveis em 4 dummies sazonais e salve os resíduos das regressões, que correspondem às séries “sem sazonalidade”. Chame as variáveis dessazonalizadas de “l_Qd” e “l_QTd”. c) Implemente o teste de raiz unitária de Dickey-Fuller Aumentado (ADF) para l_Qd, l_QTd, l_P e l_PT. A realização desse teste requer dois tipos de decisão: 1- Decisão referente a quais regressores determinísticos (constante e/ou tendência determinística) devem ser incluídos na regressão do teste. 2- Decisão referente a quantas defasagens da variável em diferença devem ser incluídas na regressão do teste. Com relação ao ponto (1), use a especificação que você julgar mais adequada, em cada caso, dentre as 3 possíveis: (i) com constante e tendência; (ii) só com constante; (iii) sem constante ou tendência. Para a escolha do número de defasagens da variável dependente em diferença, é usual partir de um número máximo de defasagens e “reduzir” o modelo, eliminando sucessivamente as defasagens de maior ordem com base em critérios de informação (Schwarz ou Akaike) ou significância estatística. Ou seja, inicialmente estima-se a regressão de teste com K defasagens da variável dependente em diferença; em seguida testa-se se é possível excluir a K-ésima defasagem; caso isso seja possível (por exemplo, no caso da K-ésima defasagem não ser significativa a 10%), estima-se a regressão de teste com (K-1) defasagens; testa-se então se é possível eliminar a (K-1)-ésima defasagem, e assim por diante, até que a eliminação de alguma defasagem seja rejeitada. Para este exercício, parta de um número máximo de 6 defasagens. [Para realizar o teste ADF no Gretl, selecione a variável a ser testada e clique em Variável/Teste de Dickey-Fuller Aumentado (Variable/Augmented Dickey-Fuller test). Na janela “gretl: ADF test” você deve indicar as especificações a serem usadas no teste (inclusão de regressores determinísticos e ordem de defasagens da variável dependente); no caso em questão, selecione as primeiras 3 opções, que correspondem às especificações (i), (ii) e (iii) citadas acima, e determine a ordem de defasagem (“lag order for ADF test”) igual a 6. Marque também a opção “teste para baixo a partir da ordem máxima de defasagens” (“test down from maximum lag order”), para que o Gretl automaticamente reduza o modelo com base na significância estatística das maiores defasagens, e a opção “mostrar resultados Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 15 da regressão” (“show regression results”), para que você possa visualizar os resultados das regressões de teste (e não apenas a estatística de teste)] d) Realize agora o teste ADF para as primeiras diferenças das variáveis acima, seguindo as mesmas orientações acima. e) Com base nos resultados dos testes ADF dos itens anteriores, o que você conclui sobre a ordem de integração das variáveis analisadas? 3.2 Estime as seguintes regressões lineares: l_P = α0 + α1 l_PT + u l_Qd = β0 + β1 l_QTd + v a) Com base no R2 da regressão e na significância estatística dos coeficientes estimados, essas parecem ser “boas” regressões? b) Com base nos testes ADF realizados no item anterior, você acredita que possa haver algum problema com essas regressões? c) Com base nas séries de resíduos das equações acima e no valor das estatísticas DW, o que você conclui acerca do “grau de persistência” dos resíduos? Esse tipo de persistência parece mais compatível com processos estacionários ou não estacionários? Isso é um indício de que se trata de regressões espúrias? d) Verifique formalmente, através do método de Engle-Granger, se a equação acima corresponde a uma regressão espúria ou a uma relação de cointegração. [Lembre que esse método requer a realização de um teste de raiz unitária na série de resíduos da equação estimada. No Gretl, você pode fazer isso de duas formas: (1) Salve a série de resíduos da regressão estimada e, em seguida, realize o teste ADF nessa série de resíduos. Note que, aqui, os valores críticos do teste ADF são diferentes dos usuais, por se tratar de testes aplicados aos resíduos de uma regressão. A Tabela 18.4 do Wooldridge apresenta os valores críticos a serem usados. (2) Clique em Model/Time series/Cointegration test/Engle-Granger e selecione as variáveis a serem incluídas na regressão do teste. Na verdade, esta segunda opção faz o “serviço completo”: primeiro ela testa a presença de raiz unitária nas variáveis selecionadas; depois ela realiza a regressão estática de Engle-Granger e, finalmente, testa se os resíduos são estacionários.] e) Um economista, ao ver o modelo proposto, diz: "Caso as variáveis l_P e l_PT (ou, analogamente, l_Qd e l_QTd) sejam cointegradas, as regressões estimadas indicam relações de equilíbrio entre P e PT (ou, analogamente, entre Q e QT)". Explique o que o economista quis dizer com essa frase. Mais especificamente, podem existir duas relações simultâneas de equilíbrio entre P e PT? Podem existir duas relações simultâneas de equilíbrio entre Q e QT? Se o economista estimasse uma relação de cointegração entre P e Q e as duas séries fossem de fato cointegradas, ele poderia interpretar essa equação de cointegração como uma equação de oferta ou de demanda? Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio 16 f) O que os resultados dos itens anteriores sugerem acerca da evolução do preço relativo de exportação do setor (P/PT) e do quantum relativo de exportação (Q/QT)? Isto é, tais indicadores são estáveis no tempo? Apresentam alguma tendência definida de crescimento ou queda? Exercício 4 (“VAR”) Neste exercício, você vai trabalhar com as séries criadas conforme instruções na questão anterior. (a) Estime um VAR com 6 defasagens de l_Qd e l_P, NESTA ORDEM (isso é importante para a identificação dos choques estruturais feita no item (c) abaixo). [No Gretl, clique em Model/Time series/Vector autoregression e inclua as variáveis em questão como “endógenas”. Inclua uma constante no VAR. Selecione 6 como “Lag order” e clique em OK] (b) A partir do VAR estimado, qual das variáveis em questão parece causar no sentido de Granger a outra? (Note que podemos ter “causalidade bi-direcional”) [No Gretl, você pode responder a essa pergunta a partir dos testes-F apresentados abaixo de cada uma das 2 equações do VAR estimado] (c) Analise as funções de resposta a impulso (FRI) obtidascom a identificação recursiva de Choleski, com as variáveis na ordem indicada acima. Os resultados parecem compatíveis com a teoria econômica? [No Gretl, clique em Graphs/Response of XXX/to YYY para ver a FRI de XXX a um choque em YYY. Note que a única opção de identificação é pelo método de Choleski, então não há como errar...] (d) Mude a ordem das variáveis do VAR. Quais das FRI mudam e quais permanecem inalteradas? (e) Selecione a ordem de defasagens do VAR com base no critério de Informação Bayesiano de Schwarz. Compare com a ordem de defasagens selecionada segundo o critério de Akaike. (f) Caso a ordem de defasagens selecionada no item anterior seja diferente de 6, refaça os itens (1)-(d) acima e compare com os resultados anteriores. (g) Repita os procedimentos (a)-(f) acima para as variáveis em primeira diferença do logaritmo (“log-differences”), isto é, ld_Qd e ld_P, e compare com os resultados anteriores – apresentando possíveis argumentos que expliquem eventuais diferenças nos resultados. Disponibilizado por Otávio Merçon e todos os colaboradores do Blog Economia a PUC-Rio
Compartilhar