Baixe o app para aproveitar ainda mais
Prévia do material em texto
Atividade 4: Análise de Resíduos Econometria III – Professor: Márcio I. Nakane Aluno: Luciano Mancuso Salomão Nº USP: 10316161 Utilizaremos na análise dos resíduos a série trimestral de média de horas semanais trabalhadas por profissionais dos setores de “Informação, comunicação e atividades financeiras, imobiliárias, profissionais e administrativas” (adm_finc) moradores da área urbana da capital paulista, como fora apresentada na última atividade. Utilizaremos a série para trabalhadores entre 22 e 35 anos de idade e com Ensino Superior completo. Série original: Como não se trata de uma série estacionária, devemos então fazer o processo de primeiras diferenças. Pelo software R, foi realizado este processo e montado o gráfico: 25,0 27,5 30,0 32,5 35,0 37,5 40,0 42,5 45,0 47,5 50,0 1º T 2º T 3º T 4º T 1º T 2º T 3º T 4º T 1º T 2º T 3º T 4º T 1º T 2º T 3º T 4º T 1º T 2º T 3º T 4º T 1º T 2º T 3º T 4º T 1º T 2º T 3º T 4º T 1º T 2º T 3º T 4º T 1º T 2º T 2012 2013 2014 2015 2016 2017 2018 2019 2020 Médias de horas trabalhadas semanalmente: adm_finc; ES Completo; 22-35 anos Com uma média muito próxima do valor 0, é possível agora, afirmarmos que nossa série é estacionária. Também foi realizado o teste de estacionaridade Augmented Dickey-Fuller. Seu resultado fortalece a afirmação anterior: Partiremos para as funções de auto correlação e auto correlação parcial desta série temporal: -6 -5 -4 -3 -2 -1 0 1 2 3 4 2013 2014 2015 2016 2017 2018 2019 2020 d _ a d m _ fi n c _ e d u c 7 _ a g e 2 Nestas funções é possível notar que o lag 3 de ambas as funções são significativos, entretanto, os resultados não permitem uma sugestão segura dos modelos que essa variável pode representar. Devemos analisar agora os critérios de informação para esta série. Realizando o comando “auto.arima” (ex: auto.arima(adm_finc_educ7_age2_dif, trace = TRUE, ic = "aic") do software R, recebemos os seguintes resultados: Utilizando o critério de informação de Akaike: Utilizando o critério de informação de Schwarz: Pelo critério de informação Akaike ser mais parcimonioso, optarei por suas sugestões: 1. ARIMA (4, 0, 0) 2. ARIMA (3, 0, 1) 3. ARIMA (3, 0, 0) Estes foram os três modelos optados para esta série tratada. Veremos agora as suas estimações: Estimações: As estimações foram realizadas pelo software GRETL, como apresentado em sala de aula: AR(4): Máxima Verossimilhança Exata: Neste caso, temos um modelo com intercepto de -0,0019 (contudo, não significante) e com os coeficientes para as defasagens de primeira, segunda, terceira e quarta ordem sendo: -0,5853 , -0,5902 , -0,7793 e -0,3762 respectivamente. É possível notar um peso maior para o valor da defasagem de terceira ordem. AR(4): Máxima Verossimilhança Condicional: Os coeficientes, entretanto, se diferem numericamente. É possível observar um maior erro padrão para as estimações do modelo por Máxima Verossimilhança Condicional. Isso se dá pelo pequeno tamanho da amostra (no processo de estimação condicionada “perdemos” algumas observações, impactando o resultado). Vale ressaltar uma diminuição dos critérios de informação para o modelo condicionado, resultado este que também será visto nos demais modelos. Por ser um modelo auto regressivo, sua estimação por Mínimos Quadrados Ordinários será possível: AR(4): Mínimos Quadrados Ordinários: Os resultados são muito semelhantes aos observados pelo modelo condicionado. Isto acontece pelo próprio mecanismo de estimação. Contudo, alguns testes só poderão realizados se o modelo for estimado por Mínimos Quadrados Ordinários, justificando essa análise. ARMA(3,1): Máxima Verossimilhança Exata: Neste caso, teremos um modelo com coeficientes auto regressivos e de média móvel. O valor do intercepto será -0,0062 , enquanto os coeficientes do processo AR serão: -0,1174 , -0328 , - 0,5886. Para o componente de média móvel, o coeficiente será -0,4269. Novamente, todas as estimações dos coeficientes são negativas e é possível notar um peso maior para a defasagem de terceira ordem. ARMA(3,1): Máxima Verossimilhança Condicional: As estimações dos coeficientes novamente se diferem entre os modelos, da mesma forma que é possível observar uma elevação no erro padrão do modelo estimado por Máxima Verossimilhança Condicional. A causa provavelmente é a mesma. ARMA(3): Máxima Verossimilhança Exata: O intercepto do modelo será -0,0184 , enquanto os coeficientes do componente auto regressivos serão: -0,3635 , -0,4066 e -0,6631. Novamente, todos os coeficientes serão negativos e é possível observar o maior peso dado a defasagem de terceira ordem. AR(3): Máxima Verossimilhança Condicional: A mesma observação feita nos modelos anteriores poderá ser feita para este. AR(3): Mínimos Quadrados Ordinários: Novamente, pode ser observado que os resultados da estimação por Mínimos Quadrados Ordinários se assemelham aos resultados por Máxima Verossimilhança Condicional. A causa já foi apresentada. Análise dos Resíduos: Será feita uma análise dos resíduos para cada modelo estimado, totalizando 8 análises. Serão analisadas a auto correlação serial dos resíduos, a sua Normalidade e a Heterocedasticidade Condicional dos mesmos. Para modelos estimados por Mínimos Quadrados Ordinários, também será realizado um teste RESET como intuito de avaliar a especificação dos mesmos. AR(4): Máxima Verossimilhança Exata: Primeiro, analisaremos a auto correlação dos resíduos: desta forma, analisaremos a independência temporal. O objeto é que não haja nenhum tipo de auto correlação significativa. É possível observar ótimos resultados para as duas funções: não possuímos nenhuma correlação significativa, demonstrando assim que não possuímos auto correlação dos resíduos para este modelo. Pelo teste de Ljung-Box controlado para auto correlações de até lag 15, temos o seguinte resultado: Desta forma, não rejeitamos a hipótese nula e assim afirmamos que não existe auto correlação serial entre os resíduos deste modelo. Com a auto correlação dos resíduos testada, será agora analisada a sua normalidade: Pelo gráfico Q-Q é possível observar que os resíduos ficam bem próximos da reta de 45 graus, indicando normalidade. Contudo, nos extremos, é possível observar valores bem distantes da reta. Iremos agora realizar o teste de normalidade Shapiro-Wilk: Pelo teste Shapiro-Wilk, graças ao alto p-valor, não é possível rejeitar a Hipótese Nula. Desta forma é possível afirmar os resíduos deste modelo possuem distribuição normal. Embora algumas correções possam ser feitas dado o que foi apontado pelo Gráfico Q-Q. Para analisar a heterocedasticidade condicional dos resíduos de nosso modelo, realizaremos o teste ARCH: Desta forma, negamos a existência de heterocedasticidade condicional nos resíduos deste modelo. AR(4): Máxima Verossimilhança Condicional: Novamente, não teremos auto correlação serial dos resíduos. Pelo teste de Ljung-Box controlado para auto correlações de até lag 15, temos o seguinte resultado: Confirmamos o resultado visto pelos correlogramas dos resíduos. Com a auto correlação dos resíduos testada, será agora analisada a sua normalidade: Um padrão muito semelhante ao gráfico anterior pode ser observado. Novamente, afirmamos uma tendência de distribuição Normal nos resíduos. Iremos agora realizar o teste de normalidade Shapiro-Wilk: É confirmada a tendência observada no Gráfico Q-Q. Entretanto, é possível especificarmos o modelo de uma melhor forma. Também foi possível observar que o p-valor deste teste para esta estimação foi menor que o encontrado para o modelo estimado por Máxima Verossimilhança Exata e por Mínimos Quadrados Ordinários. Para analisar a heterocedasticidade condicional dos resíduosde nosso modelo, realizaremos o teste ARCH: O resultado é semelhante ao observado pelo modelo estimado por Máxima Verossimilhança Exata, entretanto, o p-valor é menor. Vale ressaltar que, embora os resíduos destes modelos estimados estejam bem-comportados, a especificação de tais modelos ainda pode ser melhorada. Veremos agora para o caso de estimação por Mínimos Quadrados Ordinários. AR(4): Mínimos Quadrados Ordinários: Novamente, os resíduos não terão auto correlação serial. Para o teste Ljung-Biox: Confirmamos o resultado apresentado pelos correlogramas. Analisando a Normalidade dos resíduos: É possível observar resultados mais comportados para esta estimação, comprovando o que foi apresentado anteriormente: este modelo pode ser melhor especificado e estimado. Analisado o teste Shapiro-Wilk: Resultado que comprova o que foi apresentado pelo Gráfico Q-Q: os resíduos deste modelo seguem distribuição Normal. O teste de Heterocedasticidade condicional dos resíduos: Negamos a presença de Heterocedasticidade Condicional nos resíduos de nosso modelo. Agora, realizando o teste RESET: -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 Quantis normais Gráfico Q-Q para uhat1 y = x Desta forma, é possível afirmar que o modelo esta bem especificado linearmente. Contudo, melhorias ainda podem ser realizadas, como a introdução de variáveis dummies. ARMA(3,1): Máxima Verossimilhança Exata: Como pode ser observado, novamente temos uma tendência a não correlação serial dos resíduos do modelo estimado. Pelo teste de Ljung-Box: Confirmamos a tendência observada acima. Testando a Normalidade dos resíduos pelo Gráfico Q-Q: Curiosamente, é possível observar resultados muito comportados nos quantis centrais, enquanto nos quantis extremos o comportamento é completamente oposto. O teste de Shapiro-Wilk comprova o que foi observado pelo Gráfico Q-Q, mas dá margem para uma melhor especificação do modelo. Testando para a heterocedasticidade condicional dos resíduos: Novamente, não rejeitamos a hipótese de que o efeito ARCH esteja presente. Dessa forma, é possível confirmar que nosso modelo não possui heterocedasticidade condicional nos resíduos. ARMA(3,1): Máxima Verossimilhança Condicional: Novamente, não podemos afirmar a existência de auto correlação serial dos resíduos de nosso modelo. Comprova o resultado anterior. Neste caso, temos resíduos muito longe do esperado para uma distribuição Normal, em comparação com o modelo estimado anteriormente. Veremos agora o resultado para o teste de Shapiro-Wilk: Ainda assim aceitando a hipótese nula de resíduos seguindo uma distribuição Normal, obtemos o menor resultado deste teste. Podemos afirmar mais uma vez que este modelo pode ser melhor especificado. Para a heterocedasticidade condicional dos resíduos: Novamente, temos o menor resultado já observado, entretanto, voltamos a não negar a hipótese nula. AR(3): Máxima Verossimilhança Exata: Novamente, pelo correlograma dos resíduos, não é possível observar auto correlação serial. Desta forma, confirmamos o resultado acima apresentado. Testando para a normalidade dos resíduos: Dessa vez, curiosamente, nossos resultados estão relativamente distantes da reta de 45 graus. Veremos o resultado do teste de Shapiro-Wilk para termos um melhor embasamento: Mesmo aceitando a hipótese nula de normalidade dos resíduos, possuímos um p-valor muito baixo, indicando que o modelo pode ser melhor especificado. Novamente, aceitamos a hipótese nula de ausência de efeito ARCH e de heterocedasticidade condicional dos resíduos. AR(3): Máxima Verossimilhança Condicional: Testando a auto correlação dos resíduos: É possível observar o mesmo resultado para esta série. Desta forma, rejeitamos a hipótese de que os resíduos deste modelo sejam auto correlacionados serialmente. Realizando o teste de Ljung-Box: Chegamos ao mesmo resultado: rejeitamos a hipótese de que os resíduos sejam auto correlacionados serialmente. Gráfico Q-Q: novamente temos um caso muito parecido com o visto anteriormente, mas desta vez os valores estão menos concentrados nas proximidades da reta de 45 graus, indicando que os resíduos deste modelo talvez não sigam tão bem uma distribuição Normal quanto os resíduos dos modelos anteriores. Realizando o teste de Shapiro-Wilk: Desta forma, não rejeitamos a hipótese nula, e assim, afirmamos que os resíduos seguem uma distribuição Normal. Curiosamente, o teste ARCH deste modelo estimado apresentou resultados bem baixos para o p-valor, indicando que há espaço para uma melhor especificação. AR(3): Mínimos Quadrados Ordinários: Novamente, não é possível observar auto correlação serial dos resíduos. O resultado do teste de Ljung-Box confirma o apresentado pelos correlogramas. Para o Gráfico Q-Q: é possível, novamente observar que os resíduos do modelo seguem uma distribuição semelhante à distribuição Normal. O teste de Shapiro-Wilk novamente comprova o resultado observado pelo Gráfico Q-Q. Voltamos a observar valores pequenos para o p-valor do teste ARCH, mas não o suficiente para rejeitarmos a hipótese nula de ausência de heterocedasticidade condicional dos resíduos. Teste RESET: -3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3 Quantis normais Gráfico Q-Q para uhat8 y = x Sendo conservador, rejeitamos a hipótese nula de que esse modelo é linear, e assim, abrimos espaço para uma melhor especificação do modelo. Correções: Como foi apresentado na última parte, testes para os resíduos de alguns modelos indicaram que é possível melhorá-los. Não serão apresentados novamente os testes para a auto correlação dos resíduos: todos se mantiveram como foram apresentados, ou seja, com ausência de correlação serial. Como o resultado foi o mesmo para todos os modelos, não me debruçarei ainda mais sobre este assunto. Modelo AR(4): Realizando a estimação deste modelo por Máxima Verossimilhança Condicionada e utilizando uma variável dummy para o ano de 2020 (foi optado por uma adição de uma dummy neste período pois temos fortes variações nos trimestres desse ano), é possível obter os seguintes resultados: Não é possível rejeitar a hipótese nula de que o efeito ARCH não está presente e o p-valor deste teste aumentou de forma significativa. Para o teste Shapiro-Wilk: Embora com um menor p-valor que visto anteriormente, ainda rejeitamos a hipótese nula. Mesmo assim, a estimação por Máxima Verossimilhança Condicional é superior a opção exata justamente pela consistência de seus estimadores mesmo se o modelo não for estacionário; curiosamente, o p-valor para o teste de normalidade para o modelo agora estimado foi maior que o observado no modelo estimado por Máxima Verossimilhança Exata, usando esta mesma especificação. Realizando este mesmo modelo por Mínimos Quadrados Ordinários com erros robustos e com a variável dummy, o resultado será reconfortante: Neste modelo, não só não rejeitamos a especificação da regressão, como também mantemos o resultado de homocedasticidade dos erros visto anteriormente. Dessa forma, essa é a melhor especificação deste modelo. Infelizmente, p-valor para o teste de Normalidade é o menor já visto para este modelo, contudo, ainda assim não negamos a hipótese nula. Modelo ARMA(3,1): Será tentando especificar melhor este modelo via a inclusão da variável dummy para o ano de 2020. A estimação será por Máxima Verossimilhança Condicionada: Ambos os valores para os testes foram piores do que os observados sem a inclusão desta nova variável. Isso nos indica que talvez a inclusão da variável dummy não tenha melhorado a especificação deste modelo, muito pelo contrário. A estimação por Máxima VerossimilhançaExata, para esta mesma especificação, não nos proveu melhores resultados. Modelo AR(3): Estimando este mesmo modelo por Máxima Verossimilhança Condicional (com erros robustos) e adicionando uma variável dummy para o ano de 2020, obtemos o seguinte resultado: Neste caso, não rejeitamos a hipótese nula de ausência do efeito ARCH e também melhoramos o p-valor para o teste de normalidade dos resíduos. Realizando o mesmo processo só que para Mínimos Quadrados Ordinários, é possível obter o seguinte resultado: Nesta especificação para este tipo de estimação deste modelo, é possível perceber uma melhora no teste RESET e no teste ARCH, entretanto, uma piora no teste de normalidade. Embora não tenhamos corrigido nenhum problema nestas correções, melhoramos a especificação de alguns modelos, principalmente este último. Conclusão: Foi possível realizar todos os passos pedidos. Apresentamos a nossa série, tiramos a primeira diferença para seus valores, percebemos que se tratava de uma série estacionária, analisamos os modelos recomendados pela função “auto.arima” do software R, aprofundamos nossa análise nos resíduos de tais modelos e finalizamos corrigindo e melhorando os modelos apresentados em nossa análise.
Compartilhar