Atividade IV - Análise de Resíduos Econometria III

•

USP-SP

Luciano Mancuso Salomao

16/10/2021

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 34 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 34 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 34 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Econometria III

55 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Atividade 4: Análise de Resíduos
Econometria III – Professor: Márcio I. Nakane
Aluno: Luciano Mancuso Salomão
Nº USP: 10316161
Utilizaremos na análise dos resíduos a série trimestral de média de horas semanais trabalhadas
por profissionais dos setores de “Informação, comunicação e atividades financeiras, imobiliárias,
profissionais e administrativas” (adm_finc) moradores da área urbana da capital paulista, como
fora apresentada na última atividade. Utilizaremos a série para trabalhadores entre 22 e 35 anos
de idade e com Ensino Superior completo.
Série original:

Como não se trata de uma série estacionária, devemos então fazer o processo de primeiras
diferenças. Pelo software R, foi realizado este processo e montado o gráfico:
25,0
27,5
30,0
32,5
35,0
37,5
40,0
42,5
45,0
47,5
50,0
1º
T
2º
T
3º
T
4º
T
1º
T
2º
T
3º
T
4º
T
1º
T
2º
T
3º
T
4º
T
1º
T
2º
T
3º
T
4º
T
1º
T
2º
T
3º
T
4º
T
1º
T
2º
T
3º
T
4º
T
1º
T
2º
T
3º
T
4º
T
1º
T
2º
T
3º
T
4º
T
1º
T
2º
T
2012 2013 2014 2015 2016 2017 2018 2019 2020
Médias de horas trabalhadas semanalmente: adm_finc; ES
Completo; 22-35 anos

Com uma média muito próxima do valor 0, é possível agora, afirmarmos que nossa série é
estacionária. Também foi realizado o teste de estacionaridade Augmented Dickey-Fuller. Seu
resultado fortalece a afirmação anterior:

Partiremos para as funções de auto correlação e auto correlação parcial desta série temporal:
-6
-5
-4
-3
-2
-1
0
1
2
3
4
2013 2014 2015 2016 2017 2018 2019 2020
d
_
a
d
m
_
fi
n
c
_
e
d
u
c
7
_
a
g
e
2

Nestas funções é possível notar que o lag 3 de ambas as funções são significativos, entretanto,
os resultados não permitem uma sugestão segura dos modelos que essa variável pode
representar. Devemos analisar agora os critérios de informação para esta série.
Realizando o comando “auto.arima” (ex: auto.arima(adm_finc_educ7_age2_dif, trace = TRUE, ic =
"aic") do software R, recebemos os seguintes resultados:
Utilizando o critério de informação de Akaike:

Utilizando o critério de informação de Schwarz:

Pelo critério de informação Akaike ser mais parcimonioso, optarei por suas sugestões:
1. ARIMA (4, 0, 0)
2. ARIMA (3, 0, 1)
3. ARIMA (3, 0, 0)
Estes foram os três modelos optados para esta série tratada. Veremos agora as suas estimações:
Estimações:
As estimações foram realizadas pelo software GRETL, como apresentado em sala de
aula:
AR(4): Máxima Verossimilhança Exata:

Neste caso, temos um modelo com intercepto de -0,0019 (contudo, não significante) e com os
coeficientes para as defasagens de primeira, segunda, terceira e quarta ordem sendo: -0,5853 ,
-0,5902 , -0,7793 e -0,3762 respectivamente. É possível notar um peso maior para o valor da
defasagem de terceira ordem.
AR(4): Máxima Verossimilhança Condicional:

Os coeficientes, entretanto, se diferem numericamente. É possível observar um maior erro
padrão para as estimações do modelo por Máxima Verossimilhança Condicional. Isso se dá pelo
pequeno tamanho da amostra (no processo de estimação condicionada “perdemos” algumas
observações, impactando o resultado). Vale ressaltar uma diminuição dos critérios de
informação para o modelo condicionado, resultado este que também será visto nos demais
modelos.
Por ser um modelo auto regressivo, sua estimação por Mínimos Quadrados Ordinários será
possível:
AR(4): Mínimos Quadrados Ordinários:

Os resultados são muito semelhantes aos observados pelo modelo condicionado. Isto acontece
pelo próprio mecanismo de estimação. Contudo, alguns testes só poderão realizados se o
modelo for estimado por Mínimos Quadrados Ordinários, justificando essa análise.
ARMA(3,1): Máxima Verossimilhança Exata:

Neste caso, teremos um modelo com coeficientes auto regressivos e de média móvel. O valor
do intercepto será -0,0062 , enquanto os coeficientes do processo AR serão: -0,1174 , -0328 , -
0,5886. Para o componente de média móvel, o coeficiente será -0,4269. Novamente, todas as
estimações dos coeficientes são negativas e é possível notar um peso maior para a defasagem
de terceira ordem.
ARMA(3,1): Máxima Verossimilhança Condicional:

As estimações dos coeficientes novamente se diferem entre os modelos, da mesma forma que
é possível observar uma elevação no erro padrão do modelo estimado por Máxima
Verossimilhança Condicional. A causa provavelmente é a mesma.
ARMA(3): Máxima Verossimilhança Exata:

O intercepto do modelo será -0,0184 , enquanto os coeficientes do componente auto
regressivos serão: -0,3635 , -0,4066 e -0,6631. Novamente, todos os coeficientes serão negativos
e é possível observar o maior peso dado a defasagem de terceira ordem.
AR(3): Máxima Verossimilhança Condicional:

A mesma observação feita nos modelos anteriores poderá ser feita para este.
AR(3): Mínimos Quadrados Ordinários:

Novamente, pode ser observado que os resultados da estimação por Mínimos Quadrados
Ordinários se assemelham aos resultados por Máxima Verossimilhança Condicional. A causa já
foi apresentada.
Análise dos Resíduos:
Será feita uma análise dos resíduos para cada modelo estimado, totalizando 8 análises. Serão
analisadas a auto correlação serial dos resíduos, a sua Normalidade e a Heterocedasticidade
Condicional dos mesmos. Para modelos estimados por Mínimos Quadrados Ordinários, também
será realizado um teste RESET como intuito de avaliar a especificação dos mesmos.
AR(4): Máxima Verossimilhança Exata:
Primeiro, analisaremos a auto correlação dos resíduos: desta forma, analisaremos a
independência temporal. O objeto é que não haja nenhum tipo de auto correlação significativa.

É possível observar ótimos resultados para as duas funções: não possuímos nenhuma correlação
significativa, demonstrando assim que não possuímos auto correlação dos resíduos para este
modelo.
Pelo teste de Ljung-Box controlado para auto correlações de até lag 15, temos o seguinte
resultado:

Desta forma, não rejeitamos a hipótese nula e assim afirmamos que não existe auto correlação
serial entre os resíduos deste modelo.
Com a auto correlação dos resíduos testada, será agora analisada a sua normalidade:

Pelo gráfico Q-Q é possível observar que os resíduos ficam bem próximos da reta de 45 graus,
indicando normalidade. Contudo, nos extremos, é possível observar valores bem distantes da
reta.
Iremos agora realizar o teste de normalidade Shapiro-Wilk:

Pelo teste Shapiro-Wilk, graças ao alto p-valor, não é possível rejeitar a Hipótese Nula. Desta
forma é possível afirmar os resíduos deste modelo possuem distribuição normal. Embora
algumas correções possam ser feitas dado o que foi apontado pelo Gráfico Q-Q.
Para analisar a heterocedasticidade condicional dos resíduos de nosso modelo, realizaremos o
teste ARCH:

Desta forma, negamos a existência de heterocedasticidade condicional nos resíduos deste
modelo.
AR(4): Máxima Verossimilhança Condicional:

Novamente, não teremos auto correlação serial dos resíduos.
Pelo teste de Ljung-Box controlado para auto correlações de até lag 15, temos o seguinte
resultado:

Confirmamos o resultado visto pelos correlogramas dos resíduos.
Com a auto correlação dos resíduos testada, será agora analisada a sua normalidade:

Um padrão muito semelhante ao gráfico anterior pode ser observado. Novamente, afirmamos
uma tendência de distribuição Normal nos resíduos.
Iremos agora realizar o teste de normalidade Shapiro-Wilk:

É confirmada a tendência observada no Gráfico Q-Q. Entretanto, é possível especificarmos o
modelo de uma melhor forma. Também foi possível observar que o p-valor deste teste para esta
estimação foi menor que o encontrado para o modelo estimado por Máxima Verossimilhança
Exata e por Mínimos Quadrados Ordinários.
Para analisar a heterocedasticidade condicional dos resíduosde nosso modelo, realizaremos o
teste ARCH:

O resultado é semelhante ao observado pelo modelo estimado por Máxima Verossimilhança
Exata, entretanto, o p-valor é menor.
Vale ressaltar que, embora os resíduos destes modelos estimados estejam bem-comportados, a
especificação de tais modelos ainda pode ser melhorada. Veremos agora para o caso de
estimação por Mínimos Quadrados Ordinários.
AR(4): Mínimos Quadrados Ordinários:

Novamente, os resíduos não terão auto correlação serial.
Para o teste Ljung-Biox:

Confirmamos o resultado apresentado pelos correlogramas.
Analisando a Normalidade dos resíduos:

É possível observar resultados mais comportados para esta estimação, comprovando o que foi
apresentado anteriormente: este modelo pode ser melhor especificado e estimado.
Analisado o teste Shapiro-Wilk:

Resultado que comprova o que foi apresentado pelo Gráfico Q-Q: os resíduos deste modelo
seguem distribuição Normal.
O teste de Heterocedasticidade condicional dos resíduos:

Negamos a presença de Heterocedasticidade Condicional nos resíduos de nosso modelo.
Agora, realizando o teste RESET:
-2,5
-2
-1,5
-1
-0,5
0
0,5
1
1,5
2
2,5
3
-2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5
Quantis normais
Gráfico Q-Q para uhat1
y = x

Desta forma, é possível afirmar que o modelo esta bem especificado linearmente. Contudo,
melhorias ainda podem ser realizadas, como a introdução de variáveis dummies.
ARMA(3,1): Máxima Verossimilhança Exata:

Como pode ser observado, novamente temos uma tendência a não correlação serial dos
resíduos do modelo estimado.
Pelo teste de Ljung-Box:

Confirmamos a tendência observada acima.
Testando a Normalidade dos resíduos pelo Gráfico Q-Q:

Curiosamente, é possível observar resultados muito comportados nos quantis centrais,
enquanto nos quantis extremos o comportamento é completamente oposto.

O teste de Shapiro-Wilk comprova o que foi observado pelo Gráfico Q-Q, mas dá margem para
uma melhor especificação do modelo.
Testando para a heterocedasticidade condicional dos resíduos:

Novamente, não rejeitamos a hipótese de que o efeito ARCH esteja presente. Dessa forma, é
possível confirmar que nosso modelo não possui heterocedasticidade condicional nos resíduos.
ARMA(3,1): Máxima Verossimilhança Condicional:

Novamente, não podemos afirmar a existência de auto correlação serial dos resíduos de nosso
modelo.

Comprova o resultado anterior.

Neste caso, temos resíduos muito longe do esperado para uma distribuição Normal, em
comparação com o modelo estimado anteriormente. Veremos agora o resultado para o teste de
Shapiro-Wilk:

Ainda assim aceitando a hipótese nula de resíduos seguindo uma distribuição Normal, obtemos
o menor resultado deste teste. Podemos afirmar mais uma vez que este modelo pode ser melhor
especificado.
Para a heterocedasticidade condicional dos resíduos:

Novamente, temos o menor resultado já observado, entretanto, voltamos a não negar a
hipótese nula.
AR(3): Máxima Verossimilhança Exata:

Novamente, pelo correlograma dos resíduos, não é possível observar auto correlação serial.

Desta forma, confirmamos o resultado acima apresentado.
Testando para a normalidade dos resíduos:

Dessa vez, curiosamente, nossos resultados estão relativamente distantes da reta de 45 graus.
Veremos o resultado do teste de Shapiro-Wilk para termos um melhor embasamento:

Mesmo aceitando a hipótese nula de normalidade dos resíduos, possuímos um p-valor muito
baixo, indicando que o modelo pode ser melhor especificado.

Novamente, aceitamos a hipótese nula de ausência de efeito ARCH e de heterocedasticidade
condicional dos resíduos.
AR(3): Máxima Verossimilhança Condicional:
Testando a auto correlação dos resíduos:

É possível observar o mesmo resultado para esta série. Desta forma, rejeitamos a hipótese de
que os resíduos deste modelo sejam auto correlacionados serialmente.
Realizando o teste de Ljung-Box:

Chegamos ao mesmo resultado: rejeitamos a hipótese de que os resíduos sejam auto
correlacionados serialmente.

Gráfico Q-Q: novamente temos um caso muito parecido com o visto anteriormente, mas desta
vez os valores estão menos concentrados nas proximidades da reta de 45 graus, indicando que
os resíduos deste modelo talvez não sigam tão bem uma distribuição Normal quanto os resíduos
dos modelos anteriores.
Realizando o teste de Shapiro-Wilk:

Desta forma, não rejeitamos a hipótese nula, e assim, afirmamos que os resíduos seguem uma
distribuição Normal.

Curiosamente, o teste ARCH deste modelo estimado apresentou resultados bem baixos para o
p-valor, indicando que há espaço para uma melhor especificação.
AR(3): Mínimos Quadrados Ordinários:

Novamente, não é possível observar auto correlação serial dos resíduos.

O resultado do teste de Ljung-Box confirma o apresentado pelos correlogramas.

Para o Gráfico Q-Q: é possível, novamente observar que os resíduos do modelo seguem uma
distribuição semelhante à distribuição Normal.

O teste de Shapiro-Wilk novamente comprova o resultado observado pelo Gráfico Q-Q.

Voltamos a observar valores pequenos para o p-valor do teste ARCH, mas não o suficiente para
rejeitarmos a hipótese nula de ausência de heterocedasticidade condicional dos resíduos.
Teste RESET:
-3
-2
-1
0
1
2
3
-3 -2 -1 0 1 2 3
Quantis normais
Gráfico Q-Q para uhat8
y = x

Sendo conservador, rejeitamos a hipótese nula de que esse modelo é linear, e assim, abrimos
espaço para uma melhor especificação do modelo.
Correções:
Como foi apresentado na última parte, testes para os resíduos de alguns modelos indicaram que
é possível melhorá-los. Não serão apresentados novamente os testes para a auto correlação dos
resíduos: todos se mantiveram como foram apresentados, ou seja, com ausência de correlação
serial. Como o resultado foi o mesmo para todos os modelos, não me debruçarei ainda mais
sobre este assunto.
Modelo AR(4):
Realizando a estimação deste modelo por Máxima Verossimilhança Condicionada e utilizando
uma variável dummy para o ano de 2020 (foi optado por uma adição de uma dummy neste
período pois temos fortes variações nos trimestres desse ano), é possível obter os seguintes
resultados:

Não é possível rejeitar a hipótese nula de que o efeito ARCH não está presente e o p-valor deste
teste aumentou de forma significativa.
Para o teste Shapiro-Wilk:

Embora com um menor p-valor que visto anteriormente, ainda rejeitamos a hipótese nula.
Mesmo assim, a estimação por Máxima Verossimilhança Condicional é superior a opção exata
justamente pela consistência de seus estimadores mesmo se o modelo não for estacionário;
curiosamente, o p-valor para o teste de normalidade para o modelo agora estimado foi maior
que o observado no modelo estimado por Máxima Verossimilhança Exata, usando esta mesma
especificação.
Realizando este mesmo modelo por Mínimos Quadrados Ordinários com erros robustos e com
a variável dummy, o resultado será reconfortante:

Neste modelo, não só não rejeitamos a especificação da regressão, como também mantemos o
resultado de homocedasticidade dos erros visto anteriormente. Dessa forma, essa é a melhor
especificação deste modelo. Infelizmente, p-valor para o teste de Normalidade é o menor já
visto para este modelo, contudo, ainda assim não negamos a hipótese nula.
Modelo ARMA(3,1):
Será tentando especificar melhor este modelo via a inclusão da variável dummy para o ano de
2020. A estimação será por Máxima Verossimilhança Condicionada:

Ambos os valores para os testes foram piores do que os observados sem a inclusão desta nova
variável. Isso nos indica que talvez a inclusão da variável dummy não tenha melhorado a
especificação deste modelo, muito pelo contrário. A estimação por Máxima VerossimilhançaExata, para esta mesma especificação, não nos proveu melhores resultados.
Modelo AR(3):
Estimando este mesmo modelo por Máxima Verossimilhança Condicional (com erros robustos)
e adicionando uma variável dummy para o ano de 2020, obtemos o seguinte resultado:

Neste caso, não rejeitamos a hipótese nula de ausência do efeito ARCH e também melhoramos
o p-valor para o teste de normalidade dos resíduos.
Realizando o mesmo processo só que para Mínimos Quadrados Ordinários, é possível obter o
seguinte resultado:

Nesta especificação para este tipo de estimação deste modelo, é possível perceber uma melhora
no teste RESET e no teste ARCH, entretanto, uma piora no teste de normalidade.
Embora não tenhamos corrigido nenhum problema nestas correções, melhoramos a
especificação de alguns modelos, principalmente este último.
Conclusão:
Foi possível realizar todos os passos pedidos. Apresentamos a nossa série, tiramos a primeira
diferença para seus valores, percebemos que se tratava de uma série estacionária, analisamos
os modelos recomendados pela função “auto.arima” do software R, aprofundamos nossa
análise nos resíduos de tais modelos e finalizamos corrigindo e melhorando os modelos
apresentados em nossa análise.