Prévia do material em texto
ANÁLISE DE SÉRIES TEMPORAIS MODELOS ARIMA E SARIMA Anderson Castro Soares de Oliveira Departamento de Estatística/ICET/UFMT Modelo auto-regressivo integrado de médias móveis (ARIMA) MODELOS ARIMA • Os modelos AR, MA e ARMA, são apropriados para des- crever séries temporais estacionárias • Na prática a maioria das séries são não estacionárias • Para séries não estacionárias homogêneas, um número fi- nito de diferenças, consegue-se atingir a estacionariedade. • Na maioria dos casos e suficiente tomar d = 1 ou 2 dife- renças para que ∆dYt seja estacionaria MODELOS ARIMA • Seja Yt uma série temporal não estacionaria. • Fazendo Zt = ∆dYt • Temos que Zt é uma estacionária • Podemos representar ZT por um modelo ARMA(p,q), es- tacionário e invertível: φ(B)Zt = θ(B)at MODELOS ARIMA • Como Zt é uma diferença de Yt então, Yt é uma integral de Zt • Yt segue um modelo auto regressivo, integrado e de mé- dias móveis, isto é, um modelo ARIMA(p,d ,q) represen- tado por: φ(B)∆dYt = θ(B)at em que • p é a ordem da componente auto regressiva • d é o número de diferenças tomadas na série • q é a ordem da componente de médias móveis. MODELOS ARIMA • A identificação de um modelo ARIMA segue os seguintes passos: • Identificação da Ordem de Integração (d) • Diferencia-se a serie Yt , tantas vezes quantas necessárias, para se obter uma serie estacionaria • É importante fazer os testes para garantir a ausência das componentes deterministicas. • Identificação do processo ARMA(p,q) • a partir da série estacionária obtida na diferenciação é feita uma análise das FAC e FACP, • Pode-se identificar um dos modelos estacionários AR, MA e ARMA. MODELOS ARIMA Exemplo Período ICV 1970 1972 1974 1976 1978 1980 200 400 600 800 100 0 120 0 140 0 Figura 1: Índices mensais de custo de vida no município de São Paulo, entre os meses de janeiro de 1970 a junho de 1980. MODELOS ARIMA Exemplo • A série transformada contém a componente de tendência, teste de Cox-Stuart (valor − p < 0,01) . Período log (IC V) 1970 1972 1974 1976 1978 1980 4.5 5.0 5.5 6.0 6.5 7.0 Figura 2: Logarítmo dos índices mensais de custo de vida no município de São Paulo, entre os meses de janeiro de 1970 a junho de 1980. MODELOS ARIMA Exemplo • Para retirar a tendência é necessário fazer duas diferenças. • Pela FAC e FACP da série livre de tendência, verifica-se que um modelo preliminar é ARIMA(6,2,1). Figura 3: FAC (A) e FAP (B) da série duas diferenças de defasagem 1 do logarítmo do índice mensal de custo de vida no município de São Paulo. MODELOS ARIMA Exemplo • O modelo ajustado é dado por (1− B)2log(Yt ) = at + 0,83at−1, em que at é um ruído branco, com V̂ar(at ) = 0,00013. Modelo sazonal auto-regressivo integrado de médias móveis (SARIMA) MODELOS SARIMA • A componente periódica sazonal que se repete a cada s (s > 1) observações está presente em grande parte das séries temporais. • Em dados mensais, por exemplo, com período sazonal s = 12, espera-se que Yt dependa de Yt−12 e, talvez, de Yt−24, além de Yt−1,Yt − 2, ... . • Tomar uma diferença não é suficiente para eliminar um pa- drão sazonal acentuado e, conseqüentemente, deixar a sé- rie estacionária. • A forma apropriada é tomar diferenças no período sazonal, denotada por ∆s = (1−Bs), em que s é o período sazonal. MODELOS SARIMA • Uma generalização do modelo ARIMA é o modelo ARIMA sazonal multiplicativo (SARIMA): φ(B)Φ(Bs)(1− B)d (1− Bs)DYt = θ(B)Θ(Bs)at em que: • φ(B) = 1− φ1B − ...− φpBp é o polinômio auto-regressivo de ordem p; • Φ(Bs) = 1− Φ1Bs − ...− ΦPBPs é o polinômio auto-regressivo sazonal de ordem P; • d é o número de diferenças necessárias para retirar a tendência da série; • D é o número de diferenças de lags s necessárias para retirar a sazonalidade da série; • θ(B) = 1− θ1B− ...− θpBp é o polinômio de médias móveis de ordem q; • Θ(Bs) = 1−Θ1Bs − ...−ΘPBPs é o polinômio de médias móveis sazonal de ordem Q. MODELOS SARIMA • A identificação de um modelo SARIMA é feita considerando os passos: • Identificação da Ordem de Integração (d): diferencia-se a serie Yt até obter uma serie livre de tendência • Identificar o período sazonal s (periodograma) • Identificação da Ordem de Integração Sazonal (D): diferencia- se a serie Yt , considerando a ordem do periodo s, até obter uma série livre de sazonalidade • Identificação do processo ARMA(p,q): a partir da série es- tacionária, analisa-se as FAC e FACP, de forma a verificar a ordem p e q • Identificação do ordem sazonal: Verifica-se se existem lag’s significativos múltiplos de s na FAC e FACP, de forma a obter a ordem P e Q. MODELOS SARIMA Exemplo Período CO 2 1994 1996 1998 2000 2002 2004 35 0 35 5 36 0 36 5 37 0 37 5 38 0 Figura 4: Níveis mensais de dióxido de carbono (CO2) no norte do Canadá, de janeiro de 1994 a dezembro de 2004. MODELOS SARIMA Exemplo • Para retirar a tendência é necessário fazer uma diferença (d=1). • Foi observado um periodo de 12 meses. • Para retirar a sazonalidade é necessário fazer uma dife- rença (D=1) MODELOS SARIMA Exemplo • Pela FAC e FACP da série livre de tendência e sa- zonalidade, verifica-se que um modelo preliminar é SARIMA(2,1,1)(2,1,1)12. (A) (B) 0 5 10 15 20 25 30 35 − 0 .4 − 0 .2 0 .0 0 .2 Lag A C F 0 5 10 15 20 25 30 35 − 0 .4 − 0 .2 0 .0 0 .2 Lag P a r ti a l A C F Figura 5: FAC (A) e FACP (B) da série dos níveis mensais de CO2 livre de tendência e sazonalidade por diferenciação de defasagens 1 e 12. MODELOS SARIMA Exemplo • O modelo sazonal ajustado é dado por (1 − 0, 33B − 0, 27B2)(1 − B12)(1 − B)Yt = (1 + 0, 99B)(1 + 0, 80B12)at , em que at é um ruído branco com V̂ar(at ) = 0,5487. Metodologia de Box & Jenkins METODOLOGIA DE BOX & JENKINS • A metodologia proposta por Box & Jenkins consiste em ajustar modelos auto-regressivos integrados de médias mó- veis a um conjunto de dados. • Para a construção do modelo seguimos um algoritmo atra- vés dos seguintes passos: • Identificação • Estimação • Verificação • Previsão • Caso o modelo não seja adequado o algoritmo é repetido, voltando à fase de identificação. • O método é apropriado para séries de comprimento médio a longo, de no mínimo, 50 e, preferencialmente 100 obser- vações METODOLOGIA DE BOX & JENKINS • O processo de identificação consiste em determinar quais modelos podem ser ajustados AR, MA, ARMA, ARIMA ou SARIMA, bem como quais são suas respectivas ordens. • A realização do processo de identificação do modelo se ba- seia na análise de autocorrelações, autocorrelações parci- ais das séries estacionária • Além da FAC e FACP deve-se identificar o numero de dife- renças para tonar series não estacionárias em estacioná- ria. METODOLOGIA DE BOX & JENKINS Identificação • O processo de identificação consiste em determinar quais modelos podem ser ajustados AR, MA, ARMA, ARIMA ou SARIMA, bem como quais são suas respectivas ordens. • A realização do processo de identificação do modelo se ba- seia na análise de autocorrelações, autocorrelações parci- ais das séries estacionária • Além da FAC e FACP deve-se identificar o numero de dife- renças para tonar series não estacionárias em estacioná- ria. METODOLOGIA DE BOX & JENKINS Identificação • A identificação é a etapa mais difícil da metodologia de Box & Jenkins. • Um pesquisador pode identificar vários modelos para uma mesma serie temporal METODOLOGIA DE BOX & JENKINS Estimação • Nessa etapa é estimado os parâmetros • E verifica-se quais são significativos. • O modelo deve conter apenas os parâmetros significativos METODOLOGIA DE BOX & JENKINS Verificação • A etapa de verificação consiste fazer um diagnostico do modelo, no intuito de verificar se o modelo identificado e estimado, é adequado. • Caso o modelo não seja adequado, deve-se tentar identifi- car outro modelo. • Esta verificação é feita pelo teste da autocorrelação resi- dual e pelo teste de Box-Pierce METODOLOGIA DE BOX & JENKINS Verificação • A função de autocorrelaçãodos resíduos é utilizada para verificar se os resíduos são não-correlacionados. • Sob a suposição que o modelo ajustado é apropriado. As autocorrelações são calculadas por r̂k = T∑ t=k+1 ât ât−k T∑ t=1 â2t em que k = 0,1,2... e â2t o resíduo do modelo. • Pode-se dizer que o modelo é adequado quando r̂k estiver dentro dos limites ± 2√n . METODOLOGIA DE BOX & JENKINS Verificação • Para testar se as autocorrelações do modelo ajustado são significativamente diferente de zero pode-se utilizar o teste de Ljung-Box. • O teste é baseado nas k primeiras estimativas das autocor- relações, r̂k dos resíduos. • A estatística do teste é dada por: Q(k) = n(n + 2) k∑ j=1 r̂2k n − j METODOLOGIA DE BOX & JENKINS Verificação • Se o modelo ajustado for apropriado Q(k) ∼ χ2k−η em que k é o número de "lag’s"e η é o numero de parâme- tros estimados com excessão de σ2. • De modo geral, o número k de autocorrelações amostrais é tipicamente escolhido entre 15 e 30. • Valores grandes de Q fornecem indicação contra a hipótese de que as autocorrelações todas são nulas, em favor da hipótese de que ao menos uma delas é diferente de zero. METODOLOGIA DE BOX & JENKINS Previsão • Se o modelo for considerado adequado ele pode ser utili- zado para realizar previsões. • A previsão de Yt+h, para h = 1,2, · · · ,n, é denotada por Ŷt (h) e é definida como a esperança condicional de Yt+h dado todos os valores passados, isto é: Ŷt (h) = E [Yt+h|Yt ,Yt−1,Yt−2, · · · ] • O erro de previsão é definido por et (h) = Yt+h − Ŷt (h) em que Yt+h é o valor real e Ŷt (h) é o valor predito. • Sob a suposição que et (h) ∼ N(0, σ2a) é possível obter um intervalo de confiança para as previsões. METODOLOGIA DE BOX & JENKINS Seleção de Modelos • Vários modelos podem ser identificados para descrever uma série. • Existem critérios para escolha do melhor modelo de acordo com o objetivo do ajuste. • Em princípio, quanto menor for a variância do erro, melhor é o modelo. • Mas outros critérios podem ser utilizados, tais com • Critério de informação de Akaike (AIC) • Erro quadrático médio de previsão (EQMP) • Erro Percentual Médio Absoluto (MAPE) METODOLOGIA DE BOX & JENKINS Seleção de Modelos • Na comparação de diversos modelos, com N fixo, o crité- rio de Akaike pode ser utilizado para selecionar o melhor modelo. • Este critério, é expresso por: AIC = Nlogσ2a + 2(η + 2) • O melhor modelo será aquele que apresentar menor AIC METODOLOGIA DE BOX & JENKINS Seleção de Modelos • Sendo o objetivo do ajuste a realização de previsão, o me- lhor modelo será o que apresentar o menor erro quadrático médio de previsão (EQMP). • As estimativas EQMP são dadas pela média dos quadrados das diferenças entre valores observados e valores preditos. • O EQMP com origem em t é dado por: EQMP = 1 n n∑ h=1 ( Yt+h − Ŷt (h) )2 METODOLOGIA DE BOX & JENKINS Seleção de Modelos • Outra medidas de erro utilizada para analisar os erros gera- dos pelas previsões encontradas é o Erro Percentual Médio Absoluto (MAPE): MAPE = 1 n n∑ h=1 ∣∣∣∣∣Yt+h − Ŷt (h)Yt+h ∣∣∣∣∣ • O modelo escolhido é aquele que possuir menor MAPE. METODOLOGIA DE BOX & JENKINS Seleção de Modelos • Outra medidas de erro utilizada para analisar os erros gera- dos pelas previsões encontradas é o Erro Percentual Médio Absoluto (MAPE): MAPE = 1 n n∑ h=1 ∣∣∣∣∣Yt+h − Ŷt (h)Yt+h ∣∣∣∣∣ • O modelo escolhido é aquele que possuir menor MAPE. Modelo auto-regressivo integrado de médias móveis (ARIMA) Modelo sazonal auto-regressivo integrado de médias móveis (SARIMA) Metodologia de Box & Jenkins