Baixe o app para aproveitar ainda mais
Prévia do material em texto
Introdução às Séries Temporais Prof. Victor Hugo Prof. Victor Hugo LachosLachos DavilaDavila AULA:AULA: Natureza e Fonte de Dados Existe 3 tipos de dados disponível para análise: • Séries Temporais: quando os dados são observados em diferentes instantes do tempo, seja diariamente (preço de ações, relatórios meteorológicos), mensalmente (taxa de desemprego, IPC), trimestralmente (PIB). • Corte Transversal: quando os dados observados foram coletados no mesmo ponto do tempo (pesquisas de opinião, dados de censos) • Dados em Painel: Aqui uma unidade em corte transversal é pesquisada ao longo do tempo. (PIB de cada pais sul-americano para o período de 1990 a 2008) Exemplos de séries temporais (1) • O valor esperado é constante • A variância é constante • Simétrica • Não correlacionados entre instantes diferentes Ruído Branco Gaussiano independente e identicamente distribuídos (a.a.) i.i.d ),0(~ 2σNX t 0 3 6 9 1 2 1 5 1 8 2 1 2 4 2 7 3 0 3 3 3 6 3 9 4 2 4 5 4 8 5 1 5 4 5 7 6 0 6 3 6 6 6 9 7 2 7 5 7 8 8 1 8 4 8 7 9 0 9 3 9 6 9 9 -1.41 -0.94 -0.47 0 0.47 0.94 1.41 1.88 2.35 2.82 Exemplos de séries temporais (2) Movimento de uma partícula com relação a um ponto • O valor esperado é constante • A variância não é constante • Simétrica • Correlacionados entre instantes diferentes Passeio Aleatório i.i.d ),0(~ 2σNat ttt aXX ++= −1μ μ=0 μ=0.2 y 1 9 0 0 m 0 1 d 0 1 y 1 9 1 0 m 0 1 d 0 1 y 1 9 2 0 m 0 1 d 0 1 y 1 9 3 0 m 0 1 d 0 1 y 1 9 4 0 m 0 1 d 0 1 y 1 9 5 0 m 0 1 d 0 1 y 1 9 6 0 m 0 1 d 0 1 y 1 9 7 0 m 0 1 d 0 1 y 1 9 8 0 m 0 1 d 0 1 y 1 9 9 0 m 0 1 d 0 1 18900000 21000000 23100000 25200000 27300000 29400000 31500000 33600000 35700000 37800000 A média não é constante A população espanhola cresceu estritamente de década em década de maneira aparentemente lineal. Tendência crescenteTendência crescente Exemplos de séries temporais (3) População da Espanha y 1 9 1 0 m 0 1 d 0 1 y 1 9 2 0 m 0 1 d 0 1 y 1 9 3 0 m 0 1 d 0 1 y 1 9 4 0 m 0 1 d 0 1 y 1 9 5 0 m 0 1 d 0 1 y 1 9 6 0 m 0 1 d 0 1 y 1 9 7 0 m 0 1 d 0 1 y 1 9 8 0 m 0 1 d 0 1 y 1 9 9 0 m 0 1 d 0 1 1440000 1680000 1920000 2160000 2400000 2640000 2880000 3120000 3360000 3600000 y 1 9 2 0 m 0 1 d 0 1 y 1 9 3 0 m 0 1 d 0 1 y 1 9 4 0 m 0 1 d 0 1 y 1 9 5 0 m 0 1 d 0 1 y 1 9 6 0 m 0 1 d 0 1 y 1 9 7 0 m 0 1 d 0 1 y 1 9 8 0 m 0 1 d 0 1 y 1 9 9 0 m 0 1 d 0 1 -2030000 -1740000 -1450000 -1160000 -870000 -580000 -290000 0 290000 580000 870000 Se tomamos a diferença yt - yt-1 pode-se observar as flutuações quanto à velocidade de crescimento. As séries de consumo de eletricidade apresentam uma clara tendência positiva que parece acelerar-se no final da série. Por outro lado a série apresenta uma marcada sazonalidadesazonalidade com consumos muito elevados nos meses de inverno devido ao efeito da temperatura. A série parece ter maior dispersão na medida que toma maiores valores. Se a sazonalidade é estritamente periódica pode eliminar-se da série com um componente determinista. Um truque poderia ser estudar separadamente as séries correspondentes em períodos equivalentes. Outra alternativa é tomar diferenças de ordem apropriado. 9 1 9 4 0 1 0 3 9 3 9 5 0 2 9 7 0 4 9 6 9 8 0 0 9 2 9 9 560 700 840 980 1120 1260 1400 1540 1680 1820 1960 Exemplos de séries temporais (4) Consumo elétrico As séries de número de passageiros por mês em linhas aéreas apresenta sazonalidade com um marcado crescimento onde a variância aumenta na medida que toma maiores valores. Exemplos de séries temporais (5) Passageiros em linhas aéreas Heteroscedasticidade Se a variância não é constante pode-se normalizar transformando apropriadamente os dados iniciais. y 1 9 8 0 m 0 1 d 0 1 y 1 9 8 0 m 0 7 d 0 1 y 1 9 8 1 m 0 1 d 0 1 y 1 9 8 1 m 0 7 d 0 1 y 1 9 8 2 m 0 1 d 0 1 y 1 9 8 2 m 0 7 d 0 1 y 1 9 8 3 m 0 1 d 0 1 y 1 9 8 3 m 0 7 d 0 1 y 1 9 8 4 m 0 1 d 0 1 y 1 9 8 4 m 0 7 d 0 1 y 1 9 8 5 m 0 1 d 0 1 y 1 9 8 5 m 0 7 d 0 1 y 1 9 8 6 m 0 1 d 0 1 y 1 9 8 6 m 0 7 d 0 1 y 1 9 8 7 m 0 1 d 0 1 y 1 9 8 7 m 0 7 d 0 1 y 1 9 8 8 m 0 1 d 0 1 y 1 9 8 8 m 0 7 d 0 1 y 1 9 8 9 m 0 1 d 0 1 y 1 9 8 9 m 0 7 d 0 1 y 1 9 9 0 m 0 1 d 0 1 y 1 9 9 0 m 0 7 d 0 1 y 1 9 9 1 m 0 1 d 0 1 y 1 9 9 1 m 0 7 d 0 1 y 1 9 9 2 m 0 1 d 0 1 104 156 208 260 312 364 416 468 520 572 624 y 1 9 8 0 m 0 1 d 0 1 y 1 9 8 0 m 0 7 d 0 1 y 1 9 8 1 m 0 1 d 0 1 y 1 9 8 1 m 0 7 d 0 1 y 1 9 8 2 m 0 1 d 0 1 y 1 9 8 2 m 0 7 d 0 1 y 1 9 8 3 m 0 1 d 0 1 y 1 9 8 3 m 0 7 d 0 1 y 1 9 8 4 m 0 1 d 0 1 y 1 9 8 4 m 0 7 d 0 1 y 1 9 8 5 m 0 1 d 0 1 y 1 9 8 5 m 0 7 d 0 1 y 1 9 8 6 m 0 1 d 0 1 y 1 9 8 6 m 0 7 d 0 1 y 1 9 8 7 m 0 1 d 0 1 y 1 9 8 7 m 0 7 d 0 1 y 1 9 8 8 m 0 1 d 0 1 y 1 9 8 8 m 0 7 d 0 1 y 1 9 8 9 m 0 1 d 0 1 y 1 9 8 9 m 0 7 d 0 1 y 1 9 9 0 m 0 1 d 0 1 y 1 9 9 0 m 0 7 d 0 1 y 1 9 9 1 m 0 1 d 0 1 y 1 9 9 1 m 0 7 d 0 1 y 1 9 9 2 m 0 1 d 0 1 4.75 4.94 5.13 5.32 5.51 5.7 5.89 6.08 6.27 6.46 Se observa: • Comportamentos periódicos a nível semanale a nível anual. • Mudanças de nível. • A influência de efeitos como feriados, pontes, etc. Exemplos de séries temporais (6) Venda diária de um jornal em uma banca y 2 0 0 4 m 0 1 d 0 2 y 2 0 0 4 m 0 1 d 1 9 y 2 0 0 4 m 0 2 d 0 5 y 2 0 0 4 m 0 2 d 2 2 y 2 0 0 4 m 0 3 d 1 0 y 2 0 0 4 m 0 3 d 2 7 y 2 0 0 4 m 0 4 d 1 3 y 2 0 0 4 m 0 4 d 3 0 y 2 0 0 4 m 0 5 d 1 7 y 2 0 0 4 m 0 6 d 0 3 y 2 0 0 4 m 0 6 d 2 0 y 2 0 0 4 m 0 7 d 0 7 y 2 0 0 4 m 0 7 d 2 4 y 2 0 0 4 m 0 8 d 1 0 y 2 0 0 4 m 0 8 d 2 7 y 2 0 0 4 m 0 9 d 1 3 y 2 0 0 4 m 0 9 d 3 0 y 2 0 0 4 m 1 0 d 1 7 y 2 0 0 4 m 1 1 d 0 3 y 2 0 0 4 m 1 1 d 2 0 y 2 0 0 4 m 1 2 d 0 7 y 2 0 0 4 m 1 2 d 2 4 y 2 0 0 5 m 0 1 d 1 0 y 2 0 0 5 m 0 1 d 2 7 y 2 0 0 5 m 0 2 d 1 3 y 2 0 0 5 m 0 3 d 0 2 y 2 0 0 5 m 0 3 d 1 9 y 2 0 0 5 m 0 4 d 0 5 y 2 0 0 5 m 0 4 d 2 2 y 2 0 0 5 m 0 5 d 0 9 y 2 0 0 5 m 0 5 d 2 6 y 2 0 0 5 m 0 6 d 1 2 y 2 0 0 5 m 0 6 d 2 9 y 2 0 0 5 m 0 7 d 1 6 y 2 0 0 5 m 0 8 d 0 2 y 2 0 0 5 m 0 8 d 1 9 y 2 0 0 5 m 0 9 d 0 5 y 2 0 0 5 m 0 9 d 2 2 y 2 0 0 5 m 1 0 d 0 9 y 2 0 0 5 m 1 0 d 2 6 y 2 0 0 5 m 1 1 d 1 2 y 2 0 0 5 m 1 1 d 2 9 y 2 0 0 5 m 1 2 d 1 6 y 2 0 0 6 m 0 1 d 0 2 y 2 0 0 6 m 0 1 d 1 9 y 2 0 0 6 m 0 2 d 0 5 y 2 0 0 6 m 0 2 d 2 2 y 2 0 0 6 m 0 3 d 1 1 y 2 0 0 6 m 0 3 d 2 8 y 2 0 0 6 m 0 4 d 1 4 y 2 0 0 6 m 0 5 d 0 1 y 2 0 0 6 m 0 5 d 1 8 y 2 0 0 6 m 0 6 d 0 4 y 2 0 0 6 m 0 6 d 2 1 y 2 0 0 6 m 0 7 d 0 8 y 2 0 0 6 m 0 7 d 2 5 y 2 0 0 6 m 0 8 d 1 1 y 2 0 0 6 m 0 8 d 2 8 y 2 0 0 6 m 0 9 d 1 4 y 2 0 0 6 m 1 0 d 0 1 y 2 0 0 6 m 1 0 d 1 8 y 2 0 0 6 m 1 1 d 0 4 0 19 38 57 76 95 114 133 152 171 190 40 50 60 70 80 90 100 110 120 130 y 2 0 0 4 m 1 1 d 1 5 y 2 0 0 4 m 1 1 d 2 2 y 2 0 0 4 m 1 1 d 2 9 y 2 0 0 4 m 1 2 d 0 6 y 2 0 0 4 m 1 2 d 1 3 y 2 0 0 4 m 1 2 d 2 0 y 2 0 0 4 m 1 2 d 2 7 y 2 0 0 5 m 0 1 d 0 3 y 2 0 0 5 m 0 1 d 1 0 y 2 0 0 5 m 0 1 d 1 7 y 2 0 0 5 m 0 1 d 2 4 y 2 0 0 5 m 0 1 d 3 1 y 2 0 0 5 m 0 2 d 0 7 y 2 0 0 5 m 0 2 d 1 4 y 2 0 0 5 m 0 2 d 2 1 y 2 0 0 5 m 0 2 d 2 8 y 2 0 0 5 m 0 3 d 0 7 y 2 0 0 5 m 0 3 d 1 4 y 2 0 0 5 m 0 3 d 2 1 y 2 0 0 5 m 0 3 d 2 8 y 2 0 0 5 m 0 4 d 0 4 y 2 0 0 5 m 0 4 d 1 1 y 2 0 0 5 m 0 4 d 1 8 y 2 0 0 5 m 0 4 d 2 5 y 2 0 0 5 m 0 5 d 0 2 y 2 0 0 5 m 0 5 d 0 9 y 2 0 0 5 m 0 5 d 1 6 y 2 0 0 5 m 0 5 d 2 3 y 2 0 0 5 m 0 5 d 3 0 y 2 0 0 5 m 0 6 d 0 6 y 2 0 0 5 m 0 6 d 1 3 y 2 0 0 5 m 0 6 d 2 0 y 2 0 0 5 m 0 6 d 2 7 y 2 0 0 5 m 0 7 d 0 4 y 2 0 0 5 m 0 7 d 1 1 y 2 0 0 5 m 0 7 d 1 8 y 2 0 0 5 m 0 7 d 2 5 y 2 0 0 5 m 0 8 d 0 1 y 2 0 0 5 m 0 8 d 0 8 0 16 32 48 64 80 96 112 128 144 160 Efeitos como o começo das promoções produz um resultado em incremento instantãneo das vendas que se transmite com certo decaimento. Exemplos de séries temporais (7) Venda de um tipo de produto em uma temporada y 2 0 0 4 m 0 7 d 1 7 y 2 0 0 4 m 0 7 d 3 1 y 2 0 0 4 m 0 8 d 1 4 y 2 0 0 4 m 0 8 d 2 8 y 2 0 0 4 m 0 9 d 1 1 y 2 0 0 4 m 0 9 d 2 5 y 2 0 0 4 m 1 0 d 0 9 y 2 0 0 4 m 1 0 d 2 3 y 2 0 0 4 m 1 1 d 0 6 y 2 0 0 4 m 1 1 d 2 0 y 2 0 0 4 m 1 2 d 0 4 y 2 0 0 4 m 1 2 d 1 8 y 2 0 0 5 m 0 1 d 0 1 y 2 0 0 5 m 0 1 d 1 5 y 2 0 0 5 m 0 1 d 2 9 y 2 0 0 5 m 0 2 d 1 2 y 2 0 0 5 m 0 2 d 2 6 y 2 0 0 5 m 0 3 d 1 2 y 2 0 0 5 m 0 3 d 2 6 y 2 0 0 5 m 0 4 d 0 9 Exemplos de séries temporais (8) 1 9 9 4 1 9 9 5 1 9 9 6 1 9 9 7 1 9 9 8 1 9 9 9 2 0 0 0 2 0 0 1 2 0 0 2 2 0 0 3 -9.8 -4.9 0 4.9 9.8 14.7 19.6 24.5 29.4 34.3 39.2 -9.8 -4.9 0 4.9 9.8 14.7 19.6 24.5 29.4 34.3 As séries de temperaturas oscilam em torno de um valor central, (15º máx e 5º mín) mas sistematicamente alguns meses tem valores mais altos que outros. Por exemplo os meses de verão tem valores mais altos que os meses de inverno. Séries diferentes guardam altas correlações. Também pode-se considerar o problema de modelar ambas simultaneamente, como Séries Temporais Multivariadas.Temperatura máxima e mínima diária Os Zt,, , t=0,1,2,3,.....n, são realizações de xt Processos Estocásticos { }Ttxt ε, tz Serie Temporal Observada Um Processo Estocástico pode ser definido como uma coleção de variáveis aleatórias ordenadas no tempo ,onde T é um conjunto ordenado de índices. Conceito de Série Temporal Def.) Série temporal : Uma serie temporal se considera como a realização de um processo estocástico e que estão ordenadas em intervalos regulares de tempo (cada dia, cada mês, cada ano, etc) tt zzzzz ,...,,}{ 321 1 9 9 4 1 9 9 5 1 9 9 6 1 9 9 7 1 9 9 8 1 9 9 9 2 0 0 0 2 0 0 1 2 0 0 2 2 0 0 3 -9.8 -4.9 0 4.9 9.8 14.7 19.6 24.5 29.4 34.3 39.2 -9.8 -4.9 0 4.9 9.8 14.7 19.6 24.5 29.4 34.3 8 9 - E n e 8 9 - A b r 8 9 - J u l 8 9 - O c t 9 0 - F e b 9 0 - M a y 9 0 - A g o 9 0 - D i c 9 1 - M a r 9 1 - J u n 9 1 - S e p 9 2 - E n e 9 2 - A b r 9 2 - J u l 9 2 - N o v 9 3 - F e b 9 3 - M a y 9 3 - A g o 9 3 - D i c 9 4 - M a r 9 4 - J u n 9 4 - O c t 9 5 - E n e 9 5 - A b r 9 5 - J u l 9 5 - N o v 9 6 - F e b 9 6 - M a y 9 6 - S e p 9 6 - D i c 9 7 - M a r 9 7 - J u n 9 7 - O c t 9 8 - E n e 9 8 - A b r 9 8 - A g o 9 8 - N o v 9 9 - F e b 9 9 - M a y 9 9 - S e p 9 9 - D i c 0 0 - M a r 0 0 - J u l 0 0 - O c t 0 1 - E n e 0 1 - A b r 0 1 - A g o 0 1 - N o v 0 2 - F e b 0 2 - J u n 0 2 - S e p 0 2 - D i c 0 3 - M a r 0 3 - J u l 0 3 - O c t 0 4 - E n e 0 4 - M a y 0 200 400 600 800 1000 1200 1400 1600 1800 2000 0 200 400 600 800 1000 1200 1400 1600 1800 2000 Os dados de séries temporais geralmente não são independentes, especialmente se os intervalos da amostra são curtos. As observações próximas costumam ser mais parecidas que as mais distantes (p. ej. temperatura diária). Caracterização de Processos Estocásticos Um processo estocástico fica caracterizado se definimos a função da distribuição conjunta das variáveis aleatórias (z1,z2,.. zT) para qualquer valor de T. Dizemos que conhecemos a estrutura probabilística de um proceso estocástico quando conhecemos estas distribuições, sem embargo isto requer observar um grande número de realizações que não costumam estar disponíveis quando se trata de séries econômicas. ][ tt zE=μ Def.) Função de Médias :proporciona as esperanças das distribuições marginais de zt para cada instante ][2 tt zVar=σ Def.) Função de variâncias do processo proporciona as variâncias em cada instante temporal. Def.) Função de AutoCovariâncias: descreve a Covariâncias entre duas variáveis do processo em dois instantes quaisquer. )])([(),(),( jtjtttjtt zzEzzCovjtt +++ −−==+ μμγ Def.) Função de Autocorrelaçãon: mede a dependência lineal entre os valores do processo no instante t e no instante t+j. Chamaremo coeficiente de correlação de orden (j) a: jtt jtt zzCovjtt + +=+ σσρ ),( ),( o correlograma não é mais que a representação dos coeficientes de autocorrelación em função do atraso j. Caracterizando o processo estocástico Zt Processos Estocásticos Tipos de processos estocásticos 0 0 - E n e 0 0 - N o v 0 1 - S e p 0 2 - J u l 0 3 - M a y 0 4 - M a r 0 5 - E n e 0 5 - N o v 0 6 - S e p 0 7 - J u l 0 8 - M a y 0 9 - M a r 1 0 - E n e 1 0 - N o v -0.64 -0.48 -0.32 -0.16 0 0.16 0.32 0.48 0.64 0.8 Processos Estacionários Um processo estocástico Zt é estacionário quando as propriedades estatísticas de qualquer sequência finita z1,z2,.. zk de componentes de Zt são semelhantes às da sequência z1+h,z2+h,.. zk+h para qualquer número inteiro h Processos Não Estacionários Um processo estocástico Zt é não estacionário quando as propriedades estatísticas de ao menos uma sequência finita z1,z2,.. zk de componentes de Zt são diferentes das de sequência z1+h,z2+h,.. zk+h para ao menos um número inteiro h 9 1 9 4 0 1 0 3 9 3 9 5 0 2 9 7 0 4 9 6 9 8 0 0 9 2 9 9 560 700 840 980 1120 1260 1400 1540 1680 1820 1960 Se existe a transformação: Processos Homogêneos de Orden d Processos Estocásticos Estacionários Def.) Processo Estocástico Estacionário em Sentido Estrito : Um processo estocástico Zt é estacionário quando as propriedades estatísticas de qualquer sequência finita z1,z2,.. zk de componentes de Zt são semelhantes às da sequência z1+h,z2+h,.. zk+h para qualquer número inteiro h. Um processo estocástico Zt é estacionário quando a distribuição conjunta de qualquer conjunto de variáveis não se modifica se transferimos as variáveis no tempo. ),...,,(),...,( hkhjhikji xxxFxxxF +++= Def.) Processo Estocástico Estacionário em Sentido Débil : Quando os momentos de primeira e segunda ordem do processo são constantes e a Covariância entre duas variáveis depende somente de sua separação no tempo 2,1,0),(),( )( )( 2 ±±==+=− = = kkttktt xVar xE k t t γγγ σ μ 0 0 - E n e 0 0 - N o v 0 1 - S e p 0 2 - J u l 0 3 - M a y 0 4 - M a r 0 5 - E n e 0 5 - N o v 0 6 - S e p 0 7 - J u l 0 8 - M a y 0 9 - M a r 1 0 - E n e 1 0 - N o v -0.64 -0.48 -0.32 -0.16 0 0.16 0.32 0.48 0.64 0.8 Nota: Quando um processo é estacionário as propriedades estatísticas se simplificam notavelmente e sua caracterização é mais simples Exemplos de Processos Estocásticos Estacionários Processo Ruído Branco. ARIMA(0,0,0) tt az = Processo Homogêneo de orden 1. ARIMA(p,0,0) Proceso Homogéneo de Orden 1. ARIMA(0,1,0)tt az =∇ Processo Autoregressivo de orden (p).ARIMA(p,0,0) tptptt azzz +++= −φφ ..1 Processo Média Móvel de ordem (q).ARIMA(0,0,q) qtqttt aaaz −− +++= θθ ..11 Processo ARIMA(p,0,q) qtqttptptt aaazzz −−−− ++++++= θθφφ .... 1111 Caracterização Média de Amostra Matriz de Covariâncias Autocorrelações T z z T t t t ∑ == 1ˆ ∑ += − −−= T kt kttt zzzzT 1 )ˆ)(ˆ(1γˆ okkr γγ ˆˆ= Estimação dos momentos de Processos Estacionários Dada uma série temporal Zt nosso objetivo é construir um modelo estatístico que capture toda a informação estatística sistemática contida em essa série. Se consideramos Zt como uma realização de um processo estocástico podemos obter estimativas deseus momentos de amostras tal que: Def.) Estimador Média de amostra: é um estimador centrado da média populacional. T z z T t t t ∑ == 1ˆ μ=)ˆ( tzE Def.) Estimador das Covariânçias de orden k quando a média populacional é desconhecida. É um estimador enviesado da autocovariâncias populacionais mas têm menores erros quadráticos de estimação que o estimador com média conhecida. Garante que a matriz de covariâncias seja sempre definida positiva. ∑ += − −−= T kt kttk zzzzT 1 )ˆ)(ˆ(1γˆ ⎥⎥ ⎥⎥ ⎦ ⎤ ⎢⎢ ⎢⎢ ⎣ ⎡ =Γ −− − − 021 201 110 ˆˆˆ ˆˆˆ ˆˆˆ ~ γγγ γγγ γγγ L MOMM L L kk k k k ∑ += − −−−= T kt kttk zzkT 1 ))((1~ μμγ Média ConhecidaMédia Desconhecida: Def.) Estimador da matriz de covariâncias: Def.) Estimador das autocorrelações de orden k: okkr γγ ˆˆ= Onde é a variância do proceso oγˆ Caracterização A ponte entre os padrões de regularidade e os conceitos probabilísticos é transformar o reconhecimento intuitivo de padrões em informação estatística sistemática para ser utilizada na modelação. Def.) Modelação Empírica: Usando modelos estatísticos descrevem-se fenômenos estocásticos observáveis },,),({ xxxf ℜ∈Θ∈=Φ θθ -2 -1 0 1 2 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 2 3 4 5 6 7 8 9 10 11 12 0 30 60 90 120 150 0 30 60 90 120 150 0 1 0 1 0 2 0 1 0 3 0 1 0 4 0 1 0 5 0 1 0 6 0 1 0 7 0 1 0 8 0 1 0 9 0 1 1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 2 3 4 5 6 7 8 9 10 11 12 tzzzz ,...,, 321 Padrão de regularidade: Histograma Série Temporal: tt atfz += ),( β onde f(t,B) é uma função conhecida determinista do tempo que depende de um vetor de parâmetros B e at é uma sequência de variáveis aleatórias independentes de média zero e variância constante. Conceito de Modelação Empírica Modelo Lineal 1. Modelo estocástico: A presença de término de error faz que a relação entre a variável endógena e a explicativa seja estocástica. 2. O modelo que relaciona as variáveis endógena e explicativa é lineal nos coeficientes beta. 3. Os coeficientes beta são constantes no tempo. 4. Existe uma relação causal desde as variáveis explicativas até as variáveis endógenas. 5. As variáveis x são linealmente independentes. 6. As variáveis x são deterministas. ),0( ...),( 2211 at tkkott RBa axxxatfz σ βββββ >− +++++=+= Estimador Mínimos Quadrados Ordinários +=∂∂ ∂ =⇒=∂ ∂ +−=∂ ′∂=∂ ∂ +−= +−=′= −=−= ∴+= − defXXSR yXXXSR XXyXaaSR XXyXyySR XXyXyyaaSR Xyyya RBaaXy tt tt tttt ttttt atttt ' ' 2 '1' '''' ''''' ''''' ˆˆ )ˆ( )(ˆ0ˆ )ˆ( ˆˆˆ2ˆ ˆˆ ˆ )ˆ( )ˆˆˆ2(min)ˆ(min ˆˆˆ2ˆˆ)ˆ( ˆˆˆ ),0( ββ β ββ β βββββ β ββββ ββββ β σβ ββ Parâmetros desconhecidos do meu modelo beta e sigma XB y at=Y-XB Propriedades do Estimador MCO Se E(at)=0T então o estimador MCO é insesgado e E(β)=β 1'21'2'1' 1'''1'1'''1' '1' '1''1' '1''1' )()()()()ˆ( )(][)(])()[()ˆ( )]ˆ)(ˆ[())]ˆ(ˆ))(ˆ(ˆ[()ˆ( )(ˆ ][)(])([)ˆ( )()()(ˆ −−− −−−− − −− −− == == −−=−−= =− =+=+= +== XXXXXIXXXVar XXXaaEXXXXXXaaXXXEVar EEEEVar aXXX aEXXXaXXXEE aXXXXyXXX aTa tttt t tt t σσβ β βββββββββ ββ ββββ ββ ))(,ˆ( 1'2 −∴ XXN aσββ 2 ' 2 ' 2 )ˆ(ˆ a tt a tt a kT aaEE kT aa σσσ =⎟⎟⎠ ⎞ ⎜⎜⎝ ⎛ −=−= É necessário um estimador da variância, se demonstra que: Os métodos atuais de análises de séries temporais entende-se melhor se connhecemos as limitações de outros métodos mais simples desenvolvidos para solucionar o problema da predição. Métodos Tradicionais Modelo com Tendência Determinista tt atz ++= 1βμ Modelo com Sazonalidade Cíclica Determinista tt awtBwtsenAz +++= )cos(.)(.μ Modelo de Ajuste de Múltiplos Ciclos Deterministas t k j jj k j jjt atwBtwsenAz +++= ∑∑ == 11 )cos()(μ Modelo com Tendências Deterministas: Zt=bo+b1t+at 9 1 9 2 9 3 9 4 9 5 9 6 9 7 9 8 9 9 0 0 0 1 0 2 0 3 299000 322000 345000 368000 391000 414000 437000 460000 483000 506000 9 1 9 2 9 3 9 4 9 5 9 6 9 7 9 8 9 9 0 0 0 1 0 2 0 3 -24000 -19200 -14400 -9600 -4800 0 4800 9600 14400 19200 tott atatfz ++=+= 1),( βββ Parâmetros Estimados Name Value StDs TStudent RefuseProb B0 cte 265093.5 8403.6 31.5 6.49E-13 B1 trend 17745.6 1058.8 16.8 1.09E-09 R2 0.955771 Desv. Est. 14283.3717 Dada a série de consumo elétrico anual procedemos a representar-lo mediante um modelo estatístico consistente em uma constante, uma tendência dependente do tempo e uma variável aleatória de média zero e variância constante. Nosso objetivo é realizar uma previsão de demanda de consumo para o ano seguinte. tzt 6.177455.265093ˆ += Modelo de Tendência Lineal Para isto realizamos uma regressão lineal com os seguintes resultados O modelo dá um grande ajuste !?! Erros MUITO ALTOS Os resíduos contém claramente informação, fato que nos leva a concluir que o modelo está mal especificado. ttt zza ˆˆ −= A variância não é constante! Um modelo para a temperatura média diária é uma estrutura harmônica no tempo da forma onde • μ é uma constante (nível) • A e B dão os desvios com respeito a μ • é a frequência ( T = 365 dias , T=12, T=52) Modelo com sazonalidade cíclica tt attsenz +++= )cos(B)(A ωωμ Value StDs TStudent RefuseProb μ 7.82323835 0.06754142 115.828749 0 A -2.57632028 0.09547423 -26.9844582 0 B -4.14312321 0.09556174 -43.3554605 0 T πω 2= Realizamos uma regressão lineal com os seguintes resultados Os resíduos são grandes e têm uma certa estrutura sazonal Uma função periódica pode descompor-se como uma superposição de funções harmônicas de distintas frequências e amplitudes onde • μ é uma constante (nível) • Aj e Bj dão os desvios com respeito a μ • são as frequências ( T = 365 días ) Modelo com múltiplos ciclos de Fourier t k j jj k j jjt attsenz +++= ∑∑ == 11 )cos(B)(A ωωμ 2/,...,2,1,2 TnnT == πω O ajuste é melhor A Sazonalidade das séries econômicas pode a vezes ser representada com ciclos de Fourier Normalmente as séries apresentam tendências não constantes e padrões estacionais irregulares: Limitações dos métodos deterministas O padrão estacional é constante ao largo dos anos no consumo elétrico 1 9 9 2 m 0 5 d 0 1 1 9 9 2 m 0 6 d 0 1 1 9 9 2 m 0 7 d 0 1 1 9 9 2 m 0 8 d 0 1 1 9 9 2 m 0 9 d 0 1 1 9 9 2 m 1 0 d 0 1 1 9 9 2 m 1 1 d 0 1 1 9 9 2 m 1 2 d 0 1 1 9 9 3 m 0 1 d 0 1 1 9 9 3 m 0 2 d 0 1 1 9 9 3 m 0 3 d 0 1 1 9 9 3 m 0 4 d 0 1 1 9 9 3 m 0 5 d 0 1 1 9 9 3 m 0 6 d 0 1 1 9 9 3 m 0 7 d 0 1 1 9 9 3 m 0 8 d 0 1 1 9 9 3 m 0 9 d 0 1 1 9 9 3 m 1 0 d 0 1 1 9 9 3 m 1 1 d 0 1 1 9 9 3 m 1 2 d 0 1 1 9 9 4 m 0 1d 0 1 1 9 9 4 m 0 2 d 0 1 1 9 9 4 m 0 3 d 0 1 1 9 9 4 m 0 4 d 0 1 1 9 9 4 m 0 5 d 0 1 1 9 9 4 m 0 6 d 0 1 1 9 9 4 m 0 7 d 0 1 1 9 9 4 m 0 8 d 0 1 1 9 9 4 m 0 9 d 0 1 1 9 9 4 m 1 0 d 0 1 1 9 9 4 m 1 1 d 0 1 1 9 9 4 m 1 2 d 0 1 1 9 9 5 m 0 1 d 0 1 1 9 9 5 m 0 2 d 0 1 1 9 9 5 m 0 3 d 0 1 1 9 9 5 m 0 4 d 0 1 1 9 9 5 m 0 5 d 0 1 1 9 9 5 m 0 6 d 0 1 1 9 9 5 m 0 7 d 0 1 1 9 9 5 m 0 8 d 0 1 1 9 9 5 m 0 9 d 0 1 1 9 9 5 m 1 0 d 0 1 1 9 9 5 m 1 1 d 0 1 1 9 9 5 m 1 2 d 0 1 1 9 9 6 m 0 1 d 0 1 1 9 9 6 m 0 2 d 0 1 1 9 9 6 m 0 3 d 0 1 1 9 9 6 m 0 4 d 0 1 1 9 9 6 m 0 5 d 0 1 1 9 9 6 m 0 6 d 0 1 1 9 9 6 m 0 7 d 0 1 1 9 9 6 m 0 8 d 0 1 1 9 9 6 m 0 9 d 0 1 1 9 9 6 m 1 0 d 0 1 1 9 9 6 m 1 1 d 0 1 1 9 9 6 m 1 2 d 0 1 1 9 9 7 m 0 1 d 0 1 1 9 9 7 m 0 2 d 0 1 1 9 9 7 m 0 3 d 0 1 1 9 9 7 m 0 4 d 0 1 1 9 9 7 m 0 5 d 0 1 1 9 9 7 m 0 6 d 0 1 1 9 9 7 m 0 7 d 0 1 1 9 9 7 m 0 8 d 0 1 1 9 9 7 m 0 9 d 0 1 1 9 9 7 m 1 0 d 0 1 1 9 9 7 m 1 1 d 0 1 1 9 9 7 m 1 2 d 0 1 1 9 9 8 m 0 1 d 0 1 1 9 9 8 m 0 2 d 0 1 1 9 9 8 m 0 3 d 0 1 4 9 8 0 0 5 8 1 0 0 6 6 4 0 0 7 4 7 0 0 8 3 0 0 0 9 1 3 0 0 9 9 6 0 0 1 0 7 9 0 0 1 1 6 2 0 0 1 2 4 5 0 0 Ainda que apresente estacionalidade não se ajusta bem aos ciclos de Fourier 9 1 9 2 9 3 9 4 9 5 9 6 9 7 9 8 9 9 0 0 0 1 0 2 0 3 315000 336000 357000 378000 399000 420000 441000 462000 483000 504000 9 1 / 0 1 9 8 / 0 7 9 7 / 0 1 9 2 / 0 7 9 4 / 0 1 9 5 / 0 7 0 1 / 0 1 9 9 / 0 7 0 4 / 0 1 0 2 / 0 7 9 1 / 0 7 9 3 / 0 1 9 4 / 0 7 9 6 / 0 1 9 9 / 0 1 9 7 / 0 7 0 4 / 0 7 0 3 / 0 1 0 1 / 0 7 0 0 / 0 1 9 2 / 0 1 9 3 / 0 7 9 8 / 0 1 9 5 / 0 1 9 6 / 0 7 0 3 / 0 7 0 2 / 0 1 0 0 / 0 7 21000 24500 28000 31500 35000 38500 42000 45500 49000 52500 56000 9 2 9 3 9 5 9 7 9 9 0 1 0 3 6710.4 6715.2 6720 6724.8 6729.6 6734.4 6739.2 6744 6748.8 6753.6 9 1 9 4 0 1 0 3 9 3 9 5 0 2 9 7 0 4 9 6 9 8 0 0 9 2 9 9 560 700 840 980 1120 1260 1400 1540 1680 1820 1960 Tipos de períodos A agregação nos dados sempre conduz a perda de informação. Sempre que seja possível se deve construir modelos sobre séries temporais com a maior profundidade de desagregação. Poca Información Objetivo da análise das Séries Temporais O objetivo da análise de uma série temporal consiste em elaborar um modelo estatístico que descreva adequadamente a procedência de dita série, de maneira que as implicações teóricas do modelo resultem compatíveis com as pautas de amostras observadas nas séries temporais. Depois o modelo elaborado a partir da série temporal pode ser utilizado para prever a evolução futura da série ou explicar a relação entre os distintos componentes do modelo. 8 9 - E n e 8 9 - A b r 8 9 - J u l 8 9 - O c t 9 0 - F e b 9 0 - M a y 9 0 - A g o 9 0 - D i c 9 1 - M a r 9 1 - J u n 9 1 - S e p 9 2 - E n e 9 2 - A b r 9 2 - J u l 9 2 - N o v 9 3 - F e b 9 3 - M a y 9 3 - A g o 9 3 - D i c 9 4 - M a r 9 4 - J u n 9 4 - O c t 9 5 - E n e 9 5 - A b r 9 5 - J u l 9 5 - N o v 9 6 - F e b 9 6 - M a y 9 6 - S e p 9 6 - D i c 9 7 - M a r 9 7 - J u n 9 7 - O c t 9 8 - E n e 9 8 - A b r 9 8 - A g o 9 8 - N o v 9 9 - F e b 9 9 - M a y 9 9 - S e p 9 9 - D i c 0 0 - M a r 0 0 - J u l 0 0 - O c t 0 1 - E n e 0 1 - A b r 0 1 - A g o 0 1 - N o v 0 2 - F e b 0 2 - J u n 0 2 - S e p 0 2 - D i c 0 3 - M a r 0 3 - J u l 0 3 - O c t 0 4 - E n e 0 4 - M a y 0 200 400 600 800 1000 1200 1400 1600 1800 2000 0 200 400 600 800 1000 1200 1400 1600 1800 2000 ][ tt zE=μ ][2 tt zVar=σ jtt jtt zzCovjtt + +=+ σσρ ),( ),( 2*Sigma -2*Sigma 10 20 30 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 tot atz ++= 1ββ tt awtRsenz +++= )( θμ tt p p t q qt azBB aBBz =−−− −−−= )...1( )...1( 1 1 φφ θθ tt az += μ Pautas de Amostras Modelo Estatístico Prever, Descrever 0 5 0 6 0 7 0 8 0 9 0 9 1 0 1 1 1 2 -0.78 -0.52 -0.26 0 0.26 0.52 0.78 1.04 Modelo de séries temporais univariantes ttt aB BFXT )( )()( ϕ θ+= ( ) ttt aFXTB B =−)( )( )( θ ϕ R u i d o B l a n c o -2.75 -2.2 -1.65 -1.1 -0.55 0 0.55 1.1 1.65 2.2 Observações Filtro (fatores externos) Ruído ou Noise (fatores estruturais) i tit FBF ∑= )(α Construção do modelo 9 1 9 4 0 1 0 3 9 3 9 5 0 2 9 7 0 4 9 6 9 8 0 0 9 2 9 9 560 700 840 980 1120 1260 1400 1540 1680 1820 1960 Operadores: Diferença, Retardo, Inverso Para poder operar com processos estacionários definimos os siguientes operadores Uma propriedade importante dos processos estacionários é que os processos obtidos através das combinações lineares dos processosestacionários são também estacionários. Ou seja se Zt é estacionário então o processo é também estacionário.1−−= ttt zzw Def.) Operador Retardo: um operador linear que aplicado a uma função temporal proporciona a essa função retardada um período. Em particular se aplicamos o operador a uma série temporal obtenemos a mesma série retardada um período. )1()( −= tftBf 1−= tt zzB 2211 2 21 11 )1( .. −− − −− −−=−− == == = tttt kttt k ttt zzzzBB zBzBzB zaBzaBaz B φφφφ μμ Def.) Operador Diferença: é o operador polinômico (1-B). O resultado de aplicar o operador diferença a uma série Zt com T observações é obter uma nova série com T-1 observações através 1)1( )1( −−=−=∇ −=∇ tttt zzzBz B sttt s ts ttttt zzzBz zzzBBzBz − −− −=−=∇ +−=+−=−=∇ )1( 2)21()1( 21 222 Def.) Operadores Inversos: Verificam a propriedade que o produto por o operador inicial é a unidade. (pe. o inverso do operador retardo é o operador adiantado ) 1 1 1 = == +− BF zzBzF ttt 1)()()1()1( )1(....)1( 11 1 0 22 ==−− −==++ −− − − ∞ =∑ BBBB zBzBzBB tit i i i t φφφφ φφφφ Operadores 9 1 9 4 9 7 0 1 0 4 9 3 9 6 9 9 0 3 0 0 9 2 9 5 9 8 0 2 -5000 0 5000 10000 15000 20000 25000 30000 35000 40000 45000 50000 55000 Operador B move a série para a direita! A série Wt continua tendo estrutura Aplicando, à série de consumo elétrico em períodos mensais, os distintos operadores teremos que: 4 4 −= tt zzB A série transformada têm a mesma tendência e estrutura estacional que a série original. tt zBw )1( −= A série diferença regular é estacionária em média mas apresenta estrutura estacional. tt zBS )1( 12−= A série diferença estacional é estacionária em média e não apresenta estrutura estacional. Perdem-se 12 obvs. Aplicação de Operadores 2*Sigma-2*Sigma 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 -3 -2 -1 0 1 2 3 250 500 750 1000 1250 1500 1750 2000 2250 2500 2*Sigma-2*Sigma 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 Processo Ruído Branco. ARIMA(0,0,0) Def.) Processo Ruído Branco: é um processo estocástico onde todas as variáveis aleatórias seguem uma distribuição normal de média zero, variância constante e as covariâncias são nulas. tt az = 0)( =tzE 0),( =−ktt zzCov 2)( σ=tzVar ACF PACF Hist. 9 0 9 3 9 6 0 0 0 3 9 2 9 5 9 8 0 5 0 2 9 9 9 1 9 4 9 7 0 1 0 4 -3 -2 -1 0 1 2 3 Nota: Um processo ruído branco é estacionário em média e variância. Processo PROCESSOS ESTACIONÁRIOS Autorregressivos AR(p) Processos Autorregressivos AR(1). ARIMA(1,0,0) )1/()( 1φ−= czE t )1( 21 2 0 φ σγ −= a Def.) Proceso Autorregressivo AR(1) : é um processo estocástico {zt} que estabelece uma dependência linear sobre o primeiro retardo da variável. Dizemos que uma série Zt segue um processo autorregressivo de primeira ordem se foi gerada por: ... ~~ 3 3 2 2 1 11 −−− − +++= += tttt ttt aaaa azz φφφ φ tt tt az azB )1/(1~ ~)1( 1 1 φ φ −= =− Onde –1< <1 é uma constante a determinar, at é um processo ruído branco e .1φ czz tt −=~ Def.) Função de Médias de AR(1) :Tomando esperanças de Zt e dado que E(Zt) = E(Zt-1)=cts posto que o processo é estacionário temos que já que 2222 azz σσφσ +=0 )()()( 11 11 11 >= += += − −−−− − k azEzzEzzE azz kk tkttkttkt ttt γφγ φ φ multiplicado Zt-k e tomando esperanças onde E(at)=0 que é a solução da equação em diferenças com por tanto a função de autocorrelação tende a zero com uma rápidez que depende de quanto maior seja, menor será o decrescimento, a condição de estacionariedade nos garante que a função de autocorrelação converge. 1φ 10 =ρ11 ≥= kkk φρ Def.) Função de Autocovariâncias de AR(1) : se obtém como Def.) Função de Autocorrelação de AR(1) : dividindo a função de autocovariâncias pela variância do processo 11 −= kk ρφρ μφμ 1+= cjá que onde )1( 1φμ −=c onde Processo Caracterização Processos Autorregressivos AR(1). ARIMA(1,0,0) 0 1 0 4 0 0 0 6 0 3 0 5 0 2 -200 -100 0 100 200 300 400 500 600 700 0 1 0 4 0 0 0 6 0 3 0 5 0 2 -300 -200 -100 0 100 200 300 400 tt azB =− )9.01( 2*Sigma -2*Sigma 10 20 30 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 tt azB =+ )9.01( k k 9.0=ρ kk )9.0(−=ρ ACFACF Decrescimento lento exponencial em direção ao zero com parâmetro positivo Valores próximos tem comportamentos similares e exibem acentuada tendência que se reflexa na ACF A série tende a oscilar e se reflexa na função de autocorrelação que muda de sinal. 2*Sigma -2*Sigma 10 20 30 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 Vamos a representar duas realizações de um processo AR(1) com distintos valores do parâmetro e suas funções de autocorrelação teóricas. Alternância de sinal 2*Sigma -2*Sigma 10 20 30 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 9 2 9 3 9 4 9 5 9 6 9 7 9 8 9 9 0 0 0 1 0 2 0 3 8100 10800 13500 16200 18900 21600 24300 27000 29700 32400 9 1 9 2 9 3 9 4 9 5 9 6 9 7 9 8 9 9 0 0 0 1 0 2 0 3 315000 336000 357000 378000 399000 420000 441000 462000 483000 504000 2*Sigma -2*Sigma 10 20 30 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 A série de consumo elétrico em períodos anuais é claramente não estacionária, com um primeiro valor do correlograma muito próximo que indica a necessidade de tomar uma primeira diferença regular. A série de consumo uma vez diferenciada não apresenta uma tendência clara e o correlograma apresenta valores positivos que se amortizam com rapidez, o que nos sugere a existência de um processo autorregressivo de ordem 1 Por tanto o modelo estatístico proposto para representar o comportamento da série consumo elétrico em períodos anuais é tt ttttt azB zBwaww =∇− −=+= − )1( )1( 1 11 φ φ Consumo Elétrico Anual AR(1) ACF ACF 2*Sigma -2*Sigma 10 20 30 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 0 2 9 8 9 4 0 3 9 9 9 5 0 0 9 6 0 1 9 7 -9600 -6400 -3200 0 3200 6400 9600 12800 16000 19200 Dada a série de consumo elétrico em períodos mensais procedemos a representar-la através de um modelo estatístico consistente em uma diferença regular e um processo autorregressivo de orden 1 tal que: tt azB =∇− )1( 1φ Realizando uma estimativa por máxima verisimilitude 0 1 9 7 9 3 0 3 0 2 9 8 9 4 9 9 9 5 0 0 9 6 323000 342000 361000 380000 399000 418000 437000 456000 475000 494000 513000 Name Value StDs TStudent RefuseProb RegularAR 0.88149 0.17150 5.13991 0.00061 547794.5150.8814901.881490ˆ 11 =−= −+ ttt zzz R2Coeficient 0.471662 StandardError 11451.6037 tt azBB =−− )1)(88149.01( Predição de um período para frente é 0)( =taE 0),( =−ktt aaCov 2)( σ=taVar Pouco ajuste !?! Nota: O R2 é baixo mas o erro padrão é menor que no modelo com tendência determinista. ACFNão apresenta nenhuma estrutura Consumo Elétrico Anual AR(1) Função de Autocorrelação Parcial tkktkktkt tttt ttt zzz zzz zz .11 .2222121 ,1111 ... .... .. . ηαα ηαα ηα +++= ++= += −− −− − ),( ... ... 1111 1111 tt tktktkt tktktt vuCorr vzzz uzzz +++= +++= +−−−− +−−− γγ ββ Determinar a ordem de um processo autorregressivo a partir de sua função de autocorrelação é difícil ao ser uma mescla de decrescimentos exponenciais e sinusoidais, que se amortizam ao avançar o retardo e não apresenta rasgos fácilmente identificáveis para determinar a ordem do processo. Para resolver este problema introduz-se a função de autocorrelação parcial. Def.) Coeficiente de Autocorrelação Parcial de ordem k. é o coeficiente de correlação entre observações separadas k períodos quando eliminamos a dependência produzida pelos valores intermediários. Se elimina de Zt o efeito Zt-1, Zt-2,…, Zt-k+1 Se elimina de Zt o efeito Zt-1, Zt-2,…, Zt-k+1 Coeficiente de autocorrelação de ordem k Processo Esta definição é análoga a de coeficiente de correlação parcial da regressão múltipla. A sequência de coeficientes αii proporciona a função de autocorrelação parcial (PACF) Em um processo AR(p) a PACF terá os p primeiros coeficientes distintos de zero. PROCESSOS ESTACIONÁRIOS Autorregressivos AR(2) Processos Autorregressivos AR(2). ARIMA(1,0,0) )1/()( 21 φφ −−= czE t )1)(1)(1( )1( 2 21212 2 2 0 2 1120 2 20 2 10 12011 φφφφφ σφγσγφφγφγφγ γφγφγ −+−−+ −=+++= += a a Def.) Processo Autorregressivo AR(2) : é um processo estocástico {zt} que estabelece uma dependência linear sobre o primeiro e segundo retardo da variável. Diremos que uma série Zt segue um processo autorregressivo de segunda ordem se foi gerada por: tttt azzz ++= −− 2211 ~~~ φφ tt azBB =−− ~)1( 221 φφ Onde , são duas constantes a determinar, at é um processo ruído branco e .1φ czz tt −=~ Def.) Função de Médias de AR(2) :Tomando esperanças de Zt e dado que E(Zt) = E(Zt-1)=cts posto que o processo é estacionário temos que 1 )()()()( 2211 2211 2211 ≥+= ++= ++= −− −−−−−− −− k azEzzEzzEzzE azzz kkk tkttkttkttkt tttt γφγφγ φφ φφ multiplicado Zt-k e tomando esperanças onde E(at)=0 temos 2 2 2 1 2 2 1 1 1 2, 1 1 φφ φρφ φρ +−==−== kk Def.) Função de Autocovariâncias de AR(2) : se obtém como Def.) Função de Autocorrelação de AR(2) : dividindo a função de autocovariâncias pela variância do processo 12211 ≥+= −− kkkk ρφρφρ onde Processo Caracterização 2φ 1 1 11 21 21 2 <+ <− <<− φφ φφ φVariância do processo: para que seja positiva têm-se que cumprir que os parâmetros do processo estejam na região: iicomo ρρ =− kk k GAGAk 22113 +=≥ ρpara para ,para Resolver a Equação em diferenças Equação em diferenças para um AR(2) kk k kk k tttt tt AAk AAk AA XXXX GG GG X XX azzz azBGBG 8.0 4.0 51.04.0 4.0 11.0 8.04.091.01 10 8.04.0 12.132.0)8.01)(4.01( 8.04.0 25.15.2 64.0 4.02.1 64.0 32.042.12.1 012.132.0 32.02.1 )1)(1( 21 21 21 2 21 1 2 1 1 2 2 21 21 +−= +== +== += +−=−− == == ±=×−±= =+− +−= =−− −− −− ρ ρ Resolver a Equação em diferenças Função de Autocorrelação para o processo AR(2) t t tt tttt tt aBB BBz BB B BB B a BB z azzz azBB ...)8.08.01( ...)4.04.01( ...8.08.01 )8.01( 1 ...4.04.01 )4.01( 1 )8.01)(4.01( 1 32.02.1 )8.01)(4.01( 22 22 22 22 21 +++ +++= +++=− +++=− −−= +−= =−− −− Expressão do processo AR(2) como soma de inovações Raízes Reaistt azBB =−− )2.06.01( 2 Processos Autorregressivos AR(2) Raízes Reaistt azBB =−+ )2.06.01( 2 z e r o a p a rt i r d o s e g u n d o r e t a r d o S i n a l D i s t i n t o ACF PACF ACF PACF PROCESSOS ESTACIONÁRIOS Média Móvel MA(q) Processo Média Móvel MA(1). ARIMA(0,0,1) Def.) Processo Média Móvel MA(1): é um processo estocástico {zt} gerado pela combinação linear das duas últimas inovações. tt ttt aBz aaz )1(~ ~ 1 11 θ θ −= −= − )(~...)1()( 2211 0 1 ∞=+++==∑∞ = ARazBBzBzB tt i t ii t θθθπ onde –1< <1 é uma constante a determinar, at é um processo ruído branco e .1θ czz tt −=~ { }BFFBB FBBBB aBaaz aa a tttt 1 2 11 2 11 2 12 11 )1()1)(1()( )()()()()( )( θθθσθθσγ ψψψψσγ ψθ −++−=−−= == =−= − − Def.) Função de Autocovariâncias de MA(1) : se obtém como Def.) Função de Autocorrelação de MA(1) : dividindo a função de autocovariâncias pela variância do processo. Processo Caracterização Representação infinita com coeficientes que decrescem em progressão geométrica, somente é possível a representação se ⎪⎩ ⎪⎨ ⎧ ≥= −= += 20 )1( 2 11 2 1 2 0 kk a a γ σθγ θσγ ⎩⎨ ⎧ >= +−= 10 )1( 2111 kkρ θθρ Por tanto o correlograma do processo terá unicamente um valor distinto de zero no primeiroretardo. Def.) Função de Autocorrelação Parcial de MA(1) : utilizando as equações de Yule-Walker com y depois de manipulações algébricas obtemos que (Box-Cox 70) }1/{}1{ 121 2 11 +−−−= kkkk θθθφ Por tanto a função está dominada por um decrescimento exponencial que dependerá do valor de . Quando é positivo a função é negativa e é negativo a função alterna de sinal. )1( 2111 θθρ +−= 10 >= kkρ 1θ 1θ 11 <θ 2*Sigma -2*Sigma 5 10 15 20 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 Processos Média Móvel MA(1). ARIMA(0,0,1) tt aBz )99.01( −= PACFPACF Decrescimento lento exponencial em direção a zero com parâmetro positivo Vamos representar duas realizações de um processo MA(1) com distintos valores de parâmetro e suas funcões teóricas de autocorrelação simples e parcial. Alternância de sinal com parâmetro negativo 2*Sigma -2*Sigma 5 10 15 20 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 2*Sigma -2*Sigma 5 10 15 20 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 2*Sigma -2*Sigma 5 10 15 20 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 -0.4999747)1( 2111 =+−= θθρ 0.49997475)1( 2111 =+−= θθρ ACF ACF k kk 1|| θφ <}1/{}1{ 121211 +−−−= kkkk θθθφ tt aBz )99.01( += 11 −−= ttt aaz θ 11 −−= ttt aaz θ Ordem ARIMA(1,d,0) ARIMA(0,d,1) comportamento ACF decai exponencialmente comportamento PACF Decaimento exponencial regiao de admisibilidade Ordem ARIMA(2,d,0) ARIMA(0,d,2) comportamento ACF Misturas de exponenciais e ondas senóides amortecidas comportamento PACF Misturas de exponenciais e ondas senóides amortecidas região de admisibilidade Ordem comportamento ACF comportamento PACF região de admisibilidade ARIMA(1,d,1) Decai exponencialmente após o lag 1 Decai exponencialmente após o lag 1 011 ≠φ 01 ≠ρ 011 ≠φ 01 ≠ρ 02 ≠ρ 022 ≠φ 11 <<− φ 11 <<− θ 1 1 11 12 12 2 <+ <− <<− φφ φφ φ 1 1 11 12 12 2 <+ <− <<− θθ θθ θ 11 11 <<− <<− θ φ Comportamento das ACF e PACF de um processo ARIMA(p,d,q) Processos Estocásticos Não Estacionários Def.) Processo Estocástico Não Estacionário : Um processo estocástico Zt é não estacionário quando as propriedades estatísticas de ao menos uma sequência finita z1,z2,.. zk de componentes de Zt são diferentes das da secuencia z1+h,z2+h,.. zk+h para ao menos um número inteiro h. Um processo estocásticoZt é não estacionário quando a distribuição conjunta de qualquier conjunto de variáveis se modifica se modificamos as variáveis no tempo. ),...,,(),...,( hkhjhikji xxxFxxxF +++≠ Nota:A maioria das séries reais são não estacionárias e seu nível médio varia com o tempo, sem embargo podem converter-se em estacionárias tomando diferenças 8 9 - E n e 8 9 - A b r 8 9 - J u l 8 9 - O c t 9 0 - F e b 9 0 - M a y 9 0 - A g o 9 0 - D i c 9 1 - M a r 9 1 - J u n 9 1 - S e p 9 2 - E n e 9 2 - A b r 9 2 - J u l 9 2 - N o v 9 3 - F e b 9 3 - M a y 9 3 - A g o 9 3 - D i c 9 4 - M a r 9 4 - J u n 9 4 - O c t 9 5 - E n e 9 5 - A b r 9 5 - J u l 9 5 - N o v 9 6 - F e b 9 6 - M a y 9 6 - S e p 9 6 - D i c 9 7 - M a r 9 7 - J u n 9 7 - O c t 9 8 - E n e 9 8 - A b r 9 8 - A g o 9 8 - N o v 9 9 - F e b 9 9 - M a y 9 9 - S e p 9 9 - D i c 0 0 - M a r 0 0 - J u l 0 0 - O c t 0 1 - E n e 0 1 - A b r 0 1 - A g o 0 1 - N o v 0 2 - F e b 0 2 - J u n 0 2 - S e p 0 2 - D i c 0 3 - M a r 0 3 - J u l 0 3 - O c t 0 4 - E n e 0 4 - M a y 0 200 400 600 800 1000 1200 1400 1600 1800 2000 0 200 400 600 800 1000 1200 1400 1600 1800 2000 Se o nível da série não é estável no tempo podendo ter tendência crescente ou decrescente diremos que a série não é estacionária em média. μ≠)( txE 2)( σ≠txVar ),(),( kttktt +≠− γγ Se a variância ou as covariâncias variam com o tempo diremos que a série não é estacionária nas covariâncias. Def.) Processo Integrado de Ordem h- I(h): quando ao diferenciar-lo h vezes se obtém um processo estacionário. São processos não estacionários unicamente em média e têm a propriedade de converter-se em estacionários tomando uma diferença. Um processo estacionário é sempre I(0) . Processos Estocásticos Não Estacionários Passeio Aleatório. ARIMA(0,1,0) tt azB =− )1( Processo Alisamento Exponencial Simples. IMA(1,1). Proceso Homogéneo de Orden 1. ARIMA(0,1,0)tt aBzB )1()1( 1θ−=− Processos Integrados ARIMA(p,d,q) Processos de Memória Longa Processo ARFIMA(p,d,q) t q qt dp p aBBzBBB )...1(~)1)(...1( 11 θθφφ −−−=−−−− 5.05.0)1( <<−=− dazB ttd 5.05.0)()( <<−=∇ daBzB tqtdp φθ 9 9 9 1 9 4 0 1 0 3 9 3 9 5 0 2 9 7 0 4 9 6 9 8 0 0 9 2 -10 0 10 20 30 40 50 60 70 80 90 100 110 120 2*Sigma -2*Sigma 10 20 30 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 2*Sigma -2*Sigma 10 20 30 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 Passeio Aleatório. ARIMA(0,1,0) Def.) Passeio aleatório :é um processo estocástico cujas primeiras diferenças formam um processo ruído branco. ttt tt azz az += =∇ −1 0)( =tzE )(),( 2 ktzzCov aktt −=− σ tzVar at 2)( σ= A variância cresce com o tempo ACF PACF Hist. 0 25 50 75 100 100 200 300 400 500 Diminuição muito lenta Valor próximo a 1 Para el gráfico se ha generado un paseo aleatorio mediante una serie aleatoria en fechado diario de media cero y varianza la unidad. Processo 9 0 9 1 9 1 9 1 9 2 9 2 9 2 9 3 9 3 9 3 9 4 9 4 9 4 9 5 9 5 9 5 9 6 9 6 9 6 9 7 9 7 9 7 9 8 9 8 9 8 9 9 9 9 9 9 0 0 0 0 0 0 0 1 0 1 0 1 0 2 0 2 0 2 0 3 0 3 0 3 0 2500 5000 7500 10000 12500 2*Sigma -2*Sigma 10 20 30 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 2*Sigma -2*Sigma 10 20 30 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 Série do IBEX-35 ACF PACFA variância do modelo não é constante A série de cotizações do IBEX_35 em períodos diários é um processo não estacionário em média e em variância. Sem embargo no correlograma se aprecia uma estrutura muito parecida ao correlograma de um passeio aleatório, o que nos leva a propor esta estrutura como modelo para representar a cotização da bolsa. ttt tt aIbexIbex aIbex += =∇ −13535 35 Uma vez tomada a diferença regular (1-B) observamos que a série é estacionária em média nu=0 mas não assim em variância que apresenta períodos de muita instabilidade. Uma representação mais adequada do processo deveria introduzir a variância do erro como variável explicativa (p.e.modelo GARCH), por tanto não podemos concluir que o IBEX35 seja um passeio aleatório. 0)( =taE 2)( ataVar σ≠ At não é um passeio aleatório 0),( ≠−ktt aaCov Def.) Processos autorregressivos integrados de média móvel ARIMA(pd,q) : É um processo ARMA que possui uma ou várias raízes unidade no operador. Processo Integrado ARIMA(p,d,q) onde at é um processo ruído branco com μ−= tt zz~ Sendo p a ordem da parte autorregressiva , q a ordem da parte média móvel e d o número de raízes unitárias. O processo chama-se integrado porque zt obtém-se como soma infinita de wt. Por exemplo se tqt d p t q qt dp p aBzB aBBzBBB )(~)( )...1(~)1)(...1( 11 θφ θθφφ =∇ −−−=−−−− Processo ∑ −∞=− =+++=−= −= t j tttt tt wwBBBwBz zBw ...)1()1(~ ~)1( 321 )...1()( )...1()( 1 1 q qq p pp BBB BBB θθθ φφφ −−−= −−−= como a equação característica do processo autorregressivo Os obtém-se igualando os coeficientes em B desta expressão Definimos Duas representações alternativas do processo ARIMA como 1.) Soma de Inovações: 2.) Soma de valores passados: )()()( )(~)( )()(... )...1()1)(()( )()( 2211 1 1 BBB aBzB MAaBaaaz BBBBB MAaBaaz qdp tqtdp ttttt dp dp d pdp ti ititt θψϕ θϕ ψψψ ϕϕφϕ ψψ = = ∞=+++= −−−=−= ∞=+= + + −− + ++ ∞ = −∑ iψ )()()( )(~)( )()( 1 BBB aBzB ARazzzB qdp tqtdp ti ititt πθϕ θϕ ππ = = ∞=+= + + ∞ = −∑ Os obtém-se igualando os coeficientes em B desta expressão. iπ
Compartilhar