Baixe o app para aproveitar ainda mais
Prévia do material em texto
INE 7001 Análise de Séries Temporais 1 4 - ANÁLISE DE SÉRIES TEMPORAIS “Série Temporal é um conjunto de observações sobre uma variável, ordenado no tempo”, e registrado em períodos regulares. Podemos enumerar os seguintes exemplos de séries temporais: temperaturas máximas e mínimas diárias em uma cidade, vendas mensais de uma empresa, valores mensais do IPC-A, valores de fechamento diários do IBOVESPA, resultado de um eletroencefalograma, gráfico de controle de um processo produtivo. A suposição básica que norteia a análise de séries temporais é que há um sistema causal mais ou menos constante, relacionado com o tempo, que exerceu influência sobre os dados no passado e pode continuar a fazê-lo no futuro. Este sistema causal costuma atuar criando padrões não aleatórios que podem ser detectados em um gráfico da série temporal, ou mediante algum outro processo estatístico. O objetivo da análise de séries temporais é identificar padrões não aleatórios na série temporal de uma variável de interesse, e a observação deste comportamento passado pode permitir fazer previsões sobre o futuro, orientando a tomada de decisões. Vamos ver alguns gráficos de séries temporais. Figura 1 - Número de passageiros transportados Que padrões não aleatórios podemos identificar na Figura 1? - observe que há uma tendência crescente no número de passageiros transportados (ou pelo menos havia antes de 11 de setembro de 2001...). - há uma sucessão regular de "picos e vales" no número de passageiros transportados, isso deve ser causado pelas oscilações devido a feriados, períodos de férias escolares, etc., que estão geralmente relacionados às estações do ano, e que se repetem todo ano (com maior ou menor intensidade). Em outras palavras, identificamos dois padrões que podem tornar a ocorrer no futuro: crescimento no número de passageiros transportados, flutuações sazonais. Tais padrões poderiam ser incorporados a um modelo estatístico, possibilitando fazer previsões que auxiliarão na tomada de decisões. Companhia aérea Meses N ú m e ro d e p a s s a g e ir o s 0 100 200 300 400 500 600 700 0 100 200 300 400 500 600 700 0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 INE 7001 Análise de Séries Temporais 2 Vamos observar mais um conjunto de dados, a produção mensal de veículos no Brasil entre janeiro de 1997 e dezembro de 2014. Figura 2 - Série mensal da produção de veículos automotores no Brasil de janeiro de 1997 a dezembro de 2014 Fonte: adaptado pelo autor de Microsoft a partir de dados da ANFAVEA – Associação Nacional dos Fabricantes de Veículos Automotores, disponíveis em http://www.anfavea.com.br/tabelas.html, acessados em 13/11/2015 Quais padrões podem ser identificados na Figura 2? - observe que há uma tendência crescente no número de veículos produzidos (começando em cerca de 125000 em janeiro de 1997 e terminando em 200000 em dezembro de 2014); - as flutuações (picos e vales) não são tão regulares quanto as identificadas na Figura 1; - observa-se uma queda na produção no mês de janeiro de 2009, em fins de 2008 a produção mensal estava em torno de 300000 veículos, e caiu para menos de 100000 naquele mês (provavelmente por causa da crise mundial no último trimestre de 2008). Figura 3 - Gráfico de controle: fração de defeituosos Na Figura 3 temos uma série temporal particular, trata-se de um gráfico de controle de fração de defeituosos, bastante utilizado em Controle Estatístico da Qualidade para avaliar se um processo 0 50000 100000 150000 200000 250000 300000 350000 400000 ja n /1 9 9 7 ju l/ 1 9 9 7 ja n /1 9 9 8 ju l/ 1 9 9 8 ja n /1 9 9 9 ju l/ 1 9 9 9 ja n /2 0 0 0 ju l/ 2 0 0 0 ja n /2 0 0 1 ju l/ 2 0 0 1 ja n /2 0 0 2 ju l/ 2 0 0 2 ja n /2 0 0 3 ju l/ 2 0 0 3 ja n /2 0 0 4 ju l/ 2 0 0 4 ja n /2 0 0 5 ju l/ 2 0 0 5 ja n /2 0 0 6 ju l/ 2 0 0 6 ja n /2 0 0 7 ju l/ 2 0 0 7 ja n /2 0 0 8 ju l/ 2 0 0 8 ja n /2 0 0 9 ju l/ 2 0 0 9 ja n /2 0 1 0 ju l/ 2 0 1 0 ja n /2 0 1 1 ju l/ 2 0 1 1 ja n /2 0 1 2 ju l/ 2 0 1 2 ja n /2 0 1 3 ju l/ 2 0 1 3 ja n /2 0 1 4 ju l/ 2 0 1 4 V e íc u lo s p ro d u zi d o s Mês Produção mensal de veículos automotores no Brasil Gráf ico de Controle p - amostras com 300 elementos Amostras 0.00000 .017467 .040157 1 5 10 15 20 25 http://www.anfavea.com.br/tabelas.html INE 7001 Análise de Séries Temporais 3 produtivo está estável, e, portanto, previsível. Neste caso, não queremos que haja padrões não aleatórios, se eles existirem o processo está fora de controle estatístico, instável e imprevisível, e não podemos garantir a qualidade dos produtos resultantes: precisamos atuar sobre o processo e fazer as correções necessárias. Outro exemplo: Figura 4 - Produção mensal de minério de ferro no Brasil No caso da Figura 4 a série aparenta comportar-se de forma errática. Em vermelho pode-se ver uma linha 1 que possibilita identificar o nível da produção de minério de ferro, uma tendência, que se situa entre 10000 e 12000 milhares de toneladas: neste caso não há tendência crescente ou decrescente, mas é possível identificar o comportamento de longo prazo da série. Aparentemente não há variações regulares, como no caso da Figura 1, que configurem sazonalidade. O problema fundamental é utilizar um modelo que permita incluir os vários tipos de padrões, possibilitando realizar previsões. O ponto de partida é realizar a decomposição da série em padrões. 4.1 - Modelo Clássico das Séries Temporais Segundo o modelo clássico todas as séries temporais são compostas de quatro padrões: - tendência (T), que é o comportamento de longo prazo da série, que pode ser causada pelo crescimento demográfico, ou mudança gradual de hábitos de consumo, ou qualquer outro aspecto que afete a variável de interesse no longo prazo; - variações cíclicas ou ciclos (C), flutuações nos valores da variável com duração superior a um ano, e que se repetem com certa periodicidade 2 , que podem ser resultado de variações da economia como períodos de crescimento ou recessão, ou fenômenos climáticos como o El Niño (que se repete com periodicidade superior a um ano); 1 Veremos posteriormente que se trata de uma média móvel. 2 Alguns autores não incluem as variações cíclicas no modelo clássico da série temporal. Minério de ferro 8000 9000 10000 11000 12000 13000 14000 ja n /8 7 m a r/ 8 7 m a i/ 8 7 ju l/ 8 7 s e t/ 8 7 n o v /8 7 ja n /8 8 m a r/ 8 8 m a i/ 8 8 ju l/ 8 8 s e t/ 8 8 n o v /8 8 ja n /8 9 m a r/ 8 9 m a i/ 8 9 ju l/ 8 9 s e t/ 8 9 n o v /8 9 ja n /9 0 m a r/ 9 0 m a i/ 9 0 ju l/ 9 0 s e t/ 9 0 n o v /9 0 ja n /9 1 m a r/ 9 1 m a i/ 9 1 ju l/ 9 1 s e t/ 9 1 n o v /9 1 Meses INE 7001 Análise de Séries Temporais 4 - variações sazonais ou sazonalidade (S), flutuações nos valores da variável com duração inferior a um ano, e que se repetem todos os anos, geralmente em função das estações do ano (ou em função de feriados ou festas populares, ou por exigências legais, como o período para entrega da declaração de Imposto de Renda); se os dados forem registrados anualmente NÃO haverá influência da sazonalidade na série 3 ; - variações irregulares (I), que são as flutuações inexplicáveis, resultado de fatos fortuitos e inesperados como catástrofes naturais, atentados terroristas como o de 11 de setembro de 2001, decisões intempestivas de governos, etc. Aqui é importante salientar que nem sempre uma série temporal, mesmo que o modelo clássico seja considerado apropriado para analisá-la, irá apresentar todos os componentes citados acima: - a série pode apresentar apenas variações irregulares:não se percebe comportamento crescente ou decrescente de longo prazo (tendência), ou flutuações sazonais ou cíclicas (como as séries da Figura 3 e da Figura 4). - a série pode apresentar apenas tendência e variações irregulares 4 : não são identificadas flutuações sazonais ou cíclicas, apenas o comportamento crescente/decrescente de longo prazo e as variações aleatórias. - a série pode apresenta apenas variações sazonais e irregulares: o comportamento de longo prazo da série é aproximadamente constante, mas observam-se flutuações dentro dos períodos de um ano, que se repetem todos os anos. - quaisquer outras combinações possíveis. A decomposição da série permitirá identificar quais componentes estão atuando naquele conjunto em particular, além de possibilitar obter índices e/ou equações para realizar previsões para períodos futuros da série. A questão crucial do modelo clássico é decidir como será a equação que relaciona as componentes com a variável. Há duas opções: o modelo aditivo ou o modelo multiplicativo: - No modelo aditivo o valor da série (Y) será o resultado da soma dos valores das componentes (que apresentam a mesma unidade da variável): Y = T + C + S + I ou Y = T + C + I (se os dados forem registrados anualmente) Nas previsões não temos como incluir a componente irregular no modelo, pois ela é resultado de fatos fortuitos, teoricamente imprevisíveis. Todas as componentes têm a mesma unidade da série: se esta for em milhões de reais todas também terão tal unidade. - Pode ser usado também o modelo multiplicativo, no qual o produto das componentes resultará na variável da série: Y = T C S I ou Y = T C I (se os dados forem registrados anualmente) Novamente, não incluímos a componente irregular. Há, porém, uma diferença crucial: apenas a tendência tem a mesma unidade da variável. As demais componentes têm valores que modificam a tendência: assumem valores em torno de 1 (se maiores do que 1 aumentam a tendência, se menores diminuem a tendência, se exatamente iguais a 1 não causam efeito). Na Figura 6 observe a escala vertical do gráfico das componentes cíclicas, sazonais e irregulares: são valores próximos de 1, enquanto a escala da Figura 5 tem a mesma escala para o valor original da série e a tendência (em milhões de dólares). Isso ocorreu porque decompusemos a série temporal usando um modelo multiplicativo. Chamando a variável de interesse de Y, a equação de sua série temporal seria: Y = f(T,C,S,I) Podemos observar as componentes na Figura 5 e na Figura 6. 3 Pois não será possível observar se as flutuações se repetem sistematicamente dentro dos anos. 4 Não há como se livrar das variações irregulares... INE 7001 Análise de Séries Temporais 5 Figura 5 - Série original e tendência linear Na Figura 5 podemos observar uma série temporal de vendas (em milhões de dólares), e a tendência, no caso uma reta (tendência linear), que mostra um crescimento no longo prazo. Na Figura 6 podemos observar as três outras componentes. Observe que a cada 5 ou 6 anos ocorre um ciclo, uma mudança nos valores da variável (a linha azul). Há também variações sazonais, que se repetem todos os anos, devido provavelmente às estações (a linha vermelha). Por fim, há variações erráticas, que não apresentam regularidade, mas que talvez se relacionem com eventos inesperados ocorridos no período, as variações irregulares (linha verde). Figura 6 - Componentes cíclicas, sazonais e irregulares. Qual é o melhor modelo? Dependerá dos dados da própria série, das características intrínsecas do problema. Apresentaremos posteriormente medidas que possibilitam avaliar a adequação das previsões feitas por um modelo. Vendas e tendência linear 0 200 400 600 800 1000 1200 1400 janeiro-65 janeiro-70 janeiro-75 janeiro-80 janeiro-85 janeiro-90 janeiro-95 janeiro-00 Vendas Tendência Variações cíclicas, sazonais e irregulares 0.6 0.7 0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6 janeiro-65 janeiro-70 janeiro-75 janeiro-80 janeiro-85 janeiro-90 janeiro-95 janeiro-00 Ciclos Sazonais Irregulares INE 7001 Análise de Séries Temporais 6 4.2 - Obtenção da Tendência A tendência descreve o comportamento da variável retratada na série temporal no longo prazo. Há três objetivos básicos na sua identificação: avaliar o seu comportamento para utilizá-lo em previsões, removê-la da série para facilitar a visualização das outras componentes, ou ainda identificar o nível da série (o valor ou faixa típica de valores que a variável pode assumir, se não for observado comportamento crescente ou decrescente no longo prazo). A obtenção da tendência pode ser feita de três formas: através de um modelo de regressão (como o modelo linear - reta), através de médias móveis, ou através de ajuste exponencial (que não deixa de ser uma média móvel). 4.2.1 - Obtenção de tendência por mínimos quadrados O procedimento é semelhante ao usado na regressão linear simples (ver seção 3.2.4), mas agora a variável independente será sempre o tempo. Para uma série registrada anualmente, por exemplo, de 2005 a 2014, a variável independente assumiria os valores dos anos. Para uma série registrada mensalmente, por exemplo, com 60 meses, a variável independente poderia assumir os valores de 1 a 60. As equações podem ser as mesmas usadas anteriormente (a estimativa do valor da série, Y, é denotada como Y ), e que também podem ter seus coeficientes obtidos por aplicativos computacionais: - linear (reta) - atbT ; - polinômio de segundo grau - atbtcT 2 - logarítmico - atLnbT )( ; - potência - atbT ; - exponencial - taebT Onde T é o valor da tendência, t é o valor do tempo, no caso linear b é o coeficiente angular da reta (se positivo indica tendência crescente, se negativo a tendência é decrescente) e a é o coeficiente linear da reta. As equações dos coeficientes estão expressas a seguir. 2 11 2 111 n i i n i i n i i n i i n i ii ttn YtYtn b n tbY a n i i n i i 11 Onde Yi é um valor qualquer da variável registrada na série temporal, t i é o período associado a Yi, e n é o número de períodos da série. Para encontrar os coeficientes basta calcular os somatórios (tal como em análise de regressão linear simples). Exemplo 4.1 - Os dados a seguir apresentam o patrimônio líquido (em bilhões de reais) de um banco de 2005 a 2015. Supondo que o modelo linear seja apropriado para descrever a tendência da série, encontre os coeficientes da reta de mínimos quadrados. Faça a previsão de tendência para os anos de 2016 e 2017. INE 7001 Análise de Séries Temporais 7 Ano Patrimônio (R$1.000.000) 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 30 32 32 35 37 38 42 41 44 46 47 A variável dependente é o saldo de vendas: será o Y. Há 11 períodos: n = 11. O próximo passo é encontrar os somatórios necessários para obter os coeficientes. Mas ao invés de usarmos os anos, o que poderia complicar nossos cálculos, vamos trabalhar com períodos, sendo 2009 o período 1, 2010 o 2 e assim por diante. A tabela ficaria então (já incluindo as colunas t y e t2): Ano Patrimônio (Y) (R$1.000.000) Tempo (t) t.Y t 2 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 30 32 32 35 37 38 42 41 44 46 47 1 2 3 4 5 6 7 8 9 10 11 30 64 96 140 185 228 294 328 396 460 517 1 4 9 16 25 36 49 64 81 100 121 Soma 424 66 2768 506 Substituindo os valores nas equações: 76,1 )66(50611 42466276811 22 11 2 111 ni i n i i n i i n i i n i ii ttn ytytn b 96,27 11 )6676,1(42411 n tby a n i i n i i Então a equação de tendência é: T = 27,96 + 1,76 t O ano de 2020 corresponderá ao período 13, e 2021 ao período 14 da série temporal. Substituindo estes valores na equação acima: T2020 = 27,96 + (1,76 12) = 49,08 T2021 = 27,96 + (1,76 13) = 50,84 Podemos então apresentar um gráfico (feito no Microsoft Excel) da série original, a reta de tendência e a projeção para os anos de 2020 e 2021 (Figura 7). INE 7001 Análise de Séries Temporais 8 Figura 7 - Patrimônio líquido de um banco: série anual, tendência linear e projeção Fonte: Hipotética 4.2.1.1 – Medidas de acuracidade Conforme mencionado neste Capítulo (e no Capítulo 3) vários aplicativos computacionais podem obter os coeficientes de modelos de regressão/tendência pelo método dos mínimos quadrados. Mas como escolher qual é o melhor? Uma abordagem seria usar o coeficiente de determinação (r 2 ): o melhor modelo de tendência por mínimos quadrados seria aquele com o maior r 2 , como os aplicativos computacionais permitem a obtenção rápida deste coeficiente o processo de comparação seria simplificado. Embora simples esta opção não será adotada aqui por motivos que serão explicados a seguir. Outra possibilidade seria o uso da análise de resíduos do modelo, mas esta apresenta um inconveniente: a não ser que seja utilizado um software estatístico específico (que pode ser muito caro ou complicado de usar), a obtenção dos resíduos e a construção dos diagramas de dispersão dos resíduos em planilha eletrônica pode levar algum tempo 5 . A literatura de Análise de Séries Temporais recomenda o uso de medidas de acuracidade, que são estatísticas que permitem avaliar o ajuste de uma previsão aos dados originais, por meio do cálculo de médias das diferenças (erros) entre os dados originais e as previsões em cada período da série temporal 6 . Embora as medidas exijam o cálculo dos erros (resíduos) para todos os modelos sob análise, não demanda a construção de diagramas, e suas conclusões geralmente coincidem com as da avaliação do r 2 . E podem depois ser adaptadas para comparar os resultados da recomposição pelos modelos aditivo e multiplicativo. Dentre as várias disponíveis destacam-se três, usadas inclusive por softwares estatísticos como o Minitab : Erro Absoluto Médio (EAM), Erro Quadrático Médio (EQM) e Erro Percentual Absoluto Médio (EPAM). Todas se baseiam nos cálculos dos erros: as diferenças entre os valores da série e os valores preditos pelas equações de tendência para cada período t da série. 5 Esta abordagem foi usada no Capítulo 3 por ser a prática estabelecida em Análise de Regressão, especialmente na Análise de Regressão Múltipla (com várias variáveis independentes), que é a mais usada na prática. 6 MAKRIDAKIS, S., WHEELWRIGHT, S.C., HYNDMAN, R.J. Forecasting: methods and applications. 3rd ed.- New York: Wiley, 1998. 25 30 35 40 45 50 55 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021 P at ri m ô n io lí q u id o ( R $ b ilh õ e s( Anos Patrimônio líquido Patrimônio líquido Linear (Patrimônio líquido) INE 7001 Análise de Séries Temporais 9 Erro absoluto médio (EAM): n t te n EAM 1 1 Erro quadrático médio (EQM): n t te n EQM 1 21 Erro percentual absoluto médio (EPAM): n t t t Y e n EPAM 1 100 1 Onde: ttt TYe ˆ et é o erro (diferença entre o valor da série, Yt, e o valor previsto por um modelo de tendência tT̂ em um período genérico t). As duas primeiras medidas dependem da escala dos valores da série, o que dificulta a comparação com outras séries, ou mesmo entre diferentes intervalos de tempo na mesma série. A última, EPAM, por ser relativa, não apresenta aqueles problemas 7 . Não obstante, por apresentar divisão pelos valores da série, pode ser inapropriada quando a série tiver valores iguais ou próximos a zero. A segunda medida, EQM, semelhante ao desvio padrão, dá maior ênfase a grandes erros do que EAM 8 . Pode-se usar todas, o que é fácil de implementar em uma planilha eletrônica, ou já faz parte dos programas estatísticos. O melhor modelo será o que apresentar os valores mais próximos de zero. Exemplo 4.2 – Seja a produção mensal de veículos no Brasil entre janeiro de 1997 e dezembro de 2014, mostrada na Figura 2. Após o ajuste dos cinco modelos de tendência (linear, polinômio de segundo grau, logarítmico, potência e exponencial é possível observar as curvas e a série original na Figura 8 - Série mensal da produção de veículos automotores no Brasil de janeiro de 1997 a dezembro de 2014 com cinco modelos de tendência obtidos por mínimos quadrados Fonte: adaptado pelo autor de Microsoft a partir de dados da ANFAVEA – Associação Nacional dos Fabricantes de Veículos Automotores, disponíveis em http://www.anfavea.com.br/tabelas.html, acessados em 13/11/2015 7 MAKRIDAKIS, S., WHEELWRIGHT, S.C., HYNDMAN, R.J. Forecasting: methods and applications . John Wiley & Sons, 3rd edition, 1998, páginas 42-44. 8 CAMM, J. D., EVANS, J. R. Management Science and decision technology. South-Western College Publishing, 2000, página 103. y = 988,24x + 96844 y = 51593ln(x) - 22526 y = 0,9929x2 + 772,79x + 104672 y = 58386x0,27 y = 110007e0,0051x -50000 0 50000 100000 150000 200000 250000 300000 350000 400000 1 6 1 1 1 6 2 1 2 6 3 1 3 6 4 1 4 6 5 1 5 6 6 1 6 6 7 1 7 6 8 1 8 6 9 1 9 6 1 0 1 1 0 6 1 1 1 1 1 6 1 2 1 1 2 6 1 3 1 1 3 6 1 4 1 1 4 6 1 5 1 1 5 6 1 6 1 1 6 6 1 7 1 1 7 6 1 8 1 1 8 6 1 9 1 1 9 6 2 0 1 2 0 6 2 1 1 2 1 6 V e íc u lo s p ro d u zi d o s Mês Produção mensal de veículos automotores no Brasil (1997 -2014) Veículos produzidos Linear (Veículos produzidos) Logaritmo (Veículos produzidos) Polinômio (Veículos produzidos) Potência (Veículos produzidos) Exponencial (Veículos produzidos) http://www.anfavea.com.br/tabelas.html INE 7001 Análise de Séries Temporais 10 A tabela a seguir apresenta a produção mensal de veículos no Brasil para os meses de Janeiro a Dezembro de 1997 (correspondem aos valores de t, período, de 1 e 12, respectivamente), extraídos dos dados usados na Figura 2 e na Figura 8, e as previsões feitas para os mesmos meses pelas equações de tendência mostradas na Figura 8. t Prod. (Yt) veículos tT̂ 988,24×t + 96844 0,9929×t2 + 772,79×t + 104672 51593×ln(t) - 22526 58386×t0,27 110007×e0,0051×t 1 124889 97832,24 105445,7829 -22526 105445,8 58386 2 136323 98820,48 106221,5516 13235,54 106219,6 70402,3 3 153164 99808,72 106999,3061 34154,7 106993,3 78547,34 4 172391 100796,96 107779,0464 48997,08 107767,1 84891,64 5 162310 101785,2 108560,7725 60509,73 108540,9 90163,47 6 170685 102773,44 109344,4844 69916,25 109314,7 94712,99 7 160400 103761,68 110130,1821 77869,34 110088,5 98738,2 8 173863 104749,92 110917,8656 84758,63 110862,3 102363 9 182952 105738,16 111707,5349 90835,41 111636 105670,6 10 192829 106726,4 112499,19 96271,27 112409,8 108719,8 11 130140 107714,64 113292,8309 101188,6 113183,6 111553,9 12 101255 108702,88 114088,4576 105677,8 113957,4 114205,7 Substituindo o valor de t nas equações mostradas no Quadro 24 é possível calcular as tendências por mínimos quadrados para todos os períodos da série. Para o período 2, por exemplo, as tendências são: - linear: tT̂ 988,24×2 + 96844 = 98820,48; - polinômio de segundo grau: tT̂ 0,9929×2 2 + 772,79×2 + 104672 = 106219,6; - logarítmico: tT̂ 51593×ln(2) – 22526 = 13235,54; - potência: tT̂ 58386×2 0,27 = 106219,6; - exponencial: tT̂ 110007×e0,0051×2 = 70402,3. Na tabela a seguir mostra-se como realizar o cálculo dos erros para a tendência linear para os primeiros doze meses da série da Figura 2 (Janeiro a Dezembro de 1997). t Prod. (Yt) veículos Equação da tendência Erro Módulo do erro Erro quadrático Erro percentual tT̂ 988,24x + 96844 ttt TYe ˆ || te 2 te 100)/( tt Ye 1 124889 97832,24 27056,76 27056,76 732068261,7 21,66 2 136323 98820,48 37502,52 37502,52 1406439006 27,51 3 153164 99808,72 53355,28 53355,28 2846785904 34,84 4 172391 100796,96 71594,04 71594,04 5125706564 41,53 5 162310 101785,2 60524,8 60524,8 3663251415 37,29 6 170685 102773,44 67911,56 67911,56 4611979982 39,79 7 160400 103761,68 56638,32 56638,32 3207899292 35,31 8 173863 104749,92 69113,08 69113,08 4776617827 39,75 9 182952 105738,16 77213,84 77213,84 5961977088 42,20 10 192829 106726,4 86102,6 86102,6 7413657727 44,65 11 130140 107714,64 22425,36 22425,36 502896771,1 17,23 12 101255 108702,88 -7447,88 7447,88 55470916,49 7,36 Realizando o mesmo procedimento para as outras equações de tendência, para todos os períodos da série mostrada na Figura 2, podem-se obter as medidas de acuracidade de cada modelo, conforme a tabela a seguir: INE 7001 Análise de Séries Temporais 11 Medida Modelo Linear Polinômio de 2º grau Logarítmico Potência Exponencial EAM 27928,64 27752,31 42944,76 39481,05 28195,36 EQM 1247075874 1235156012 2618630743 2222579666 1306864744 EPAM 15,83 15,63 25,37 22,01 15,35 Os menores valores das medidas de acuracidade são mostrados em negrito. A tendência por polinômio de segundo grau tem os menores valores de EAM e EQM, mas a tendência por exponencial tem o menor EPAM. Por maioria, escolhe-se o polinômio de segundo grau como o melhor modelo para representar a tendência da série por mínimos quadrados. Podemos usar este modelo para fazer a previsão da tendência da série nos doze meses de 2015, que seriam os períodos 217 a 228 da série. Mês Período (t) Previsão tendência (polinômio de 2º grau) (veículos) Janeiro 2015 217 tT̂ 0,9929×217 2 + 772,79×217 + 104672 = 319122,0981 Fevereiro 2015 218 tT̂ 0,9929×218 2 + 772,79×218 + 104672 = 320326,7996 Março 2015 219 tT̂ 0,9929×219 2 + 772,79×219 + 104672 = 321533,4869 Abril 2015 220 tT̂ 0,9929×220 2 + 772,79×220 + 104672 = 322742,16 Maio 2015 221 tT̂ 0,9929×221 2 + 772,79×221 + 104672 = 323952,8189 Junho 2015 222 tT̂ 0,9929×222 2 + 772,79×222 + 104672 = 325165,4636 Julho 2015 223 tT̂ 0,9929×223 2 + 772,79×223 + 104672 = 326380,0941 Agosto 2015 224 tT̂ 0,9929×224 2 + 772,79×224 + 104672 = 327596,7104 Setembro 2015 225 tT̂ 0,9929×225 2 + 772,79×225 + 104672 = 328815,3125 Outubro 2015 226 tT̂ 0,9929×226 2 + 772,79×226 + 104672 = 330035,9004 Novembro 2015 227 tT̂ 0,9929×227 2 + 772,79×227 + 104672 = 331258,4741 Dezembro 2015 228 tT̂ 0,9929×228 2 + 772,79×228 + 104672 = 332483,0336 4.2.2 - Obtenção de tendência por médias móveis As médias móveis são uma forma alternativa de obtenção da tendência ou nível de uma série temporal. Calcula-se a média dos primeiros n períodos da série, colocando o resultado no período exatamente no centro deles. Progressivamente, vamos acrescentando um período seguinte e desprezando o primeiro da média imediatamente anterior, e calculando novas médias, que vão se movendo até o fim da série. O número de períodos (n) é chamado de ordem da série. Exemplo 4.3 - Os dados a seguir, que representam as vendas anuais das fábricas (em milhões de unidades), em todo o mundo, de carros, caminhões e ônibus fabricados pela General Motors Corporation de 1970 a 1992. Obtenha a tendência da série por médias móveis de 3, 5 e 7 períodos, e plote-as em um gráfico junto com os dados originais 9 . 9 Adaptado de LEVINE, D. M., BERENSON, M. L. e STEPHAN, D. – Estatística: Teoria e Aplicações usando o Excel. Rio de Janeiro: LTC, 2000. INE 7001 Análise de Séries Temporais 12 Ano Vendas Ano Vendas Ano Vendas 1970 5,3 1978 9,5 1986 8,6 1971 7,8 1979 9,0 1987 7,8 1972 7,8 1980 7,1 1988 8,1 1973 8,7 1981 6,8 1989 7,9 1974 6,7 1982 6,2 1990 7,5 1975 6,6 1983 7,8 1991 7,0 1976 8,6 1984 8,3 1992 7,2 1977 9,1 1985 9,3 Primeiramente vamos apresentar um gráfico da série original, para observar se não seria possível ajustar uma reta como tendência da série. Veja a Figura 9. Figura 9 - Vendas da GM (milhões de unidades) Não parece haver um comportamento crescente, ou decrescente, no longo prazo. Poderia se afirmar que a série não tem tendência, e que não seria apropriado ajustar uma equação de reta aos dados. Não obstante, há interesse em obter o nível da série, em que patamar estão as vendas da GM. Vamos aplicar médias móveis de 3, 5 e 7 períodos e observar os resultados. Médias Móveis de 3 períodos Devemos juntar os períodos de 3 em 3, sempre acrescentando o próximo e desprezando o primeiro do grupo anterior, colocando o resultado no período central (2 o período): 1970 - 1971 - 1972 com resultado em 1971; 1971 - 1972 - 1973 com resultado em 1972; 1972 - 1973 - 1974 com resultado em 1973; 1973 - 1974 - 1975 com resultado em 1974; 1974 - 1975 - 1976 com resultado em 1975; 1975 - 1976 - 1977 com resultado em 1976; 1976 - 1977 - 1978 com resultado em 1977; e assim por diante, até chegar a 1990 - 1991 - 1992 com resultado em 1991. 4 5 6 7 8 9 10 1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 Anos V e n d a s (m il h õ e s d e u n id a d e s) INE 7001 Análise de Séries Temporais 13 A tabela com os resultados: Ano Vendas (Y) - em milhões Total Móvel 3 períodos Média Móvel 3 períodos 1970 5,3 - - 1971 7,8 20,9 6,97 1972 7,8 24,3 8,10 1973 8,7 23,2 7,73 1974 6,7 22 7,33 1975 6,6 21,9 7,30 1976 8,6 24,3 8,10 1977 9,1 27,2 9,07 1978 9,5 27,6 9,20 1979 9 25,6 8,53 1980 7,1 22,9 7,63 1981 6,8 20,1 6,70 1982 6,2 20,8 6,93 1983 7,8 22,3 7,43 1984 8,3 25,4 8,47 1985 9,3 26,2 8,73 1986 8,6 25,7 8,57 1987 7,8 24,5 8,17 1988 8,1 23,8 7,93 1989 7,9 23,5 7,83 1990 7,5 22,4 7,47 1991 7 21,7 7,23 1992 7,2 - - Observe que ao calcularmos médias móveis alguns períodos ficam sem tendência, porque os resultados das médias são postos no centro dos períodos. Média móvel de 5 períodos Devemos juntar os períodos de 5 em 5, sempre acrescentando o próximo e desprezando o primeiro do grupo anterior, colocando o resultado no período central (3 o período): 1970 - 1971 - 1972 - 1973 - 1974 com resultado em 1972; 1971 - 1972 - 1973 - 1974 - 1975 com resultado em 1973; 1972 - 1973 - 1974 - 1975 - 1976 com resultado em 1974; 1973 – 1974 – 1975 – 1976 – 1977 com resultado em 1975; 1974 – 1975 – 1976 – 1977 – 1978 com resultado em 1976; e assim por diante, até chegar a 1988 - 1989 - 1990 - 1991 - 1992 com resultado em 1990. A tabela com os resultados: INE 7001 Análise de Séries Temporais 14 Ano Vendas (Y) - em milhões Total Móvel 5 períodos Média Móvel 5 períodos 1970 5,3 - - 1971 7,8 - - 1972 7,8 36,3 7,26 1973 8,7 37,6 7,52 1974 6,7 38,4 7,68 1975 6,6 39,7 7,94 1976 8,6 40,5 8,1 1977 9,1 42,8 8,56 1978 9,5 43,3 8,66 1979 9 41,5 8,3 1980 7,1 38,6 7,72 1981 6,8 36,9 7,38 1982 6,2 36,2 7,24 1983 7,8 38,4 7,68 1984 8,3 40,2 8,04 1985 9,3 41,8 8,36 1986 8,6 42,1 8,42 1987 7,8 41,7 8,34 1988 8,1 39,9 7,98 1989 7,9 38,3 7,66 1990 7,5 37,7 7,54 1991 7 - - 1992 7,2 - - Novamente, alguns períodos ficam sem tendência, porque os resultados das médias são postos no centro dos períodos. Aqui, como as médias agrupam 5 períodos, dois ficam sem tendência no início e dois ao final da série. Média móvel de 7 períodos Devemos juntar os períodos de 7 em 7, sempre acrescentando o próximoe desprezando o primeiro do grupo anterior, colocando o resultado no período central (5 o período): 1970 - 1971 - 1972 - 1973 - 1974 - 1975 - 1976 com resultado em 1973; 1971 - 1972 - 1973 - 1974 - 1975 - 1976 - 1977 com resultado em 1974; 1972 - 1973 - 1974 - 1975 - 1976 - 1977 - 1978 com resultado em 1975; 1973 - 1974 - 1975 - 1976 - 1977 - 1978 - 1979 com resultado em 1976; 1974 - 1975 - 1976 - 1977 - 1978 - 1979 - 1980 com resultado em 1977; 1975 - 1976 - 1977 - 1978 - 1979 - 1980 - 1981 com resultado em 1978; e assim por diante, até chegar a 1986 - 1987 - 1988 - 1989 - 1990 - 1991 - 1992 com resultado em 1989. A tabela com os resultados: INE 7001 Análise de Séries Temporais 15 Ano Vendas (Y) - em milhões Total Móvel 7 períodos Média Móvel 7 períodos 1970 5,3 - - 1971 7,8 - - 1972 7,8 - - 1973 8,7 51,5 7,36 1974 6,7 55,3 7,90 1975 6,6 57 8,14 1976 8,6 58,2 8,31 1977 9,1 56,6 8,09 1978 9,5 56,7 8,10 1979 9 56,3 8,04 1980 7,1 55,5 7,93 1981 6,8 54,7 7,81 1982 6,2 54,5 7,79 1983 7,8 54,1 7,73 1984 8,3 54,8 7,83 1985 9,3 56,1 8,01 1986 8,6 57,8 8,26 1987 7,8 57,5 8,21 1988 8,1 56,2 8,03 1989 7,9 54,1 7,73 1990 7,5 - - 1991 7 - - 1992 7,2 - - Aqui, como as médias agrupam 7 períodos, três ficam sem tendência no início e três ao final da série. Construindo o gráfico da série original com as médias móveis: Figura 10 - Vendas da GM e médias móveis de 3, 5 e 7 períodos Quanto maior o número de períodos da série agrupados pela média móvel mais "alisada" fica a linha de tendência (média móvel de 7 períodos): esta representa melhor o comportamento de longo prazo, indicando uma ligeira oscilação em torno de 8 milhões de unidades vendidas (este é o nível da série). E quanto menor o número de períodos mais a tendência acompanhará os dados originais (média móvel de 3 períodos). Por este motivo, quando uma série apresenta muitas irregularidades é comum "alisá-la" através de médias móveis. 4 5 6 7 8 9 10 1 9 7 0 1 9 7 2 1 9 7 4 1 9 7 6 1 9 7 8 1 9 8 0 1 9 8 2 1 9 8 4 1 9 8 6 1 9 8 8 1 9 9 0 1 9 9 2 V e n d a s (m il h õ e s d e u n id a d e s ) Vendas Médias móveis de 3 períodos Médias Móveis de 5 períodos Médias Móveis de 7 períodos INE 7001 Análise de Séries Temporais 16 Mas o que aconteceria se o número de períodos fosse par? Se possível, devemos escolher um número ímpar de períodos, para que o resultado seja colocado em um período central que tem correspondente na série temporal. Contudo, se a série temporal for registrada trimestralmente, e queremos obter a sua tendência por médias móveis, devemos utilizar médias móveis de 4 períodos (porque há 4 trimestres no ano), para que possamos obter a tendência sem influência da sazonalidade. Se a série for registrada mensalmente, devemos utilizar médias móveis de 12 períodos. Nestes dois casos os períodos "centrais" (que começariam em 2,5 o e 6,5 o respectivamente) não têm correspondente na série original, o que tornará impossível remover a tendência da série para observar outras componentes. As médias móveis precisam ser centralizadas: calculam-se novas médias móveis, a partir das calculadas com 4 ou 12 períodos, mas agora de 2 períodos, colocando seus resultados em períodos que têm correspondentes na série. Exemplo 4.4 - Uma corretora de seguros está avaliando os contratos obtidos ao longo de vários anos. A série foi registrada trimestralmente. Obtenha a tendência da série utilizando médias móveis. Trimestre Ano I II III IV 2016 2017 2018 24 20 15 21 20 14 11 7 5 9 6 6 2019 13 12 4 5 Como a série é registrada trimestralmente, e a tendência deve ser obtida por médias móveis, é preciso calcular médias móveis de 4 períodos, pois há 4 trimestres no ano. Contudo, como este número de períodos é par, médias móveis de 2 períodos, calculadas a partir daquelas de 4 períodos, precisam ser obtidas para obter resultados centrados. Trim. Con. Total móvel 4 per. Total móvel 2 per. (centrado) Média Móvel 2 per. (centrada) 2016 I 24 2016 II 21 65 2016 III 11 126 15,75 61 2016 IV 9 121 15,125 60 2017 I 20 116 14,5 56 2017 II 20 109 13,625 53 2017 III 7 101 12,625 48 2017 IV 6 90 11,25 42 2018 I 15 82 10,25 40 2018 II 14 80 10 40 2018 III 5 78 9,75 38 2018 IV 6 74 9,25 36 2019 I 13 71 8,875 35 2019 II 12 69 8,625 34 2019 III 4 2019 IV 5 INE 7001 Análise de Séries Temporais 17 As linhas mais escuras na tabela acima indicam os períodos "centrais" das médias móveis de ordem 4, que não têm correspondente na série original. Para facilitar o nosso trabalho calculamos apenas os totais móveis de 4 períodos, acompanhe: - os primeiros 4 períodos são os 4 trimestres de 2016: 2016 I, 2016 II, 2016 III, 2016 IV; o total móvel deles (igual a 65) deve ficar no centro destes períodos, ou seja entre 2016 II e 2016 III, que é um período inexistente na série original; - em seguida desprezamos 2016 I e incluímos 2017 I: 2016 II, 2016 III, 2016 IV, 2017 I; o total móvel (igual a 61) deve ficar entre 2016 III e 2016 IV, novamente inexistente na série original; - prosseguimos até os 4 últimos períodos: 2019 I, 2019 II, 2019 III, 2019 IV; o total móvel (igual a 34) deve ficar entre 2019 II e 2019 III. Agora precisamos obter as médias móveis centradas. Primeiramente calculamos os totais móveis de 2 períodos, juntando 2 totais móveis de 4 períodos calculados anteriormente: - o total móvel de 4 períodos que está entre 2016 II e 2016 III, com o que está entre 2016 III e 2016 IV, cujo resultado (126) deverá ficar em 2016 III (passando a ter correspondente na série original); - o total móvel de 4 períodos que está entre 2016 III e 2016 IV, com o que está entre 2016 IV e 2017 I, cujo resultado (121) deverá ficar em 2016 IV (passando a ter correspondente na série original); - prosseguimos até os últimos 2 totais móveis de 4 períodos: entre 2019 I e 2019 II, e entre 2019 II e 2019 III, cujo resultado (69) deverá ficar em 2019 II. Dividimos os totais móveis de 2 períodos por oito (porque agrupamos dois conjuntos de 4 períodos), e obtemos as médias móveis centradas. Repare que faltam médias móveis para exatamente 2 períodos no início da série e para exatamente 2 no final, porque as médias móveis iniciais envolvem 4 períodos (porque há 4 trimestres no ano). Se a série fosse mensal faltariam 6 períodos no início e 6 no final. Vamos ver como ficam a série original e a tendência em um gráfico: Figura 11 - Número de contratos: série original e médias móveis de 4 períodos (centradas) É interessante observar que a tendência do número de contratos é decrescente. Supondo que fossem dados atuais e desejássemos fazer previsões para o futuro, trata-se de um inquietante sinal para a corretora de seguros. Se o mercado encontra-se retraído o mau desempenho seria explicável, mas mesmo assim é preocupante que no longo prazo o número de contratos está caindo, a não ser que o valor individual dos contratos compense esta redução. 0 5 10 15 20 25 30 2016 I 2016 II 2016 III 2016 IV 2017 I 2017 II 2017 III 2017 IV 2018 I 2018 II 2018 III 2018 IV 2019 I 2019 II 2019 III 2019 IV N ú m e ro d e c o n tr at o s Trimestres Série original Médias móveis centradas INE 7001 Análise de Séries Temporais 18 4.2.3 - Ajuste Exponencial O ajuste exponencial é uma outra forma de obter a tendência de uma série temporal. Apresenta algumas vantagens em relação às médias móveis: - permite realizar previsões de curto prazo (para o período seguinte da série), o que não é possível por médias móveis. - leva em conta todos os valores previamente observados ao período sob análise, e não somente os"mais próximos" dele, como ocorre nas médias móveis. Na realidade o ajuste exponencial fornece uma média móvel exponencialmente ponderada ao longo da série temporal: ou seja, cada previsão ou valor ajustado depende de todos os valores prévios. Os pesos designados para os valores observados decrescem ao longo do tempo, ou seja, o valor observado mais recentemente recebe o maior peso, o valor anterior o segundo maior e o valor observado inicialmente recebe o menor peso: isso é bom senso, imagina-se que os dados mais recentes devam ter mais influência nas previsões do que os mais antigos. O ajuste exponencial é uma das ferramentas disponíveis no suplemento Análise de Dados do Microsoft Excel. Para realizar o ajuste exponencial basta aplicar a seguinte fórmula para um período de tempo i qualquer: 1)1( iii EWYWE Onde: i - um período de tempo qualquer; Yi - valor da série original no período i; Ei - valor da série exponencialmente ajustada no período i; Ei-1 - valor da série exponencialmente ajustada no período i - 1 (período anterior); W - constante de regularização ou coeficiente de ajuste (0 < W < 1); Considera-se que o primeiro valor da série original será igual ao primeiro valor ajustado, isto significa que o ajuste realmente começa a partir do segundo período da série. Como cada valor ajustado leva em conta o valor ajustado imediatamente anterior (multiplicado pela constante de regularização) teoricamente todos os valores prévios da série contribuem para o valor ajustado. A escolha da constante de regularização W é crucial para o ajuste exponencial, mas é um processo subjetivo. Não obstante, é possível estabelecer uma regra de escolha: - se o interesse é simplesmente obter a tendência, eliminando o efeito das outras componentes, o valor de W deverá ser próximo de zero; - se houver interesse, porém, em realizar previsão com a série é recomendável que o valor de W seja mais próximo de 1, de maneira a refletir melhor o comportamento da série no curto prazo. Exemplo 4.5 - Faça o ajuste exponencial da série de vendas do Exemplo 4.2 (usando W = 0,25; W = 0,5; W = 0,75 e W = 0,10). Construa um gráfico conjunto da série original com os quatro ajustes. Ano Vendas (Y) Ano Vendas (Y) Ano Vendas (Y) 1970 5,3 1978 9,5 1986 8,6 1971 7,8 1979 9,0 1987 7,8 1972 7,8 1980 7,1 1988 8,1 1973 8,7 1981 6,8 1989 7,9 1974 6,7 1982 6,2 1990 7,5 1975 6,6 1983 7,8 1991 7,0 1976 8,6 1984 8,3 1992 7,2 1977 9,1 1985 9,3 Vamos demonstrar os cálculos para W = 0,25. INE 7001 Análise de Séries Temporais 19 Vamos considerar que o primeiro valor da série, Y1970, será igual ao primeiro valor ajustado, E1970. Podemos então realizar o ajuste para o ano de 1971: milhões 93,5)3,5()25,01()8,725,0()1( 197019711971 EWYWE Para o ano de 1972: milhões 39,6)93,5()25,01()8,725,0()1( 197119721972 EWYWE O processo segue até o final da série. De maneira análoga podemos obter o ajuste para W = 0,5 e W = 0,75. Os valores ajustados estão na tabela a seguir: Ano Vendas (Y) - em milhões W = 0,25 W = 0,50 W = 0,75 W = 0,10 1970 5,3 5,3 5,3 5,3 5,3 1971 7,8 5,93 6,55 7,18 5,55 1972 7,8 6,39 7,18 7,64 5,78 1973 8,7 6,97 7,94 8,44 6,07 1974 6,7 6,90 7,32 7,13 6,13 1975 6,6 6,83 6,96 6,73 6,18 1976 8,6 7,27 7,78 8,13 6,42 1977 9,1 7,73 8,44 8,86 6,69 1978 9,5 8,17 8,97 9,34 6,97 1979 9 8,38 8,98 9,08 7,17 1980 7,1 8,06 8,04 7,60 7,16 1981 6,8 7,74 7,42 7,00 7,13 1982 6,2 7,36 6,81 6,40 7,04 1983 7,8 7,47 7,31 7,45 7,11 1984 8,3 7,68 7,80 8,09 7,23 1985 9,3 8,08 8,55 9,00 7,44 1986 8,6 8,21 8,58 8,70 7,55 1987 7,8 8,11 8,19 8,02 7,58 1988 8,1 8,11 8,14 8,08 7,63 1989 7,9 8,05 8,02 7,95 7,66 1990 7,5 7,92 7,76 7,61 7,64 1991 7 7,69 7,38 7,15 7,58 1992 7,2 7,57 7,29 7,19 7,54 E o gráfico é mostrado na Figura 12: Figura 12 - Ajuste exponencial com vários valores de W 4 5 6 7 8 9 10 19 70 19 72 19 74 19 76 19 78 19 80 19 82 19 84 19 86 19 88 19 90 19 92 Anos V e n d a s ( m il h õ e s d e u n id a d e s ) Vendas W = 0,25 W = 0,50 W = 0,75 W = 0,10 INE 7001 Análise de Séries Temporais 20 Quanto menor o valor de W mais "alisada" é a série, com as variações de curto prazo sendo amortizadas, possibilitando visualizar o comportamento de longo prazo da série, seja ele crescente/decrescente ou estacionário: para W = 0,1 é fácil perceber uma tendência crescente nas vendas, mas que parece estar se estabilizando. À medida que o valor de W aproxima-se de 1 o ajuste exponencial torna-se mais próximo da série original, o que pode ser útil na previsão para o ano de 1993. Por exemplo, se quiséssemos realizar a previsão para o ano de 1993, o valor previsto seria aquele ajustado para o ano imediatamente anterior (1992): para W = 0,25 Vendas1993 = 7,57 milhões; para W = 0,50 Vendas1993 = 7,29 milhões; para W = 0,75 Vendas1993 = 7,19 milhões; para W = 0,10 Vendas1993 = 7,59 milhões. Qual destas previsões é a mais apropriada? Como se trata de uma previsão de curto prazo é recomendável escolher as previsões feitas para valores mais altos de W, 0,5 ou 0,75, que mostram melhor as flutuações. Sendo assim, espera-se que as vendas em 1993 estejam entre em 7,29 e 7,19 milhões de unidades. Assim que os dados de 1993 estivessem disponíveis poderíamos fazer a previsão sobre 1994, e assim por diante. Compare a curva para W = 0,10 da Figura 12, que indica uma tendência crescente de vendas, com a média móvel de 7 períodos da Figura 10, que indica estabilização em torno de 8 milhões. Em qual das duas confiar? Lembre-se de que o ajuste exponencial leva em conta todos os valores anteriores ao período, e que a média móvel apenas aqueles definidos no seu período (3, 5, 7), e que maior peso é dado aos valores dos períodos mais próximos, o que pode representar maior acuracidade, pois são mais recentes. 4.2.4 - Remoção da Tendência Uma vez identificada a tendência, seja por equações ou por médias móveis, ela pode ser removida da série, para facilitar a visualização das outras componentes: ISCTY para um modelo aditivo ISC T Y para um modelo multiplicativo Vejamos como ficaria a série mostrada na Figura 5 com a remoção da tendência, pelos modelos aditivo e multiplicativo (ambas supondo uma tendência linear): Figura 13- Série temporal de vendas (Figura 5) com tendência removida – modelo aditivo Vendas sem tendência - modelo aditivo -300 -200 -100 0 100 200 300 400 500 600 jan/65 jan/70 jan/75 jan/80 jan/85 jan/90 jan/95 jan/00 INE 7001 Análise de Séries Temporais 21 Observe a escala do gráfico. Os valores oscilam em torno de zero: se maiores do que zero indicam componentes que aumentam a tendência, se menores que diminuem. A escala do gráfico é semelhante a da Figura 6 (milhões de dólares). Figura 14 - Série temporal de vendas (Figura 5) com tendência removida – modelo multiplicativo Observe a escala do gráfico, com valores em torno de 1: a tendência foi removida, restaram apenas as componentes cíclicas, sazonais e irregulares que modificam a tendência em um modelo multiplicativo. 4.3 - Obtenção das variações sazonais Conforme visto na seção 4.1 as variações sazonais são oscilações de curto prazo, que ocorrem sempre dentro do ano, e que se repetem sistematicamente ano após ano. Obviamente uma série temporal registrada anualmente (ou seja, os valores dos dias, meses, trimestres, são resumidos em um valor anual) não tem componente sazonal. Nos modelos aditivo e multiplicativo as variações sazonais são representadas pelos índices sazonais, ou fatores sazonais, um para cada período em que o ano é dividido (se a série é registrada mensalmente há 12 índices, se trimestralmente há 4 índices, etc.). Os índices sazonais modificam a tendência, ao serem somados (modelo aditivo) oumultiplicados por ela: - no modelo aditivo, se todos os índices forem próximos ou exatamente iguais a zero então as componentes sazonais parecem não exercer grande efeito sobre a série; se os índices forem substancialmente diferentes de zero, tanto positivos como negativos, o valor da tendência será modificado por eles, indicando influência das componentes sazonais na série. - no modelo multiplicativo, se todos os índices sazonais forem aproximadamente iguais a 1 então as componentes sazonais parecem não exercer grande efeito sobre a série; se os índices forem substancialmente diferentes de 1, pelo menos 5% acima ou abaixo em alguns dos meses ou trimestres, o valor da tendência será modificado por eles, indicando que as componentes sazonais afetam a série. Quando se usa o modelo aditivo a soma de todos os índices sazonais precisa ser igual, ou muito próxima, de zero. Quando se usa o modelo multiplicativo a soma precisa ser igual ao período INE 7001 Análise de Séries Temporais 22 da sazonalidade: se a série é trimestral deve ser igual a 4 (4 trimestres no ano), se é mensal deve ser igual a 12, e assim por diante. Em alguns casos é preciso fazer pequenas correções para garantir tal comportamento. Para obter as variações sazonais recomenda-se que a série temporal tenha, no mínimo, quatro anos completos (16 trimestres, 48 meses, por exemplo). Caso contrário, será mais difícil confirmar a existência da regularidade inerente às variações sazonais (alguns programas estatísticos simplesmente não apresentam os resultados para séries menores). Há vários métodos para a obtenção dos índices sazonais, entre eles o método da razão para a média móvel (ou método da média móvel percentual). Ele consiste em: 1) obter médias móveis de ordem igual ao número de períodos sazonais (4 se a série é trimestral, 12 se é mensal); 2) obter médias móveis de 2 períodos, centradas, a partir das médias móveis calculadas no passo 1; 3) obter os índices sazonais para cada período: - no modelo ADITIVO, subtraindo dos valores originais da série as médias móveis centradas calculadas no passo 2; - no modelo MULTIPLICATIVO, dividindo os valores originais da série pelas médias móveis centradas calculadas no passo 2; 4) obter medidas de síntese dos índices calculados no passo 3, que representarão cada período sazonal (por exemplo, a mediana dos índices sazonais de todos os janeiros existentes na série). - no modelo ADITIVO, calcular a média aritmética simples dos valores correspondentes ao período sazonal (média dos índices obtidos em todos os janeiros da série, por exemplo); - no modelo MULTIPLICATIVO, calcular a média aritmética simples dos valores correspondentes ao período sazonal, sem incluir os valores máximo e mínimo 10 (imagine que há os índices 1,05; 1,054; 1,061; 1,07; 1,072; 1,08, a média seria calculada excluindo os valores 1,05 e 1,08, mínimo e máximo respectivamente); uma solução alternativa seria calcular a mediana dos índices de cada período. 5) fazer as correções necessárias para que a soma dos índices seja coerente (igual a zero para o aditivo e igual à ordem da sazonalidade no multiplicativo): - no modelo ADITIVO, somar todos os índices calculados no passo 4 e dividir a soma pela ordem da sazonalidade (4 se trimestral, 12 se mensal, etc.); o resultado deverá ser subtraído de cada um dos índices, garantindo que a soma deles seja igual a zero. - no modelo MULTIPLICATIVO, somar todos os índices calculados no passo 4, subtrair da soma a ordem da sazonalidade (4 se trimestral, 12 se mensal, etc.), e dividir a subtração pela ordem da sazonalidade (novamente, 4 se trimestral, 12 se mensal, etc.); subtrair o resultado de 1; o resultado deverá ser multiplicado por cada um dos índices, garantindo que a soma deles seja igual à ordem da sazonalidade. Os passos 1 e 2 são virtualmente idênticos ao procedimento para obtenção de tendência por médias móveis visto na seção 4.2.2 (quando o número de períodos é par). Exemplo 4.6 - Obtenha os índices sazonais, tanto pelo modelo aditivo quanto pelo multiplicativo, para a série de contratos de seguros apresentada no Exemplo 4.4. Interprete os resultados encontrados. Há dados disponíveis para quatro anos completos, de 2014 a 2017. Veja os resultados na tabela abaixo: 10 Também chamada de média interna, ou medial average (em inglês). INE 7001 Análise de Séries Temporais 23 Pelo modelo aditivo. Trimestre No. de Contratos Totais Móveis 4 períodos Totais Móveis 2 períodos (centrados) Médias Móveis 2 períodos (centradas) Índices sazonais 2016 I 24 2016 II 21 65 2016 III 11 126 15,75 -4,750 61 2016 IV 9 121 15,125 -6,125 60 2017 I 20 116 14,5 5,500 56 2017 II 20 109 13,625 6,375 53 2017 III 7 101 12,625 -5,625 48 2017 IV 6 90 11,25 -5,250 42 2018 I 15 82 10,25 4,750 40 2018 II 14 80 10 4,000 40 2018 III 5 78 9,75 -4,75 38 2018 IV 6 74 9,25 -3,25 36 2019 I 13 71 8,875 4,125 35 2019 II 12 69 8,625 3,375 34 2019 III 4 2019 IV 5 Temos que encontrar 4 índices sazonais, já que há 4 trimestres no ano. Como a série é registrada trimestralmente, e a tendência deve ser obtida por médias móveis, é preciso calcular médias móveis de 4 períodos, pois há 4 trimestres no ano. Contudo, como este número de períodos é par, médias móveis de 2 períodos, calculadas a partir daquelas de 4 períodos, precisam ser obtidas para obter resultados centrados. O procedimento inicial é semelhante ao feito no Exemplo 4.3, até a obtenção das médias móveis de 2 períodos centradas. Para obter os índices sazonais devemos subtrair dos valores originais da série as médias móveis centradas, a partir de 2014 III até 2017 II, cujos resultados estão na última coluna da tabela acima. Os índices para cada trimestre serão: Trimestre I => 5,500 4,750 4,000 Trimestre II => 6,375 4,000 3,375 Trimestre III=> -4,750 -5,625 -4,75 Trimestre IV=> -6,125 -5,250 -3,25 Os índices somente foram calculados para os períodos em que havia médias móveis de 2 períodos centradas. Como é um modelo aditivo precisamos calcular a média de cada trimestre. Então os índices sazonais serão: Trimestre I = 4,792 Trimestre II = 4,583 Trimestre III = -5,042 Trimestre IV = -4,875 INE 7001 Análise de Séries Temporais 24 Observe que há uma diferença considerável entre os índices. No primeiro trimestre do ano o número de contratos aumenta em cerca de 5, no segundo aumenta outros 5, e no terceiro e quarto trimestres sofre uma queda de 5. Estas oscilações são grandes demais para ter ocorrido por acaso, há influência da sazonalidade na série de contratos. Somando os índices vamos obter -0,5417, indicando que é preciso realizar uma correção. Como a sazonalidade tem ordem 4, divide-se a soma por 4 obtendo -0,135417. Subtraindo de cada índice este valor: Trimestre I = 4,792 – (-0, 135417) = 4,9271 Trimestre II = 4,583 – (-0, 135417) = 4,7188 Trimestre III = -5,042 – (-0, 135417) = - 4,9063 Trimestre IV = -4,875 – (-0, 135417) = -4,7396 E a soma dos quatro índices é virtualmente igual a zero. Pelo modelo multiplicativo: Trimestre No. de Contratos Totais Móveis 4 períodos Totais Móveis 2 períodos (centrados) Médias Móveis 2 períodos (centradas) Índices sazonais 2016 I 24 2016 II 21 65 2016 III 11 126 15,75 0,698 61 2016 IV 9 121 15,125 0,595 60 2017 I 20 116 14,5 1,379 56 2017 II 20 109 13,625 1,468 53 2017 III 7 101 12,625 0,554 48 2017 IV 6 90 11,25 0,533 42 2018 I 15 82 10,25 1,463 40 2018 II 14 80 10 1,400 40 2018 III 5 78 9,75 0,51338 2018 IV 6 74 9,25 0,649 36 2019 I 13 71 8,875 1,465 35 2019 II 12 69 8,625 1,391 34 2019 III 4 2019 IV 5 Temos que encontrar 4 índices sazonais, já que há 4 trimestres no ano. Como a série é registrada trimestralmente, e a tendência deve ser obtida por médias móveis, é preciso calcular médias móveis de 4 períodos, pois há 4 trimestres no ano. Contudo, como este número de períodos é par, médias móveis de 2 períodos, calculadas a partir daquelas de 4 períodos, precisam ser obtidas para obter resultados centrados. O procedimento inicial é semelhante ao feito no Exemplo 4.4, até a obtenção das médias móveis de 2 períodos centradas. Para obter os índices sazonais devemos dividir os valores originais da série pelas médias móveis centradas, a partir de 2014 III até 2017 II, cujos resultados estão na última coluna da tabela acima. Os índices para cada trimestre serão: Trimestre I => 1,379 1,463 1,465 INE 7001 Análise de Séries Temporais 25 Trimestre II => 1,468 1,400 1,391 Trimestre III=> 0,698 0,554 0,513 Trimestre IV=> 0,595 0,533 0,649 Os índices somente foram calculados para os períodos em que havia médias móveis de 2 períodos centradas. Precisamos calcular a média de cada trimestre, excluindo os valores máximo e mínimo.. Neste caso, como há apenas 3 valores basta excluir os extremos. Então os índices sazonais serão: Trimestre I = 1,463 Trimestre II = 1,400 Trimestre III = 0,554 Trimestre IV = 0,595 Observe que há uma diferença considerável entre os índices. No primeiro trimestre do ano o número de contratos aumenta cerca de 46,3% ([1,463 - 1] 100), no segundo aumenta 40%, no terceiro trimestre sofre uma queda de 44,6% ([0,554 - 1] 100), e no quarto a queda é de 40,5%. Estas oscilações são grandes demais para ter ocorrido por acaso, há influência da sazonalidade na série de contratos. Somando os índices vamos obter 4,013, indicando que é preciso realizar uma correção. Como a sazonalidade tem ordem 4, subtrai-se a soma de 4 e divide-se o resultado por 4 obtendo 0,0032. Subtraindo este valor de 1, teremos 0,9968, multiplicando este resultado pelos índices obtemos os índices corrigidos: Trimestre I = 1,463 × 0,9968 = 1,459 Trimestre II = 1,400 × 0,9968 = 1,395 Trimestre III = 0,554 × 0,9968 = 0,553 Trimestre IV = 0,595 × 0,9968 = 0,593 E a soma dos quatro índices é virtualmente igual a 4. Podemos remover a sazonalidade da série, dividindo os valores originais de cada período por seu respectivo índice sazonal, pelos modelos aditivo e multiplicativo, e podemos ver o resultado em gráficos: Trimestre Y S (multiplicativo) T × C × I = Y/ S S (aditivo) T + C + I = Y - S 2016 I 24 1,459 16,453 4,927 19,073 2016 II 21 1,395 15,049 4,719 16,281 2016 III 11 0,553 19,904 -4,906 15,906 2016 IV 9 0,593 15,174 -4,740 13,740 2017 I 20 1,459 13,711 4,927 15,073 2017 II 20 1,395 14,332 4,719 15,281 2017 III 7 0,553 12,666 -4,906 11,906 2017 IV 6 0,593 10,116 -4,740 10,740 2018 I 15 1,459 10,283 4,927 10,073 2018 II 14 1,395 10,032 4,719 9,281 2018 III 5 0,553 9,047 -4,906 9,906 2018 IV 6 0,593 10,116 -4,740 10,740 2019 I 13 1,459 8,912 4,927 8,073 2019 II 12 1,395 8,599 4,719 7,281 2019 III 4 0,553 7,238 -4,906 8,906 2019 IV 5 0,593 8,430 -4,740 9,740 Figura 15 - Série sem sazonalidade – modelo aditivo Figura 16 - Índices Sazonais trim.– modelo aditivo 0 5 10 15 20 25 30 2016 I 2016 II 2016 III 2016 IV 2017 I 2017 II 2017 III 2017 IV 2018 I 2018 II 2018 III 2018 IV 2019 I 2019 II 2019 III 2019 IV N ú m e ro d e c o n tr at o s Trimestres Série original Série sem Sazonalidade: Y - S = T + C + I -6,000 -5,000 -4,000 -3,000 -2,000 -1,000 0,000 1,000 2,000 3,000 4,000 5,000 6,000 Ín d ic e s sa zo n ai s Trimestres Índices sazonais aditivos INE 7001 Análise de Séries Temporais 26 Figura 17 – Série sem sazonalidade – modelo multiplic. Figura 18 - Índices sazonais - modelo multiplicativo Qual dos dois modelos é o mais apropriado? Veremos posteriormente medidas da acuracidade dos modelos, que permitirá escolher o mais adequado. 4.4 - Obtenção de variações cíclicas e irregulares11 Geralmente as variações cíclicas e irregulares são avaliadas em conjunto. Conforme visto anteriormente as variações cíclicas são padrões de longo prazo (superiores a um ano), como por exemplo períodos de crescimento e recessão da economia. Já as variações irregulares são resultado de fatos fortuitos, inesperados. Alguns autores não mencionam as variações cíclicas porque em certos casos a série temporal precisa abranger décadas para que seja possível identificar o comportamento cíclico, e, especialmente em séries sócio-econômicas os dados mais antigos podem estar realmente ultrapassados e contribuir para a construção de um modelo irreal. Não obstante, optou-se por levá-las em conta neste texto para obter um modelo completo. As variações cíclicas e irregulares são obtidas através da remoção das componentes tendência e sazonalidade (esta última apenas se os dados não forem anuais). No modelo aditivo: STYCI No modelo multiplicativo: ST Y CI Onde Y é o valor original da série, T é a tendência, e S é a componente sazonal (representada através dos índices sazonais). É costume construir um gráfico de linhas com as variações cíclicas e irregulares, através do qual podemos identificar se os ciclos realmente influenciam a série, qual é sua periodicidade, e ainda se o efeito das variações irregulares é muito grande (e se é possível relacioná-lo com fatos específicos). Às vezes as variações irregulares tornam difícil a visualização dos ciclos, o que pode exigir a aplicação de médias móveis às variações cíclicas e irregulares para "alisá-la", de modo a facilitar a sua identificação. 11 Embora todos os autores concordem com a presença das componentes irregulares no modelo clássico das séries temporais, não há unanimidade sobre as componentes cíclicas. Assim, o leitor pode encontrar referências sobre séries temporais que desconsideram por completo os ciclos. 0 5 10 15 20 25 30 2016 I 2016 II 2016 III 2016 IV 2017 I 2017 II 2017 III 2017 IV 2018 I 2018 II 2018 III 2018 IV 2019 I 2019 II 2019 III 2019 IV N ú m e ro d e c o n tr at o s Trimestres Série original Série sem Sazonalidade: Y / S = T x C x I 0,500 0,600 0,700 0,800 0,900 1,000 1,100 1,200 1,300 1,400 1,500 1,600 Ín d ic e s sa zo n ai s Trimestres Índices sazonais multiplicativos INE 7001 Análise de Séries Temporais 27 Para identificar se há ciclos na série os seguintes padrões devem ser observados no gráfico das variações cíclicas e irregulares: - no modelo aditivo, se há alternâncias sistemáticas entre valores maiores e menores do que zero ao longo dos períodos, e se os valores permanecem predominantemente maiores/menores do que zero durante pelo menos 1 ano (por exemplo: 2 anos acima de zero, seguido por 3 abaixo de zero, e assim sucessivamente); - no modelo multiplicativo, se há alternâncias sistemáticas entre valores maiores e menores do que 1 ao longo dos períodos, e se os valores permanecem predominantemente maiores/menores do que 1 durante pelo menos 1 ano (por exemplo: 2 anos acima de 1, seguido por 3 abaixo de 1, e assim sucessivamente); Os valores zero e 1 são os pontos neutros nos modelos aditivo e multiplicativo respectivamente, se as variações não se afastarem muito de zero (no modelo aditivo) ou de 1 (no modelo multiplicativo) elas não causarão modificações tangíveis na tendência, e portanto não influenciarão na série. A alternância sistemática precisa ser identificada, caso contrário o efeito dos ciclos ou é inexistente ou é inferior ao das componentes irregulares, podendo entãoser desprezado no processo de previsão. Se os ciclos influenciam na série temporal eles precisam ser levados em consideração no modelo. Precisamos calcular índices para os ciclos também, para os períodos de baixa e de alta, havendo dois procedimentos: - calcula-se a mediana 12 , ou a média sem os valores máximo e mínimo, das variações cíclicas e irregulares para todos os períodos de alta (e baixa) existentes na série; este procedimento agrega informações de toda a série; - calcula-se a mediana, ou a média sem os valores máximo e mínimo, apenas para o último período de alta (e baixa); este procedimento privilegia as informações mais recentes, que podem ser mais úteis em previsões. Também podemos observar os efeitos das variações irregulares, basta identificarmos eventuais quedas e altas no gráfico e relacionar tais eventos com fatos ocorridos no mesmo período. É importante observar que muitas vezes tais acontecimentos não causam efeito imediato, ou mesmo não causam efeito algum, o que pode surpreender o analista desavisado. Na Figura 19 podemos observar novamente a série temporal da Figura 5. Na Figura 20 temos esta série após a remoção da tendência e sazonalidade, supondo um modelo aditivo, resultando apenas nas variações cíclicas e sazonais. Na Figura 22 temos a mesma situação, mas com o modelo multiplicativo. Figura 19 - Série temporal de vendas (Figura 5) 12 Usamos a mediana ao invés da média para evitar que valores discrepantes, causados por variações irregulares, distorçam os resultados. INE 7001 Análise de Séries Temporais 28 Figura 20 - Série temporal de vendas - apenas variações cíclicas e irregulares - modelo aditivo Com alguma atenção conseguimos identificar a existência de ciclos, relativamente longos. Observe a alternância sistemática de valores menores e maiores do que zero, por períodos superiores a 1 ano: janeiro de 1965 a dezembro de 1971 baixa, de janeiro de 1972 a dezembro de 1978 alta, etc. Observe, porém, que há pontos que mesmo nos períodos de baixa atingem valores acima de zero, e em períodos de alta abaixo de zero. Isso ocorre devido à influência das variações irregulares. Contudo, se o efeito das variações irregulares fosse suavizado a visualização seria mais fácil. Aplicando médias móveis de 12 períodos, posteriormente centradas, temos a Figura 21: Figura 21 - Série temporal de vendas - médias móveis de 12 períodos das variações cíclicas e irregulares - modelo aditivo Com o modelo multiplicativo: Dados após a remoção da tendência e sazonalidade (apenas variações cíclicas e irregulares) - modelo aditivo -300 -200 -100 0 100 200 300 400 500 jan/65 jan/69 jan/73 jan/77 jan/81 jan/85 jan/89 jan/93 jan/97 Médias móveis das variações cíclicas e irregulares (centradas) - modelo aditivo -150 -100 -50 0 50 100 150 200 jan/65 jan/69 jan/73 jan/77 jan/81 jan/85 jan/89 jan/93 jan/97 INE 7001 Análise de Séries Temporais 29 Figura 22 - Série temporal de vendas - apenas variações cíclicas e irregulares – modelo multiplicativo Com alguma atenção conseguimos identificar a existência de ciclos, relativamente longos. Observe a alternância sistemática de valores menores e maiores do que 1, por períodos superiores a 1 ano: janeiro de 1965 a dezembro de 1971 baixa, de janeiro de 1972 a dezembro de 1978 alta, etc. Novamente, se o efeito das variações irregulares fosse suavizado a visualização seria mais fácil. Aplicando médias móveis de 12 períodos, posteriormente centradas, temos a Figura 23: Figura 23 - Série temporal de vendas - médias móveis de 12 períodos das variações cíclicas e irregulares – modelo multiplicativo. Foi possível verificar, tanto pelo modelo aditivo quanto pelo multiplicativo que as variações cíclicas têm influência sobre os valores da série. Isso obriga a sua consideração ao realizar a previsão dos valores futuros da série: é necessário identificar se os períodos para os quais se quer fazer a previsão serão de alta ou baixa, e obter índices cíclicos (semelhantes aos índices sazonais) para os períodos. Para o caso do exemplo acima a série terminou em dezembro de 2000. Imagine-se que houvesse interesse em fazer a previsão para os anos imediatamente seguintes, 2001 e 2002. Estes dois anos, de acordo com os resultados da Figura 20 a Figura 23, seriam anos de alta ou baixa? Conforme visto anteriormente, os períodos de alta e baixa costumam inverter-se a cada 7 anos, 84 meses: em 1993 iniciou-se um período de baixa, que durou até fins de 1999, passando a haver um aumento nos índices a partir de 2000, como o período de alta dura cerca de 7 anos espera-se que os anos de 2000 a 2006 sejam períodos de alta. Dados após a remoção da tendência e sazonalidade (apenas variações cíclicas e irregulares) - modelo multiplicativo 0,6 0,7 0,8 0,9 1 1,1 1,2 1,3 1,4 1,5 1,6 jan/65 jan/69 jan/73 jan/77 jan/81 jan/85 jan/89 jan/93 jan/97 Médias móveis das variações cíclicas e irregulares (centradas) - modelo multiplicativo 0,8 0,85 0,9 0,95 1 1,05 1,1 1,15 1,2 1,25 jan/65 jan/69 jan/73 jan/77 jan/81 jan/85 jan/89 jan/93 jan/97 INE 7001 Análise de Séries Temporais 30 Como obter os índices cíclicos? Vamos obter um valor apenas, que representará os períodos de alta: podemos calcular a mediana dos valores de todos os períodos de alta (1972 a 1978; 1986 a 1992; 2000); ou obter a mediana dos valores do último período completo de alta (1986 a 1992), que seriam dados mais recentes e talvez com maior influência sobre a série. Exemplo 4.7 - Os dados a seguir representam as vendas líquidas (em bilhões de dólares), e a tendência (obtida por uma equação de reta) da Kodak. Remova a tendência da série usando os modelos aditivo e multiplicativo. Você identifica variações cíclicas? Ano Vendas Tendência CI = Vendas - Tendência CI = Vendas/Tendência 1978 1,60 0,743587 0,856413 2,151732 1979 2,00 1,566462 0,433538 1,276763 1980 2,70 2,389338 0,310662 1,13002 1981 3,70 3,212213 0,487787 1,151854 1982 4,60 4,035089 0,564911 1,14 1983 4,62 4,857964 -0,23796 0,951016 1984 5,00 5,68084 -0,68084 0,880152 1985 5,78 6,503715 -0,72371 0,888723 1986 6,30 7,326591 -1,02659 0,859881 1987 8,00 8,149466 -0,14947 0,981659 1988 10,25 8,972342 1,277658 1,1424 1989 10,50 9,795217 0,704783 1,071952 1990 11,90 10,61809 1,28191 1,120729 1991 10,20 11,44097 -1,24097 0,891533 1992 10,60 12,26384 -1,66384 0,86433 1993 10,60 13,08672 -2,48672 0,809981 1994 11,50 13,90959 -2,40959 0,826768 1995 13,30 14,73247 -1,43247 0,902768 1996 17,00 15,55535 1,44465 1,092872 1997 18,40 16,37822 2,02178 1,123443 1998 18,90 17,2011 1,6989 1,098767 1999 18,90 18,02397 0,87603 1,048604 2000 18,94 18,84685 0,09315 1,004942 Figura 24 - Vendas líquidas da Kodak - variações cíclicas e irregulares – modelo aditivo CI Aditivo -3,00000 -2,50000 -2,00000 -1,50000 -1,00000 -0,50000 0,00000 0,50000 1,00000 1,50000 2,00000 2,50000 1 9 7 8 1 9 7 9 1 9 8 0 1 9 8 1 1 9 8 2 1 9 8 3 1 9 8 4 1 9 8 5 1 9 8 6 1 9 8 7 1 9 8 8 1 9 8 9 1 9 9 0 1 9 9 1 1 9 9 2 1 9 9 3 1 9 9 4 1 9 9 5 1 9 9 6 1 9 9 7 1 9 9 8 1 9 9 9 2 0 0 0 Como a série é anual NÃO HÁ influência da sazonalidade. Podemos simplesmente subtrair a Tendência das vendas (modelo aditivo) ou dividir as Vendas pela Tendência (modelo multiplicativo), obtendo as componentes CI. Os resultados ao lado permitem observar os valores da série com a tendência linear removida. Observe que há alternância entre valores maiores e menores do que zero no modelo aditivo, e 1 no modelo multiplicativo, ao longo dos anos. Contudo tal constatação pode se tornar difícil para séries maiores. É preciso construir os gráficos das variações cíclicas e irregulares. INE7001 Análise de Séries Temporais 31 Pelo modelo aditivo é possível identificar uma variação sistemática: nos anos de 1978 a 1982 (5 anos) têm valores MAIORES DO QUE ZERO para as variações CI. De 1983 a 1987 (outros 5 anos), os valores de CI são MENORES DO QUE ZERO. Em 1988 ocorre outra inversão, valores maiores do que zero até 1990. Em 1991, as variações CI voltam a ficar menores do que zero, permanecendo assim até 1995 (5 anos). No ano de 1996 ocorre a última inversão da série, com os valores tornando a ser maiores do que zero até o ano 2000. Conclui-se então que HÁ VARIAÇÃO CÍCLICA nesta série, pois se pode perceber uma alternância entre valores maiores e menores do que zero (das variações CI) a cada 5 anos. Figura 25 - Vendas líquidas da Kodak - variações cíclicas e irregulares – modelo multiplicativo Pelo modelo multiplicativo também é possível identificar uma variação sistemática: nos anos de 1978 a 1982 (5 anos) têm valores MAIORES DO QUE 1 para as variações CI. De 1983 a 1987 (outros 5 anos), os valores de CI são MENORES DO QUE 1. Em 1988 ocorre outra inversão, valores maiores do que 1 até 1990. Em 1991, as variações CI voltam a ficar menores do que 1, permanecendo assim até 1995 (5 anos). No ano de 1996 ocorre a última inversão da série, com os valores tornando a ser maiores do que 1 até o ano 2000. Conclui-se então que HÁ VARIAÇÃO CÍCLICA nesta série, pois se percebe uma alternância entre valores maiores e menores do que 1(das variações CI) a cada 5 anos. Como há variações cíclicas na série elas devem ser levadas em conta na previsão que será feita. Observando os gráficos das variações CI acima, o ano de 2000 parece ser o último de um ciclo de alta. É razoável imaginar que os anos de 2001 a 2005 serão anos de baixa: a tendência precisará ser multiplicada pelos índices de ciclos de baixa. Além disso, na etapa de recomposição da série (ver seção 4.5), para avaliar qual modelo (aditivo ou multiplicativo) é o mais adequado para representá-la, será necessário usar os índices para os ciclos de alta também 13 . Então, são necessários índices cíclicos para alta e baixa, oriundos do modelo aditivo e do multiplicativo, considerando todos os ciclos completos para a recomposição e os índices do último ciclo completo de baixa para usar na previsão futura. Ciclos de alta Ano 1978 1979 1980 1981 1982 1988 1989 Aditivo 0,856413 0,433538 0,310662 0,487787 0,564911 1,277658 0,704783 Multiplicativo 2,151732 1,276763 1,13002 1,151854 1,14 1,1424 1,071952 Ano 1990 1996 1997 1998 1999 2000 Aditivo 1,28191 1,44465 2,02178 1,6989 0,87603 0,09315 Multiplicativo 1,120729 1,092872 1,123443 1,098767 1,048604 1,004942 13 Embora os ciclos de alta não tenham a regularidade dos de baixa, enquanto os dois ciclos de alta tem exatamente 5 anos, os três ciclos de alta têm 5, 3 e 5 anos respectivamente. CI Multiplicativo 0,75 1 1,25 1,5 1,75 2 2,25 1 9 7 8 1 9 7 9 1 9 8 0 1 9 8 1 1 9 8 2 1 9 8 3 1 9 8 4 1 9 8 5 1 9 8 6 1 9 8 7 1 9 8 8 1 9 8 9 1 9 9 0 1 9 9 1 1 9 9 2 1 9 9 3 1 9 9 4 1 9 9 5 1 9 9 6 1 9 9 7 1 9 9 8 1 9 9 9 2 0 0 0 INE 7001 Análise de Séries Temporais 32 Para a recomposição, calculando as medianas: CI Aditivo = 0,856413; CI Multiplicativo = 1,123443. Para a previsão: não se calcula, pois os períodos seguintes da série supostamente seriam de baixa. Ciclos de baixa Ano 1983 1984 1985 1986 1987 1991 1992 Aditivo -0,23796 -0,68084 -0,72371 -1,02659 -0,14947 -1,24097 -1,66384 Multiplicativo 0,951016 0,880152 0,888723 0,859881 0,981659 0,891533 0,86433 Ano 1993 1994 1995 Aditivo -2,48672 -2,40959 -1,43247 Multiplicativo 0,809981 0,826768 0,902768 Para a recomposição, calculando as medianas: CI Aditivo = -1,13378; CI Multiplicativo = 0,884437. Para a previsão (medianas dos resultados do último ciclo completo de baixa, de 1991 a 1995): CI Aditivo = -1,66384; CI Multiplicativo = 0,86433. 4.5 - Recomposição A recomposição consiste em agregar todas as componentes identificadas na análise de séries temporais, para que seja possível realizar a melhor previsão possível. Ao fazer a recomposição, levando em conta todas as componentes que causam influência na série é possível avaliar qual modelo, aditivo ou multiplicativo, apresenta melhores resultados. No modelo aditivo: CSTŶ No modelo multiplicativo: CSTŶ Onde T é a tendência (definida por uma equação, médias móveis ou ajuste exponencial - seção 4.2), S é a componente sazonal (definida pelos índices sazonais - seção 4.3), e C é a componente cíclica (definida por índices - seção 4.4). Exemplo 4.8 – Faça a recomposição da série a seguir, supondo um modelo aditivo. Aditivo: Ŷ = T + C + S T C S 90 -22 -5 94 -22 -4 98 -22 -4 102 -22 -6 106 -22 -7 110 -22 -3 114 -22 -1 118 -22 5 122 -22 5 Aditivo: Ŷ = T + C + S T C S Y 90 -22 -5 63 94 -22 -4 68 98 -22 -4 72 102 -22 -6 74 106 -22 -7 77 110 -22 -3 85 114 -22 -1 91 118 -22 5 101 122 -22 5 105 Para fazer a recomposição da série devemos somar as componentes da série, já que é um modelo aditivo. O resultado está na tabela a seguir. Para fazer previsões para períodos futuros basta obter os valores de tendência, aplicar os índices sazonais apropriados (se houver influência da sazonalidade), e os índices das variações cíclicas (se houver influência delas) identificando se os períodos para os quais desejamos fazer as previsões serão de alta ou baixa. INE 7001 Análise de Séries Temporais 33 Exemplo 4.9 - Faça a recomposição da série a seguir, supondo um modelo multiplicativo. Multiplicativo: Ŷ = T x C x S T C S 90 0,7 0,90 94 0,7 0,92 98 0,7 0,92 102 0,7 0,86 106 0,7 0,82 110 0,7 0,94 114 0,7 0,95 118 0,7 1,10 122 0,7 1,10 Multiplicativo: Ŷ = T x C x S T C S Y 90 0,7 0,9 56,7 94 0,7 0,92 60,536 98 0,7 0,92 63,112 102 0,7 0,86 61,404 106 0,7 0,82 60,844 110 0,7 0,94 72,38 114 0,7 0,95 75,81 118 0,7 1,1 90,86 122 0,7 1,1 93,94 4.5.1 – Medição da acuracidade do modelo Na seção 4.2.1.1 foram apresentadas as medidas de acuracidade para avaliar qual modelo de tendência por mínimos quadrados era o mais apropriado. As mesmas medidas podem ser utilizadas para avaliar qual modelo (aditivo ou multiplicativo) é o mais apropriado para descrever a série e ser usado nas previsões. A diferença é que agora os erros são calculados usando os valores da recomposição. Erro absoluto médio (EAM): n t te n EAM 1 1 Erro quadrático médio (EQM): n t te n EQM 1 21 Erro percentual absoluto médio (EPAM): n t t t Y e n EPAM 1 100 1 Onde: ttt YYe ˆ et é o erro (diferença entre o valor da série, Yt, e o valor de recomposição pelo modelo aditivo ou multiplicativo tŶ em um período genérico t). O melhor modelo será o que apresentar os valores mais próximos de zero. Para fazer a recomposição da série devemos multiplicar as componentes da série, já que é um modelo multiplicativo. O resultado está na tabela a seguir. Novamente, para fazer previsões para períodos futuros basta obter os valores de tendência, aplicar os índices sazonais apropriados (se houver influência da sazonalidade), e os índices das variações cíclicas (se houver influência delas) identificando se os períodos para os quais desejamos fazer as previsões serão de alta ou baixa. INE 7001 Análise de Séries Temporais 34 Exemplo 4.10. Os dados abaixo contêm os valores trimestrais de exportação de minério de ferro do país latino-americano Pindorama (em milhões de dólares, já expurgado o efeito da inflação). Usando o modelo aditivo e o multiplicativo: a) obtenha os componentes da série b) interprete os resultados c) faça a recomposição
Compartilhar