Baixe o app para aproveitar ainda mais
Prévia do material em texto
Análise de séries temporais Problema A empresa ABC é do ramo de informática. Um dos carros-chefe da em- presa é um novo modem que está tendo muita aceitação no mercado. Os diretores desejam fazer previsões de vendas para os próximos meses com base nos dados de venda dos últimos 24 meses. A tabela abaixo apresenta o resultado das vendas: Tabela 1 – número de modems vendidos Mês Vendas (R$) 1 48 2 53 3 46 4 51 5 47 6 50 7 49 8 55 9 55 10 51 11 54 12 52 13 51 14 55 15 47 16 51 17 53 249 250 Análise de séries temporais Mês Vendas (R$) 18 56 19 52 20 50 21 50 22 48 23 51 24 53 Desejamos construir um modelo matemático idealmente satisfatório dessa série temporal. Idealmente deveríamos procurar definir e medir os muitos fatores que determinam as variações da quantidade vendida e então estabelecer as relações matemáticas entre esses fatores e a particular série em questão. No entanto, as determinantes das mudanças de uma série tem- poral como essa são múltiplas, incluindo fatores como concorrência, prefe- rências do consumidor, tecnologia, investimentos, clima, costumes e mais uma série de variáveis econômicas e não econômicas. A enormidade e a impraticabilidade da tarefa de medir todos esses fa- tores e então relacioná-los matematicamente dificulta o enfoque chamado direto. Assim, a opção por um enfoque mais prático e indireto tem sido a opção de contorno dessas dificuldades. Conceitos fundamentais A análise de séries temporal clássica é essencialmente um método que busca quebrar uma série em distintos componentes que representam os efeitos de fatores explanatórios. Esses componentes são: (I) tendência; (II) flutuações cíclicas; (III) variações sazonais; e (IV) movimentos irregulares. Série temporal Uma série temporal é um conjunto de observações de uma variável quan- titativa coletada no tempo. A série pode ser determinada em qualquer in- tervalo de tempo, hora, dia, semana, mês, trimestre ou ano, dependendo do Análise de séries temporais 251 interesse do tomador de decisões ou das condições do estudo ou ainda da disponibilidade de informações. Qualquer variável quantitativa pode ser medida no tempo e na área de negócios pode interessar fazer medidas de vendas, preços, inventários e assim por diante. Gráfico de linhas Como verificado no capítulo de análise de dados, o gráfico adequado para a apresentação dos dados de uma série temporal é um gráfico de linhas. Para o exemplo da venda dos modems, o gráfico correspondente é o apresentado a seguir: Gráfico de linhas 40 42 44 46 48 50 52 54 56 58 1 24232221201918171615141312111092 3 4 5 6 7 8 Métodos de séries temporais As técnicas que analisam o comportamento de dados do passado e do presente para predizer o futuro são chamadas de modelos de extrapolação. A forma geral de tais modelos é Ŷt+1 = f (Yt, Yt-1, Yt-2 ...), em que Ŷt+1 representa o valor predito para a variável em questão no período t + 1. Yt representa o valor da série no tempo t, Yt-1 representa o valor da série no tempo t – 1 e assim por diante. O objetivo de um modelo de extrapolação é identificar a função f(.) que produza previsões de valores futuros da variável da série temporal. 252 Análise de séries temporais Tendência A tendência se refere a movimentos crescentes ou decrescentes de uma série temporal em um longo período de tempo. Antes que uma tendência de uma particular série possa ser determinada, é geralmente necessário submeter os dados a algum tratamento prelimi- nar, como, por exemplo, verificar a quantidade em relação a uma população determinada durante o período em que os dados foram coletados. Dessa forma, caracteriza-se a quantidade per capita. O gráfico a seguir apresenta uma série com tendência crescente. Observe que a linha de tendência faz um ângulo significativamente maior que zero com o eixo X. 1050 1200 1350 1500 1650 1 20171395 Série temporal estacionária Uma série temporal é dita estacionária se não há uma tendência de cresci- mento ou decrescimento significativo nos dados através do tempo. Se a série temporal apresentar alguma dessas tendências, ela é dita não estacionária. Em uma série estacionária, os dados estão espalhados no tempo de forma aleatória ao redor de uma reta paralela ao eixo X, que representa os valores da média dos dados, apresentando um equilíbrio estável. Uma série pode ser esta- cionária durante um período e não estacionária durante outro período. A série a seguir pode ser considerada estacionária. Observe que a linha de tendência da série é paralela ao eixo X. Análise de séries temporais 253 80 90 100 110 120 1 1082 3 4 5 6 7 9 11 12 13 14 15 16 Erro Médio Quadrático (EMQ) Vários métodos podem ser utilizados para modelar dados de uma série temporal. Uma forma de avaliar qual é o melhor modelo é estudar qual ex- plica melhor o comportamento da série em relação aos dados do passado. Podemos fazer essa verificação através da comparação dos dados reais (Y) com os dados decorrentes do ajuste do modelo (Ŷ). Com base nas observações acima, podemos definir o Erro Médio Quadráti- co (EMQ) correspondente a cada um dos modelos propostos. Aquele modelo com o menor erro médio quadrático será considerado o mais adequado. O EMQ é definido como a soma da diferença entre os valores observados e valores reais dividida por n. EMQ = ∑(Y – Ŷ)2 n O EMQ é bastante próximo do critério de mínimos quadrados ordinários utilizado na construção do modelo de regressão linear simples. 254 Análise de séries temporais Ciclo Flutuações cíclicas ou movimentos cíclicos são movimentos de cresci- mento ou decrescimento recorrentes em torno dos níveis de tendência. Sazonalidade Variações sazonais são ciclos que se completam dentro de um período de calendário regular, repetindo esse padrão básico ao longo de toda a série. Os maiores fatores que produzem esses padrões repetidos ocorrem em séries anuais que obedecem a variações sazonais devido ao clima e aos costumes. Todos os anos, no período que antecede o inverno, há um crescimento da venda de roupas para o frio. Também há todo ano um crescimento de vendas em datas como o Dia das Mães, Dia dos Pais, Dia das Crianças e no período do Natal. Movimentos irregulares Movimentos irregulares são flutuações nas séries temporais que têm du- ração curta, têm natureza errática e não seguem nenhuma regularidade re- corrente ou outro padrão discernível. Método dos mínimos quadrados ordinários Para situações nas quais é desejável ter uma equação matemática para descrever a tendência em uma série temporal, o método mais comumente usado é ajustar alguma forma de função polinomial para os dados. Nesta seção, vamos ilustrar o método geral através de um exemplo simples, ajus- tando uma linha reta ao método dos mínimos quadrados. O método dos mínimos quadrados O método dos mínimos quadrados, quando usado para ajustar linhas retas de tendência em dados de séries temporais, é empregado principal- mente porque é simples e prático e fornece o melhor ajustamento de acordo com um critério razoável. Análise de séries temporais 255 No entanto, devemos alertar que o método de mínimos quadrados não tem o mesmo tipo de suporte teórico quando aplicado para ajustar retas na análise de regressão, conforme visto no capítulo 6. A maior dificuldade é que as suposições probabilísticas feitas na análise de regressão simplesmente não são encontradas na análise de séries temporais. No exemplo que analisamos naquele capítulo, verificamos como gastos em pesquisa e desenvolvimento tecnológico podem afetar positivamente o fatura- mento de empresas de informática. Naquele caso, o faturamento era considera- do uma variável aleatória e o investimento uma variável fixa ou controlada. Para a variável dependente, o modelo assumia distribuições de proba- bilidade condicional dessa variável aleatória em torno de seus valores que caiam na reta de regressão. Os valores Y eram as médias das distribuições de probabilidadecondicional. Algumas suposições estavam implícitas nesse tipo de modelo: os desvios em torno da reta eram considerados erros alea- tórios descritos por uma distribuição de probabilidades. As sucessivas ob- servações da variável dependente foram assumidas como independentes. Por exemplo, os gastos da empresa B em p&d não dependiam dos gastos da empresa A, e assim por diante. Se uma reta é ajustada, por exemplo, para uma série de tempo anual sobre vendas, o tempo é tratado como a variável independente X e as vendas como a variável independente Y. Não é razoável pensar que os des- vios das vendas reais em um dado ano seja um erro aleatório. De fato, se os dados originais são anuais, os desvios em relação à reta podem ser devido a operações cíclicas ou fatores irregulares. Se a série for de um ano, não faz sentido pensar em fatores sazonais devidos ao clima ou costumes porque a série duraria um só período. Finalmente, a suposição de independência não é encontrada em uma série temporal. As vendas de um determinado mês certamente não são in- dependentes do que foi vendido no mês anterior. Ajustamento de uma reta Como exemplo, vamos ajustar uma reta pelo método dos mínimos qua- drados para as vendas de computadores de uma grande loja durante o perí- odo de 1993 a 2007, conforme tabela a seguir: 256 Análise de séries temporais Ano Tempo Vendas (R$) 1993 1 2.484 1994 2 2.767 1995 3 2.088 1996 4 3.611 1997 5 4.216 1998 6 4.665 1999 7 5.275 2000 8 5.616 2001 9 6.165 2002 10 6.720 2003 11 7.400 2004 12 7.975 2005 13 8.800 2006 14 9.520 2007 15 10.450 A reta de regressão pode ser expressa como Ŷ = a + b t. Os valores de “a” e “b” estimados através do método de regressão são substituídos na reta e o modelo linear que explica a relação. O sistema de equações normais é dado então por: y = a + b t ∑tY = a∑t + b∑t 2 Usualmente, quando uma equação de regressão é utilizada para séries temporais, os valores dos tempos são transformados para valores com poucos dígitos. Então, o ano 1993 será transformado para 1, o de 1994 para 2 e assim por diante. Poderíamos também transformar os dados fazendo o ano central igual a 0, os anteriores –1, –2 ... e os posteriores 1, 2... Utilizaremos a primeira opção. Dessa forma, o sistema de equações normais será: 88 752 = 15a + 120b 8 666 864 = 120a + 1 240b Análise de séries temporais 257 Resolvendo o sistema, encontraremos os valores de a = 1 435,43 e b = 560,17. A reta de regressão será então: Ŷ = 1 435,43 + 560,17 t. O gráfico que se segue representa os dados originais e a reta de regressão ajustada. 4 000 6 000 8 000 10 000 12 000 0 105 15 2 000 0 20 Gráfico de vendas O valor de r2, o coeficiente de determinação, é igual a 0,987, ou seja, o ajuste é bastante bom para essa série. O valor de a = 1 453,43 tem a mesma interpretação que na reta de regressão. É o valor de vendas para t = 0, ou seja, para o ano 1992. Também b = 560,17 é a variação de vendas para a variação de um ano. Projeção no tempo Projeções na reta determinada podem ser obtidas se substituirmos t na reta por valores apropriados. Por exemplo, a projeção para vendas de com- putador para o ano de 2008, por exemplo, pode ser realizada assumindo o valor t = 16 na reta de tendência. Então, os valores das vendas seriam Ŷ = 1 435,43 + 560,17 t = 1 435,43 + 560,17 . (16) = 10 398,2, ou simplesmente 10 398 computadores. Essas estimativas podem ser feitas para mais um ou dois períodos, e ainda assim há um alto grau de incerteza. Se predições para mais tempo forem desejadas, estimativas de outros fatores teriam que ser acrescentados à esti- mativa da tendência. Flutuações cíclicas Como foi indicado previamente, quando uma série temporal consistir de dados anuais, ela poderá conter tendência, ciclo e elementos irregulares. As 258 Análise de séries temporais variações sazonais estarão ausentes, uma vez que elas ocorrem dentro de um ano. Então, desvios dos dados anuais em relação à reta de tendência são atribuíveis somente a fatores cíclicos e irregulares. Os desvios em relação à tendência são mais facilmente observados divi- dindo o valor dos dados originais pelos valores correspondentes na linha de tendência para o mesmo período. Por convenção, o resultado da divisão do dado original pelo valor na linha de tendência é multiplicado por 100 para expressar os resultados como percentuais de tendência. Assim, se o dado original é exatamente igual ao valor estimado, a per- centagem de tendência será igual a 100. Se o dado original é maior do que o valor estimado, o valor da percentagem de tendência será maior que 100, caso contrário será menor. A expressão para a percentagem de tendência é então dada por: Percentagem de tendência = (Y/Ŷ).100 Quando convertidos à percentagem de tendência, os dados contêm so- mente os movimentos cíclicos e irregulares, uma vez que a divisão pela ten- dência elimina aquele fator. O modelo multiplicativo para a análise fornece a lógica desse procedimento. Isto é, os dados originais são vistos como repre- sentando os efeitos combinados de tendência, ciclo e fatores irregulares. Em símbolos, T, C e I representam tendência, ciclo e fatores irregulares, respectivamente. Dividindo a série temporal original pelos resultados obti- dos dos valores da tendência, produzem: = T.C.I T Y Ŷ = C.I As percentagens de tendência da série de vendas de computador mos- trada no início desta seção está apresentada na tabela e no gráfico a seguir: Tempo Vendas (R$) Yest. %Tend. 1 2.484 1 995,6 124,5 2 2.767 2 555,8 108,3 3 3.088 3 115,9 99,1 Análise de séries temporais 259 Tempo Vendas (R$) Yest. %Tend. 4 3.611 3 676,1 98,2 5 4.216 4 236,3 99,5 6 4.665 4 796,5 97,3 7 5.275 5 356,6 98,5 8 5.616 5 916,8 94,9 9 6.165 6 477,0 95,2 10 6.720 7 037,1 95,5 11 7.400 7 597,3 97,4 12 7.975 8 157,5 97,8 13 8.800 8 717,7 100,9 14 9.520 9 277,8 102,6 15 10.450 9 838,0 106,2 Percentagem de tendência 90 95 100 105 110 115 120 125 130 1 15141312111092 3 4 5 6 7 8 Tempo Abaixo e acima da linha que representa 100% estão as percentagens que podem mostrar picos e vales durante o período estudado. Esses gráficos de flutuações cíclicas são muito úteis na área de negócios e aparecem frequen- temente em jornais e periódicos econômicos. Eles podem ainda ser utilizados para verificar a amplitude das flutuações, da duração dos períodos de expansão e contração e para outros itens de interesse dos ciclos de negócios. 260 Análise de séries temporais Modelo de médias móveis A técnica conhecida como médias móveis é provavelmente o método de extrapolação mais simples para dados estacionários. Com essa técnica, o valor predito para a série temporal no período t + 1, denotado Ŷt+1, é simples- mente a média das k observações anteriores da série, isto é: Ŷt+1 = (Yt + Yt-1 + ... + Yt-k+1) K O valor k determina quantas observações prévias serão incluídas na média móvel. Não há um valor de k que seja teoricamente melhor que outro, sendo assim devemos tentar vários valores para escolher o melhor. O primeiro exemplo do capítulo forneceu informações da quantidade de modems vendidos durante um período de 24 meses. A tabela a seguir repro- duz a quantidade das vendas. Observe que para k = 2, o valor Ŷ3 = 50,5 é a média entre Y1 = 48 e Y2 = 53. O valor Ŷ4 = 49,5 é a média entre Y2 = 53 e Y3 = 46, e assim por diante. Mês Vendas (R$) Ŷ p/ média móveis Ŷ p/ média móveis 2 meses 4 meses 1 48 2 53 3 46 50,5 4 51 49,5 5 47 48,5 49,5 6 50 49 49,25 7 49 48,5 48,5 8 55 49,5 49,25 9 55 52 50,25 10 51 55 52,25 11 54 53 52,5 12 52 52,5 53,75 13 51 53 53 14 55 51,5 52 Análise de séries temporais 261 Mês Vendas (R$) Ŷ p/ média móveis Ŷ p/ média móveis 2 meses 4 meses 15 47 53 53 16 51 51 51,25 17 53 49 51 18 56 52 51,50 19 52 54,5 51,75 20 50 54 53 21 50 51 52,75 22 48 50 52 23 51 49 50 24 53 49,5 49,75 EMQ 9,55 9,35 Procedimento semelhante se aplica a outros valores de k. Para k = 4, em queŶ5 = (Y1 + Y2 + Y3 + Y4)/4, os valores restantes são calculados com igual procedimento. O gráfico a seguir apresenta as três séries. A série 1 corres- ponde aos dados reais. A série 2 e a série 3 correspondem às médias móveis com k = 2 e k = 4, respectivamente. Média móvel com k = 2 e k = 4 44 46 48 50 52 54 56 58 1 15131193 5 7 17 19 21 23 Série 1 Série 2 Série 3 Os gráficos mostram que os valores preditos tendem a ser menos volá- teis, ou mais suaves, do que os dados reais. Isso ocorre porque o método de médias móveis retira os picos e os vales. Esse método então é conhecido como método de suavização ou alisamento. Quanto maior for o valor de k, maior será a suavização, como pode ser observado no gráfico anterior. 262 Análise de séries temporais Podemos verificar a acurácia relativa das duas funções de previsão atra- vés da comparação entre os erros médios quadráticos. Os valores dos erros médios quadráticos para k = 2 e k = 4 são determinados pela expressão do EMQ e são dados na tabela. O EMQ(k = 2) = 9,55 e EMQ(k = 4) = 9,35. O modelo com quatro médias é um pouco melhor do que o modelo com duas médias. Previsão com o modelo de médias móveis Supondo que o modelo com média móvel de 2 meses para a venda de modems possa ser aceito como satisfatório, a predição do número de modems a ser vendido no vigésimo-quinto mês é calculado como: (Y24 + Y23) = (53 + 51) 2 2 = 52Ŷ25 = Para fazer previsões além de um único período e do conjunto de dados da série temporal usando a técnica de médias móveis, devemos substituir os va- lores previstos por valores reais não observados. Por exemplo, suponha que ao final do período 24 desejamos prever o número de modems que serão vendidos nos períodos 25 e 26. Usando a média móvel de dois períodos, a previsão para o período 26 será: Ŷ26 = (Y25 + Y24) 2 No entanto, não sabemos o valor real de Y25. Temos que substituir Y25 por Ŷ25 na equação passada, assim: (Ŷ25 + Y24) (52 + 53) 2 2 = 52,5Ŷ26 = = Método de médias móveis para estudar sazonalidade Para derivar um conjunto de índices de uma série caracterizada por um padrão sazonal estável, cerca de cinco a nove anos de dados mensais ou trimes- trais são necessários. Um padrão de sazonalidade estável significa que picos e vales geralmente ocorrem nos mesmos meses ou trimestres a cada ano. Análise de séries temporais 263 Um exemplo de valores de vendas de televisores em uma rede de lojas de departamentos no país durante um período de cinco anos; medidos a cada trimestre, será útil para ilustrar o método. Tabela 2 – Vendas de televisão Ano Trimestre Vendas (em milhares de reais) 2003 I 942 2003 II 1355,4 2003 III 1168,8 2003 IV 1248,3 2004 I 998,5 2004 II 1470 2004 III 1297,1 2004 IV 1311,2 2005 I 1113,5 2005 II 1565,2 2005 III 1410,9 2005 IV 1484 2006 I 1152,4 2006 II 1653,5 2006 III 1442,6 2006 IV 1535,8 2007 I 1267,1 2007 II 1678,7 2007 III 1527 2007 IV 1625,3 O gráfico a seguir representa a série correspondente aos valores de venda de televisão no período: 264 Análise de séries temporais Vendas de televisão 750 1 000 1 250 1 500 1 750 1 15131193 5 7 17 19 Os dados revelam que nos dois primeiros trimestres de cada semestre, ou seja, no primeiro e no terceiro trimestres, há uma queda no valor das vendas de televisão. O processo de determinação das médias móveis consistirá em calcular inicialmente a soma das vendas em 2003 (942; 1 355,4; 1 168,8 e 1 248,3) cor- respondentes aos quatro primeiros valores de venda. O resultado encontra- do foi de 4 714,5, como pode ser observado na tabela a seguir: Ano Trimestre Vendas (em milhares de reais) Total 1 2003 I 942 2003 II 1.355,4 2003 III 1.168,8 4.714,5 2003 IV 1.248,3 4.771 2004 I 998,5 4.885,6 2004 II 1.470 5.013,9 2004 III 1.297,1 5.076,8 2004 IV 1.311,2 5.191,8 2005 I 1.113,5 5.287 2005 II 1.565,2 5.400,8 2005 III 1.410,9 5.573,6 2005 IV 1.484 5.612,5 Análise de séries temporais 265 Ano Trimestre Vendas (em milhares de reais) Total 1 2006 I 1.152,4 5.700,8 2006 II 1.653,5 5.732,5 2006 III 1.442,6 5.784,3 2006 IV 1.535,8 5.899 2007 I 1.267,1 5.924,2 2007 II 1.678,7 6.008,6 2007 III 1.527 6.098,1 2007 IV 1.625,3 Este processo deve ser continuado a partir do II trimestre de 2003. Então o valor R$4.771,00 é o resultado da soma dos quatro valores subsequentes (R$1.355,40; R$1.168,80; R$1.248,30 e R$998,50). Dessa forma, completa-se a quarta coluna da tabela, Total 1, como resultado da soma de quatro valores. A coluna seguinte, Total 2, será o resultado da soma de dois em dois valores. Assim, o total R$9.485,50 é o resultado da soma de R$4.714,50 e R$4.771,00. O Total 2 é o resultado então da soma de oito valores. Ver desta- que na tabela a seguir: Ano Trimestre Vendas (em milhares de reais) Total 1 Total 2 2003 I 942 2003 II 1.355,4 2003 III 1.168,8 4.714,5 9.485,5 2003 IV 1.248,3 4.771 9.656,6 2004 I 998,5 4.885,6 9.899,5 2004 II 1.470 5.013,9 10.090,7 2004 III 1.297,1 5.076,8 10.268,6 2004 IV 1.311,2 5.191,8 10.478,8 2005 I 1.113,5 5.287 10.687,8 2005 II 1.565,2 5.400,8 10.974,4 266 Análise de séries temporais Ano Trimestre Vendas (em milhares de reais) Total 1 Total 2 2005 III 1.410,9 5.573,6 11.186,1 2005 IV 1.484 5.612,5 11.313,3 2006 I 1.152,4 5.700,8 11.433,3 2006 II 1.653,5 5.732,5 11.516,8 2006 III 1.442,6 5.784,3 11.683,3 2006 IV 1.535,8 5.899 11.823,2 2007 I 1.267,1 5.924,2 11.932,8 2007 II 1.678,7 6.008,6 12.106,7 2007 III 1.527 6.098,1 2007 IV 1.625,3 Os outros valores da coluna Total 2 são calculados da mesma forma. Agora, é possível calcularmos as médias de vendas para cada período de 8 trimestres, dividindo-se o Total 2 por 8. Essas determinações estão na seguinte tabela: Ano Trimestre Vendas (em milhares de reais) Total 1 Total 2 Média móvel 2003 I 942 2003 II 1.355,4 2003 III 1.168,8 4.714,5 9.485,5 1.185,69 2003 IV 1.248,3 4.771 9.656,6 1.207,08 2004 I 998,5 4.885,6 9.899,5 1.237,44 2004 II 1.470 5.013,9 10.090,7 1.261,34 2004 III 1.297,1 5.076,8 10268,6 1.283,58 2004 IV 1.311,2 5.191,8 10.478,8 1.309,85 2005 I 1.113,5 5.287 10.687,8 1.335,98 2005 II 1.565,2 5.400,8 10.974,4 1.371,8 2005 III 1.410,9 5.573,6 11.186,1 1.398,26 Análise de séries temporais 267 Ano Trimestre Vendas (em milhares de reais) Total 1 Total 2 Média móvel 2005 IV 1.484,00 5.612,50 11.313,30 1.414,16 2006 I 1.152,40 5.700,80 11.433,30 1.429,16 2006 II 1.653,50 5.732,50 11.516,80 1.439,60 2006 III 1.442,60 5.784,30 11.683,30 1.460,41 2006 IV 1.535,80 5.899,00 11.823,20 1.477,90 2007 I 1.267,10 5.924,20 11.932,80 1.491,60 2007 II 1.678,70 6.008,60 12.106,70 1.513,34 2007 III 1.527,00 6.098,10 2007 IV 1.625,30 O gráfico a seguir apresenta a série original das vendas e a nova série de médias móveis sem a influência da sazonalidade. 750 1 000 1 250 1 500 1 750 1 15131193 5 7 17 19 Observe que essa série de médias móveis não é igual à reta que se obteria se utilizássemos o método de mínimos quadrados, procedimento que resulta na reta de regressão ou tendência. A tabela que se segue apresenta os dois re- sultados para efeito de comparação. Pode-se observar que os valores são bem próximos. Ano Trimestre Média móvel Regressão 2003 III 1.185,69 1.181,3 2003 IV 1.207,08 1.205,4 2004 I 1.237,44 1.229,6 268 Análise de séries temporais Ano Trimestre Média móvel Regressão 2004 II 1.261,34 1.253,7 2004 III 1.283,58 1.277,9 2004 IV 1.309,85 1.302,0 2005 I 1.335,98 1.326,1 2005 II 1.371,80 1.350,3 2005 III 1.398,26 1.374,4 2005 IV 1.414,16 1.398,6 2006 I 1.429,16 1.422,7 2006 II 1.439,60 1.446,9 2006 III 1.460,41 1.471,0 2006 IV 1.477,90 1.495,2 2007 I 1.491,60 1.519,3 2007 II 1.513,34 1.543,5 É útil verificar algumas informações reveladas no gráfico dos dados origi- nais e os dados das médias móveis. Os dados originais foram estabelecidos trimestralmente e contêm todos os componentes dos movimentos de ten- dência, ciclo, sazonale movimentos irregulares. Embora o período nesse exemplo seja um pouco curto para que a tendência seja revelada, podemos observar que as vendas de televisão tendem a crescer durante todo o período. Movimentos irregulares estão presentes. A média móvel, que passa suavemente entre os dados, segue uma tendência crescente. Se as flutuações cíclicas estão claramente in- dicadas, podemos ser capazes de observar como as médias móveis as descrevem bem. Retirada da sazonalidade A percentagem da média móvel é dada pela razão entre os dados originais e os das médias móveis multiplicada por 100, como de costume. Análise de séries temporais 269 Ano Trimestre Vendas (em milhares de reais) Média móvel Percentagem m. móveis 2003 I 942 2003 II 1.355,4 2003 III 1.168,8 1.185,69 98,60 2003 IV 1.248,3 1.207,08 103,40 2004 I 998,5 1.237,44 80,70 2004 II 1.470 1.261,34 116,50 2004 III 1.297,1 1.283,58 101,10 2004 IV 1.311,2 1.309,85 100,10 2005 I 1.113,5 1.335,98 83,30 2005 II 1.565,2 1.371,80 114,10 2005 III 1.410,9 1.398,26 100,90 2005 IV 1.484 1.414,16 104,90 2006 I 1.152,4 1.429,16 80,60 2006 II 1.653,5 1.439,60 114,90 2006 III 1.442,6 1.460,41 98,80 2006 IV 1.535,8 1.477,90 103,90 2007 I 1.267,1 1.491,60 84,90 2007 II 1.678,7 1.513,34 110,90 2007 III 1.527 2007 IV 1.625,3 Esses valores podem ser apresentados através de um gráfico com centro no valor 100%. Podemos ver no gráfico que os movimentos de tendência e de ciclo não estão mais presentes. A linha base 100 representa o nível de média móvel ou base tendência-ciclo. As flutuações acima e abaixo desta linha revelam claramente o movimento sazonal repetitivo das vendas de te- levisão. Como notado antes, a componente irregular também está presente. Verifique essas observações no gráfico a seguir: 270 Análise de séries temporais 80 90 100 110 120 1 15131193 5 7 Percentagem de médias móveis 161412108642 O próximo passo no procedimento é remover o efeito dos movimentos ir- regulares. Isso é conseguido através do cálculo de médias das percentagens das médias móveis para o mesmo trimestre. Isto é, calculamos as médias de todos os primeiros trimestres e depois de todos os segundos trimestres, e assim por diante. Ano Trimestre Percentagem m. móveis 2003 I 2003 II 2003 III 98,60 2003 IV 103,40 2004 I 80,70 2004 II 116,50 2004 III 101,10 2004 IV 100,10 2005 I 83,30 2005 II 114,10 2005 III 100,90 2005 IV 104,90 2006 I 80,60 2006 II 114,90 Análise de séries temporais 271 Ano Trimestre Percentagem m. móveis 2006 III 98,80 2006 IV 103,90 2007 I 84,90 2007 II 110,90 2007 III 2007 IV Percentagem de médias móveis por trimestre: Ano Trimestre I Trimestre II Trimestre III Trimestre IV 2003 – – 98,60 103,40 2004 80,70 116,50 101,10 100,10 2005 83,10 114,10 100,90 104,90 2006 80,60 114,90 98,80 103,90 2007 84,90 110,90 – – Média 82,02 114,48 99,84 103,67 Quando dividimos o valor dos dados originais de valor de venda pelas per- centagens médias das médias móveis por trimestre e multiplicamos por 100, encontramos os valores estimados para trimestre, retirando a sazonalidade. Então, para o primeiro valor de vendas R$942 milhões pelo índice sazonal de 82,02 e multiplicando-se esse resultado por 100, obtemos o valor de R$1.148,53 milhões. O mesmo procedimento é realizado para todos os outros trimestres: Ano Trimestre Vendas (em milhares de reais) Índice de sazonalidade Valores sem sazonalidade 2003 I 942 82,02 1.148,50 2003 II 1.355,4 114,48 1.183,96 2003 III 1.168,8 99,84 1.170,67 2003 IV 1.248,3 103,67 1.204,11 2004 I 998,5 82,02 1.217,39 272 Análise de séries temporais Ano Trimestre Vendas (em milhares de reais) Índice de sazonalidade Valores sem sazonalidade 2004 II 1.470 114,48 1.284,07 2004 III 1.297,1 99,84 1.299,18 2004 IV 1.311,2 103,67 1.264,78 2005 I 1.113,5 82,02 1.357,60 2005 II 1.565,2 114,48 1.367,23 2005 III 1.410,9 99,84 1.413,16 2005 IV 1.484 103,67 1.431,47 2006 I 1.152,4 82,02 1.405,02 2006 II 1.653,5 114,48 1.444,36 2006 III 1.442,6 99,84 1.444,91 2006 IV 1.535,8 103,67 1.481,43 2007 I 1.267,1 82,02 1.544,87 2007 II 1.678,7 114,48 1.466,37 2007 III 1.527 99,84 1.529,45 2007 IV 1.625,3 103,67 1.567,76 O gráfico seguinte apresenta os valores sem sazonalidade. 1050 1200 1350 1500 1650 1 1395 Valores sem sazonalidade 17 Podemos observar no gráfico a tendência subjacente e os movimentos irregulares. Comparando com os dados originais, observamos que o movi- mento sazonal já não se encontra mais presente. Análise de séries temporais 273 Outros métodos de previsão Além dos métodos apresentados, várias outras propostas podem ser in- crementadas para o estudo de séries temporais. Para os métodos de médias móveis apresentados, podemos observar que todos os dados do passado têm o mesmo peso. No entanto, muitas vezes os dados mais recentes podem influenciar mais fortemente as previsões. A técnica conhecida como médias móveis ponderadas permite assinalar diferentes pesos para os dados que par- ticiparão como base de previsões. Também a técnica conhecida como alisamento exponencial permite a pon- deração de dados provenientes de dados estacionários. Nesse caso, busca-se a melhor combinação de pesos para os dados de tal forma que dados mais recentes tenham maior peso e também buscando encontrar o melhor valor dos ponderadores para obtenção de menor erro médio quadrático. Uma série estacionária pode ter efeitos de sazonalidade tanto aditivos como multiplicati- vos. Essa consideração leva também à construção de modelos particulares. Para estudar tendência, é proposto um modelo de médias móveis duplas. Essa técnica envolve tomar médias de médias. O alisamento exponencial duplo é uma derivação dessa técnica que implica considerar também pon- derações. O método de Holt faz parte dessas técnicas. Além de considerar a tendência, dados não estacionários podem adicionalmente apresentar sazonalidade. Aqui também os efeitos sazonais podem ser de nature- za aditiva ou multiplicativa. O método de Holt-Winter é outra técnica que pode ser aplicada a séries temporais que exibem efeitos de tendência e sazonalidade. Alguns modelos podem ser considerados como uma representação pro- babilística de uma série temporal. Nesse caso, o modelo é caracterizado como um processo estocástico ou uma função aleatória. Esses modelos, con- siderados através do método de Box & Jenkins, consistem em três estágios. O primeiro, de identificação, propicia verificar se a série temporal pode ser descrita através de uma combinação de médias móveis e termos de auto- correlação. No segundo estágio, estimação, os dados da série temporal são usados para estimar os parâmetros do modelo tentativa; e o terceiro estágio, teste-diagnóstico, consiste em testes para examinar os desvios do modelo ajustado para determinar a adequação dos modelos. 274 Análise de séries temporais Atividades de aplicação A tabela a seguir mostra os resultados da produção de um componen- te eletrônico em uma fábrica. Os dados servirão para a resolução dos exercícios de 1 a 4. Ano Produção (em 1 000) Ano Produção (em 1 000) 1994 1 286,40 2001 1 547,50 1995 1 324,40 2002 1 585,50 1996 1 368,70 2003 1 625,20 1997 1 426,90 2004 1 684,30 1998 1 478,60 2005 1 738,10 1999 1 511,10 2006 1 801,10 2000 1 533,40 2007 1 855,40 1. Determine a forma do modelo através do método de mínimos qua- drados. 2. Construa os gráficos de linha e o gráfico da regressão. 3. Quais os valores esperados de venda do componente eletrônico para os anos de 2008 e 2009? 4. Faça uma análise das flutuações cíclicas através do cálculo da percen- tagem de tendência. As despesas em novas instalações e equipamentos das indústrias ma- nufatureiras no período de 1987 a 2006, em milhões de reais, são apre- sentadas na tabela a seguir. Faça as análises propostas nos exercícios de 5 a 7 acompanhadas dos respectivos gráficos: Ano Despesas Ano Despesas 1987 11,44 1997 22,45 1988 14,97 1998 26,991989 15,96 1999 28,51 1990 11,44 2000 28,37 1991 12,08 2001 31,68 1992 14,48 2002 31,95 Análise de séries temporais 275 Ano Despesas Ano Despesas 1993 13,68 2003 29,99 1994 14,68 2004 31,35 1995 15,69 2005 38,01 1996 18,58 2006 46,10 5. Utilizar a técnica de médias móveis com k = 2 para fazer a previsão de vendas de automóveis para os anos de 2007 e 2008. 6. Fazer as mesmas previsões do exercício 5 utilizando a técnica de mé- dias móveis com k = 4. 7. Comparar os resultados obtidos nos exercícios 5 e 6 através da deter- minação do Erro Médio Quadrático (EMQ) de cada ano. Qual técnica mostrou-se mais adequada para a análise proposta? 8. A tabela a seguir apresenta as vendas mensais em milhões de reais por parte de fábricas de carros de passageiros para o período de janeiro de 2003 a dezembro de 2007. Determinar uma nova série utilizando a primeira etapa do método de médias móveis para retirada da sazona- lidade. Ano Mês Vendas Ano Mês Vendas 2004 Janeiro 545,00 2006 Janeiro 666,00 Fevereiro 528,40 Fevereiro 716,10 Março 594,40 Março 765,20 Abril 627,20 Abril 736,90 Maio 684,40 Maio 798,00 Junho 738,40 Junho 761,60 Julho 464,30 Julho 393,60 Agosto 254,00 Agosto 371,00 Setembro 454,20 Setembro 808,80 Outubro 365,40 Outubro 841,70 Novembro 341,10 Novembro 827,40 Dezembro 570,60 Dezembro 666,20 276 Análise de séries temporais Ano Mês Vendas Ano Mês Vendas 2005 Janeiro 678,10 2007 Janeiro 859,80 Fevereiro 719,00 Fevereiro 815,50 Março 815,90 Março 882,80 Abril 736,60 Abril 786,60 Maio 716,70 Maio 880,10 Junho 761,30 Junho 873,30 Julho 468,00 Julho 677,50 Agosto 457,60 Agosto 415,70 Setembro 712,00 Setembro 666,10 Outubro 758,60 Outubro 887,20 Novembro 736,60 Novembro 827,10 Dezembro 593,20 Dezembro 745 Gabarito 1. Com o quadro a seguir, é possível determinar o sistema de equações normais da análise de regressão: ∑Y = na + b∑X ∑XY = a∑X + b∑X2 Observe que os anos (X) podem ser reescritos de 1 a 14 ou da forma como está na tabela, de dois em dois anos, para se fazer ΣX = 0. Isso facilita as contas e o sistema pode ser escrito como: ∑Y = na ∑XY = b∑X2 X Y XY X2 Yest –13 1 286,4 –16 723,2 169 1 287,08 –11 1 324,4 –14 568,4 121 1 328,26 Análise de séries temporais 277 X Y XY X2 Yest –9 1 368,7 –12 318,3 81 1 369,44 –7 1 426,9 –9 988,3 49 1 410,62 –5 1 478,6 –7 393,0 25 1 451,80 –3 1 511,1 –4 533,3 9 1 492,99 –1 1 533,4 -1 533,4 1 1 534,17 1 1 547,5 1 547,5 1 1 575,35 3 1 585,5 4 756,5 9 1 616,53 5 1 625,2 8 126,0 25 1 657,71 7 1 684,3 11 790,1 49 1 698,89 9 1 738,1 15 642,9 81 1 740,07 11 1 801,1 19 812,1 121 1 781,25 13 1 855,4 24 120,2 169 1 822,43 0 21 766,6 18 737,4 910 Dessa forma: a = ∑Y n b = ∑XY ∑X2 Assim, 21 766,6 1 554,76 14 = =a 18 737, 4 20,59 910 = =b O modelo será então: Ŷ = a + bX = 1557,76 + 20,59X. 278 Análise de séries temporais 2. O gráfico adequado para representar uma série temporal é o chamado gráfico de linhas: Gráfico de linhas 1200 1300 1400 1500 1600 1700 1800 1900 Ve nd as 1 141312111098765432 Tempo Para a análise de regressão entre os pontos, traça-se a reta de regressão ou reta de tendência: Gráfico de regressão 1200 1300 1400 1500 1600 1700 1800 1900 Ve nd as 0 Tempo 5 10 15 3. Os valores esperados de venda para os anos de 2008 e 2009 podem ser obtidos substituindo os valores correspondentes a esses anos na equação da reta de regressão. Para 2008, o valor de X será igual a 15 e para 2009 será igual a 17. Assim: Para X = 15, Análise de séries temporais 279 Ŷ = 1 557,76 + 20,59X = 1 557,76 + 20,59(15) = 1 863,615. Ou seja, o valor esperado de vendas para 2008 é de 1 863 615 compo- nentes. Para X = 17, Ŷ = 1 557,76 + 20,59X = 1 557,76 + 20,59(17) = 1 904,796. Ou seja, o valor esperado de vendas para 2009 é de 1 904 796 com- ponentes. 4. As flutuações cíclicas podem ser verificadas através da determinação da percentagem de tendência, Y .100 Ŷ . Y Yest (Y/Yest)100 1 286,4 1 287,08 99,95 1 324,4 1 328,26 99,71 1 368,7 1 369,44 99,95 1 426,9 1 410,62 101,15 1 478,6 1 451,80 101,85 1 511,1 1 492,99 101,21 1 533,4 1 534,17 99,95 1 547,5 1 575,35 98,23 1 585,5 1 616,53 98,08 1 625,2 1 657,71 98,04 1 684,3 1 698,89 99,14 1 738,1 1 740,07 99,89 1 801,1 1 781,25 101,11 1 855,4 1 822,43 101,81 280 Análise de séries temporais Percentagem de tendência 90,00 92,00 94,00 96,00 98,00 100,00 102,00 104,00 % te nd ên ci a 0 Tempo 15 106,00 108,00 110,00 105 Observa-se que os dados oscilam em torno do valor 100%. 5. As médias móveis para k = 2 são determinadas como as médias dos dois anos anteriores. O valor 13,21 é a média entre 11,44 e 14,97. O valor 15,47 é a média entre 14,97 e 15,96, e assim por diante. Ano Despesas k = 2 1987 11,44 1988 14,97 1989 15,96 13,21 1990 11,44 15,47 1991 12,08 13,70 1992 14,48 11,76 1993 13,68 13,28 1994 14,68 14,08 1995 15,69 14,18 1996 18,58 15,19 1997 22,45 17,14 1998 26,99 20,52 1999 28,51 24,72 2000 28,37 27,75 Análise de séries temporais 281 Ano Despesas k = 2 2001 31,68 28,44 2002 31,95 30,03 2003 29,99 31,82 2004 31,35 30,97 2005 38,01 30,67 2006 46,10 34,68 Média móvel para k = 2 0 5 10 15 20 25 30 35 D es pe sa s 1 Tempo 3 17 19 40 45 50 13 159 1175 Série 1 Série 2 A previsão para 2007 é feita como a média entre os anos 2005 e 2006, então: 2005 2006 2007 38,01 46,10ˆ 42,06 2 2 + += = = Y Y Y O valor previsto de despesas para 2007 é de R$42,06 milhões. A previsão para 2008 é feita como a média entre os anos 2006 e 2007. Como o valor para 2007 não é conhecido, utiliza-se o valor calculado da estimativa Ŷ2007 = 42,06: 2006 2007 2008 ˆ 46,10 42,06ˆ 44,08 2 2 + += = = Y Y Y O valor previsto de despesas para 2008 é de R$44,08 milhões. 282 Análise de séries temporais 6. As médias móveis para k = 4 são determinadas como as médias dos quatro anos anteriores. O valor 13,45 é a média entre 11,44, 14,97, 15,96 e 11,44. O valor 13,61 é a média entre 14,97, 15,96, 11,44 e 12,08 e assim por diante. Ano Despesas k = 4 1987 11,44 1988 14,97 1989 15,96 1990 11,44 1991 12,08 13,45 1992 14,48 13,61 1993 13,68 13,49 1994 14,68 12,92 1995 15,69 13,73 1996 18,58 14,63 1997 22,45 15,66 1998 26,99 17,85 1999 28,51 20,93 2000 28,37 24,13 2001 31,68 26,58 2002 31,95 28,89 2003 29,99 30,13 2004 31,35 30,50 2005 38,01 31,24 2006 46,10 32,83 Análise de séries temporais 283 Média móvel para k = 4 0 10 20 30 D es pe sa s 1 Tempo 3 17 19 40 50 13 159 1175 Despesas k = 4 A previsão para 2007 é feita como a média entre os anos 2003, 2004, 2005 e 2006, então: 2003 2004 2005 2006 2007 29,99 31,35 38,01 46,10ˆ 36,36 4 4 + + + + + += = = Y Y Y Y Y O valor previsto de despesas para 2007 é de R$36,36 milhões. A previsão para 2008 é feita como a média entre os anos 2004, 2005, 2006 e 2007. Como o valor para 2007 não é conhecido, utiliza-se o va- lor calculado da estimativa Ŷ2007 = 36,36. 2004 2005 2006 2007 2008 ˆ 31,35 38,01 46,10 36,36ˆ 37,96 4 4 + + + + + += = = Y Y Y Y Y O valor previsto de despesas para 2008 é de R$ 37,96 milhões. 7. Comparar o EMQ para k = 2 e para k = 4. Ano Despesas k = 2 k = 4 EMQ k = 2 EMQ k = 4 1987 11,44 1988 14,97 1989 15,96 13,21 7,5900 1990 11,44 15,47 16,2006 284 Análise de séries temporais Ano Despesas k = 2 k = 4 EMQ k = 2 EMQ k = 4 1991 12,08 13,70 13,45 2,6244 1,8838 1992 14,48 11,76 13,61 7,3984 0,7526 1993 13,68 13,28 13,49 0,1600 0,0361 1994 14,68 14,08 12,92 0,3600 3,0976 1995 15,69 14,18 13,73 2,2801 3,8416 1996 18,58 15,19 14,63 11,5260 15,5828 1997 22,45 17,14 15,66 28,2492 46,1381 1998 26,99 20,52 17,85 41,9256 83,5396 1999 28,51 24,72 20,93 14,3641 57,4943 2000 28,37 27,75 24,13 0,3844 17,9564 2001 31,68 28,44 26,58 10,4976 26,0100 2002 31,95 30,03 28,89 3,7056 9,3789 2003 29,99 31,82 30,13 3,3306 0,0189 2004 31,35 30,97 30,50 0,1444 0,7268 2005 38,01 30,67 31,24 53,8756 45,7991 200646,10 34,68 32,83 130,4164 176,2256 EMQ = 19 30,53 EMQ(k = 2) = 19 e EMQ(k = 4) = 30,53. Como o EMQ para média móvel com dois valores é menor do que para quatro, o método é mais adequado para duas médias. Observando os valores previstos para 2007, percebemos que o valor previsto para as despesas para k = 2 é de R$42,02 milhões, enquanto para k = 4 o valor das despesas previstas é de R$36,36 milhões. De fato, o valor previsto para 2007 com duas médias parece ser o mais adequado. 8. As médias móveis calculadas a seguir correspondem a médias que envolvem 13 medidas cada uma e 24 valores, conforme técnica apresenta no texto. Análise de séries temporais 285 Ano Mês Vendas Total 1 Total 2 Média móvel 2004 Janeiro 545,00 Fevereiro 528,40 Março 594,40 Abril 627,20 Maio 684,40 Junho 738,40 Julho 464,30 Agosto 254,00 Setembro 454,20 Outubro 365,40 Novembro 341,10 6 167,40 12 467,90 519,50 Dezembro 570,60 6 300,50 12 791,60 532,98 2005 Janeiro 678,10 6 491,10 13 203,70 550,15 Fevereiro 719,00 6 712,60 13 534,60 563,94 Março 815,90 6 822,00 13 676,30 569,85 Abril 736,60 6 854,30 13 731,50 572,15 Maio 716,70 6 877,20 13 758,10 573,25 Junho 761,30 6 880,90 13 965,40 581,89 Julho 468,00 7 084,50 14 426,80 601,12 Agosto 457,60 7 342,30 15 077,80 628,24 Setembro 712,00 7 735,50 15 866,50 661,10 Outubro 758,60 8 131,00 16 284,60 678,53 Novembro 736,60 8 153,60 16 295,10 678,96 Dezembro 593,20 8 141,50 16 280,10 678,34 2006 Janeiro 666,00 8 138,60 16 226,50 676,10 Fevereiro 716,10 8 087,90 16 176,10 674,00 Março 765,20 8 088,20 16 257,70 677,40 Abril 736,90 8 169,50 16 339,30 680,80 286 Análise de séries temporais Ano Mês Vendas Total 1 Total 2 Média móvel Maio 798,00 8 169,80 16 265,20 677,72 Junho 761,60 8 095,40 16 104,20 671,01 Julho 393,60 8 008,80 16 114,40 671,43 Agosto 371,00 8 105,60 16 294,30 678,93 Setembro 808,80 8 188,70 16 468,20 686,18 Outubro 841,70 8 279,50 16 632,00 693,00 Novembro 827,40 8 352,50 16 898,80 704,12 Dezembro 666,20 8 546,30 17 192,00 716,33 2007 Janeiro 859,80 8 645,70 17 409,00 725,38 Fevereiro 815,50 8 763,30 17 576,30 732,35 Março 882,80 8 813,00 17 708,10 737,84 Abril 786,60 8 895,10 17 901,90 745,91 Maio 880,10 9 006,80 18 297,50 762,40 Junho 873,30 9 290,70 18 626,10 776,09 Julho 677,50 9 335,40 18 528,10 772,00 Agosto 415,70 9 192,70 18 430,90 767,95 Setembro 666,10 9 238,20 18 476,10 769,84 Outubro 887,20 9 237,90 18 554,60 773,11 Novembro 827,10 9 316,70 Dezembro 745,00 Análise de séries temporais 287 O gráfico a seguir apresenta a retirada da sazonalidade propiciada pelo método: Gráfico de linhas 300,00 600,00 700,00 800,00 Ve nd as Tempo 900,00 1000,00 400,00 500,00 Série 1 Série 2 1 4 7 10 13 16 19 22 25 28 31 34 288 Análise de séries temporais
Compartilhar