Baixe o app para aproveitar ainda mais
Prévia do material em texto
Alex Cunha Princípios e Técnicas Data Science Séries Temporais É um conjunto de observações sobre uma variável, ordenado no tempo, e registrado em períodos regulares. Alex Cunha | @iamalex.com.br Item 1 Item 2 Item 3 Item 4 Item 5 40 30 20 10 0 Objetivo Identificar padrões não aleatórios na série temporal de uma variável de interesse, e a observação deste comportamento passado pode permitir fazer previsões sobre o futuro, orientando a tomada de decisões. Alex Cunha | @iamalex.com.br T Tendência C Variação Cíclica S Sazonalidade Modelo Clássico das Séries Temporais Segundo o modelo clássico todas as séries temporais são compostas de quatro padrões: I Variação Irregular Alex Cunha | @iamalex.com.br Tendência É o comportamento de longo prazo da série, que pode ser causada pelo crescimento demográfico, ou mudança gradual de hábitos de consumo, ou qualquer outro aspecto que afete a variável de interesse no longo prazo. Alex Cunha | @iamalex.com.br Variação Cíclica Flutuações nos valores da variável com duração superior a um ano, e que se repetem com certa periodicidade, que podem ser resultado de variações da economia como períodos de crescimento ou recessão, ou fenômenos climáticos . Alex Cunha | @iamalex.com.br Variação Sazonal São flutuações nos valores da variável com duração inferior a um ano, e que se repetem todos os anos, geralmente em função das estações do ano (ou em função de feriados ou festas populares, ou por exigências legais, como o período para entrega da declaração de Imposto de Renda); se os dados forem registrados anualmente NÃO haverá influência da sazonalidade na série. Alex Cunha | @iamalex.com.br Variações Irregulares São as flutuações inexplicáveis, resultado de fatos fortuitos e inesperados como catástrofes naturais, atentados terroristas como o de 11 de setembro de 2001, decisões intempestivas de governos, etc. Alex Cunha | @iamalex.com.br Modelo Aditivo O valor da série (Y) será o resultado da soma dos valores das componentes (que apresentam a mesma unidade da variável): Y = T + C + S + I Y = T + C + I (se os dados forem registrados anualmente) Alex Cunha | @iamalex.com.br Modelo Multiplicativo O produto das componentes resultará na variável da série: Y = T x C x S x I ou Y = T x C x I (se os dados forem registrados anualmente) Alex Cunha | @iamalex.com.br Prática import pandas as pd loja=pd.read_csv('alucar.csv') loja.head() loja.dtypes loja['mes'] = pd.to_datetime(loja['mes']) loja.dtypes import seaborn as sns from matplotlib import pyplot as plt sns.lineplot(x='mes', y='vendas', data=loja) 1. 2. 3. 4. 5. 6. 7. 8. 9. Alex Cunha | @iamalex.com.br Prática sns.set_palette('Accent') sns.set_style('darkgrid') ax = sns.lineplot(x='mes', y='vendas', data=loja) ax.figure.set_size_inches(12,6) ax.set_title('Vendas Balcão de 2017 e 2018', loc='left', fontsize=18) ax.set_xlabel('Meses', fontsize=14) ax.set_ylabel('Vendas (R$)', fontsize=14) ax = ax 1. 2. 3. 4. 5. 6. 7. 8. Alex Cunha | @iamalex.com.br 1 - Paleta de Cores 2- Estilo 4 - Aumentar o tamanho do gráfico 5 - loc-Alinhamento do Titulo 8 - Ocultar titulo gerado O que mais podemos extrair do DataFrame? Prática loja['aumento'] = loja['vendas'].diff() loja.head() 1. 2. Alex Cunha | @iamalex.com.br 1 - Subtrair o valor das vendas do mês atual - anterior Prática sns.set_palette('Accent') sns.set_style('darkgrid') ax = sns.lineplot(x='mes', y='vendas', data=loja) ax.figure.set_size_inches(12,6) ax.set_title('Aumento das Vendas Balcão de 2017 e 2018', loc='left', fontsize=18) ax.set_xlabel('Meses', fontsize=14) ax.set_ylabel('Vendas (R$)', fontsize=14) ax = ax 1. 2. 3. 4. 5. 6. 7. 8. Alex Cunha | @iamalex.com.br Prática def plotar(titulo, labelx, labely, x, y, dataset): sns.set_palette('Accent') sns.set_style('darkgrid') ax = sns.lineplot(x=x, y=y, data=dataset) ax.figure.set_size_inches(12,6) ax.set_title(titulo, loc='left', fontsize=18) ax.set_xlabel(labelx, fontsize=14) ax.set_ylabel(labely, fontsize=14) ax = ax 1. 2. 3. 4. 5. 6. 7. 8. 9. Alex Cunha | @iamalex.com.br Prática loja['aceleracao'] = loja['aumento'].diff() loja.head() plotar('Aceleração das vendas da Loja de 2017 a 2018', 'Tempo','Aceleração', 'mes','aceleracao', loja) 1. 2. 3. 4. Alex Cunha | @iamalex.com.br
Compartilhar