Buscar

Data Science (1)

Prévia do material em texto

Alex Cunha
Princípios e Técnicas
Data Science
Séries
Temporais
 É um conjunto de observações sobre
uma variável, ordenado no tempo, e
registrado em períodos regulares.
Alex Cunha | @iamalex.com.br
Item 1 Item 2 Item 3 Item 4 Item 5
40 
30 
20 
10 
0 
Objetivo
Identificar padrões não aleatórios na
série temporal de uma variável de
interesse, e a observação deste
comportamento passado pode
permitir fazer previsões sobre o
futuro, orientando a tomada de
decisões.
Alex Cunha | @iamalex.com.br
T
Tendência
C
Variação Cíclica
S
Sazonalidade
Modelo Clássico das
Séries Temporais
Segundo o modelo clássico todas as séries
temporais são compostas de quatro
padrões:
I
Variação Irregular
Alex Cunha | @iamalex.com.br
Tendência
É o comportamento de longo prazo
da série, que pode ser causada pelo
crescimento demográfico, ou
mudança gradual de hábitos de
consumo, ou qualquer outro aspecto
que afete a variável de interesse no
longo prazo.
Alex Cunha | @iamalex.com.br
Variação Cíclica
Flutuações nos valores da variável com
duração superior a um ano, e que se
repetem com certa periodicidade, que
podem ser resultado de variações da
economia como períodos de crescimento
ou recessão, ou fenômenos climáticos . 
Alex Cunha | @iamalex.com.br
Variação Sazonal
São flutuações nos valores da variável com
duração inferior a um ano, e que se
repetem todos os anos, geralmente em
função das estações do ano (ou em função
de feriados ou festas populares, ou por
exigências legais, como o período para
entrega da declaração de Imposto de
Renda); se os dados forem registrados
anualmente NÃO haverá influência da
sazonalidade na série.
Alex Cunha | @iamalex.com.br
Variações Irregulares
 São as flutuações inexplicáveis, resultado
de fatos fortuitos e inesperados como
catástrofes naturais, atentados terroristas
como o de 11 de setembro de 2001,
decisões intempestivas de governos, etc.
Alex Cunha | @iamalex.com.br
Modelo Aditivo
O valor da série (Y) será o resultado da soma dos
valores das componentes (que apresentam a
mesma unidade da variável):
Y = T + C + S + I
Y = T + C + I (se os dados forem registrados
anualmente)
Alex Cunha | @iamalex.com.br
Modelo
Multiplicativo
O produto das componentes resultará na
variável da série:
Y = T x C x S x I ou
Y = T x C x I (se os dados forem registrados
anualmente)
Alex Cunha | @iamalex.com.br
Prática
import pandas as pd
loja=pd.read_csv('alucar.csv')
loja.head()
loja.dtypes
loja['mes'] = pd.to_datetime(loja['mes'])
loja.dtypes
import seaborn as sns
from matplotlib import pyplot as plt
sns.lineplot(x='mes', y='vendas', data=loja)
1.
2.
3.
4.
5.
6.
7.
8.
9.
Alex Cunha | @iamalex.com.br
Prática
sns.set_palette('Accent')
sns.set_style('darkgrid') 
ax = sns.lineplot(x='mes', y='vendas', data=loja)
ax.figure.set_size_inches(12,6)
ax.set_title('Vendas Balcão de 2017 e 2018', loc='left', fontsize=18)
ax.set_xlabel('Meses', fontsize=14)
ax.set_ylabel('Vendas (R$)', fontsize=14)
ax = ax 
1.
2.
3.
4.
5.
6.
7.
8.
Alex Cunha | @iamalex.com.br
1 - Paleta de Cores 
2- Estilo
4 - Aumentar o tamanho do gráfico
5 - loc-Alinhamento do Titulo
8 - Ocultar titulo gerado
O que mais
podemos
extrair do
DataFrame?
Prática
loja['aumento'] = loja['vendas'].diff()
loja.head()
1.
2.
Alex Cunha | @iamalex.com.br
1 - Subtrair o valor das vendas do mês atual - anterior
Prática
sns.set_palette('Accent')
sns.set_style('darkgrid') 
ax = sns.lineplot(x='mes', y='vendas', data=loja)
ax.figure.set_size_inches(12,6)
ax.set_title('Aumento das Vendas Balcão de 2017 e 2018',
loc='left', fontsize=18)
ax.set_xlabel('Meses', fontsize=14)
ax.set_ylabel('Vendas (R$)', fontsize=14)
ax = ax 
1.
2.
3.
4.
5.
6.
7.
8. Alex Cunha | @iamalex.com.br
Prática
def plotar(titulo, labelx, labely, x, y, dataset):
 sns.set_palette('Accent')
 sns.set_style('darkgrid') 
 ax = sns.lineplot(x=x, y=y, data=dataset)
 ax.figure.set_size_inches(12,6)
 ax.set_title(titulo, loc='left', fontsize=18)
 ax.set_xlabel(labelx, fontsize=14)
 ax.set_ylabel(labely, fontsize=14)
 ax = ax 
1.
2.
3.
4.
5.
6.
7.
8.
9.
Alex Cunha | @iamalex.com.br
Prática
loja['aceleracao'] = loja['aumento'].diff()
loja.head()
plotar('Aceleração das vendas da Loja de 2017 a 2018',
'Tempo','Aceleração', 'mes','aceleracao', loja)
 
1.
2.
3.
4.
Alex Cunha | @iamalex.com.br

Continue navegando