Buscar

Biblioteca aula06

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

INTELIGÊNCIA EMPRESARIAL
Aula 6 – Modelagem de Data Warehouse
Conteúdo Programático desta aula
Modelagem Multidimensional
Modelo Esquema Estrela
Modelo Floco de Neve
Exercícios
 
2
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
2
MODELAGEM DE DADOS PARA O DW
A modelagem de dados para DW é diferente da utilizada para sistemas OLTP.
Se simplesmente movermos o modelo de dados transacional para um banco de dados separado, inserirmos dados históricos e chamarmos de DW não conseguiremos trabalhar com estes dados por duas razões principais:
3
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
3
MODELAGEM DE DADOS PARA O DW
Os usuários não ficarão felizes porque a complexidade será muito alta, para que eles próprios possam realizar consultas ad hoc
Modelos de dados transacionais são construídos respeitando a Terceira Forma Normal e não respondem com rapidez a questões típicas de queries de apoio á decisão
4
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
4
MODELAGEM DE DADOS PARA O DW
A Modelagem Multidimensional é uma técnica de concepção e visualização de um Modelo de Dados de um conjunto de medidas que descrevem aspectos comuns de negócios.
É utilizada especialmente para sumarizar e reestruturar dados e apresenta-los em visões que suportem a análise dos valores desses dados.
5
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
5
MODELAGEM DE DADOS PARA O DW - Multidimensional
Facilita o entendimento e visualização de problemas típicos de suporte à decisão;
Mais intuitiva para o processamento analítico;
Utilizada pelas ferramentas OLAP.
6
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
6
DW - Modelagem
Na modelagem tradicional usamos a normalização para:
Evitar redundâncias e garantir consistência
Gastar o menor espaço possível
Ex:	 Vendas (CodRev, Grupo, Valor)
	 Revendedoras (CodRev, Nome)
	 Grupos (Grupo, Nome Grupo)
7
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
7
DW - Modelagem
Em DW privilegiamos a velocidade da consulta
A normalização torna-se irrelevante
Ex:	Vendas (CodRev, Nome, Grupo, Nome Grupo, Valor)
8
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
8
DW - Modelagem
Vantagem:
As consultas ficam muito mais rápidas
Os dados ficam mais intuitivos para os usuários
Desvantagem:
Gasta-se muito mais espaço (que ficou barato hoje em dia)
9
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
9
DW - Modelagem
Um modelo multidimensional é formado por três elementos básicos:
 Fatos;
 Dimensões;
 Medidas ( Variáveis ) 
10
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
10
MODELAGEM DE DADOS PARA O DW - FATO
Representação de um assunto
Um assunto pode ser um dado operacional, uma transação do negócio ou um evento
Um fato é composto por dimensões e medidas
Exemplos (domínio Loja):
– vendas (transação do negócio)
– promoções (evento)
– produtos e estoque (dado operacional)
11
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
11
MODELAGEM DE DADOS PARA O DW - DIMENSÃO
Representação dos contextos relevantes para a análise de um fato.
• Exemplo:
– Fato: Vendas
– Dimensões: Clientes, Produtos, Tempo, Locais, ...
• Uma dimensão pode:
– conter membros
– ser organizada em hierarquias
12
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
12
MODELAGEM DE DADOS PARA O DW - DIMENSÃO
São as possíveis formas de visualizar os dados, ou seja, são os “por” dos dados: “por mês”, “por produto”, “por país”, “por região”, etc.
Normalmente não possuem atributos numéricos, são somente descritivas e classificatórias dos elementos que participam de um fato.
13
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
13
MODELAGEM DE DADOS PARA O DW - MEDIDA
 Representação de atributos (variáveis) relevantes para a análise de um fato:
– valores numéricos em geral
– indicadores de desempenho para a análise
14
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
14
MODELAGEM DE DADOS PARA O DW - MEDIDA
 Uma medida é determinada pela associação de dimensões
– produto X tempo.ano;
- local.estado X cliente.classe X tempo.semana.dia
• Exemplo:
– Fato: Vendas
– Medidas: quantidade vendida, valor da venda
15
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
15
MODELAGEM DE DADOS PARA O DW - MEDIDA
São os atributos numéricos que representam um fato, a performance de um indicador de negócios relativo às dimensões que participam desse fato.
Uma medida é determinada pela combinação das dimensões que participam de um fato, e estão localizadas como atributos de um fato.
16
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
16
Tabela Fato
 Chave composta
 Tempo é sempre parte da chave
 Usualmente numérica
 Variáveis tipicamente aditivas
17
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
17
Tabelas Dimensões
Chave simples
Serve como cabeçalho das linhas e colunas das análises e filtro nas consultas
Descrição única para cada registro
Usualmente não dependente do tempo
Desnormalizada
Hierarquias implícitas
18
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
18
UMA NOVA FORMA DE VER OS DADOS
 
Uma visão multidimensional é usualmente representada por um cubo
 O cubo é apenas uma metáfora visual, dá a impressão de múltiplas dimensões.
 Os “cubos” podem ter 2, 3, 4 ou mais dimensões
19
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
19
UMA NOVA FORMA DE VER OS DADOS
 
O usuário pode rolar e cortar (“slice and dice”) o cubo, escolhendo qual a dimensão(ões) que será usada em cada consulta (query)
 É uma representação intuitiva do evento porque todas as dimensões coexistem para todo ponto no cubo e são independentes umas das outras.
20
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
20
UMA NOVA FORMA DE VER OS DADOS
21
(Fonte: http://www.inf.ufsc.br/~ronaldo/ine5342/6-dw.pdf)
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
21
VISUALIZAÇÃO - EXEMPLO - Cubo do Fato Vendas
	
22
(Fonte: http://www.inf.ufsc.br/~ronaldo/ine5342/6-dw.pdf)
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
22
Uma dimensão …. 
	
23
Utilizando-se uma única dimensão (Região) para obter a agregação de um fato relacionado (Vendas):
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
23
Duas Dimensões ………. 
	
24
Utilizando-se duas dimensões (Região e Tempo) para obter a agregação de um fato relacionado
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
24
Três Dimensões …. 
	
25
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
25
UMA NOVA FORMA DE VER OS DADOS
26
Cada nova dimensão aumenta o nível de detalhe.
Acrescentando-se uma quarta dimensão (Produto) é possível analisar as Vendas por Produto, por Linha de produtos, por Trimestre, por Região.
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
26
“Aplanando” a Visão Multidimensional	
27
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
27
Modelo Dimensional - Diagrama Estrela ( Star Schema )
Star Schema é o termo comum para designação de modelos de dados multidimensionais;
Como o termo esquema nos leva diretamente a uma ideia de modelo físico, o mais usual é denominarmos de modelo estrela;
28
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
28
Modelo Dimensional - Diagrama Estrela ( Star Schema )
O modelo estrela é a estrutura básica de um modelo de dados multidimensional
Sua composição típica possui uma grande entidade central denominada fato e um conjunto de entidades menores denominadas dimensões, arranjadas ao redor dessa entidade central, formando uma estrela
29
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
29
Modelo Dimensional
- Diagrama Estrela ( Star Schema )
30
Modelo dimensional de um assunto ou negócio
Cada face representa uma dimensão ou perspectiva de interesse do negócio.
O núcleo contém medidas do negócio tomadas na interseção das faces.
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
30
Modelo Dimensional - Diagrama Estrela ( Star Schema )
31
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
31
Modelo Dimensional - Diagrama Estrela ( Star Schema )
32
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
32
A Tabela FATO
33
Contém os atributos de identificação
Armazenam os “números” da empresa
Cada conjunto de “Fatos” é baseado na interseção de cada combinação dos atributos dimensionais
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
33
Junção lógica entre tabelas Fato e Dimensão
34
Fonte: Prof. Clodis Boscarioli
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
34
Performance do Modelo Estrela
35
As tabelas Fato contêm a maioria das linhas de dados
As Dimensões tendem a ter um número menor de linhas
Os “Joins” em um Modelo Estrela tipicamente envolvem uma tabela fato grande e uma ou mais tabelas Dimensão pequenas, o que torna a operação mais rápida
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
35
Comparação dos Esquemas
36
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
36
Diagrama Floco de Neve ( Snowflake )
O modelo Snowflake é o resultado da decomposição de uma ou mais dimensões que possuam hierarquias entre seus membros;
Podemos definir relacionamento muitos para um entre os membros em uma dimensão, formando uma hierarquia por meio desses relacionamentos entre entidades dimensões;
 O modelo floco de neve é resultado da aplicação da terceira forma normal sobre as entidades dimensão
37
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
37
Diagrama Floco de Neve ( Snowflake )
38
(Fonte: http://www.inf.ufsc.br/~ronaldo/ine5342/6-dw.pdf)
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
38
Diagrama Floco de Neve ( Snowflake )
 
 Variante do modelo estrela
	Tabelas de dimensões estão normalizadas (3FN)
	Representação explícita das hierarquias
 Vantagem
	Evita redundância (mais economia de espaço)
39
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
39
Diagrama Floco de Neve ( Snowflake )
 
 
 Desvantagem
	– maior número de tabelas (maior número de junções)
 Modelo estrela é considerado mais apropriado
	- desperdício de espaço é menos crítico que tempo para 		recuperação de dados em um DW
40
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
40
Modelo Floco de Neve x Modelo Estrela
 
Segundo Felipe Nery, é mais vantajoso utilizar o Modelo Estrela que o Floco de Neve
Através de pesquisa na Internet ele obteve dados que comprovam em testes esta afirmação
Vejamos dois modelos desenvolvidos de forma diferente mas que acessam o mesmo fato
41
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
41
Modelo Floco de Neve x Modelo Estrela
 
O primeiro tem as dimensões separadas em hierarquias, uma tabela para cada nível ( snowflake )
A hierarquia obedece ao relacionamento das tabelas de dimensão
O segundo modelo possui as mesmas dimensões, com todos os níveis em só tabela ( estrela )
42
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
42
Modelo Floco de Neve
 
43
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
43
Modelo Estrela
 
44
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
44
Modelo Floco de Neve x Modelo Estrela
 
Os testes de acesso às tabelas fato nos dois modelos apresentaram uma diferença de 30% no tempo de acesso no modelo snowflake 
Os testes foram realizados com as seguintes populações: 
Modelo Estrela
Tempo: 6209 linhas
Produto: 50 linhas
Local: 50 linhas
Fato: 100.064 linhas
45
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
45
Modelo Floco de Neve x Modelo Estrela
 
Modelo Snowflake
Ano: 8 linhas
Semestre: 16 linhas
Trimestre: 32 linhas
Mês: 96 linhas
Dia: 2.922 linhas
Produto: 50 linhas
Família: 5 linhas
Linha: 2 linhas
Fato: 100.064 linhas
46
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
46
Modelo Floco de Neve x Modelo Estrela
 
Se aplicarmos um cálculo matemático simples para realizar a querie de todas as ocorrências do fato no modelo estrela, teremos um resultado de 1,553.243.440.000 linhas. Para o conjunto de ocorrências de linhas de tabela no modelo snowflake, teremos o número de 57.485.624.868.864.000 linhas resultantes.
47
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
47
Modelo Floco de Neve x Modelo Estrela
 
Serão necessários mais junções e, consequentemente, mais tempo.
O modelo snowflake é esteticamente mais semântico para a visualização das hierarquias 
48
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
48
Esquema Constelação
União de esquemas estrela e/ou floco de neve
– esquema estrela: modela em geral um Data Mart
– esquema constelação: modela o DW
Constelação de Fatos
Constelação de fatos são exemplos de estruturas mais complexas nas quais múltiplas tabelas fato compartilham tabelas dimensão
49
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
49
Esquema Constelação
50
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
50
51
EC: Cinema
INTELIGÊNCIA EMPRESARIAL – AULA 6
INTELIGÊNCIA EMPRESARIAL 
51

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Outros materiais