Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
INTELIGÊNCIA EMPRESARIAL Aula 6 – Modelagem de Data Warehouse Conteúdo Programático desta aula Modelagem Multidimensional Modelo Esquema Estrela Modelo Floco de Neve Exercícios 2 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 2 MODELAGEM DE DADOS PARA O DW A modelagem de dados para DW é diferente da utilizada para sistemas OLTP. Se simplesmente movermos o modelo de dados transacional para um banco de dados separado, inserirmos dados históricos e chamarmos de DW não conseguiremos trabalhar com estes dados por duas razões principais: 3 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 3 MODELAGEM DE DADOS PARA O DW Os usuários não ficarão felizes porque a complexidade será muito alta, para que eles próprios possam realizar consultas ad hoc Modelos de dados transacionais são construídos respeitando a Terceira Forma Normal e não respondem com rapidez a questões típicas de queries de apoio á decisão 4 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 4 MODELAGEM DE DADOS PARA O DW A Modelagem Multidimensional é uma técnica de concepção e visualização de um Modelo de Dados de um conjunto de medidas que descrevem aspectos comuns de negócios. É utilizada especialmente para sumarizar e reestruturar dados e apresenta-los em visões que suportem a análise dos valores desses dados. 5 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 5 MODELAGEM DE DADOS PARA O DW - Multidimensional Facilita o entendimento e visualização de problemas típicos de suporte à decisão; Mais intuitiva para o processamento analítico; Utilizada pelas ferramentas OLAP. 6 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 6 DW - Modelagem Na modelagem tradicional usamos a normalização para: Evitar redundâncias e garantir consistência Gastar o menor espaço possível Ex: Vendas (CodRev, Grupo, Valor) Revendedoras (CodRev, Nome) Grupos (Grupo, Nome Grupo) 7 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 7 DW - Modelagem Em DW privilegiamos a velocidade da consulta A normalização torna-se irrelevante Ex: Vendas (CodRev, Nome, Grupo, Nome Grupo, Valor) 8 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 8 DW - Modelagem Vantagem: As consultas ficam muito mais rápidas Os dados ficam mais intuitivos para os usuários Desvantagem: Gasta-se muito mais espaço (que ficou barato hoje em dia) 9 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 9 DW - Modelagem Um modelo multidimensional é formado por três elementos básicos: Fatos; Dimensões; Medidas ( Variáveis ) 10 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 10 MODELAGEM DE DADOS PARA O DW - FATO Representação de um assunto Um assunto pode ser um dado operacional, uma transação do negócio ou um evento Um fato é composto por dimensões e medidas Exemplos (domínio Loja): – vendas (transação do negócio) – promoções (evento) – produtos e estoque (dado operacional) 11 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 11 MODELAGEM DE DADOS PARA O DW - DIMENSÃO Representação dos contextos relevantes para a análise de um fato. • Exemplo: – Fato: Vendas – Dimensões: Clientes, Produtos, Tempo, Locais, ... • Uma dimensão pode: – conter membros – ser organizada em hierarquias 12 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 12 MODELAGEM DE DADOS PARA O DW - DIMENSÃO São as possíveis formas de visualizar os dados, ou seja, são os “por” dos dados: “por mês”, “por produto”, “por país”, “por região”, etc. Normalmente não possuem atributos numéricos, são somente descritivas e classificatórias dos elementos que participam de um fato. 13 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 13 MODELAGEM DE DADOS PARA O DW - MEDIDA Representação de atributos (variáveis) relevantes para a análise de um fato: – valores numéricos em geral – indicadores de desempenho para a análise 14 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 14 MODELAGEM DE DADOS PARA O DW - MEDIDA Uma medida é determinada pela associação de dimensões – produto X tempo.ano; - local.estado X cliente.classe X tempo.semana.dia • Exemplo: – Fato: Vendas – Medidas: quantidade vendida, valor da venda 15 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 15 MODELAGEM DE DADOS PARA O DW - MEDIDA São os atributos numéricos que representam um fato, a performance de um indicador de negócios relativo às dimensões que participam desse fato. Uma medida é determinada pela combinação das dimensões que participam de um fato, e estão localizadas como atributos de um fato. 16 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 16 Tabela Fato Chave composta Tempo é sempre parte da chave Usualmente numérica Variáveis tipicamente aditivas 17 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 17 Tabelas Dimensões Chave simples Serve como cabeçalho das linhas e colunas das análises e filtro nas consultas Descrição única para cada registro Usualmente não dependente do tempo Desnormalizada Hierarquias implícitas 18 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 18 UMA NOVA FORMA DE VER OS DADOS Uma visão multidimensional é usualmente representada por um cubo O cubo é apenas uma metáfora visual, dá a impressão de múltiplas dimensões. Os “cubos” podem ter 2, 3, 4 ou mais dimensões 19 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 19 UMA NOVA FORMA DE VER OS DADOS O usuário pode rolar e cortar (“slice and dice”) o cubo, escolhendo qual a dimensão(ões) que será usada em cada consulta (query) É uma representação intuitiva do evento porque todas as dimensões coexistem para todo ponto no cubo e são independentes umas das outras. 20 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 20 UMA NOVA FORMA DE VER OS DADOS 21 (Fonte: http://www.inf.ufsc.br/~ronaldo/ine5342/6-dw.pdf) INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 21 VISUALIZAÇÃO - EXEMPLO - Cubo do Fato Vendas 22 (Fonte: http://www.inf.ufsc.br/~ronaldo/ine5342/6-dw.pdf) INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 22 Uma dimensão …. 23 Utilizando-se uma única dimensão (Região) para obter a agregação de um fato relacionado (Vendas): INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 23 Duas Dimensões ………. 24 Utilizando-se duas dimensões (Região e Tempo) para obter a agregação de um fato relacionado INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 24 Três Dimensões …. 25 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 25 UMA NOVA FORMA DE VER OS DADOS 26 Cada nova dimensão aumenta o nível de detalhe. Acrescentando-se uma quarta dimensão (Produto) é possível analisar as Vendas por Produto, por Linha de produtos, por Trimestre, por Região. INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 26 “Aplanando” a Visão Multidimensional 27 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 27 Modelo Dimensional - Diagrama Estrela ( Star Schema ) Star Schema é o termo comum para designação de modelos de dados multidimensionais; Como o termo esquema nos leva diretamente a uma ideia de modelo físico, o mais usual é denominarmos de modelo estrela; 28 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 28 Modelo Dimensional - Diagrama Estrela ( Star Schema ) O modelo estrela é a estrutura básica de um modelo de dados multidimensional Sua composição típica possui uma grande entidade central denominada fato e um conjunto de entidades menores denominadas dimensões, arranjadas ao redor dessa entidade central, formando uma estrela 29 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 29 Modelo Dimensional - Diagrama Estrela ( Star Schema ) 30 Modelo dimensional de um assunto ou negócio Cada face representa uma dimensão ou perspectiva de interesse do negócio. O núcleo contém medidas do negócio tomadas na interseção das faces. INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 30 Modelo Dimensional - Diagrama Estrela ( Star Schema ) 31 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 31 Modelo Dimensional - Diagrama Estrela ( Star Schema ) 32 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 32 A Tabela FATO 33 Contém os atributos de identificação Armazenam os “números” da empresa Cada conjunto de “Fatos” é baseado na interseção de cada combinação dos atributos dimensionais INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 33 Junção lógica entre tabelas Fato e Dimensão 34 Fonte: Prof. Clodis Boscarioli INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 34 Performance do Modelo Estrela 35 As tabelas Fato contêm a maioria das linhas de dados As Dimensões tendem a ter um número menor de linhas Os “Joins” em um Modelo Estrela tipicamente envolvem uma tabela fato grande e uma ou mais tabelas Dimensão pequenas, o que torna a operação mais rápida INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 35 Comparação dos Esquemas 36 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 36 Diagrama Floco de Neve ( Snowflake ) O modelo Snowflake é o resultado da decomposição de uma ou mais dimensões que possuam hierarquias entre seus membros; Podemos definir relacionamento muitos para um entre os membros em uma dimensão, formando uma hierarquia por meio desses relacionamentos entre entidades dimensões; O modelo floco de neve é resultado da aplicação da terceira forma normal sobre as entidades dimensão 37 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 37 Diagrama Floco de Neve ( Snowflake ) 38 (Fonte: http://www.inf.ufsc.br/~ronaldo/ine5342/6-dw.pdf) INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 38 Diagrama Floco de Neve ( Snowflake ) Variante do modelo estrela Tabelas de dimensões estão normalizadas (3FN) Representação explícita das hierarquias Vantagem Evita redundância (mais economia de espaço) 39 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 39 Diagrama Floco de Neve ( Snowflake ) Desvantagem – maior número de tabelas (maior número de junções) Modelo estrela é considerado mais apropriado - desperdício de espaço é menos crítico que tempo para recuperação de dados em um DW 40 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 40 Modelo Floco de Neve x Modelo Estrela Segundo Felipe Nery, é mais vantajoso utilizar o Modelo Estrela que o Floco de Neve Através de pesquisa na Internet ele obteve dados que comprovam em testes esta afirmação Vejamos dois modelos desenvolvidos de forma diferente mas que acessam o mesmo fato 41 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 41 Modelo Floco de Neve x Modelo Estrela O primeiro tem as dimensões separadas em hierarquias, uma tabela para cada nível ( snowflake ) A hierarquia obedece ao relacionamento das tabelas de dimensão O segundo modelo possui as mesmas dimensões, com todos os níveis em só tabela ( estrela ) 42 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 42 Modelo Floco de Neve 43 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 43 Modelo Estrela 44 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 44 Modelo Floco de Neve x Modelo Estrela Os testes de acesso às tabelas fato nos dois modelos apresentaram uma diferença de 30% no tempo de acesso no modelo snowflake Os testes foram realizados com as seguintes populações: Modelo Estrela Tempo: 6209 linhas Produto: 50 linhas Local: 50 linhas Fato: 100.064 linhas 45 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 45 Modelo Floco de Neve x Modelo Estrela Modelo Snowflake Ano: 8 linhas Semestre: 16 linhas Trimestre: 32 linhas Mês: 96 linhas Dia: 2.922 linhas Produto: 50 linhas Família: 5 linhas Linha: 2 linhas Fato: 100.064 linhas 46 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 46 Modelo Floco de Neve x Modelo Estrela Se aplicarmos um cálculo matemático simples para realizar a querie de todas as ocorrências do fato no modelo estrela, teremos um resultado de 1,553.243.440.000 linhas. Para o conjunto de ocorrências de linhas de tabela no modelo snowflake, teremos o número de 57.485.624.868.864.000 linhas resultantes. 47 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 47 Modelo Floco de Neve x Modelo Estrela Serão necessários mais junções e, consequentemente, mais tempo. O modelo snowflake é esteticamente mais semântico para a visualização das hierarquias 48 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 48 Esquema Constelação União de esquemas estrela e/ou floco de neve – esquema estrela: modela em geral um Data Mart – esquema constelação: modela o DW Constelação de Fatos Constelação de fatos são exemplos de estruturas mais complexas nas quais múltiplas tabelas fato compartilham tabelas dimensão 49 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 49 Esquema Constelação 50 INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 50 51 EC: Cinema INTELIGÊNCIA EMPRESARIAL – AULA 6 INTELIGÊNCIA EMPRESARIAL 51
Compartilhar