joined_document_7
129 pág.

joined_document_7


DisciplinaInteligência Empresarial1.098 materiais3.932 seguidores
Pré-visualização32 páginas
e campos calculados. 
( ) Do ponto de vista gerencial o ambiente OLTP é uma ferramenta muito importante pois proporciona uma grande capacidade 
de efetuar cálculos complexos como previsões e percentuais de crescimento. 
 
 1) V,V,V,F,F 
 2) F,F,F,V,V 
 3) V,F,F,F,F 
 4) F,F,V,V,V 
 5) F,F,V,V,F 
 
 Aula 09: Modelagem de Data Warehouse 
Nesta aula, você irá: 
 
1. Compreender a visão multidimensional; 
2. Diferenciar a modelagem multidimensional da relacional; 
3. Identificar as características específicas do Esquema Estrela e do Esquema Floco de Neve. 
Modelagem de dados para Data Warehouse 
A modelagem de dados para Data Warehouse é diferente da utilizada para sistemas OLTP uma vez que as características e 
objetivos destes dois ambientes são distintos. 
O modelo de dados tradicional utiliza uma abordagem normalizada para o projeto de banco de dados. 
As ferramentas baseadas em SQL podem ajudar na pesquisa, mas não são flexíveis o suficiente para fornecer as respostas em 
um tempo hábil, dificultando o trabalho do tomador de decisão. 
A modelagem de dados para Data Warehouse, chamada Modelagem Multidimensional, é uma técnica de concepção e 
visualização de um Modelo de Dados apresentado em uma arquitetura intuitiva, a partir de um conjunto de medidas que 
descrevem aspectos comuns de negócios. É utilizada especialmente para sumarizar e reestruturar dados e apresenta-los em 
visões que suportem a análise dos valores desses dados. 
Mundo de Negócios 
Um modelo é uma abstração e uma reflexão do mundo real 
Modelar é a forma de visualizarmos o que queremos realizar 
A modelagem multidimensional provê uma capacitação de visualizarmos questões muito abstratas que usuários de negócio 
desejam que sejam respondidas como requisitos de negócio 
Com a modelagem multidimensional os usuários finais facilmente entendem e navegam pela solução de estrutura de dados 
resultante 
A modelagem multidimensional exige abstração superior ao que é comum utilizarmos em modelos de dados transacionais 
O Modelo Dimensional apresenta as informações na forma de um \u201ccubo de dados\u201d (Data Cube) 
Modelo Dimensional 
Um modelo dimensional é formado por três elementos básicos: 
Fatos: Um fato é uma coleção de itens de dados, composta de dados de medidas e de contexto. Cada fato representa um 
item, uma transação ou um evento de negócio de uma empresa. É tudo aquilo que reflete a evolução dos negócios do dia-a-dia 
de uma organização. A característica básica de um fato é que ele é representado por valores numéricos e implementado em 
tabelas denominadas Tabela Fato. A tabela Fato contém medidas que são usadas para realizar análises e também as chaves 
que ligam as dimensões. 
Medidas(Variáveis): Conceitualmente são os elementos que participam de um fato, assunto de negócios. As dimensões 
determinam o contexto de um assunto de negócios, por exemplo, um banco de dados que analise as vendas de produtos teria, 
em geral, as seguintes Tabelas Dimensão: 
 Tempo; Localização; Clientes; Vendedores; Cenário´s ( realizados, projetado) 
As tabelas de dimensões conteem os atributos que descrevem os componentes de dados e provêem a informação para realizar 
análises comparativas. 
Normalmente não possuem atributos numéricos, são somente descritivas e classificatórias dos elementos que participam de 
um fato. Dica: São as possíveis formas de visualizar os dados, ou seja, são os \u201cpor\u201d dos dados: \u201cpor mês\u201d, \u201cpor produto\u201d, \u201cpor 
país\u201d, \u201cpor região\u201d, etc \u2026 
Dimensões: São os atributos numéricos que representam um fato. Uma medida é determinada pela combinação das 
dimensões que participam de um fato, e estão localizadas como atributos de um fato. Exemplos: valor em reais das vendas, 
número de unidades de produtos vendidas, quantidade de unidades em estoque, custo de uma venda, etc... 
Exemplo de Modelo Dimensional 
 
Uma nova forma de ver os dados 
A metáfora do cubo dá a impressão de múltiplas dimensões. Os \u201ccubos\u201d podem ter 2, 3, 4 ou mais dimensões. 
O usuário pode rolar e cortar (\u201cslice and dice\u201d) o cubo, escolhendo qual a dimensão(ões) que será usada em cada consulta 
(query). 
 
Vamos entender melhor esta visualização do \u201ccubo\u201d. Vamos iniciar com: 
Utilizando-se uma única dimensão (Região) para obter a agregação de um fato relacionado (Vendas) teríamos a seguinte 
representação. 
 
Utilizando-se duas dimensões (Região e Tempo) para obter a agregação de um fato relacionado (Vendas) teríamos a seguinte 
representação. 
 
Utilizando-se três dimensões (Região,Tempo e Linha de Produto) para obter a agregação de um fato relacionado (Vendas) 
teríamos a seguinte representação. 
 
Cada nova dimensão aumenta o nível de detalhe. Exemplo: acrescentando-se uma quarta dimensão (Produto) é possível 
analisar as Vendas por Produto, por Linha de produtos, por Trimestre, por Região. 
 
Modelo Dimensional \u2013 Representação 
Diagrama Estrela ( Star Schema ) 
- Star Schema é o termo comum para designação de modelos de dados multidimensionais; 
 - Como o termo esquema nos leva diretamente a uma idéia de modelo físico, costumamos utilizar a nomenclatura \u201cmodelo 
estrela\u201d; 
 - O modelo estrela é a estrutura básica de um modelo de dados multidimensional; 
 - Sua composição típica possui uma grande entidade central denominada fato e um conjunto de entidades menores 
denominadas dimensões, arranjadas ao redor dessa entidade central, formando uma estrela. 
 
- Cada face representa uma dimensão ou perspectiva de interesse do negócio. 
 - O núcleo contém medidas do negócio tomadas na interseção das faces. 
 
A Tabela FATO 
 
- As tabelas Fato contêm a maioria das linhas de dados; 
 - As Dimensões tendem a ter um número menor de linhas; 
 - Os Joins em um Modelo Estrela, tipicamente, envolvem uma tabela fato grande e uma ou mais tabelas Dimensão pequenas, 
o que torna a operação mais rápida. 
 
Modelo Estrela 
Altamente desnormalizado para melhor performance; 
Os dados transacionais são armazenados em Tabelas Fato e os dados de referência são armazenados em Tabelas Dimensão . 
Modelo Relacional Normalizado 
- Minimiza a redundância de dados 
- Os dados transacionais podem ser armazenados em qualquer tabela 
Diagrama Floco de Neve ( Snowflake ) 
- O modelo Snowflake é o resultado da decomposição de uma ou mais dimensões que possuam hierarquias entre seus membros; 
 - Podemos definir relacionamento muitos para um entre os membros em uma dimensão, formando uma hierarquia por meio 
desses relacionamentos entre entidades dimensões; 
 - O modelo floco de neve é resultado da aplicação da terceira forma normal sobre as entidades dimensão; 
 - Acrescenta estruturas hierárquicas ao Modelo Estrela. 
 
 
Leia o livro de Felipe Nery R Machado, Tecnologia e Projeto de Data Warehouse, para acessar mais informações sobre os 
Modelos estrela e Floco de Neve. 
Agregações 
- Fornecem níveis múltiplos de detalhes do fato; 
 - Os resultados das queries (ou seus valores intermediários) são pré-calculados, o que melhora muito a performance; 
 - As agregações podem ser acumuladas através de agrupamentos diferentes - Freqüentemente através de várias dimensões ou 
combinações de dimensões; 
 - Os valores agregados podem ser armazenados em tabelas de fatos separadas, compartilhando dimensões com a tabela de 
fatos básica ou podem ser armazenados codificados nas mesmas tabelas de dimensões e de fatos básica . 
 
- Agregam-se vários fatos por Loja por Dia; 
 - Número de clientes - Quantos clientes fizeram compras? 
 - Quantidade de produtos - Quantas unidades de produtos foram vendidas? 
 - Valor da venda - Qual foi o faturamento bruto do dia? 
A Tabela FATO 
 
- As tabelas Fato contêm a maioria