Buscar

Modelagem de Dados para Data Warehouse

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Aula 9 – Modelagem de Data Warehouse 
 
Modelagem de dados para Data Warehouse 
 
A modelagem de dados para Data Warehouse é diferente da utilizada para sistemas OLTP uma vez que as 
características e objetivos destes dois ambientes são distintos. 
O modelo de dados tradicional utiliza uma abordagem normalizada para o projeto de banco de dados. 
As ferramentas baseadas em SQL podem ajudar na pesquisa, mas não são flexíveis o suficiente para 
fornecer as respostas em um tempo hábil, dificultando o trabalho do tomador de decisão. 
 
A modelagem de dados para Data Warehouse, chamada Modelagem Multidimensional, é uma técnica de 
concepção e visualização de um Modelo de Dados apresentado em uma arquitetura intuitiva, a partir de um 
conjunto de medidas que descrevem aspectos comuns de negócios. É utilizada especialmente para sumarizar 
e reestruturar dados e apresentá-los em visões que suportem a análise dos valores desses dados. 
 
Mundo de Negócios 
 
 
 
Um modelo é uma abstração e uma reflexão do mundo real 
 
Modelar é a forma de visualizarmos o que queremos realizar 
 
A modelagem multidimensional provê uma capacitação de visualizarmos questões muito abstratas que 
usuários de negócio desejam que sejam respondidas como requisitos de negócio 
 
Com a modelagem multidimensional os usuários finais facilmente entendem e navegam pela solução de 
estrutura de dados resultante 
 
A modelagem multidimensional exige abstração superior ao que é comum utilizarmos em modelos de dados 
transacionais 
 
O Modelo Dimensional apresenta as informações na forma de um “cubo de dados” 
(Data Cube) 
 
Modelo Dimensional 
 
Um modelo dimensional é formado por três elementos básicos: 
 
 
 
Um fato é uma coleção de itens de dados, composta de dados de medidas e de contexto 
 
Cada fato representa um item, uma transação ou um evento de negócio de uma empresa. É tudo aquilo que 
reflete a evolução dos negócios do dia-a-dia de uma organização 
 
A característica básica de um fato é que ele é representado por valores numéricos e implementado em 
tabelas denominadas Tabela Fato . 
 
A tabela Fato contém medidas que são usadas para realizar análises e também as chaves que ligam as 
dimensões. 
 
 
 
Conceitualmente são os elementos que participam de um fato, assunto de negócios. 
 
As dimensões determinam o contexto de um assunto de negócios, por exemplo, um banco de dados que 
analise as vendas de produtos teria, em geral, as seguintes Tabelas Dimensão: 
 Tempo; 
 Localização; 
 Clientes; 
 Vendedores; 
 Cenário´s ( realizados, projetado) 
 
As tabelas de dimensões conteem os atributos que descrevem os componentes de dados e provêem a 
informação para realizar análises comparativas. 
 
Normalmente não possuem atributos numéricos, são somente descritivas e classificatórias dos elementos que 
participam de um fato. 
Dica: São as possíveis formas de visualizar os dados, ou seja, são os “por” dos dados: “por mês”, “por 
produto”, “por país”, “por região”, etc … 
 
 
 
São os atributos numéricos que representam um fato. 
 
Uma medida é determinada pela combinação das dimensões que participam de um fato, e estão localizadas 
como atributos de um fato. 
 
Exemplos: valor em reais das vendas, número de unidades de produtos vendidas, quantidade de unidades em 
estoque, custo de uma venda, etc... 
 
Exemplo de Modelo Dimensional 
 
Quantas finalizações o atleta João fez durante o mês de Abril no campeonato 1? 
 
Uma nova forma de ver os dados 
 
(Fonte: Valsoir, T.J, Data Warehousing: Aspectos Estratégicos e de Implementação, palestra acessada na 
Internet em 18 dezembro 2005, site: Google) 
 
A metáfora do cubo dá a impressão de múltiplas dimensões. Os “cubos” podem ter 2, 3, 4 ou mais 
dimensões. 
O usuário pode rolar e cortar (“slice and dice”) o cubo, escolhendo qual a dimensão(ões) que será usada em 
cada consulta (query). 
 
 
 
Vamos entender melhor esta visualização do “cubo”. Vamos iniciar com: 
 
 
 
Utilizando-se uma única dimensão (Região) para obter a agregação de um fato relacionado (Vendas) 
teríamos a seguinte representação. 
 
 
 
 
 
Utilizando-se duas dimensões (Região e Tempo) para obter a agregação de um fato relacionado (Vendas) 
teríamos a seguinte representação. 
 
 
 
 
Utilizando-se três dimensões (Região,Tempo e Linha de Produto) para obter a agregação de um fato 
relacionado (Vendas) teríamos a seguinte representação. 
 
 
Atenção! 
Cada nova dimensão aumenta o nível de detalhe. Exemplo: acrescentando-se uma quarta dimensão 
(Produto) é possível analisar as Vendas por Produto, por Linha de produtos, por Trimestre, por Região. 
 
 
 
 
 
“Aplanando” a Visão Multidimensional 
 
 
Modelo Dimensional – Representação 
Diagrama Estrela (Star Schema) 
- Star Schema é o termo comum para designação de modelos de dados multidimensionais; 
 - Como o termo esquema nos leva diretamente a uma idéia de modelo físico, costumamos utilizar a 
nomenclatura “modelo estrela”; 
 - O modelo estrela é a estrutura básica de um modelo de dados multidimensional; 
 - Sua composição típica possui uma grande entidade central denominada fato e um conjunto de entidades 
menores denominadas dimensões, arranjadas ao redor dessa entidade central, formando uma estrela. 
 
- Cada face representa uma dimensão ou perspectiva de interesse do negócio. 
 - O núcleo contém medidas do negócio tomadas na interseção das faces. 
 
 
 
 
 
A Tabela FATO 
 
- As tabelas Fato contêm a maioria das linhas de dados; 
 - As Dimensões tendem a ter um número menor de linhas; 
 - Os Joins em um Modelo Estrela, tipicamente, envolvem uma tabela fato grande e uma ou mais tabelas 
Dimensão pequenas, o que torna a operação mais rápida. 
Comparação dos Modelos: Transacional Relacional e Esquema Estrela 
Modelo Estrela 
Altamente desnormalizado para melhor performance; 
Os dados transacionais são armazenados em Tabelas Fato e os dados de referência são armazenados em 
Tabelas Dimensão. 
 
Modelo Relacional Normalizado 
- Minimiza a redundância de dados 
- Os dados transacionais podem ser armazenados em qualquer tabela 
 
 
(Fonte: Valsoir, T.J, Data Warehousing: Aspectos Estratégicos e de Implementação, palestra acessada na 
Internet em 18 dezembro 2005, site: Google) 
Diagrama Floco de Neve ( Snowflake ) 
 - O modelo Snowflake é o resultado da decomposição de uma ou mais dimensões que possuam hierarquias 
entre seus membros; 
 - Podemos definir relacionamento muitos para um entre os membros em uma dimensão, formando uma 
hierarquia por meio desses relacionamentos entre entidades dimensões; 
 - O modelo floco de neve é resultado da aplicação da terceira forma normal sobre as entidades dimensão; 
 - Acrescenta estruturas hierárquicas ao Modelo Estrela. 
 
 
Atenção! 
Leia o livro de Felipe Nery R Machado, Tecnologia e Pojeto de Data Warehouse, para acessar mais 
informações sobre os Modelos estrela e Floco de Neve 
Agregações 
- Fornecem níveis múltiplos de detalhes do fato; 
 - Os resultados das queries (ou seus valores intermediários) são pré-calculados, o que melhora muito a 
performance; 
 - As agregações podem ser acumuladas através de agrupamentos diferentes - Freqüentemente através de 
várias dimensões ou combinações de dimensões; 
 - Os valores agregados podem ser armazenados em tabelas de fatos separadas, compartilhando dimensões 
com a tabela de fatos básica ou podem ser armazenados codificados nas mesmas tabelas de dimensões e de 
fatos básica. 
 
- Agregam-se vários fatos por Loja por Dia; 
 - Númerode clientes - Quantos clientes fizeram compras? 
 - Quantidade de produtos - Quantas unidades de produtos foram vendidas? 
 - Valor da venda - Qual foi o faturamento bruto do dia? 
 
A Tabela FATO 
 
- As tabelas Fato contêm a maioria das linhas de dados; 
 - As Dimensões tendem a ter um número menor de linhas; 
 - Os Joins em um Modelo Estrela, tipicamente, envolvem uma tabela fato grande e uma ou mais tabelas 
Dimensão pequenas, o que torna a operação mais rápida. 
 
Saiba mais: 
Para saber mais sobre os tópicos estudados nesta aula, pesquise na internet sites, vídeos 
e artigos sobre casos de empresas que utilizam o Data Warehouse, para refinar seu 
conhecimento. Se ainda tiver alguma dúvida, fale com seu professor online utilizando os 
recursos disponíveis no ambiente de aprendizagem. 
Vamos exercitar o Modelo Estrela? 
Estudo de caso 
Aula 9 - EC - Cinema.pdf 
Aula 9 - EC - Cinema - solucao.pdf

Outros materiais