Baixe o app para aproveitar ainda mais
Prévia do material em texto
Aula 9 – Modelagem de Data Warehouse Modelagem de dados para Data Warehouse A modelagem de dados para Data Warehouse é diferente da utilizada para sistemas OLTP uma vez que as características e objetivos destes dois ambientes são distintos. O modelo de dados tradicional utiliza uma abordagem normalizada para o projeto de banco de dados. As ferramentas baseadas em SQL podem ajudar na pesquisa, mas não são flexíveis o suficiente para fornecer as respostas em um tempo hábil, dificultando o trabalho do tomador de decisão. A modelagem de dados para Data Warehouse, chamada Modelagem Multidimensional, é uma técnica de concepção e visualização de um Modelo de Dados apresentado em uma arquitetura intuitiva, a partir de um conjunto de medidas que descrevem aspectos comuns de negócios. É utilizada especialmente para sumarizar e reestruturar dados e apresentá-los em visões que suportem a análise dos valores desses dados. Mundo de Negócios Um modelo é uma abstração e uma reflexão do mundo real Modelar é a forma de visualizarmos o que queremos realizar A modelagem multidimensional provê uma capacitação de visualizarmos questões muito abstratas que usuários de negócio desejam que sejam respondidas como requisitos de negócio Com a modelagem multidimensional os usuários finais facilmente entendem e navegam pela solução de estrutura de dados resultante A modelagem multidimensional exige abstração superior ao que é comum utilizarmos em modelos de dados transacionais O Modelo Dimensional apresenta as informações na forma de um “cubo de dados” (Data Cube) Modelo Dimensional Um modelo dimensional é formado por três elementos básicos: Um fato é uma coleção de itens de dados, composta de dados de medidas e de contexto Cada fato representa um item, uma transação ou um evento de negócio de uma empresa. É tudo aquilo que reflete a evolução dos negócios do dia-a-dia de uma organização A característica básica de um fato é que ele é representado por valores numéricos e implementado em tabelas denominadas Tabela Fato . A tabela Fato contém medidas que são usadas para realizar análises e também as chaves que ligam as dimensões. Conceitualmente são os elementos que participam de um fato, assunto de negócios. As dimensões determinam o contexto de um assunto de negócios, por exemplo, um banco de dados que analise as vendas de produtos teria, em geral, as seguintes Tabelas Dimensão: Tempo; Localização; Clientes; Vendedores; Cenário´s ( realizados, projetado) As tabelas de dimensões conteem os atributos que descrevem os componentes de dados e provêem a informação para realizar análises comparativas. Normalmente não possuem atributos numéricos, são somente descritivas e classificatórias dos elementos que participam de um fato. Dica: São as possíveis formas de visualizar os dados, ou seja, são os “por” dos dados: “por mês”, “por produto”, “por país”, “por região”, etc … São os atributos numéricos que representam um fato. Uma medida é determinada pela combinação das dimensões que participam de um fato, e estão localizadas como atributos de um fato. Exemplos: valor em reais das vendas, número de unidades de produtos vendidas, quantidade de unidades em estoque, custo de uma venda, etc... Exemplo de Modelo Dimensional Quantas finalizações o atleta João fez durante o mês de Abril no campeonato 1? Uma nova forma de ver os dados (Fonte: Valsoir, T.J, Data Warehousing: Aspectos Estratégicos e de Implementação, palestra acessada na Internet em 18 dezembro 2005, site: Google) A metáfora do cubo dá a impressão de múltiplas dimensões. Os “cubos” podem ter 2, 3, 4 ou mais dimensões. O usuário pode rolar e cortar (“slice and dice”) o cubo, escolhendo qual a dimensão(ões) que será usada em cada consulta (query). Vamos entender melhor esta visualização do “cubo”. Vamos iniciar com: Utilizando-se uma única dimensão (Região) para obter a agregação de um fato relacionado (Vendas) teríamos a seguinte representação. Utilizando-se duas dimensões (Região e Tempo) para obter a agregação de um fato relacionado (Vendas) teríamos a seguinte representação. Utilizando-se três dimensões (Região,Tempo e Linha de Produto) para obter a agregação de um fato relacionado (Vendas) teríamos a seguinte representação. Atenção! Cada nova dimensão aumenta o nível de detalhe. Exemplo: acrescentando-se uma quarta dimensão (Produto) é possível analisar as Vendas por Produto, por Linha de produtos, por Trimestre, por Região. “Aplanando” a Visão Multidimensional Modelo Dimensional – Representação Diagrama Estrela (Star Schema) - Star Schema é o termo comum para designação de modelos de dados multidimensionais; - Como o termo esquema nos leva diretamente a uma idéia de modelo físico, costumamos utilizar a nomenclatura “modelo estrela”; - O modelo estrela é a estrutura básica de um modelo de dados multidimensional; - Sua composição típica possui uma grande entidade central denominada fato e um conjunto de entidades menores denominadas dimensões, arranjadas ao redor dessa entidade central, formando uma estrela. - Cada face representa uma dimensão ou perspectiva de interesse do negócio. - O núcleo contém medidas do negócio tomadas na interseção das faces. A Tabela FATO - As tabelas Fato contêm a maioria das linhas de dados; - As Dimensões tendem a ter um número menor de linhas; - Os Joins em um Modelo Estrela, tipicamente, envolvem uma tabela fato grande e uma ou mais tabelas Dimensão pequenas, o que torna a operação mais rápida. Comparação dos Modelos: Transacional Relacional e Esquema Estrela Modelo Estrela Altamente desnormalizado para melhor performance; Os dados transacionais são armazenados em Tabelas Fato e os dados de referência são armazenados em Tabelas Dimensão. Modelo Relacional Normalizado - Minimiza a redundância de dados - Os dados transacionais podem ser armazenados em qualquer tabela (Fonte: Valsoir, T.J, Data Warehousing: Aspectos Estratégicos e de Implementação, palestra acessada na Internet em 18 dezembro 2005, site: Google) Diagrama Floco de Neve ( Snowflake ) - O modelo Snowflake é o resultado da decomposição de uma ou mais dimensões que possuam hierarquias entre seus membros; - Podemos definir relacionamento muitos para um entre os membros em uma dimensão, formando uma hierarquia por meio desses relacionamentos entre entidades dimensões; - O modelo floco de neve é resultado da aplicação da terceira forma normal sobre as entidades dimensão; - Acrescenta estruturas hierárquicas ao Modelo Estrela. Atenção! Leia o livro de Felipe Nery R Machado, Tecnologia e Pojeto de Data Warehouse, para acessar mais informações sobre os Modelos estrela e Floco de Neve Agregações - Fornecem níveis múltiplos de detalhes do fato; - Os resultados das queries (ou seus valores intermediários) são pré-calculados, o que melhora muito a performance; - As agregações podem ser acumuladas através de agrupamentos diferentes - Freqüentemente através de várias dimensões ou combinações de dimensões; - Os valores agregados podem ser armazenados em tabelas de fatos separadas, compartilhando dimensões com a tabela de fatos básica ou podem ser armazenados codificados nas mesmas tabelas de dimensões e de fatos básica. - Agregam-se vários fatos por Loja por Dia; - Númerode clientes - Quantos clientes fizeram compras? - Quantidade de produtos - Quantas unidades de produtos foram vendidas? - Valor da venda - Qual foi o faturamento bruto do dia? A Tabela FATO - As tabelas Fato contêm a maioria das linhas de dados; - As Dimensões tendem a ter um número menor de linhas; - Os Joins em um Modelo Estrela, tipicamente, envolvem uma tabela fato grande e uma ou mais tabelas Dimensão pequenas, o que torna a operação mais rápida. Saiba mais: Para saber mais sobre os tópicos estudados nesta aula, pesquise na internet sites, vídeos e artigos sobre casos de empresas que utilizam o Data Warehouse, para refinar seu conhecimento. Se ainda tiver alguma dúvida, fale com seu professor online utilizando os recursos disponíveis no ambiente de aprendizagem. Vamos exercitar o Modelo Estrela? Estudo de caso Aula 9 - EC - Cinema.pdf Aula 9 - EC - Cinema - solucao.pdf
Compartilhar