Baixe o app para aproveitar ainda mais
Prévia do material em texto
- -1 INTELIGÊNCIA EMPRESARIAL MODELAGEM DE DATA WAREHOUSE - -2 Olá! Nesta aula, você irá: 1. Compreender a visão multidimensional; 2. Diferenciar a modelagem multidimensional da relacional; 3. Identificar as características específicas do Esquema Estrela e do Esquema Floco de Neve. Modelagem de dados para Data Warehouse A modelagem de dados para Data Warehouse é diferente da utilizada para sistemas OLTP uma vez que as características e objetivos destes dois ambientes são distintos. O modelo de dados tradicional utiliza uma abordagem normalizada para o projeto de banco de dados. As ferramentas baseadas em SQL podem ajudar na pesquisa, mas não são flexíveis o suficiente para fornecer as respostas em um tempo hábil, dificultando o trabalho do tomador de decisão. A modelagem de dados para Data Warehouse, chamada Modelagem Multidimensional, é uma técnica de concepção e visualização de um Modelo de Dados apresentado em uma arquitetura intuitiva, a partir de um conjunto de medidas que descrevem aspectos comuns de negócios. É utilizada especialmente para sumarizar e reestruturar dados e apresenta-los em visões que suportem a análise dos valores desses dados. Mundo de Negócios Para entendermos um pouco melhor vamos tentar observar o “Mundo de Negócios”: Um modelo é uma abstração e uma reflexão do mundo real. Modelar é a forma de visualizarmos o que queremos realizar. A modelagem multidimensional provê uma capacitação de visualizarmos questões muito abstratas que usuários de negócio desejam que sejam respondidas como requisitos de negócio. Com a modelagem multidimensional os usuários finais facilmente entendem e navegam pela solução de estrutura de dados resultante. A modelagem multidimensional exige abstração superior ao que é comum utilizarmos em modelos de dados transacionais. O Modelo Dimensional apresenta as informações na forma de um “cubo de dados” (Data Cube). Modelo Dimensional - -3 Um modelo dimensional é formado por três elementos básicos: Fatos Um fato é uma coleção de itens de dados, composta de dados de medidas e de contexto Cada fato representa um item, uma transação ou um evento de negócio de uma empresa. É tudo aquilo que reflete a evolução dos negócios do dia-a-dia de uma organização A característica básica de um fato é que ele é representado por valores numéricos e implementado em tabelas denominadas Tabela Fato . A tabela Fato contém medidas que são usadas para realizar análises e também as chaves que ligam as dimensões. Medidas (variáveis) São os atributos numéricos que representam um fato. Uma medida é determinada pela combinação das dimensões que participam de um fato, e estão localizadas como atributos de um fato. Exemplos: valor em reais das vendas, número de unidades de produtos vendidas, quantidade de unidades em estoque, custo de uma venda, etc... Dimensões Conceitualmente são os elementos que participam de um fato, assunto de negócios. As dimensões determinam o contexto de um assunto de negócios, por exemplo, um banco de dados que analise as vendas de produtos teria, em geral, as seguintes Tabelas Dimensão: • Tempo; • Localização; • Clientes; • Vendedores; • Cenários ( realizados, projetado). As tabelas de dimensões conteem os atributos que descrevem os componentes de dados e provêem a informação para realizar análises comparativas. Normalmente não possuem atributos numéricos, são somente descritivas e classificatórias dos elementos que participam de um fato. Dica: São as possíveis formas de visualizar os dados, ou seja, são os “por” dos dados: “por mês”, “por produto”, “por país”, “por região”, etc … Exemplo de Modelo Dimensional • • • • • - -4 Uma nova forma de ver os dados (Fonte: Valsoir, T.J, Data Warehousing: Aspectos Estratégicos e de Implementação, palestra acessada na Internet em 18 dezembro 2005, site: Google) A metáfora do cubo dá a impressão de múltiplas dimensões. Os “cubos” podem ter 2, 3, 4 ou mais dimensões. O usuário pode rolar e cortar (“slice and dice”) o cubo, escolhendo qual a dimensão(ões) que será usada em cada consulta (query). Vamos entender melhor esta visualização do “cubo”. Vamos iniciar com: - -5 Uma dimensão Utilizando-se uma única dimensão (Região) para obter a agregação de um fato relacionado (Vendas) teríamos a seguinte representação. Duas dimensões Utilizando-se duas dimensões (Região e Tempo) para obter a agregação de um fato relacionado (Vendas) teríamos a seguinte representação. Três dimensões - -6 Utilizando-se três dimensões (Região,Tempo e Linha de Produto) para obter a agregação de um fato relacionado (Vendas) teríamos a seguinte representação. “Aplanando” a Visão Multidimensional Fique ligado Cada nova dimensão aumenta o nível de detalhe. Exemplo: acrescentando-se uma quarta dimensão (Produto) é possível analisar as Vendas por Produto, por Linha de produtos, por Trimestre, por Região. - -7 Fonte: Valsoir, T.J, Data Warehousing: Aspectos Estratégicos e de Implementação, palestra acessada na Internet em 18 dezembro 2005, site: Google Modelo Dimensional – Representação Diagrama Estrela ( Star Schema ) - Star Schema é o termo comum para designação de modelos de dados multidimensionais; - Como o termo esquema nos leva diretamente a uma idéia de modelo físico, costumamos utilizar a nomenclatura “modelo estrela”; - O modelo estrela é a estrutura básica de um modelo de dados multidimensional; - Sua composição típica possui uma grande entidade central denominada fato e um conjunto de entidades menores denominadas dimensões, arranjadas ao redor dessa entidade central, formando uma estrela. - -8 - Cada face representa uma dimensão ou perspectiva de interesse do negócio. - O núcleo contém medidas do negócio tomadas na interseção das faces. A Tabela FATO - -9 - As tabelas Fato contêm a maioria das linhas de dados; - As Dimensões tendem a ter um número menor de linhas; - Os Joins em um Modelo Estrela, tipicamente, envolvem uma tabela fato grande e uma ou mais tabelas Dimensão pequenas, o que torna a operação mais rápida. Comparação dos Modelos: Transacional Relacional e Esquema Estrela Modelo Estrela Altamente desnormalizado para melhor performance; Os dados transacionais são armazenados em e os dados de referência são armazenados em Tabelas Fato .Tabelas Dimensão - -10 Fonte: Valsoir, T.J, Data Warehousing: Aspectos Estratégicos e de Implementação, palestra acessada na Internet em 18 dezembro 2005, site: Google Modelo Relacional Normalizado - Minimiza a redundância de dados - Os dados transacionais podem ser armazenados em qualquer tabela - -11 Fonte: Valsoir, T.J, Data Warehousing: Aspectos Estratégicos e de Implementação, palestra acessada na Internet em 18 dezembro 2005, site: Google Diagrama Floco de Neve ( Snowflake ) - O modelo Snowflake é o resultado da decomposição de uma ou mais dimensões que possuam hierarquias entre seus membros; - Podemos definir relacionamento muitos para um entre os membros em uma dimensão, formando uma hierarquia por meio desses relacionamentos entre entidades dimensões; - O modelo floco de neve é resultado da aplicação da terceira forma normal sobre as entidades dimensão; - Acrescenta estruturas hierárquicas ao Modelo Estrela. - -12 Agregações - Fornecem níveis múltiplos de detalhes do fato; - Os resultados das queries (ou seus valores intermediários) são pré-calculados, o que melhora muito a performance; - As agregações podem ser acumuladas através de agrupamentos diferentes - Freqüentemente através de várias dimensões ou combinações de dimensões; - Os valores agregados podem ser armazenados em tabelas de fatos separadas, compartilhando dimensões com a tabela de fatos básica ou podem ser armazenados codificados nas mesmas tabelas de dimensões e de fatos básica . - Agregam-se vários fatos por Loja por Dia; - Número de clientes - Quantos clientes fizeram compras? - Quantidade de produtos - Quantas unidades de produtos foram vendidas? Fique ligado Leiao livro de Felipe Nery R Machado, Tecnologia e Pojeto de Data Warehouse, para acessar mais informações sobre os Modelos estrela e Floco de Neve - -13 - Valor da venda - Qual foi o faturamento bruto do dia? Fonte: Valsoir, T.J, Data Warehousing: Aspectos Estratégicos e de Implementação, palestra acessada na Internet em 18 dezembro 2005, site: Google O que vem na próxima aula •O processo de construção do Data Warehouse, suas etapas e interligações Saiba mais Para saber mais sobre os tópicos estudados nesta aula, pesquise na internet sites, vídeos e artigos sobre casos de empresas que utilizam o Data Warehouse, para refinar seu conhecimento. Se ainda tiver alguma dúvida, fale com seu professor online utilizando os recursos disponíveis no ambiente de aprendizagem. Vamos exercitar o Modelo Estrela? http://estaciodocente.webaula.com.br/cursos/GRA303/docs/Aula%209%20-%20EC%20-% 20Cinema.pdf http://estaciodocente.webaula.com.br/cursos/GRA303/docs/Aula%209%20-%20EC%20-% 20Cinema%20-%20solucao.pdf • Estudo de caso.• • Solução.• http://estaciodocente.webaula.com.br/cursos/GRA303/docs/Aula%209%20-%20EC%20-%20Cinema.pdf http://estaciodocente.webaula.com.br/cursos/GRA303/docs/Aula%209%20-%20EC%20-%20Cinema.pdf http://estaciodocente.webaula.com.br/cursos/GRA303/docs/Aula%209%20-%20EC%20-%20Cinema%20-%20solucao.pdf http://estaciodocente.webaula.com.br/cursos/GRA303/docs/Aula%209%20-%20EC%20-%20Cinema%20-%20solucao.pdf - -14 CONCLUSÃO Nesta aula, você: • Compreendeu a visão multidimensional utilizada para projetar o Data Warehouse; • Compreendeu as diferenças entre a modelagem multidimensional e a relacional; • Conheceu as características específicas do Esquema Estrela e do Esquema Floco de Neve. • • • Olá! O que vem na próxima aula CONCLUSÃO
Compartilhar