Prévia do material em texto
PÓS-GRADUAÇÃO EM GESTÃO E ANÁLISE ESTRATÉGICA DE DADOS IEC PUC MINAS Professor: Gideão Nery MODELAGEM DE DADOS DIMENSIONAL Disciplina: INICIAREMOS EM INSTANTES… MODELAGEM DE DADOS DIMENSIONAL MÉTRICAS DERIVADAS E DIMENSIONS MODELAGEM DE DADOS DIMENSIONAL SLOWLY CHANGING DIMENSIONS As Dimensões servem para descrever os fatos... • O que? • Quem? • Quando? • Onde? • Como, etc? Slowly Changing Dimension Techniques (SCD) • Dimensões até agora foram consideradas independentes do tempo • Não assuma isso simplesmente porque a área de negócio não mencionou durante a fase de levamento demanda / requisitos • Considere a necessidade de rastrear alguns atributos / manter o histórico destes atributos ao longo do tempo • Área de negócio deve explicitamente nomear os atributos com mapeamento de histórico SK Surrogate Key • Já vimos o conceito de SK dentro de uma Dimensão. Porém, vamos ver 3 tipos de implementação de SKs para casos de negócios. • 1 - SK Sequencial Única: ✓ É uma Chave interna ✓ Não tem significado de negócio ✓ Cumpre o propósito apenas de relacionamento entre as tabelas SK Surrogate Key • 2 - SK Composta: ✓ É uma Chave interna ✓ Apresenta um significado de negócio ✓ Utilizada em relacionamento entre as tabelas SK Surrogate Key • 3 - SK Hash: ✓ É uma Chave interna gerada por uma função ✓ Não tem significado de negócio ✓ Cumpre o propósito apenas de relacionamento entre as tabelas Slowly Changing Dimension Techniques (SCD) • Técnicas para ligar com atributos de dimensões: • Tipo 0 a 7 • Para cada atributo é necessário definir qual tipo de técnica será aplicada Slowly Changing Dimension Techniques (SCD) • Tipo 0: • Atributos que não são alterados ao longo do tempo. Duráveis. • Tipo 1: • Sobrescreve o valor antigo pelo valor novo • Tipo 2: • Cria nova linha na dimensão preservando o valor antigo • Tipo 3: • Utiliza colunas na tabela da dimensão para lidar com novos valores Slowly Changing Dimension Techniques (SCD) • Tipo 4: • Mini dimensão associada ao fato. • Tipo 5: • Combina técnicas tipos 4 + 1 • Tipo 6: • Combina técnicas tipos 1 + 2 + 3 • Tipo 7: • FK´s duplicadas para dimensões tipo 1 e tipo 2 SCD – Tipo 0 • Atributo da dimensão nunca muda. • Fatos são agrupados sempre pelo valor original • É uma replicação do modelo relacional SCD – Tipo 1 • Sobrescreve o valor antigo pelo valor novo • O atributo sempre reflete o valor mais recente Vantagem: ✓ Ocupa menos espaço, mantendo a mesma chave SK Desvantagem: ✓ Perde o histórico dos registros SCD – Tipo 1 SCD – Tipo 2 • Cria-se novas sk´s para cada alteração em atributos mapeados por essa técnica Vantagem: ✓ Mantem o histórico do registros Desvantagem: ✓ Ocupa mais espaço com os novo registros ✓ Necessidade de ter cláusulas Where para pegar registros mais recentes SCD – Tipo 2 SCD – Tipo 3 • Cria-se colunas para preservar o histórico do atributo mapeado pela técnica de SCD • Utilizada quando a alteração do atributo ocorre de forma previsível e massiva SCD – Tabela Comparativa ATÉ A PRÓXIMA AULA MODELAGEM DE DADOS DIMENSIONAL Slide 1 Slide 2 Slide 3 Slide 4 Slide 5 Slide 6 Slide 7 Slide 8 Slide 9 Slide 10 Slide 11: As Dimensões servem para descrever os fatos... Slide 12: Slowly Changing Dimension Techniques (SCD) Slide 13: SK Surrogate Key Slide 14: SK Surrogate Key Slide 15: SK Surrogate Key Slide 16: Slowly Changing Dimension Techniques (SCD) Slide 17: Slowly Changing Dimension Techniques (SCD) Slide 18: Slowly Changing Dimension Techniques (SCD) Slide 19: SCD – Tipo 0 Slide 20: SCD – Tipo 1 Slide 21: SCD – Tipo 1 Slide 22: SCD – Tipo 2 Slide 23: SCD – Tipo 2 Slide 24: SCD – Tipo 3 Slide 25: SCD – Tabela Comparativa Slide 26