Baixe o app para aproveitar ainda mais
Prévia do material em texto
Modelagem da Informação Material Teórico Responsável pelo Conteúdo: Prof. Me. José Ahirton Batista Lopes Filho Revisão Textual: Prof.ª Me. Sandra Regina Fonseca Moreira Modelagem de Dados no Power BI • Power BI para Modelagem de Dados; • Usando o Power BI; • O Esquema Relacional. • Capacitar os alunos para a utilização da ferramenta Power BI para Modelagem de Dados; • Impulsionar o pensamento crítico quanto a utilização de ferramentas para modelagem de dados e criação de visualizações para orientação à tomada de decisões, não só nas especifi cidades de desenvolvimento, mas, de fato, pensando em como atender às neces- sidades de negócios reais. OBJETIVOS DE APRENDIZADO Modelagem de Dados no Power BI Orientações de estudo Para que o conteúdo desta Disciplina seja bem aproveitado e haja maior aplicabilidade na sua formação acadêmica e atuação profissional, siga algumas recomendações básicas: Assim: Organize seus estudos de maneira que passem a fazer parte da sua rotina. Por exemplo, você poderá determinar um dia e horário fixos como seu “momento do estudo”; Procure se alimentar e se hidratar quando for estudar; lembre-se de que uma alimentação saudável pode proporcionar melhor aproveitamento do estudo; No material de cada Unidade, há leituras indicadas e, entre elas, artigos científicos, livros, vídeos e sites para aprofundar os conhecimentos adquiridos ao longo da Unidade. Além disso, você tam- bém encontrará sugestões de conteúdo extra no item Material Complementar, que ampliarão sua interpretação e auxiliarão no pleno entendimento dos temas abordados; Após o contato com o conteúdo proposto, participe dos debates mediados em fóruns de discus- são, pois irão auxiliar a verificar o quanto você absorveu de conhecimento, além de propiciar o contato com seus colegas e tutores, o que se apresenta como rico espaço de troca de ideias e de aprendizagem. Organize seus estudos de maneira que passem a fazer parte Mantenha o foco! Evite se distrair com as redes sociais. Mantenha o foco! Evite se distrair com as redes sociais. Determine um horário fixo para estudar. Aproveite as indicações de Material Complementar. Procure se alimentar e se hidratar quando for estudar; lembre-se de que uma Não se esqueça de se alimentar e de se manter hidratado. Aproveite as Conserve seu material e local de estudos sempre organizados. Procure manter contato com seus colegas e tutores para trocar ideias! Isso amplia a aprendizagem. Seja original! Nunca plagie trabalhos. UNIDADE Modelagem de Dados no Power BI Power BI para Modelagem de Dados Diante de mudanças constantes, tais como o volume crescente de dados (o cha- mado Big Data) e a cada vez maior pressão por decisões mais produtivas, o BI (Business Intelligence), ou Inteligência Empresarial, surge como um arcabouço de técnicas e tecnologias indispensáveis no auxílio a gestores e organizações na defini- ção de estratégias, avaliações, correções de planejamentos e de apoio a gestão de negócios e melhor tomada de decisões. Nesse contexto, o Power BI vem despontando como uma das soluções mais robustas dispo- níveis, uma vez que tem muitos usos, adeptos ao redor do mundo, grandes empresas utiliza- doras e material de referência fartamente disponível. Disponível gratuitamente, para Windows, em: http://bit.ly/37A0jtb Ex pl or Um desses usos, e o mais interessante no contexto desta disciplina de Mo- delagem da Informação, é a possibilidade de modelagem de dados de modo a facilitar o chamado self service BI, ou como conhecido em português, BI de autoatendimento, tornando mais fácil o processo de conexão a dados, visuali- zação e análise. O Power BI é uma solução completa que inclui não só o carregamento de dados e modelagem, mas também auxilia na utilização de diferentes métricas, bem como na construção e distribuição de relatórios. O software pode então se utilizar dos dados de origem e executar a mode- lagem de dados em forma de processo, de modo bastante facilitado, além de fornecer uma interface de usuário poderosa para a construção de análises e relatórios variados. Quer ver diferentes exemplos de painéis e relatórios feitos por usuários de todo o mundo? Acesse o Data Stories Gallery, parte do site Microsoft Power BI Community no seguinte link: http://bit.ly/37qLw3A Ex pl or A adoção do Power BI para auxílio na modelagem de dados tem aumentado, haja vista que um dos pontos fortes do software é que não é necessário nivelar os dados em uma tabela. Ao invés disso, pode-se usar várias tabelas, de várias fontes diferentes, e se definir a relação entre elas, o que será apresentado a partir de exem- plo prático nesta unidade. Também podemos, por exemplo, criar cálculos personalizados e atribuir no- vas métricas para se exibir segmentos específicos de dados, bem como usar essas novas medidas em visualizações para uma fácil modelagem, tudo de acordo com nosso escopo específico de negócio. 8 9 Por que modelar dados no Power BI? A abordagem clássica de BI de autoatendimento geralmente segue a abordagem descrita na Figura 1 abaixo: Carregar dados De�nir métricas Produzir reports Figura 1 – Exemplo clássico de um self service BI convencional Esta é a solução implementada pela ampla maioria de usuários que necessitam de um BI de autoatendimento. Mas, afinal, o que seria um BI de autoatendimento? Ex pl or Um BI de autoatendimento é uma abordagem na qual as equipes de dados forne- cem soluções, sistemas e aplicações para que as outras equipes da empresa possam acessar dados inerentes ao negócio de forma mais simplificada, de modo que eles mesmos consigam fazer suas próprias análises, de modo independente. Na estrutura mais tradicional, de acordo com o observado na Figura 1, ba- sicamente se encontram fontes de dados, então há a devida conexão a elas, importando-se o que se precisa à medida em que todos os cálculos necessários são devidamente adicionados antes de se criar as visualizações e painéis (do inglês, dashboards). É exatamente para isso que o produto foi projetado, geralmente funcionando perfeitamente a partir de uma grande variedade de fontes de dados. Outro ponto a favor da utilização do Power BI é a existência do DAX (Data Analysis Expressions), a linguagem de fórmulas proprietária do software, a qual, em sua versão mais recente, pode ser utilizada para estender um modelo de dados com métricas adicionais complexas. Ainda, o software também fornece recursos de modelagem de dados que permitem a adição de hierarquias e definição de KPIs (do inglês, key performance indicators), nossos indicadores para tomada de decisões. No entanto, essa abordagem da Figura 1 pressupõe que os dados de origem sejam compreensíveis para os usuários, e fáceis de se aplicar. Essa é uma suposi- ção deveras otimista, uma vez que pode não funcionar quando nossa aplicação se utiliza de dados mais complexos. Dito isto, ultimamente tem havido uma mudança de paradigma quando fala- mos em BI de autoatendimento. Mais especificamente, falamos da adição de uma camada de metadados aos dados de origem para tornar as informações acessíveis aos usuários. Esta é a abordagem descrita na Figura 2 a seguir: 9 UNIDADE Modelagem de Dados no Power BI Carregar dados Modelar um DataWarehouse (DW) De�nir métricas Produzir reports Figura 2 – Exemplo clássico de um self service BI mais atual Podemos perceber que não há nada original nessa abordagem; inclusive é o que a grande maioria dos arquitetos e desenvolvedores de BI faz a partir do SQL Server há anos. Então, por que não a aplicar a uma solução para modelagem de dados a partir do Power BI? Ex pl or Pode ser uma surpresa para alguns, mas o Power BI pode, com o auxílio de ou- tros produtos Microsoft, tornar-se uma solução de BI completa. Isso ocorre porque, embora seja uma ferramenta única, permite executar as principais etapas de um processo de BI. A saber, para o processo de carregamento de dados temos, por exemplo,a inter- face do Power BI Query Editor; para o processo de modelagem, podemos utilizar ambos Power BI e Power BI Query Editor; para métricas, temos o Power BI e o DAX; para a criação de relatórios temos o Power BI e, para distribuição do que foi criado, podemos utilizar o PowerBI.com. Ainda em comparação com o SQL Server, o Power BI leva certa vantagem quando falamos de: • Desenvolvimento de um data warehouse para construção de provas de concei- to (POCs) em um curto prazo; • Projetos onde devemos evitar estender um data warehouse corporativo para capacitar apenas um pequeno grupo de usuários; • Fornecimento de uma solução em específico e personalizada para um conjunto de usuários; • Fornecimento de uma solução direcionada para um grupo específico de usuá- rios em que uma solução corporativa não é rentável; • Projetos onde vamos permitir que os usuários acessem dados de fora dos da- dos corporativos específicos que eles usam tradicionalmente (normalmente fontes de Big Data). A variedade de recursos que o Power BI oferece permite executar todas as se- guintes tarefas diárias do BI, seja para carga de dados (sequenciamentos de cargas, pesquisas de dados, conversão de tipo de dados dentre outros), seja para modela- gem de dados e métricas (desenho do esquema, seja dimensional ou tabular, utili- zação de camada semântica, onde podemos renomear objetos para maior clareza, auxílio a hierarquias, KPIs e cálculo de métricas), bem como para camada de apre- sentação (comparação de tipos de visualização, criação de pesquisa hierárquica, definição de requisitos de interação do usuário) e muito mais. 10 11 Modelagem Star Schema vs. Snowflake Schema O esquema em estrela (no inglês, star schema) é o tipo de modelo multidimen- sional usado em data warehouses. No esquema em estrela, as tabelas de fatos e as tabelas de dimensões estão contidas. Nesse esquema, menos junções de chaves estrangeiras (foreign-key join) são usadas. Este esquema forma uma estrela com a tabela de fato, e as tabelas de dimensões. Fact Table Dimension Table Dimension Table Dimension Table Dimension Table Dimension Table Figura 3 – Exemplo de Star Schema Já o esquema de floco de neve (do inglês, snowflake schema) é outro tipo de modelo multidimensional usado para a construção de data warehouses onde estão contidas as tabelas de fatos, as tabelas de dimensão e as tabelas de subdimensão. Esse esquema forma um floco de neve com tabelas de fatos, tabelas de dimensão e tabelas de subdimensão, como na Figura 4 a seguir: Fact Table Dimension Table Dimension Table Dimension Table Dimension Table Dimension Table Sub-dimensional Table Sub-dimensionalTable Sub-dimensional Table Sub-dimensional Table Sub-dimensional Table Sub-dimensional Table Sub-dimensional Table Sub-dimensional Table Sub-dimensional Table Figura 4 – Exemplo de Snowfl ake Schema 11 UNIDADE Modelagem de Dados no Power BI Algumas das diferenças entre os esquemas em estrela e floco de neve, podem ser definidas como: • No esquema em estrela, as tabelas de fatos e as tabelas de dimensões estão contidas. Já no esquema de floco de neve além das tabelas de fatos e das tabe- las de dimensões, as subdimensionais também estão contidas; • O esquema em estrela é um modelo de cima para baixo, enquanto o esquema em floco de neve é considerado um esquema de baixo para cima; • O esquema em estrela usa mais espaço, enquanto o esquema em floco de neve usa menos espaço; • Leva-se menos tempo para a execução de consultas no esquema em estrela; • No esquema em estrela, a Normalização não é usada. Enquanto isso, a norma- lização e a desnormalização são usadas no esquema em floco de neve; • O design no esquema em estrela é muito simples, enquanto no esquema floco de neva o design é complexo; • A complexidade da consulta do esquema em estrela é baixa; • O entendimento no esquema em estrela é muito simples. Usando o Power BI Agora que já sabemos o que o Power BI oferece, vamos nos concentrar nos aspectos relacionados à modelagem de modo que, a partir de exemplos práticos, possamos abordar os seguintes tópicos: • Aplicação de uma estrutura dimensional lógica a uma fonte de dados relacional; • Adaptação da camada semântica e adição de métricas calculadas e algu- mas hierarquias. Isso permitirá que você aprecie alguns dos aspectos mais conhecidos do Power BI Query Editor no Power BI Desktop. O que veremos acaba por incluir também: • Junção de tabelas a nível da consulta; • Utilização de consultas intermediárias ocultas como uma área de preparação de dados; • Geração e aplicação de chaves substitutas no Power BI Query Editor; • Renomeação de consultas e campos; • Adição de hierarquias; • Criação de medidas calculadas. 12 13 O Esquema Relacional Os dados exemplo da atividade desta unidade estão disponíveis em um banco de dados OLTP (transacional) simples, que contém seis tabelas, devidamente ilustradas na Figura 5 a seguir: Figura 5 – Tabelas do banco de dados exemplo referente a vendas de carros e suas devidas informações Fonte: ASPIN, 2016 Claramente, esse esquema não representa uma arquitetura de dados corpora- tivos completa, no entanto, é suficiente para os propósitos do exemplo, pois nos permitirá sobrepor o design relacional existente com uma topologia de dados radi- calmente diferente, e então estendê-lo com uma dimensão de tempo, passos esses que serão explicados melhor nas sessões seguintes desta unidade. Para a feitura do exemplo a seguir, passo a passo, considere o seguinte cenário: como usuários, para nossa análise, precisaremos de dados distribuídos entre dife- rentes tabelas; também desejamos uma camada de apresentação simplificada que nos forneça atributos e métricas em um esquema em estrela clássico. Mais informações sobre o esquema estrela em: http://bit.ly/2TSd8uI Ex pl or De fato, podemos simplificar ao máximo a visão de nossa arquitetura de BI ideal exemplo (ou seja, nosso esquema dimensional desejado), como mostrado na Figura 6: Localização Geográ�ca Clientes Tempo VeículosVendas Figura 6 – Visão de arquitetura ideal para o exemplo da unidade 13 UNIDADE Modelagem de Dados no Power BI Carregando dados Como primeira etapa na criação de um esquema em estrela sobre um modelo relacional, precisamos carregar os dados. Este exemplo usará o conhecido banco de dados de exemplo, intitulado CarSalesData, consistindo em dados de vendas de automóveis, ou seja, dados sobre carros, modelos, concessionárias, fabricantes etc. Os arquivos referidos nessa unidade podem ser baixados no seguinte link do Google Drive, disponível em: http://bit.ly/38Bb2U1Ex pl or Se você preferir evitar o problema de criar um banco de dados e executar o script para preencher as tabelas, os dados dessas tabelas também estão em uma planilha denominada CarSales_Tables, também fornecida no link acima. Os passos para carregar os dados exemplo no Power BI são: 1. Iniciar o Power BI Desktop e clicar em Obter Dados, na tela inicial; 2. Clique em Banco de Dados, Banco de Dados do SQL Server e então em Conectar; 3. A caixa de diálogo Banco de Dados do SQL Server será exibida; 4. Digite o Nome do Servidor, clique em Importar e OK; 5. A caixa de diálogo Navegador será exibida; 6. Expanda o banco de dados CarSalesData e selecione as seis tabelas que estão no DER da Figura 5; A caixa de diálogo Navegador será semelhante à da Figura 7 a seguir: Figura 7 – Caixa de diálogo Navegador (do inglês, Navigator) Fonte: ASPIN, 2016 7. Clique em Editar. O Editor de Consultas do Power BI (Query Editor) abri- rá e exibirá as tabelas que você selecionou. Podemos ver melhor isso na Figura 8 a seguir: 14 15 Figura 8 – Editor de Consultas do Power BI (do inglês, Query Editor) Fonte: ASPIN, 2016 8. No painel Consultas, à esquerda da tela, clique com o botão direito do mouse em cada tabela de dados de origem individualmente e desmarque a opção Ativar Carregamento; Esse passo fará com que as tabelas de origem sejamtransformadas em tabelas intermediárias, as quais não estarão visíveis para nossos usuários fi nais, mas que poderão ser usadas como base para as transformações de dados que serão aplicadas posteriormente. Os nomes das tabelas apa- recerão em itálico no painel Consultas, à esquerda; 9. Renomeie todas as consultas para remover o prefi xo Data. Ao final desse passo-a-passo, nossa primeira etapa, de carregamento de dados, es- tará concluída. Como produto desta etapa temos nossos dados relacionais disponí- veis no Power BI Desktop, prontos para a correta modelagem dimensional. Criando a dimensão do veículo Uma rápida análise nos dados de origem mostra que os atributos que descrevem os veículos podem ser encontrados em algumas tabelas tais como Stock (estoque) e Colors (cores). Portanto, precisamos isolar os atributos necessários dessas tabelas e criar uma única tabela virtual (em verdade, uma outra consulta), a qual ficará visível para o usuário como a dimensão Vehicle (veículo). 1. Clique com o botão direito do mouse na consulta Stock e selecione Re- ferência (Reference); 2. Isso criará uma cópia da consulta de estoque que dependerá dos dados de origem na consulta de origem; 3. No painel de Confi gurações da Consulta (Query Settings), à direita, reno- meie a consulta Stock (2) para Dim_Vehicle; 15 UNIDADE Modelagem de Dados no Power BI 4. Deixando a consulta Dim_Vehicle selecionada, clique em Mesclar Con- sultas (Merge); 5. Quando a caixa de diálogo Mesclar aparecer, clique na coluna ColorID na parte superior da caixa de diálogo; 6. Selecione a consulta Colors na lista pop-up e clique na coluna ColorID na parte inferior da caixa de diálogo; 7. Defina o tipo de junção (Join) como interno (Inner); Se tudo foi feito corretamente, você terá resultado semelhante ao da Figura 9: Figura 9 – Exemplo de Junção (Merge) no Power BI Fonte: ASPIN, 2016 8. Clique em OK. Uma nova coluna (NewColumn) aparecerá à direita da tabela de dados; 9. Clique no ícone à direita da nova coluna; 10. No pop-up, selecione o botão de opção Expandir, desmarque ColorID e desmarque a opção Usar o Nome da Coluna Original como Prefixo; 11. Clique em OK. A coluna Color da consulta Colors será adicionada à consulta Dim_Vehicle; 12. Como efeito disso, você acabou de criar uma visualização com base nas duas consultas; 13. Clique com a tecla Control pressionada para selecionar as seguintes co- lunas: Make (Marca), Model (Modelo), VehicleType (Tipo de veículo) e Color (Cor); 14. Em seguida, clique com o botão direito do mouse em qualquer uma das colunas selecionadas e escolha a opção Remover Outras Colunas; 15. Isso deixará você com uma tabela de dados contendo apenas quatro colunas; 16. Essas colunas são os atributos exigidos pela dimensão Vehicle (Veículo); 17. Selecione todas as quatro colunas na tabela e, na faixa inicial, clique em Remover Linhas e, em seguida, em Remover Duplicatas. Assim, somente registros exclusivos permanecerão na tabela; 16 17 18. Na faixa de opções Adicionar Coluna, clique no triângulo pop-up no botão Adicionar Coluna de Índice. Selecionar desde 1; 19. Então, uma nova coluna contendo um identifi cador monotônico cres- cente único será adicionada. Essa será a chave substituta (no inglês, surrogate key); 20. Clique com o botão direito do mouse na nova coluna e renomeie-a para VehicleSK. A consulta da dimensão final será semelhante à da Figura 10 a seguir: Figura 10 – Exemplo da nossa dimensão VehicleSK criada nos passos anteriores Fonte: ASPIN, 2016 Criando a tabela de fatos Vendas Vamos agora criar a tabela de fatos que mostra todas as vendas de carros do banco de dados de origem. Podemos fazer a criação da seguinte maneira: 1. Clique com o botão direito do mouse na consulta InvoiceLines e selecio- ne Referência; 2. A partir desse comando será criada uma cópia da consulta de origem. A consulta recém-criada usará a consulta original como fonte de dados; 3. Clique com o botão direito do mouse na tabela de referência que você acabou de criar e selecione Renomear. Chame-a de Fact_Sales; 4. Deixando a consulta Fact_Sales selecionada, na faixa de opções Início, clique em Mesclar Consultas. Quando a caixa de diálogo Mesclar apare- cer, clique na coluna StockID, na parte superior da caixa de diálogo; 5. Selecione a consulta Stock na lista pop-up e clique na coluna StockID na parte inferior da caixa de diálogo; 17 UNIDADE Modelagem de Dados no Power BI 6. Defina o tipo de Junção como Interno (lembrando, inner join). Clique em OK; 7. Clique no ícone à direita da nova coluna; 8. No pop-up, selecione o botão de opção Expandir, desmarque Selecionar todas as colunas e também desmarque Usar o nome da coluna original como prefixo; 9. Selecione as colunas Make, Model, VehicleType e ColorID e clique em OK; 10. Clique em Mesclar Consultas; 11. Quando a caixa de diálogo Mesclar aparecer, clique na coluna NewColumn.ColorID na parte superior da caixa de diálogo; 12. Selecione a consulta Colors na lista pop-up e clique na coluna ColorID na parte inferior da caixa de diálogo; 13. Defina o tipo de junção como interno (inner). Clique em OK; 14. Clique no ícone à direita da nova coluna. No pop-up, selecione o botão de opção Expandir, desmarque ColorID e desmarque Usar o nome da coluna original como prefixo; 15. Selecione as colunas Make, Model, VehicleType e ColorID e clique OK; 16. Clique em Mesclar consultas (merge queries); 17. Quando a caixa de diálogo Mesclar aparecer, clique nas colunas NewColumn.Make, NewColumn.Model, NewColumn.VehicleType e NewColumn.Color, nesta respectiva ordem; 18. Selecione a consulta Dim_Vehicle na lista pop-up de consultas disponíveis; 19. Clique nas colunas Make, Model, VehicleType e Color, nesta ordem, na parte inferior da caixa de diálogo e clique em OK; 20. Você estará então ingressando nas duas consultas utilizando-se de vá- rios campos; 21. Clique no ícone à direita da nova coluna. No pop-up, selecione o botão de opção Expandir, desmarque a opção Selecionar todas as colunas e selecione apenas a coluna VehicleSK. Clique em OK; 22. Selecione os VehiclePrice e VehicleSK na tabela Fact_Sales; 23. Clique com o botão direito do mouse em qualquer uma dessas colunas e selecione Remover outras colunas; A tabela de fatos será semelhante à da Figura 11 a seguir: 18 19 Figura 11 – Exemplo da nossa tabela de fatos criada nos passos anteriores. Fonte: ASPIN, 2016 O processo feito permite detectar e adicionar o campo VehicleSK da dimensão do veículo à tabela de fatos. Adicionando uma dimensão de tempo É difícil imaginar um data warehouse, mesmo em um modelo exemplo pequeno como o estudado nesta unidade, sem uma dimensão de tempo. Então, vamos ver como adicionar isso ao modelo em alguns poucos passos, de maneira facilitada e intuitiva: 1. Na Visualização de Dados (Data View), ative a faixa de opções Modela- gem e clique no botão Nova Tabela; 2. A expressão Table = aparecerá na barra de fórmulas; 3. Substitua a expressão Table por DateDimension; 4. Clique à direita do sinal de igual e insira a seguinte função DAX: 5. DateDimension = CALENDAR( “1/1/2012”, “31/12/2016” ) 6. Adicione cinco novas colunas contendo as fórmulas mostradas na Tabela 1 a seguir: 19 UNIDADE Modelagem de Dados no Power BI Tabela 1 – Colunas e Fórmulas a serem adicionadas FullYear YEAR([DateSK]) Quarter “Q”&ROUNDDOWN(MONTH([DateSK])/4,0)+1 QuarterNumber ROUNDDOWN(MONTH([DateSK])/4,0)+1 MonthFull FORMAT([DateSK], “MMMM”) MonthNumber MONTH([DateSK]) Fonte: Adaptação de ASPIN, 2016 7. Selecione a coluna Quarter (Trimestre). Na faixa de opções Modelagem, clique no triângulo pop-up no botão Classificar por Coluna e selecione QuarterNumber (número de trimestre); 8. Selecione a coluna FullMonth; 9. Na faixa de opções Modelagem, clique no triângulo pop-up no botão Classificar por Coluna e selecione MonthNumber. Você acaba de utilizar a fórmula DAX CALENDAR (), onde especificou um intervalo de datas para o PowerBI gerar uma tabela contendo um período contínuo. Em seguida, você adicionou campos para exibir trimestre e mês, bem como os números desses itens que são usados como indicadores de classificação. Finalmente, você aplicou a ordem de classificação a qualquer coluna do tipo não numérica. Logo, isso evita que os nomes dos meses apareçam em ordem alfabética. Assim, sua dimensão Data está concluída. É claramente uma versão reduzida do tipo de tabela completa que você precisaria em um aplicativo a ser utilizado por clientes finais em um projeto de larga escala. Criando o modelo dimensional Agora vamos criar o modelo dimensional, embora com apenas uma dimensão no momento: 1. Supondo que você ainda esteja no Editor de Consulta do Power BI Desktop, clique em Fechar e Aplicar para retornar à exibição do relatório; 2. Clique no ícone Relacionamentos, à esquerda (terceiro ícone para baixo); 3. Você deve ver a tabela de fatos e dimensões unida no campo VehicleSK; O modelo inicial será semelhante ao da Figura 12: Figura 12 – Exemplo do nosso modelo inicial de relacionamento Dim_Vehicle e Fact_Sales Fonte: ASPIN, 2016 20 21 O Power BI Desktop acaba inferindo que as consultas (agora, no contexto do Power BI, tabelas) foram projetadas para serem unidas em um campo específico, e já adiciona o relacionamento entre as tabelas. As duas dimensões restantes podem ser criadas usando exatamente as mesmas técnicas que você viu na seção que descreve como criar a dimensão do veícu- lo. O modelo finalizado, contendo todas as dimensões, pode ser encontrado no arquivo ModelagemdeDadosnoPowerBI.Pbix disponível no drive. A partir do arquivo, você pode conferir o modelo de dados finalizado na exibição Relaciona- mentos do Power BI Desktop, e perceber que acabamos criando uma implementação prática completa, com base no ponto inicial da Figura 4 anterior. Ex pl or Finalizando o modelo de dados O modelo de dados ainda precisa de alguns ajustes para torná-lo realmente ami- gável e pronto para o BI de autoatendimento. Algumas coisas a fazer são: 1. Ocultar as chaves substitutas e classifi cá-las por colunas; 2. Adição de uma hierarquia de veículos e de uma hierarquia de tempo; 3. Criação de medidas calculadas, como exemplos simples do que pode ser feito para se estender um modelo de dados. O primeiro passo é simples, porém necessário. Tudo o que você precisa fazer, em qualquer uma das visualizações do Power BI no Power BI Desktop, é clicar com o botão direito do mouse no campo que você deseja mascarar e selecionar Ocultar na exibição de relatório. O campo Chave Substituta não será mais visível para os usuários. No entanto, eles aparecerão em itálico na exibição Relacionamento e dados. Você deve fazer isso não apenas para todas as chaves substitutas em todas as tabelas, mas também para os campos QuarterNumber e MonthNumber na tabela DateDimension. Adicionando hierarquias As hierarquias são uma estrutura tradicional de metadados no BI; e o Power BI Desktop possibilita que você as crie: 1. Na visualização Relatório, verifi que se a lista Campos está visível à direita; 2. Expanda a tabela Dim_Vehicle; 3. Clique com o botão direito do mouse no campo Criar e selecione Nova Hierarquia; 4. Clique com o botão direito do mouse no campo Model e selecione Adi- cionar à hierarquia; 21 UNIDADE Modelagem de Dados no Power BI 5. Clique com o botão direito do mouse nos campos Make e Model origi- nais (fora da hierarquia que você acabou de criar) e selecione Ocultar. Dessa forma, esses campos serão visíveis apenas na hierarquia. Agora você tem uma hierarquia pai-filho pronta para usar, que pode ser aplicada a tabelas, matrizes e gráficos. Criar uma hierarquia de tempo é um processo praticamente idêntico, a saber, começamos com o campo FullYear como base para uma nova hierarquia na tabela DataDimension e adicionam-se os campos Quarter e Month Full. Finalmente, ocultamos esses dois últimos campos fora da hierarquia. Criando medidas calculadas O processo de BI inevitavelmente envolve adicionar mais cálculos analíticos ao modelo de dados. A seguir temos passos para um breve demonstração do DAX (a linguagem que o Power BI usa para o cálculo de métricas) para este fim: 1. Na visualização Dados, verifique se a lista Campos está visível à direita; 2. Selecione a tabela Fact_Sales na lista Campos; 3. Na faixa de opções Página inicial, clique no triângulo pop-up no botão Nova medida e selecione Nova coluna; 4. Uma coluna, chamada de Column (Coluna) aparecerá na tabela Fact_Sales à direita de todas as colunas pré-existentes; 5. Clique dentro da barra de fórmulas acima da tabela e insira a seguinte fórmula: TotalCosts = [CostPrice] - [SpareParts] - [LaborCost] 6. Pressione Enter ou clique no ícone de visto na barra de fórmulas; A nova coluna calculará o custo total para cada registro na tabela de fatos; 7. Como detalhe final, podemos adicionar um pouco de inteligência quanto a Tempo ao modelo exemplo. Assim, na visualização Dados, verifique se a lista Campos está visível à direita; 8. Selecione a tabela Fact_Sales na lista Campos; 9. Na faixa de opções Página inicial, clique no triângulo pop-up no botão Nova medida e selecione Nova medida; 10. Digite a medida abaixo: QuarterSales = TOTALQTD (SUM (Fact_Sales [SalePrice]), DateDimension [DateSK]) 11. Na faixa de opções Página inicial, clique no triângulo pop-up no botão “Nova medida e selecione Nova medida; 12. Digite a seguinte medida: YearSales = TOTALYTD (SUM (Fact_Sales [SalePrice]), DateDimension [DateSK]) 22 23 Agora temos algumas medidas que calcularão as vendas mês a dia e ano a data. Ago- ra que o modelo de dados foi concluído, você deverá ver todas as medidas e atributos exibidos na Figura 13 a seguir, que é a Lista de Campos da Exibição de Relatório no Power BI Desktop. Figura 13 – Lista de Campos de Exibição de Relatório de nosso exemplo Fonte: ASPIN, 2016 Dashboards no Power BI Agora você pode salvar e fechar o Editor de Consulta do Power BI Desktop e começar a usar os atributos e medidas disponíveis para criar relatórios e painéis a partir do painel Visualizações. Diferentes visualizações disponíveis no Power BI: http://bit.ly/30NvuOY Ex pl or Para mais detalhes a respeito de dashboards e visualizações, favor checar o seguinte mate- rial, disponível em: http://bit.ly/2GjJnLtEx pl or Com o apresentado nestas unidades espera-se que você seja capaz de modelar dados para todas as necessidades envolvidas em uma equipe de dados, principalmen- te no que tange o fornecimento de informações para a correta tomada de decisões. A partir disso, passará a perceber que o processo de self service BI tem se mos- trado como um diferencial para os profissionais da área, uma vez que se espera hoje em dia que as equipes de dados estejam compostas não só por perfis analíticos e de uso de ferramentas, mas também por profissionais cada vez mais capazes a ní- vel de entendimento de negócios e storytelling de dados, o que acaba por envolver conhecimentos de modelagem, mineração e visualização de dados. 23 UNIDADE Modelagem de Dados no Power BI Material Complementar Indicações para saber mais sobre os assuntos abordados nesta Unidade: Leitura Data Stories Gallery http://bit.ly/37qLw3A Data Warehouse – O Que É Star Schema? http://bit.ly/2TSd8uI Power BI: Novas ferramentas de modelagem de dados http://bit.ly/2RMIjoz Trabalhar com a exibição de Modelagem no Power BI Desktop http://bit.ly/2NUALyM Criação de relatórios facilitada http://bit.ly/2NUAN9S Introdução a dashboards para designers do Power BI http://bit.ly/2GjJnLt Criar um dashboard do Power BI de um relatório http://bit.ly/2Rp8djm 24 25 Referências ASPIM, A. Pro Power BI Desktop, Apress, 2016. Materiais de auxílio disponíveis em: <https://github.com/Apress/pro-power-bi-desktop-2018>. 25
Compartilhar