Baixe o app para aproveitar ainda mais
Prévia do material em texto
DESCRIÇÃO O conceito de On-line Analytical Processing (OLAP), sua estrutura típica de dados e suas operações comuns às ferramentas com essa finalidade na utilização do Microsoft Power BI. PROPÓSITO Compreender a estruturação de dados em diferentes níveis de informação e granularidade para análise em ferramentas OLAP, bem como a instalação e configuração do Microsoft Power BI e suas principais características, utilizações típicas e eventuais limitações. PREPARAÇÃO Para iniciar o conteúdo, é necessário ter o instalador do Microsoft Power BI Desktop baixado localmente, que pode ser encontrado no próprio site do produto de forma gratuita. Para a instalação da ferramenta, é necessário ter uma máquina com sistema operacional Windows instalado, não havendo alternativas para o Power BI em outros sistemas operacionais. Caso sua máquina utilize sistemas operacionais Mac OS ou Linux, será possível apenas a utilização da versão on-line do Power BI Services com acesso exclusivamente por uma conta corporativa ou de estudante. OBJETIVOS MÓDULO 1 Descrever o conceito On-line Analytical Processing (OLAP) e suas operações MÓDULO 2 Executar a instalação e a configuração do Microsoft Power BI MÓDULO 3 Reconhecer as funcionalidades básicas da ferramenta Microsoft Power BI INTRODUÇÃO Neste conteúdo, aprenderemos as características de um sistema OLAP, bem como suas principais funções em um ambiente de produção, em qualquer local onde seja necessário avaliar um conjunto de informações além da sua forma pura ou desagregada. Descreveremos o conceito OLAP e seguiremos com esses conceitos na ferramenta Microsoft Power BI, passando desde a instalação e configuração desse software e seguindo para ilustrações das características e primeiros passos com a ferramenta, até o ponto de fazer a conexão dos dados de diferentes fontes para criação de relatórios ou painéis. MÓDULO 1 Descrever o conceito On-line Analytical Processing (OLAP) e suas operações LIGANDO OS PONTOS Você sabe o que é OLAP? Em que situações práticas você poderia utilizá-la? Para respondermos a essas perguntas, vamos analisar alguns casos. O Brasil é um dos grandes produtores de minérios, tais como ferro, cobre e ouro. A Tatu S.A. (empresa fictícia) é uma mineradora que utiliza equipamentos de grande porte para realizar a extração desses minérios. Os equipamentos possuem sistemas embarcados de sensores que registram as condições dos componentes, tais como pressão e temperatura. Os dados gerados por eles podem criar a necessidade de parar o equipamento a fim de realizar algum tipo de reparo. No primeiro semestre, foi constatada uma queda de 30% na produção. Imediatamente, a diretoria solicitou uma análise do que ocorreu nesse meio tempo para descobrir quais foram as causas dessa queda e o que poderia ser feito para resolver os problemas. Nessa análise, foram constatadas paradas frequentes para realizar reparos em quatro equipamentos, sendo que um deles é gargalo para o processo de extração de minério. Ainda no detalhamento da análise, foram observados os alertas de um dos supervisores sobre a variação de temperatura num dos equipamentos e as solicitações frequentes do coordenador de manutenção para que fossem realizados reparos no medidor de pressão de outro equipamento. Um aspecto fundamental desse processo é que um problema raramente ocorre isolado; por outro lado, trabalhar sem foco torna muito difícil chegar às causas, por isso são utilizados indicadores que são uma composição de vários fatores. Neste caso, a diretoria pediu uma análise da situação. E você como analista, quais dados pediria? De que setores? De que período? Como faria a composição dos indicadores para melhorar a análise? Certamente, uma das ações que você precisa realizar para dar respostas a essas perguntas vem com a utilização de uma tecnologia conhecida como OLAP, que estrutura os dados com o objetivo de facilitar o processo de análise. Mas ela é apenas uma ferramenta para dar suporte à tomada de decisão. Conhecer os detalhes do negócio, que dados e informações devem ser compostas para formar os indicadores e que caminhos devem ser seguidos da análise é responsabilidade do analista. Após a leitura do caso, é hora de aplicar seus conhecimentos! Vamos ligar esses pontos? 3. CONSIDERE A SEGUINTE SITUAÇÃO: VOCÊ RECEBEU A INCUMBÊNCIA DE PROJETAR UMA SOLUÇÃO QUE AUXILIE OS GESTORES DA MINERADORA TATU S.A. A ANALISAREM O ATINGIMENTO OU NÃO DAS METAS DE PRODUÇÃO. DE FORMA RESUMIDA, QUAIS PASSOS VOCÊ REALIZARIA PARA PROJETAR ESSA SOLUÇÃO? RESPOSTA O primeiro e mais básico de todos os passos é garantir que haja um sistema de banco de dados que armazene os dados históricos da produção da Tatu S.A. e quaisquer outros que estejam relacionados a esse processo, como os dados de manutenção e operação dos equipamentos. Sem dados, as análises são especulações. Outro ponto importante é a composição dos dados para a criação de indicadores relacionados à produção, pois, a partir disso, é possível construir tabelas OLAP que reflitam como os fatores mapeados influenciaram nesse processo ao longo do tempo. DEFINIÇÃO DE ON-LINE ANALYTICAL PROCESSING (OLAP) On-line Analytical Processing, ou Processamento Analítico On-line em tradução livre para o português, é a tecnologia embarcada em uma grande quantidade de ferramentas destinadas tanto a Business Intelligence quanto para Business Analytics. APESAR DE SEREM TRATADOS COMO SINÔNIMOS, BUSINESS INTELLIGENCE, BUSINESS ANALYTICS E OLAP SÃO CONCEITOS DIFERENTES, MAS QUE SE RELACIONAM DE FORMA ÍNTIMA NOS TEMPOS ATUAIS. Talvez a situação temporal desses termos seja a razão pela confusão na atribuição correta da nomenclatura e que vale um entendimento básico de cada um deles para a devida separação. Vejamos: BUSINESS INTELLIGENCE O termo Business Intelligence representa uma área de negócios que busca extrair valor analisando resultados, medidas baseadas em dados passados até o presente, não necessariamente utilizando uma ferramenta em específico. javascript:void(0) javascript:void(0) BUSINESS ANALYTICS Já o termo Business Analytics refere-se ao estudo de comportamento e modelos de negócio no futuro, por meio da modelagem com o histórico de dados, buscando prever resultados e comportamentos com diferentes cenários estabelecidos pelos especialistas de área. Essas ferramentas são tipicamente utilizadas por profissionais dos diferentes níveis de uma empresa para visualizar e analisar dados multidimensionais ou estudar diferentes cenários corporativos de forma concisa, rápida e interativa. Provêm a capacidade de performar cálculos complexos, análises de tendências e modelagem complexa de dados e suportam diversas áreas de negócios, como Planejamento, Gerenciamento de Performance, Finanças/Custos, Modelos de Simulação, Relatórios de Data Warehouse, entre outros mais. SAIBA MAIS Além da capacidade de analisar dinamicamente dados multidimensionais, essas ferramentas são desenvolvidas para trabalhar com bancos de dados desnormalizados, possibilitando transformações de dados e navegação dentro de um Data Warehouse, tendo uma estrutura adequada, tanto para pesquisa quanto para apresentação de informações. Os resultados de pesquisas, estudos e projetos apresentados que utilizam tais ferramentas são exibidos tipicamente em relatórios ou painéis de controle. SISTEMAS OLAP OLAP é uma tecnologia em forma de ferramenta que possibilita, nos tempos atuais, analisar de forma mais rápida um conjunto cada vez maior de dados e seu efetivo compartilhamento de informação com diferentes grupos dentro de uma organização, sejam executivos, gerentes, analistas ou operação. Dessa forma, é possível fazer uma diferenciação sobre os tipos de análises de acordo com a posição dentro de uma empresa, como se pode observar na estrutura mostrada na imagem a seguir: javascript:void(0) Níveis de sistemas na hierarquia organizacional. Agora, clique nas abas abaixo e leia mais sobre cada um dos níveis:EIS – EXECUTIVE INFORMATION SYSTEM O tipo EIS, Sistemas de Informação Executiva em tradução livre, tem como objetivo os profissionais no nível estratégico de empresas. Para esse grupo, são necessários um conjunto de indicadores-chave de desempenho que sintetizam os números da organização e dão a visibilidade do andamento da operação de acordo com as estratégias adotadas. MIS – MANAGEMENT INFORMATION SYSTEM Sistemas de Informação Gerencial (no acrônimo inglês, MIS – Management Information Systems), como o próprio nome sugere, têm como alvo o nível tático e gerencial da organização. Permitem análises mais profundas dos dados apresentados, como a simulação de diferentes cenários para um dado produto ou avaliação em diferentes níveis dentro da empresa, por exemplo, acompanhar os números nas diferentes hierarquias de venda, passando por gerente de produto, KAM (Key Account Manager ou, em português, Gerente de Contas-Chave), até chegar nos representantes de venda. DSS – DECISION SUPPORT SYSTEM Os Sistemas de Suporte de Decisão (no acrônimo inglês, DSS – Decision Support Systems) são direcionados ao nível operacional de organizações. Costumam apresentar, além de sumarizações e indicadores de performance, dados até o nível mais baixo da hierarquia disponível. Dessa forma, é possível tomar decisão pontual sobre um evento identificado em tais sistemas. Ainda, é possível fazer diferenciação entre arquiteturas de sistemas OLAP, mas esse aspecto será tratado após o entendimento de base de dados multidimensional. DIFERENÇAS ENTRE ON-LINE ANALYTICAL PROCESSING (OLAP) E ON-LINE TRANSACTIONAL PROCESSING (OLTP) Apesar da terminologia muito próxima entre essas duas tecnologias, elas tratam de conceitos completamente diferentes e que andam lado a lado em grande parte dos fluxos de Business Intelligence ou de Business Analytics. Além das características já citadas dos sistemas OLAP, convém citar outros elementos para efeito comparativo com o sistema OLTP, como performance, estrutura de dados, armazenamento e taxa de atualização bem como as permissões de acesso. Veja as principais diferenças: ON-LINE ANALYTICAL PROCESSING (OLAP) ON-LINE TRANSACTIONAL PROCESSING (OLTP) Sistemas OLAP possuem uma estrutura de dados baseada em modelagem dimensional, ainda a ser discutida neste conteúdo, de modo a obter uma melhor performance na leitura e disponibilização de grandes quantidades de dados em relatórios e análises gerenciais. De modo geral, o armazenamento é feito utilizando estrutura de Data Warehouse para otimização de desempenho e direcionado a um grupo restrito de gestores e analistas para tomada de decisão, sendo que os desenvolvedores têm autonomia para fazer inserção e leitura de informações, e os usuários apenas permissão de leitura. Ou seja, os dados são não voláteis e possuem informação histórica com uma frequência de atualização reduzida no processo de carga. A frequência reduzida é baseada na demanda do negócio e pode ser diária, semanal ou por algum critério específico. Sistemas Transacionais (no acrônimo inglês, OLTP – On-line Transaction Processing) são sistemas baseados em transações, como o próprio nome sugere, e têm a função primária de contabilizar e escriturar as transações feitas na organização com o status mais recente em cada uma delas. Como exemplo dessas soluções, estão as aplicações de cadastro, sistemas de controle de estoque, compra ou de inventário, ERP (Enterprise Resource Planning ou, em português, Sistema de Gestão Integrada), CRM (Customer Relationship Management ou, em português, Gestão do Relacionamento com Clientes), entre outros. Ainda sobre OLTP, vale destacar que tais ferramentas possuem um grande volume de dados sob sua gestão e buscam manter esses dados no status mais atual, com atualizações frequentes da base de dados, de modo que ela reflita de forma precisa a realidade momentânea do evento mapeado por essa aplicação e na menor granularidade possível. Além do mais, as estruturas mais comuns em sistemas OLTP são linhas e colunas em bases tabulares de bancos de dados convencionais, que seguem o modelo relacional de dados. Essa estrutura possibilita grande agilidade, com pesquisas de baixa complexidade do ponto de vista de negócios e com extrações de dados tipicamente limitadas a milhares de linhas. Uma comparação entre esses dois sistemas pode ser sumarizada na tabela abaixo: Característica Sistemas Analíticos (OLAP) Sistemas Transacionais (OLTP) Foco/Alvo Nível estratégico da organização para análise e tomada de decisão Nível operacional visando à execução operacional da organização Estrutura dos dados Dados estruturados na modelagem dimensional, tipicamente com alto nível de sumarização Dados tipicamente estruturados em modelo relacional normalizado, com alto nível de detalhes Armazenamento Armazenamento em estrutura de Data Warehouse Armazenamento em sistemas convencionais de banco de dados e sistemas de informação da organização Performance Otimizado para leitura e geração de relatórios gerenciais com grandes volumes de dados Alta velocidade para manipulação de dados operacionais (escrita e atualização de informações) Atualização Atualização durante carga de informações com frequência baixa Atualização instantânea da informação com frequência muito alta Volatilidade Dado histórico e não volátil, sem necessidade de alterações (somente por erros ou inconsistências) Dados voláteis, passíveis de modificação e exclusão Permissões Inserção e leitura para desenvolvedores e apenas leitura para usuários Inserção, leitura, modificação e exclusão para usuários operacionais autorizados Atenção! Para visualizaçãocompleta da tabela utilize a rolagem horizontal Tabela: Diferenças entre sistemas analíticos e transacionais. Como esses sistemas são de tipos diferentes, é esperado que as técnicas de manuseio de dados sejam diferentes, seja no armazenamento ou nas buscas, e valem um detalhamento a ser abordado no próximo tópico. BANCO DE DADOS MULTIDIMENSIONAL Sistemas OLAP são comumente desenvolvidos utilizando banco de dados multidimensional e, para uma maior clareza dos conceitos de tais bancos, vale iniciar com o esclarecimento do principal norteador na escolha desse tipo de banco de dados, o uso da análise multidimensional. ATENÇÃO A análise multidimensional é uma representação do cruzamento de informações tipicamente descrita em Dimensões, Medidas e Fatos, agrupadas em Cubos e extraídas em Visões. Os elementos que compõem a análise multidimensional possuem características que impactam diretamente na performance dos sistemas OLAP e merecem uma discussão mais detalhada. Veja mais sobre cada uma delas: DIMENSÕES Estabelecem a organização dos dados com os quais se podem fazer consultas e cruzamentos de bases. São estruturas que armazenam, por exemplo, a geografia, o tempo em forma de calendário, a estrutura de vendas de uma organização ou qualquer outra estrutura. Cada dimensão possui membros que podem se estruturar em níveis hierárquicos, como o exemplo do tempo em que o primeiro nível seria o ano, seguido dos meses, até chegar na menor hierarquia que poderia ser, neste caso, o dia. MEDIDAS São os valores em si a serem analisados e podem ser compostos de quantidades, como volume de um produto ou valor apurado em uma venda, médias de descontos aplicados para cada produto, totais de vendas por região ou qualquer grandeza numérica. FATOS São os dados a serem agrupados com os valores de cada uma das medidas para cada combinação das dimensões existentes. Por exemplo, uma tabela Fato poderia conter a agregação das vendas de um produto por região, nos diferentes níveis hierárquicos ou, ainda, ter a média de desconto aplicado para uma família de produtos e suas subdivisões dentro da corporação. O cruzamento dessas fontes de dados pode ser armazenado em uma nova estrutura, denominada Cubo ou Hipercubo. Essa estrutura, apesar de consumir mais espaço nos servidores de armazenamento,possui a vantagem de ser mais rápida para consultas e agregações, se devidamente modeladas. javascript:void(0) HIPERCUBO Denominação usada por se tratar de cubo com diferentes números de dimensões. SAIBA MAIS Existem outras formas de se estruturar os dados para um sistema OLAP, como sistemas de dados colunares, modelos de dados em memória e outros modelos de dados NoSQL (Not Only Structured Query Language ou bancos de dados não relacionais), que excedem o escopo deste conteúdo, mas podem e devem ser explorados em um momento oportuno. Ainda existem outros detalhes sobre a implementação de sistemas OLAP, que podem variar de acordo com a demanda de projetos específicos, sendo importante deixar claro que não existe uma metodologia ou técnica que resolva todos os problemas, mas apenas as mais adequadas a cada contexto. ESQUEMAS DE MODELAGEM DIMENSIONAL É importante citar também que a modelagem dimensional, desenvolvida por Ralph Kimball, tem sido amplamente utilizada e foi provada desde a década de 1990. Além da estrutura de Cubo, os modelos podem ser feitos usando diferentes esquemas, que basicamente são formas de estruturar os elementos citados. Os mais conhecidos são os modelos Estrela (Star Schema) e Flocos de Neve (Snowflake). Esses modelos têm por característica relacionar as dimensões e fatos de modo a otimizar armazenamento ou performance na leitura. O modelo de esquema em Estrela possui dados não normalizados nas dimensões, ou seja, redundantes com foco em acelerar o processamento de bases com menos interações. Veja uma ilustração da modelagem dimensional em Estrela: Já o modelo em Flocos de Neve possui normalização parcial das dimensões, reduzindo a redundância dos dados, mas tomando mais tempo em operar entre as bases, em razão da necessidade de junções entre as tabelas de dimensões normalizadas. Veja uma ilustração da modelagem dimensional em esquema Snowflake: ARQUITETURAS OLAP Dentro de sistemas OLAP, podem ser considerados ainda três tipos de arquiteturas, sendo elas baseadas em dois alicerces. O primeiro alicerce corresponde ao modelo relacional em que se opera sobre as bases multidimensionais armazenadas em servidores de bancos de dados. O segundo alicerce utiliza a estrutura em cubos com o modelo de Hipercubo para otimizar as consultas, sacrificando, assim, a performance em atualização dos dados. A estrutura baseada em alicerce relacional é denominada de Processamento Analítico On-line Relacional, em inglês, Relational On-line Analytical Processing (ROLAP). É a arquitetura baseada na maioria dos bancos de dados relacionais existentes no mercado. Já a estrutura em cubos é denominada Processamento Analítico On-line Multidimensional, em inglês, Multidimensional On-line Analytical Processing (MOLAP). Um exemplo clássico de arquitetura MOLAP é o sistema Essbase, criado pela empresa Hyperion, hoje, um produto da Oracle. Ainda há uma versão híbrida que conjuga elementos das duas estruturas citadas denominada Processamento Analítico On-line Híbrido, em inglês, Hybrid On-line Analytical Processing (HOLAP). Nessa categoria, enquadram-se as extensões a bancos de dados relacionais com opção OLAP, como o Microsoft Analysis Services, Oracle Database OLAP Option, MicroStrategy, entre outros. INTRODUÇÃO A OLAP (ON LINE ANALYTICAL PROCESSING) Antes de verificar seus conhecimentos, que tal assistir a um vídeo? Nele, você acompanha os conceitos de OLAP e modelagem dimensional. VERIFICANDO O APRENDIZADO MÓDULO 2 Executar a instalação e a configuração do Microsoft Power BI LIGANDO OS PONTOS Você já ouviu falar no Microsoft Power BI? Sabe como ele pode ser útil no dia a dia para auxiliar no aumento da eficiência de um negócio? Para respondermos a essas perguntas, vamos analisar algumas situações práticas. A Vendas On-line S.A. (empresa fictícia) é uma empresa que trabalha com vendas on-line de diversos tipos de produtos. Seu modelo de negócio é baseado na atuação como uma intermediária de vendas para outras empresas menores por meio de um portal que facilita a interação com os clientes. Ao longo dos anos, essa estratégia mostrou-se mutuamente benéfica tanto para a Vendas On-line S.A. como para as empresas menores e os clientes. No entanto, no levantamento do desempenho do último ano, percebeu-se que as vendas de diversos produtos tiveram um comportamento completamente anômalo: alguns caíram em torno de 50%, enquanto outros, especialmente relacionados a produtos eletrônicos, tiveram um aumento de mais 150%. A diretoria da empresa fez a solicitação de uma análise detalhada para tentar entender quais foram os fatores que influenciaram esse comportamento. No primeiro momento, a equipe de analistas produziu alguns relatórios – de boa qualidade visual – que não permitiam a compreensão do que realmente havia acontecido. Um dos diretores atribuiu essa dificuldade de compreensão à falta de detalhamento da análise e solicitou que ela fosse refeita. Para a surpresa de todos, o processo de aprofundar a análise foi bastante complexo e tomou muito mais tempo do que estava previsto. Entre as dificuldades observadas na análise, houve: Problemas para cruzar dados, mesmo que todos eles estivessem bem estruturados no banco de dados; Dificuldade em relacionar os dados com os fatores que impactaram nos resultados da empresa; Falta de clareza em decidir quais gráficos eram os mais adequados para representar a informação. No final, a diretoria conseguiu obter o resultado que queria, mas ficou claríssimo que seria necessário reestruturar a área de análise da empresa por meio de treinamentos para os membros do time, adoção de tecnologias OLAP e de visualização de gráficos e relatórios dinâmicos e da construção de indicadores que relacionassem os dados com os fatores que são influenciados por eles. E você, concorda com as ações adotadas pela diretoria? Que ferramenta usaria para fazer as análises? Que tipo de treinamento indicaria para o time de análise? Tomar decisões exige planejamento, estudo e “sujar a mão com graxa”. Após a leitura do caso, é hora de aplicar seus conhecimentos! Vamos ligar esses pontos? 3. CONSIDERE O SEGUINTE CENÁRIO: VOCÊ TRABALHA NA VENDAS ON-LINE S.A. E LHE PEDIRAM QUE FIZESSE UMA DEMONSTRAÇÃO DE UMA FERRAMENTA PARA ANÁLISE DOS DADOS VOLTADA PARA INTELIGÊNCIA DE NEGÓCIOS (BUSINESS INTELLIGENCE). VOCÊ SABE QUE NO DIA DA APRESENTAÇÃO É ESPERADA A PRESENÇA DE PESSOAS COM DIFERENTES PERFIS E CARGOS. NESSE CENÁRIO, QUAL SERIA A ESTRATÉGIA QUE VOCÊ UTILIZARIA PARA QUE SUA APRESENTAÇÃO FOSSE BEM- SUCEDIDA? RESPOSTA O primeiro passo é a demonstração da necessidade. A utilidade de uma ferramenta é demonstrada pela sua capacidade de resolver problemas importantes da empresa. No caso da Vendas On-line S.A., existe a demanda de estudar o comportamento das vendas dos diversos produtos. Demonstrada a necessidade, vem a parte de mostrar os benefícios que uma ferramenta de análise pode oferecer e como isso pode ser útil no dia a dia para dar suporte à tomada de decisão. INTRODUÇÃO AO POWER BI O Power BI é uma plataforma de Business Intelligence e Business Analytics da Microsoft, lançada em 2015 como uma evolução de extensões do Excel 2013, então denominadas Power Query, Power Pivot e Power View. A plataforma provê recursos de data warehouse, incluindo preparação e carga de dados, assim como visualizações de dados por meio de uma interface simples e amigável que permite a criação de relatórios e painéis (dashboards) interativos. Como consequência da sua crescente popularidade entre os usuários do Excel, o Power BI rapidamente ganhou marketshare em diversas áreas de aplicação, passando a figurar no Quadrante Mágico do Gartner Group como uma das plataformas líderes no mercado de BI&A. javascript:void(0) Segundo as avaliações de mercado realizadas pelo Gartner Group, as seguintes características são determinantes para a liderança do Power BI no mercado: A plataforma é fácil para iniciantes, pois a maioria dosseus usuários conhecem as funcionalidades do Excel. A versão Power BI Desktop não tem custo de licença e é uma ferramenta suficientemente poderosa e completa para suportar provas de conceito com soluções definitivas para casos de negócio. Uma desvantagem apontada nas avaliações é que o Power BI ainda roda exclusivamente no Windows. Porém, usuários de outros sistemas operacionais, como Linux e Mac OS, podem usar a versão Power BI Services, um serviço on-line baseado em SaaS (do inglês Software as a Service ou Software como Serviço). Além disso, o Power BI Mobile Apps fornece aplicativos para dispositivos Android e iOS, bem como para smartphones e tablets windows. BAIXANDO O INSTALADOR DO MICROSOFT POWER BI A primeira etapa para explorar o Microsoft Power BI é instalar a versão Desktop na máquina e, para tanto, é necessário fazer o download do instalador no site do desenvolvedor da ferramenta. Caso ainda não possua o instalador em sua máquina, esse pode ser encontrado no endereço indicado na preparação para este conteúdo. SAIBA MAIS Em se tratando de um equipamento Mac OS ou Linux, conforme descrito anteriormente, não existe instalador para tais sistemas operacionais. Entretanto, é possível o uso on-line do Power BI (assim como no Microsoft Office 365, em que se pode usar a versão on-line), que não demanda a instalação na máquina local, mas exige uma conta de acesso corporativo ou de estudante ou ainda, fazer a instalação em uma máquina virtual. Os requisitos de instalação de máquinas virtuais, bem como os softwares necessários não serão abordados explicitamente neste conteúdo, mas haverá uma dica na sessão Explore + sobre a instalação de ambientes virtualizados, em que se procederá a instalação do Power BI de forma similar à contida neste material. ATENÇÃO Cabe apenas ressaltar que os recursos computacionais necessários para execução da ferramenta em uma máquina virtual serão maiores que os listados a seguir, visto que estão sendo executados simultaneamente dois sistemas operacionais em uma mesma máquina. REQUISITOS MÍNIMOS DE SISTEMA PARA O MICROSOFT POWER BI As configurações mínimas descritas pela desenvolvedora da ferramenta para o correto funcionamento são: FRAMEWORK .NET Mínimo: Versão 4.8 (há necessidade de módulos adicionais quando a versão do Windows não for a 10 ou Windows Server 2016 em diante). Recomendado: Versão 4.8. ARMAZENAMENTO Mínimo: 1GB (será necessário espaço adicional no servidor de banco de dados que hospeda o servidor do relatório). Recomendável: Apesar de não ser explicitamente recomendado pela empresa, o uso de armazenamento em memória SSD (do inglês Solid State Drive ou Dispositivo de Estado Sólido) aumenta a resposta de aplicações baseadas em consulta e escrita de dados, sendo recomendável a utilização em máquinas de desenvolvimento e em servidores, caso seja possível do ponto de vista financeiro. MEMÓRIA Mínimo: 1GB. Recomendável: Pelo menos 4GB. VELOCIDADE DO PROCESSADOR Mínimo: Processadores x64 1.4GHz. Recomendável: Processadores x64 com 2.0GHz ou mais rápidos. SISTEMA OPERACIONAL Mínimo: Windows 8.1 e Windows Server 2012 R2 (com a instalação do Framework .NET antes de instalar o Power BI). Recomendável: Windows Server 2016/2019 (Datacenter/Standard), Windows 10 (Home/Professional/Enterprise). É importante salientar que essas são as configurações mínimas descritas no site do desenvolvedor e, quanto melhor o equipamento disponível, melhor será o desempenho da ferramenta. Esse elemento de performance fica mais evidente quando se demanda processar grandes volumes de dados, independentemente de se tratar dos ambientes de Desenvolvimento, Garantia de Qualidade ou Produção. INSTALAÇÃO DO MICROSOFT POWER BI Veja o processo para a instalação do Microsoft Power BI: Para os que ainda não possuem o instalador da ferramenta baixado na máquina local, este é o site do desenvolvedor indicado para baixar o instalador. Ao clicar no botão “Faça download gratuitamente”, em uma máquina que atenda aos requisitos descritos previamente, será iniciada a aplicação Loja Microsoft direcionada ao Power BI. Nessa janela, clique no botão “Instalar” para que o processo automatizado de download e instalação se inicie. O progresso da instalação pode ser acompanhado pela interface da loja da Microsoft, sendo que o tempo de instalação vai depender da qualidade e velocidade da conexão. Tipicamente, com uma internet de 120Mb/s, o download dura menos de 5 minutos e o tempo de instalação depende das configurações do equipamento, tendendo a ser maior inclusive se a execução se der em um ambiente virtualizado. Após esse processo, o Power BI pode ser aberto normalmente e, dessa forma, será possível prosseguir para as configurações mais simples da ferramenta antes de iniciar qualquer etapa do processamento de dados. EXECUÇÃO E CONFIGURAÇÃO DO MICROSOFT POWER BI Se devidamente instalado, o Power BI ao ser executado apresenta uma interface que traz algumas informações e possibilidades de início do uso da ferramenta. Na figura a seguir, pode-se observar, no painel preto à esquerda, as opções de ingestão de dados e de arquivos de relatórios editados recentemente. No painel amarelo, a ferramenta apresenta algumas fontes de conteúdo relacionadas a novidades de atualizações da ferramenta, guias para utilização em blogs e fóruns para discussões, além de um guia introdutório com tutoriais para os novos usuários. Captura de tela do Software Power BI. ATENÇÃO É importante ressaltar que essa janela inicial contém opções que podem ser acessadas através de menus do Power BI, por exemplo, no menu “Página Inicial” para as opções mostradas no painel preto e no menu “Ajuda” para as opções mostradas no painel amarelo. Sobre as configurações da ferramenta para uso em algum projeto, devem ser observados alguns aspectos durante a elaboração do relatório ou painel como: Tamanho das bases utilizadas Região de uso do relatório Complexidade dos filtros a serem aplicados Tais elementos podem impactar significativamente na experiência do usuário consumidor do relatório gerado, tanto em tempo de processamento quanto na usabilidade proposta pelo desenvolvedor. O tamanho das bases utilizadas influencia diretamente no esforço computacional envolvido no cálculo de elementos do relatório e deve ser o primeiro ponto de configuração de um relatório. Para tanto, pode- se habilitar o armazenamento de dados localmente para processamento pelo Power BI ou, idealmente, processar a maior quantidade de dados possível dentro da fonte de dados original (ERP ou Business Warehouse, por exemplo), ou durante a query de extração de tais informações. Dessa forma, haverá uma menor quantidade de informações a serem baixadas e processadas localmente, que normalmente tende a ter configurações e capacidade de expansão inferiores a servidores. As configurações relacionadas a esse aspecto no Power BI podem ser ajustadas no menu: “ARQUIVO” > “OPÇÕES E CONFIGURAÇÕES” > “OPÇÕES” > “GLOBAL” – “CARREGAMENTO DE DADOS”. Você também pode ver na imagem abaixo o caminho a ser seguido: Captura de tela do Software Power BI. A região de uso do relatório ou painel também deve ser considerada durante a configuração inicial, pois ela influencia em aspectos de manutenção do relatório gerado, bem como nos padrões a serem utilizados pelo time de desenvolvimento, principalmente, se os times forem globais. SAIBA MAIS Atualmente, a solução não possui uma ferramenta nativa de conversão de elementos utilizados nos relatórios como, por exemplo, índices de tabelas, sendo possível apenas a conversão de elementos nativos da aplicação que ainda depende do idioma local do usuário (navegador ou Power BI desktop). As configurações relacionadas a esse aspecto no Power BI podem ser ajustadas no menu: “ARQUIVO” > “OPÇÕES E CONFIGURAÇÕES” > “GLOBAL” – “CONFIGURAÇÕES REGIONAIS” > IDIOMA DO APLICATIVO | IDIOMA DO MODELO | ETAPAS DE CONSULTA OU, AINDA, EM “ARQUIVO” > “OPÇÕESE CONFIGURAÇÕES” > “OPÇÕES” > “ARQUIVO ATUAL” – “CONFIGURAÇÕES REGIONAIS” > LOCALIDADE PARA IMPORTAÇÃO. Você também pode ver, na imagem a seguir, o caminho a ser seguido: Captura de tela do Software Power BI. Sobre a complexidade dos filtros a serem aplicados no relatório, existe um impacto sobre a experiência do usuário, considerando que o número de filtros a serem aplicados pode ser considerável dependendo do relatório desenvolvido. Assim, se um conjunto de filtros deve ser aplicado em uma base de dados de tamanho considerável, existe um tempo de latência entre a aplicação do filtro selecionado e a atualização dos dados na tela que tende a ser demasiado longo e que nesses casos pode ser aplicado de uma única vez ao fim da seleção de todos os filtros no relatório. A utilização desse aspecto do relatório será abordada no módulo seguinte. As configurações necessárias para habilitar esse aspecto no Power BI podem ser ajustadas no menu: “ARQUIVO” > “OPÇÕES E CONFIGURAÇÕES” > “GLOBAL” – “CONFIGURAÇÕES REGIONAIS” > IDIOMA DO APLICATIVO | IDIOMA DO MODELO | ETAPAS DE CONSULTA OU, AINDA, EM “ARQUIVO” > “OPÇÕES E CONFIGURAÇÕES” > “OPÇÕES” > “REDUÇÃO DE CONSULTA”. Você também pode ver na imagem abaixo o caminho a ser seguido: Captura de tela do Software Power BI. Após a instalação e definições básicas que dependerão de cada projeto, pode-se seguir para avaliar as demais funcionalidades mais comuns ao Power BI quando da elaboração de relatórios e painéis. INSTALAÇÃO DO POWER BI DESKTOP Chegamos ao fim de mais um módulo e, para prosseguir, assista ao vídeo indicado que demonstra a instalação e a configuração inicial do Microsoft Power BI Desktop. VERIFICANDO O APRENDIZADO MÓDULO 3 Reconhecer as funcionalidades básicas da ferramenta Microsoft Power BI LIGANDO OS PONTOS Você conhece as funcionalidades básicas do Microsoft Power BI? Sabe como elas podem lhe ajudar a construir soluções de Business Intelligence de modo eficaz? Para entendermos sobre os conceitos na prática, vamos analisar uma situação. A empresa Bom Paladar S.A. (empresa fictícia) atua no setor de alimentos. Ela se posiciona como uma empresa que oferece produtos de alta qualidade e, ainda assim, tem preços competitivos em relação a outros concorrentes do mercado. Dessa forma, ela consegue ter entrada nos mais diversos segmentos da sociedade. Uma de suas características é possuir uma cultura de análise de resultados por meio de indicadores-chaves que são utilizados para corrigir e melhorar a execução de processos rotineiramente. Recentemente, a equipe de análise de dados recebeu da diretoria a incumbência de estudar o potencial de crescimento da empresa para um novo perfil de público: jovens de 20 a 25 anos. Para realizar esse estudo, a equipe utilizou diversas fontes de dados. Algumas delas foram de arquivos texto, outras de planilhas e algumas outras estavam em tabelas do banco de dados. A estratégia adotada pelo time foi: Elaborar um conjunto de perguntas para as quais a análise deve produzir respostas; Construir uma relação lógica entre os dados e os indicadores-chaves de modo que representem como o potencial de crescimento pode ser influenciado pelas novas estratégias de atuação; Estabelecer um roteiro de análise; Implementar o projeto em uma ferramenta de análise específica para inteligência de negócios (Business Intelligence). Ao completar todas essas etapas, o representante do time de análise apresentou os resultados em relatórios e gráficos que respondiam às seguintes questões: Os produtos e a periodicidade em que são mais consumidos pelo público de 20 a 25 anos; Como esse público reage quando ocorre atrasos na entrega; Quais são os principais comentários e avaliações desse público em relação aos produtos da Bom Paladar S.A. Ao final da apresentação, o trabalho foi bastante elogiado e funcionou como base para o processo de expansão dos negócios da Bom Paladar S.A. E você, concorda com os passos que o time de análise da Bom Paladar S.A. tomou? Faria alguma coisa diferente? Após a leitura do caso, é hora de aplicar seus conhecimentos! Vamos ligar esses pontos? 3. CONSIDERE O SEGUINTE CENÁRIO: VOCÊ FOI CONTRATADO PELA BOM PALADAR S.A. PARA ENSINAR A UM TIME DA EMPRESA COMO CONSTRUIR INDICADORES- CHAVES. VOCÊ FOI AVISADO DE QUE AS PESSOAS QUE VOCÊ VAI ENSINAR TÊM POUCA EXPERIÊNCIA NA ÁREA. INFELIZMENTE, O TEMPO É LIMITADO E, PARA ATINGIR SEUS OBJETIVOS, VOCÊ PRECISA TRAÇAR UMA ESTRATÉGIA MUITO EFICIENTE DE TRANSMISSÃO DE CONHECIMENTOS. COM BASE EM SUA EXPERIÊNCIA, COMO VOCÊ CUMPRIRIA ESSA MISSÃO? RESPOSTA A melhor forma de aprender como construir um indicador-chave é por meio de exemplos práticos. Em especial, por causa da limitação do tempo. Portanto, uma boa estratégia de transmissão de conhecimento é analisar um subconjunto de indicadores-chaves relacionados ao negócio que já tenham sido validados. Ao longo do treinamento, o conhecimento deve ser transmitido com pequenas tarefas de modo que as pessoas possam cumprir pequenas missões e, assim, acumularem vitórias e absorverem o conhecimento. Este módulo cobre características elementares da ferramenta, desde a apresentação das diferentes formas de se conectar dados até as áreas de manipulação e etapas mais comuns de limpeza e preparação de dados quando se conecta a bases, de modo que o aluno seja capaz de: Inserir diferentes tipos de fontes de dados. Conhecer os elementos principais para manuseio da ferramenta. Reconhecer aspectos de performance OLAP no Power BI. INSERÇÃO DE DIFERENTES TIPOS DE FONTES DE DADOS Supondo que haja dados disponíveis e que se sabe a sua localização, podendo ser dentro ou fora de uma empresa, esses devem ser ingeridos na plataforma em que se deseja construir relatórios ou painéis para acompanhamento de um projeto ou produto que deve ser monitorado ou estudado. COMENTÁRIO A disponibilidade de tais dados pode modificar de forma substancial o modelo de dados utilizado e a ingestão de forma geral, sendo que podem estar em servidores de bancos de dados, sites na web, javascript:void(0) arquivos de diferentes formatos, entre outras fontes. A ingestão de tais dados na ferramenta Power BI pode ser feita de forma simples, valendo a máxima de que nem sempre o fato de ser possível indica o que é o recomendável. Nos tópicos a seguir, apresentaremos as formas de ingestão dos tipos mais comuns de bases de dados no Power BI, sendo indicada aqui a instrução simplificada de como conectar a diferentes tipos de bases na ferramenta. Entretanto, vale atentar para conceitos de escala de dados ao se abordar ingestão e tratamento de dados, cujos detalhes não serão discutidos por exceder o escopo deste conteúdo. A ingestão pode ser feita de diversas formas, sendo aqui abordada a estrutura mais geral, cobrindo alguns tipos de conectores prontos na ferramenta, cabendo apenas as especificações de endereços e permissões no caso de bancos de dados e serviços. As opções ficam dentro do menu Página Inicial, na área Dados, conforme a imagem a seguir: Captura de tela do Software Power BI. Essa área contém o botão de obtenção de dados, destacado em vermelho, e atalhos de alguns dos tipos mais comuns de inserção. Tais funcionalidades também se encontram dentro do botão destacado. Ao se clicar no elemento Obter Dados, abre uma janela de seleção conforme a imagem a seguir: Captura de tela do Software Power BI. Nessa janela, há uma expansão das possibilidades de ingestão de dados em que os tipos mais comuns podem ser abordados. ATENÇÃO Vale ressaltar que existem diversos conectores para soluções nativas Microsoft e concorrentes, como do Google Cloud Platform ou Amazon Web Services. Ao se estudar a ingestão de dados relacionando modelagem e uso da linguagem M, pode-se abordar com mais detalhes alguns dos conectores, já que para tanto são considerados diferentes fontes e tipos de dados utilizados para ilustrar a modelagem de dados. Os indicadores numéricos da imagem representamingestão de dados segregados por arquivos, bancos de dados, fontes na Web ou Analysis Services, e podem ser mais bem descritos nos tópicos a seguir: CÍRCULO VERDE COM O NÚMERO 1 – OBTER DADOS DE ARQUIVOS Dados provenientes de arquivos com extensões diversas podem ser incluídos facilmente no Power BI. As extensões mais comuns são arquivos de Excel .xlsx, .csv, .dat, .txt ou outros, desde que possuam lógica de separação clara e simples. CÍRCULO VERMELHO COM O NÚMERO 2 – OBTER DADOS DE BASES RELACIONAIS Bancos de dados relacionais e não relacionais podem ser utilizados como fonte para projetos no Power BI. Vale destacar que, sempre que possível, os dados devem ser carregados com o máximo de transformações já feitas no servidor de banco de dados, de modo a reduzir a carga na ferramenta. Outras estratégias de redução de processamento serão abordadas neste conteúdo. CÍRCULO AMARELO COM O NÚMERO 3 – OBTER DADOS DO AZURE ANALYSIS SERVICES (AAS) Existe um conector especial para o serviço do AAS que visa facilitar a conexão de tais bases de dados ao Power BI, sendo uma camada intermediária de processamento de dados com a finalidade de reduzir a demanda no cliente Power BI do usuário, quando impossibilitado de se operar diretamente no banco de dados. CÍRCULO ROXO COM O NÚMERO 4 – OBTER DADOS DE SERVIÇOS ON-LINE A conexão a sites e endereços indexados na web pode ser feita com esse tipo de conector, sendo que, após a inserção do endereço do domínio, haverá uma etapa na qual os dados serão segregados dentro da ferramenta de transformação do Power BI. Cabe salientar que, dependendo da estrutura do site acessado, pode não ser possível estruturar a informação nele contida. ELEMENTOS PRINCIPAIS PARA MANUSEIO DA FERRAMENTA O Power BI contém quatro grandes elementos para interação com o usuário no fluxo de desenvolvimento de relatórios e painéis, sendo cada um responsável por uma etapa bem definida. Dentre as possibilidades da ferramenta, é possível acessar os elementos na interface pelos seguintes botões numerados na imagem abaixo: Captura de tela do Software Power BI. Transformar dados Relatório Dados Modelo O primeiro elemento na interface (Transformar dados) é o Editor do Power Query, em que se tem a possibilidade de editar a base de dados a ser inserida logo na importação. Dentro dessa estrutura, existem diversas possibilidades de tratamento, sendo que a intenção nesta etapa é dar visibilidade das ferramentas disponíveis, e não de cobrir como se deve operar tais ferramentas. A seguir, pode-se observar uma janela do editor com um arquivo simples aberto, para se explorar tais funcionalidades disponibilizadas: Captura de tela do Software Power BI, adaptada por Paulo Lomeu. Veja mais explicações sobre cada uma das seções apresentadas: SEÇÃO 1 SEÇÃO 2 SEÇÃO 3 Nesta seção, são exibidos os dados importados em diferentes tabelas, ou seja, caso seja importado um arquivo .xlsx com várias abas, cada uma das abas seria uma linha de consulta diferente e o mesmo pode se aplicar para qualquer tipo de arquivo ou de base de dados. Por exemplo, em tabelas de visualizações de cubos ou arquivos .json importados. Nesta seção central, são apresentados os dados de cada uma das consultas, de acordo com o separador identificado automaticamente. Caso o identificador não seja identificado de forma autônoma, o usuário pode alterar nas Configurações da Fonte de Dados. Também é nessa área em que se avalia os tipos de dados importados e sua conformidade com o esperado, bem como se há dados faltantes ou com falhas e erros. Na seção número 3, à direita, estão as propriedades da base de dados bem como as etapas de processamento eventualmente aplicadas, como filtros, reordenações, renomeações, entre outras. É importante frisar que a ordem das etapas aplicadas é crítica no tratamento aplicado e alterações sem levar esse ponto em consideração podem quebrar uma solução. No menu principal, há a Página inicial, Transformar, Adicionar coluna, Exibição, Ferramentas e Ajuda como opções. Dentro de tais menus, estão contidos os diversos mecanismos de tratamento de dados do Power BI. Veja detalhes do menu: A imagem sumariza os campos de uso da ferramenta no que diz respeito a importar novas bases, configurações de tais bases e grandes operações relacionadas à importação de base, como, por exemplo, a divisão de colunas. Já o menu Transformar contém os recursos para alterar as próprias colunas e elementos importados das bases, sem fazer a inclusão de novas informações, apenas modificando as existentes. O menu Adicionar Coluna contém as funcionalidades de criar novas colunas utilizando para tanto as existentes. Pode conter já algumas transformações de dados de acordo com o comando utilizado na criação de novas colunas ou demandar transformações subsequentes do menu anterior. O menu de Exibição contém ajustes para exibição de elementos visuais auxiliares no desenvolvimento dos tratamentos de dados, por exemplo, exibir a barra de fórmulas similar à existente no Excel para acompanhar o código gerado pelas transformações feitas usando a interface gráfica. Por fim, o menu de Ferramentas contém itens de diagnóstico no carregamento de informações e itens de suporte para localização de falhas no processo de carregamento. O segundo elemento na interface (Relatório) é a visão Relatório do Power BI, o local em que se edita o relatório ou painel desenvolvido, adicionando as visualizações em forma de gráficos, tabelas, cartões ou mapas. Esse elemento está na janela principal do Power BI e, ao se inserir conjuntos de dados para serem utilizados em um relatório, a ferramenta apresenta tipicamente o seguinte layout: Captura de tela do Software Power BI. A área em branco no retângulo amarelo é o local em que se compõe o relatório ou painel sendo desenvolvido. Sua área pode ser configurada e ajustada de acordo com o layout necessário e novas páginas ou visualizações podem ser adicionadas pelo botão “+” dentro da área em destaque vermelha. Os campos com os dados passíveis de serem utilizados são exibidos dentro do retângulo verde e agrupados por base de dados inserida. No caso do exemplo ilustrado na imagem, existem nove variáveis com as quais se pode gerar elementos visuais. A última área que compõe a visualização de relatório talvez seja a mais importante, pois contém todas as visualizações nativas passíveis de serem utilizadas ou ainda ícone para se inserir uma visualização customizada gerada nas linguagens Python ou R. Essa área também apresenta os campos para se inserir as informações da visualização e nível de detalhe ou interação com os demais componentes do relatório, bem como as configurações disponíveis para customização de um dado elemento de visualização inserido no relatório. ATENÇÃO Os menus disponibilizados nessa visualização são Página Inicial, Inserir, Modelagem, Exibição e Ajuda, sendo importante relembrar que tais menus se alteram ao se navegar em outras funcionalidades, como nas visualizações Dados e Modelos, a serem discutidas a seguir. Veja detalhes dos menus: O menu Página Inicial possui os elementos de inserção de dados, inserção de visuais (elementos) ou, ainda, itens de modelo de dados (Medidas). Também apresenta um botão para publicação do relatório ou painel desenvolvido, porém essa funcionalidade só é possível de ser utilizada quando conectado na conta on-line da Microsoft e a partir de lá controlar quais os grupos terão acesso aos relatórios criados. O menu Inserir possui uma expansão dos elementos contidos na página inicial, na seção Inserir, havendo elementos gráficos possíveis de serem inseridos e, ainda, elementos visuais para compor as interfaces. Além disso, é possível associar ao relatório aplicativos do Power Apps com interação simplificada. O menu Modelagem trata da inclusão de elementos novos no modelo de dados, podendo ser Medidas ou Colunas novas, parâmetros ou tabelas novas. Por fim, a Exibição apresenta as customizaçõesde temas utilizados, e que podem ser configurados separadamente, além das possibilidades de escolher modo Layout móvel e outros tópicos, como os Filtros aplicados no relatório, ou Indicadores para serem utilizados como referências de navegação. Ainda deve ser observado que, ao se inserir algum elemento no relatório e ele estiver selecionado, o menu disponibilizará novos itens para edição, conforme a imagem abaixo destaca em vermelho para elementos do gráfico de colunas clusterizado: Captura de tela do Software Power BI. O elemento na interface Dados, destacado pelo ícone de tabela com destaque de um retângulo roxo na imagem abaixo, como o próprio nome sugere, é utilizado para suportar modificações nos dados, sejam por transformações ou adições de informações por colunas, tabelas ou medidas. Captura de tela do Software Power BI. De modo geral, a visão Dados é utilizada como suporte visual e de navegação para a visualização Transformar dados, na qual estão as ferramentas de transformação e inclusão de dados. O elemento na interface Modelo, indicado pelo ícone de itens se relacionando, com destaque de um retângulo roxo na imagem abaixo, como o próprio nome sugere, é utilizado para suportar modificações no esquema de dados, sejam por transformações ou adições de informações por colunas, tabelas ou medidas. Captura de tela do Software Power BI. ATENÇÃO Essa visualização tem fundamental importância no processo de modelagem e entendimento do modelo de dados aplicado, sendo possível visualizar e editar as relações entre diferentes tabelas com uso de chaves. Além do mais, existem as configurações sobre o carregamento parcial de dados, bem como das relações estabelecidas entre variáveis de diferentes bases. ASPECTOS DE PERFORMANCE OLAP NO POWER BI Um ponto importante referente ao processamento de dados no Power BI e em qualquer sistema de visualização e análise de dados está relacionado ao montante de informação que deve ser processado, bem como onde essas transformações devem ocorrer. Neste módulo, abordaremos dois aspectos que podem ser configurados diretamente na ferramenta, além das soluções em serviços de bancos de dados, claro. Os dois aspectos são: Modo de armazenamento utilizado Otimização de performance No primeiro tópico, são avaliados aspectos de armazenamento de conjuntos de dados. Ainda que a forma de utilizar os dados na ferramenta seja importando um conjunto de dados do Power BI, essa abordagem pode não funcionar em todas as ocasiões. Pode haver situações em que a base de dados é grande demais para ser armazenada localmente ou que os dados devem ser os mais atuais possíveis. É possível contornar alguns desses gargalos de desempenho ou disponibilidade de informação atualizada por meio das configurações do Modo de armazenamento, sendo possível escolher entre Importar, DirectQuery ou Duplo. Veja as diferenças entre esses modos de armazenamentos: MODO DE IMPORTAÇÃO Possibilita a criação de uma cópia local dos dados do Power BI, proveniente da fonte de dados e que é exportada junto com o modelo do Power BI quando publicado ou compartilhado. Dessa forma, os dados devem ser atualizados manualmente, utilizando o botão Atualizar, tanto na janela principal do Power BI, quanto na de Transformação de dados. MODO DIRECTQUERY Apresenta vantagens quando não é possível salvar cópias locais de dados, pois eles não serão armazenados em cache, sendo consultados na fonte quando uma solicitação ou gatilho for acionado. Essa opção é a mais adequada quando se trata de grandes volumes de dados, reduzindo o tempo de carregamento quando se elimina o pull. Dessa forma, os dados consumidos pelo modelo sempre serão os mais atuais, atendendo aos requisitos de segurança de consulta. CONSULTA COMPOSTA OU MODO DUPLO Agrega o melhor de ambas as possibilidades quando disponível e a escolha de quais elementos serão importados ou consultados é feita de forma automática pela ferramenta. A localização dessas configurações pode ser encontrada na janela Modelo da ferramenta a partir do processo indicado na imagem a seguir: Captura de tela do Software Power BI. A otimização de desempenho no Power BI pode ser feita com o auxílio da ferramenta Performance Analyzer, localizada no menu Exibição. Com ela, é possível detectar quais elementos do relatório ou do painel possuem uma maior latência no carregamento e disponibilização de dados para, então, atuar na solução, que pode extrapolar os limites do Power BI. A imagem abaixo ilustra o botão de abertura da ferramenta no Power BI, no item de destaque 1, bem como a funcionalidade exibida ao se clicar, no item de destaque 2. Captura de tela do Software Power BI. O principal ponto de melhoria de performance de carregamento de dados no Power BI está no Power Query, mas este depende diretamente do desempenho no nível da fonte de dados. Isso significa que, no exemplo de um conjunto de dados ser provido por um servidor SQL, as premissas de melhores práticas para desempenho de SQL devem ser aplicadas nas consultas a essas bases, bem como deve se garantir a integridade, especificação e correto funcionamento do hardware desse servidor para atingir os níveis esperados de performance. ATENÇÃO A estratégia para aumentar o desempenho da consulta na fonte de dados pelo Power Query se chama Dobragem de consultas. Esse processo possibilita que as edições feitas no Editor do Power Query sejam controladas de forma simultânea como instruções SQL Select simples ou consultas nativas enquanto se avança no processo de transformações. Dessa forma, pode-se garantir que o máximo de transformações ocorra diretamente no servidor da fonte de dados, reduzindo, assim, a carga sobre os recursos do Power BI. Os benefícios da dobragem de consultas incluem mais eficiência nas atualizações de dados e nas atualizações incrementais e a compatibilidade automática com os modos de armazenamento DirectQuery e Modo duplo. As consultas nativas não são possíveis para um conjunto de transformações, sendo elas: 1 Adicionar coluna índice. 2 Mesclar ou acrescentar colunas de tabelas diferentes de fontes de dados diferentes. 3 Alterar o tipo de dado de uma coluna. 4 Executar funções DAX complexas. Uma boa prática de avaliação da utilização de Consulta nativa é avaliar se a transformação em uma instrução SQL tenha cláusulas como GROUP BY, SORT BY, WHERE, JOIN, entre outros. Outra forma de otimizar o desempenho é utilizar o Diagnóstico de Consulta, ferramenta disponibilizada no menu Ferramentas do Editor do Power Query. Com essa ferramenta, é possível mapear os gargalos existentes durante o carregamento e transformação de dados. Além dos artefatos de otimização de performance providos no Power BI, existem estratégias clássicas para melhorar desempenhos em consultas de dados. O primeiro ponto é processar o máximo possível das transformações dentro das fontes de dados originais, reduzindo, assim, a demanda de processamento na ferramenta. O segundo ponto é fazer o uso de consultas SQL nativas, reduzindo a extração de dados para processar internamente. O terceiro ponto é separar datas e horas quando combinadas na mesma coluna. Ao final deste módulo, compreende-se as possibilidades de inserção de dados no Power BI, os principais elementos que compõem a ferramenta e suas funcionalidades e pontos de tratativa de performance. FUNCIONALIDADES BÁSICAS DO POWER BI Estamos chegando ao fim do nosso conteúdo, mas antes, assista ao vídeo a seguir e veja as principais características e funcionalidades básicas da ferramenta Power BI. VERIFICANDO O APRENDIZADO CONCLUSÃO CONSIDERAÇÕES FINAIS Como vimos, ao longo do conteúdo, foram apresentados tópicos de Processamento Analítico On-line (OLAP) juntamente com a ferramenta Power BI, que possui capacidade de carregar, processar e visualizar informações e dados de forma simples e eficaz. Além de a instalação ser um processo simples em máquinas Windows, o processo decarregar informações e aplicar tratamentos no conjunto de dados também é muito acessível ao usuário da plataforma Microsoft Office, compartilhando vários elementos visuais e de navegação entre as ferramentas. Usuários acostumados com a ferramenta Power Query do Excel apresentam vantagem extra no exercício de extração e transformação de dados, já que ela é usada no Power BI de forma nativa, bem como as linguagens DAX e M. Tópicos sobre performance de extração e processamento de dados também foram apresentados, ressaltando a importância de analisar esse aspecto em outras esferas de uma solução. Por ser um tópico muito complexo e extenso, a cobertura de performance e otimização de extração de dados deve ser aprofundada em outra oportunidade, cabendo aqui apenas os ajustes mencionados no material. PODCAST Estamos encerrando o conteúdo Visão geral de OLAP e do Power BI, mas, antes de finalizar, ouça o podcast que preparamos sobre o assunto. AVALIAÇÃO DO TEMA: REFERÊNCIAS BECKER, B. Design Tip #178 Tried and True Concepts for DW-BI Success. Kimball Group. Publicado em: 1 out. 2015. Consultado na internet em: 7 jun. 2021. GARTNER. Microsoft Power BI Reviews by Microsoft in Analytics and Business Intelligence Platforms. Gartner. Consultado na internet em: 7 jun. 2021. HAN, J.; KAMBER, M.; PEI, J. Data Mining: Concepts and Techniques. 3. ed. Massachusetts: Morgan Kaufmann, 2012. KIMBALL, R.; ROSS, M. The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling. 3. ed. New Jersey: Wiley, 2013. WEBB, C. Power BI da Microsoft. Blog do Microsoft Power BI. Publicado em: 3 jun. 2021. Consultado na internet em: 7 jun. 2021. EXPLORE+ Para saber mais sobre os assuntos tratados neste conteúdo, pesquise na internet: Uma boa referência de conteúdos sobre DW e arquiteturas para sistemas OLAP pode ser encontrada no site do Kimball Group, sendo esse mantido pelo precursor das estratégias de sucesso em sistemas OLAP. O site da Microsoft publica vários recursos do Power BI, incluindo uma Introdução ao Power BI Desktop, em formato Getting Started. CONTEUDISTA Paulo Frederico Souza Lomeu
Compartilhar