Baixe o app para aproveitar ainda mais
Prévia do material em texto
Módulo Laboratório de Open Source Business Intelligence 1 Módulo Laboratório de Open Source Business Intelligence Módulo Laboratório de Open Source Business Intelligence 2 Sumário Introdução .................................................................................................................................................................................. 7 O Problema ........................................................................................................................................................................... 7 Soluções Tradicionais e Suas Limitações ......................................................................................................................... 8 Pentaho Business Intelligence: Visão Geral ....................................................................................................................... 10 O que é o Pentaho? .......................................................................................................................................................... 10 História .................................................................................................................................................................................. 10 Quem é a Pentaho Corporation? .................................................................................................................................. 11 Quem é Quem na Pentaho? ........................................................................................................................................... 12 Origem do Nome ............................................................................................................................................................... 12 Modelo de Negócios ......................................................................................................................................................... 12 Versões ................................................................................................................................................................................. 13 Pentaho e Big Data............................................................................................................................................................ 15 Pentaho Agile BI ................................................................................................................................................................. 15 Arquitetura ........................................................................................................................................................................... 16 Pentaho do Mundo............................................................................................................................................................ 20 Pentaho no Brasil ................................................................................................................................................................ 21 Sumário de Vantagens do Pentaho ............................................................................................................................... 21 Pentaho Business Intelligence: Componentes .................................................................................................................. 23 Pentaho BI Server................................................................................................................................................................ 23 Apache Tomcat ............................................................................................................................................................. 24 Jetty .................................................................................................................................................................................. 24 Spring Security ................................................................................................................................................................ 25 Hibernate ......................................................................................................................................................................... 25 Quartz ............................................................................................................................................................................... 25 Hyper SQL (HSQLDB) ...................................................................................................................................................... 26 Pentaho Administration – PAC ......................................................................................................................................... 26 Pentaho User Console – PUC ........................................................................................................................................... 26 Pentaho Data Integration ................................................................................................................................................ 26 Pentaho Analysis ................................................................................................................................................................. 28 Pentaho Schema Workbench ..................................................................................................................................... 29 Pentaho Aggregation Designer .................................................................................................................................. 29 Módulo Laboratório de Open Source Business Intelligence 3 Mondrian ......................................................................................................................................................................... 30 Jpivot ................................................................................................................................................................................ 30 Saiku.................................................................................................................................................................................. 30 Pentaho Reporting ............................................................................................................................................................. 31 Pentaho MetaData Editor ............................................................................................................................................ 31 Web-based Adhoc Query and Reporting ................................................................................................................ 32 Pentaho Report Designer ............................................................................................................................................. 32 Pentaho Dashboard .......................................................................................................................................................... 32 C**Tools ............................................................................................................................................................................ 32 CDF - Community Dashboard Framework ................................................................................................................ 33 CDA - Community Dashboard Access ...................................................................................................................... 33 CDE - Community Dashboard Editor ......................................................................................................................... 33 CCC - Community Chart Components.....................................................................................................................33 CST - Community Startup Tabs .................................................................................................................................... 34 Pentaho Data Mining ........................................................................................................................................................ 34 Pentaho Design Studio ...................................................................................................................................................... 34 Instalação e Configuração do Pentaho ........................................................................................................................... 35 Download e Instalação .................................................................................................................................................... 35 Drivers JDBC’s com Pentaho ............................................................................................................................................ 38 Caminhos dos drivers JDBC’s nos softwares Pentaho ............................................................................................ 41 Definindo a Senha de Publisher ...................................................................................................................................... 42 Retirando a mensagem do rodapé do JPivot no Pentaho 4 CE ............................................................................. 42 Instalação do C**Tools ...................................................................................................................................................... 43 Instalando o CDA (Community Data Access) com o CDA-Installer ................................................................... 44 Instalando o C**Tools com o C**Tools Installer ........................................................................................................ 48 Instalação do Saiku............................................................................................................................................................ 49 Saiku Plugin ...................................................................................................................................................................... 49 Saiku Reporting ............................................................................................................................................................... 49 Customização do Pentaho User Console ..................................................................................................................... 51 Retirar Listagem de Usuários ........................................................................................................................................ 51 Adicionar o Saiku na Tela de Login ............................................................................................................................ 52 Pentaho Administration Console ......................................................................................................................................... 53 Módulo Laboratório de Open Source Business Intelligence 4 Pentaho Data Integration ..................................................................................................................................................... 55 PDI e Expressões Regulares ............................................................................................................................................... 59 PDI e Principais Steps (Transformations) ......................................................................................................................... 59 Categoria Input .............................................................................................................................................................. 60 Categoria Output .......................................................................................................................................................... 63 Categoria Transform...................................................................................................................................................... 64 Categoria Utility .............................................................................................................................................................. 65 Categoria Flow ............................................................................................................................................................... 66 Categoria Scripting ....................................................................................................................................................... 67 Categoria Lookup.......................................................................................................................................................... 68 Categoria Joins .............................................................................................................................................................. 69 Categoria Data Warehouse ........................................................................................................................................ 70 Categoria Statistics ........................................................................................................................................................ 71 Categoria Job ................................................................................................................................................................ 72 Categoria Bulk loading ................................................................................................................................................. 73 Categoria Inline.............................................................................................................................................................. 73 Categoria Deprecated ................................................................................................................................................ 74 PDI e Principais Steps (Jobs) ............................................................................................................................................. 75 Categoria General ........................................................................................................................................................ 76 Categoria Mail ............................................................................................................................................................... 77 Categoria File management....................................................................................................................................... 78 Categoria Condições ................................................................................................................................................... 80 Categoria Scripting ....................................................................................................................................................... 80 Categoria Bulk loading ................................................................................................................................................. 81 Categoria XML ............................................................................................................................................................... 82 Categoria Utility .............................................................................................................................................................. 83 Categoria File transfer................................................................................................................................................... 84 SchemaWorkbench............................................................................................................................................................... 85 Introdução ........................................................................................................................................................................... 86 Objetivos .............................................................................................................................................................................. 86 Criando uma conexão com o Banco de dados ........................................................................................................ 87 Navegação ......................................................................................................................................................................... 87 Módulo Laboratório de Open Source Business Intelligence 5 Criando um Schema para identificação de um cubo .............................................................................................. 88 Publicando o Schema criado para o "Pentaho New Analysis" ................................................................................ 89 Pentaho Metadata Editor ..................................................................................................................................................... 90 Configuração inicial .......................................................................................................................................................... 91 Ativando as conexões do banco de dados ................................................................................................................ 91 Importando Tabelas Físicas e Colunas: Camada Física ............................................................................................. 92 Criando Modelo de Negócios: Camada de Lógica .................................................................................................. 92 Criando Tabelas e Colunas de Negócios ................................................................................................................. 92 Removendo Colunas Indesejáveis ao Modelo de Negócios ............................................................................... 93 Relacionando Tabelas e Colunas .............................................................................................................................. 93 Criando uma Visão de Negócios: Camada de Entrega ........................................................................................... 93 Agrupando Colunas em Categorias ......................................................................................................................... 94 Configurar os Locales no Editor de Idiomas ................................................................................................................. 94 Adicionando Segurança aos Objetos do Metadata Business.................................................................................. 94 Modificando Segurança de Conteúdos .................................................................................................................. 95 Configurando o Pentaho BI Server para Segurança ............................................................................................. 96 Backups e Recuperação de Domínio ........................................................................................................................... 96 Exportando Domínios......................................................................................................................................................... 96 Importando Domínios ........................................................................................................................................................ 96 Testando o Meta-Modelo ................................................................................................................................................. 97 Publicando um Domínio para o Pentaho BI Server ..................................................................................................... 97 Análise de Dados com o JPivot ........................................................................................................................................... 98 Análise de Dados com o Saiku .......................................................................................................................................... 114 Criação de Relatórios no WAQR ....................................................................................................................................... 123 Trabalho Prático .................................................................................................................................................................... 127 Staging Área e Script de Criação do Banco.............................................................................................................. 128 Modelo Dimensional e Script de Criação do Banco ................................................................................................ 129 Criação de Repositório no Pentaho Data Integration ............................................................................................. 131 Criação da Transformation da Staging ....................................................................................................................... 146 Carga da Dimensão Tempo .......................................................................................................................................... 188 Carga da Dimensão Município ..................................................................................................................................... 199 Carga da Dimensão Ocorrência .................................................................................................................................. 202 Módulo Laboratório de Open Source Business Intelligence 6 Carga da Fato Criminalidade ....................................................................................................................................... 205 Criação de Usuário, Data Source no PAC e Configuração da Senha de Publisher ......................................... 215 Montagem do Cubo no Schema Workbench ........................................................................................................... 218 Montagem de Modelo de Metadados no Metadata Editor .................................................................................. 236 Referências............................................................................................................................................................................. 244 Módulo Laboratório de Open Source Business Intelligence 7 Introdução As organizações estão sempre procurando aumentar seu faturamento, diminuir despesas e melhorar sua lucratividade pelo aumento da eficiência e eficácia de seus processos de negócio. Os vendedores de softwares de Business Intelligence (BI) afirmam que eles possuem a tecnologia que pode oferecer estas melhorias. Vendedores concentram-se em vender produtos ou ferramentas que podem ser usadas para construir estas soluções, mas raramente se concentram nos problemas que seus clientes estão tentando resolver. Devido a constante dinâmica de operação das organizações, novos requisitos são percebidos frequentemente, trazendo novos vendedores de softwares ao mercado, com novos produtos e consultores para fazê-las funcionar. Eventualmente, a iniciativa de instalar um BI corporativo se torna uma coleção de soluções disjuntas usando uma combinação de aplicaçõescomerciais caras, fechadas e de difícil manutenção. Dentro desta perspectiva, cada ferramenta é projetada para operar em uma tarefa muito específica. Os processos de negócios devem ser quebrados em pedaços e segregados em tarefas tais como geração de relatórios, análise, mineração de dados, workflow, etc. Não existe uma plataforma responsável pela gestão, verificação e coordenação destas tarefas. Pessoas e procedimentos são chamados para resolver estas deficiências. O Problema Ferramentas tradicionais de Business Inteligente são caras, complexas e falhas em termos de proporcionarem às empresas os benefícios prometidos em relação a ganhos de eficiência e eficácia. Empresas de software de BI prometem que seus produtos irão fornecer a agregação, análise e relatórios que transforma dados em informação de alto valor agregado que permitem a melhora dos processos decisórios nas organizações. Infelizmente, a maioria se limita a gerar relatórios, o que é muito pouco. Quando um relatório é entregue ou uma situação particular é encontrada nos dados, algumas necessidades específicas ocorrem: uma decisão deve ser feita, causas devem ser descobertas, ou um processo deve ser iniciado. Nestes casos, a apresentação da informação, análise, e a realização de business intelligence são elementos de um processo maior. Este processo existe para resolver o problema relacionado ao negócio. Clarificando: Frequentemente, a solução para um problema de negócios é um processo que inclui Business Intelligence (BI). BI sozinho, raramente, é a completa solução de um problema. Se BI é parte de um processo, então ferramentas de BI são inevitavelmente, também parte do processo. Módulo Laboratório de Open Source Business Intelligence 8 Uma ferramenta de BI que não entende processos, ou como ser parte deles, dificilmente será integrada a uma solução mais ampla. Uma empresa pode maximizar o valor dos negócios disponibilizando informações aos trabalhadores que as utilizam para impactar o modo como ele opera. Benefícios serão obtidos quando a empresa otimiza os vários processos que afetam os indicadores chaves de desempenho (ICD), métricas que os gestores monitoram, relatam e analisam. As implementações de BI, tipicamente, apresentam os seguintes estágios: 1. Desenvolvendo relatórios e identificando a necessidade de informações. 2. Dashboards e a apresentação dos KPI's. 3. Análise avançada das causas prováveis de exceções. 4. Integração de relatórios com a Gestão de Processos/Workflow. 5. Avaliação e correção destes processos. Infelizmente, muitas organizações só atingem o estágio de implementação de relatórios. A falta de uma gestão de processo/workflow adequada associada com a ausência de metodologias impedem as organizações de avançarem no processo de implementação de BI. Elas gastam excessivas quantidades de dinheiro em soluções proprietárias de BI na esperança que estes softwares irão ajudar. Infelizmente, ferramentas tradicionais de BI não atendem às necessidades das organizações. Soluções Tradicionais e Suas Limitações Preço A licença, manutenção, suporte e serviços relacionados ao software são bastante caros. Usabilidade Módulo Laboratório de Open Source Business Intelligence 9 Muito difícil para a maioria dos usuários. Habilidades Dificuldade de transferência do vendedor para o cliente. Ausência de metodologias de implementação. Customização Bastante difícil para clientes desenvolverem soluções e as integrarem as regras de negócios. Orientação a Ferramentas As soluções são conjuntos de ferramentas e não uma solução integrada. Extensão As soluções são proprietárias e difíceis, ou até impossíveis, para os clientes ou consultores externos expandirem as funcionalidades do sistema. Clientes não compram o software, mas sim pagam adiantado pelo direito de usá-lo. Isto é como fazer um leasing em um carro, mas realizando todos os pagamentos no primeiro dia. Este é o pior dos mundos. Foco em Relatórios e Análise As soluções são focadas em apresentação e análise de ICD, ignorando o desempenho do processo que afeta a métrica. Influência em processos Elas são incapazes de assegurar mudanças importantes nos processos de negócios. Elas assumem que a entrega de um relatório terá um efeito colateral de influenciar um processo. Auditoria Elas são incapazes de prover ferramentas para a realização de uma auditoria completa. Quem obteve um relatório? Que ações elas fizeram? Quanto tempo levou? Um processo teve início? Qual é o desempenho do processo? Prototipagem O elevado custo das ferramentas não permite a realização de prototipagem, necessária para assegurar o sucesso de projetos de Business Intelligence. Contratos e acordos financeiros de altos valores financeiros devem ser firmados ante de qualquer avaliação e prototipagem. Flexibilidade da Licença Ferramentas tradicionais de BI são construídas assumindo que um usuário utilizará na maior parte do seu dia um sistema de BI como uma ferramenta isolada. O melhor exemplo de que isto não é verdade ocorre durante o desenvolvimento de um extranet para usuários externos, infrequentes ou casuais, fora do firewall, onde uma licença, envolvendo milhares de dólares, precisa ser obtida. Módulo Laboratório de Open Source Business Intelligence 10 Pentaho Business Intelligence: Visão Geral O que é o Pentaho? O Pentaho é atualmente a plataforma Open Source de Inteligência de Negócios (BI) e Integração de Dados mais popular e poderosa no mundo. Os dados abaixo confirmam o sucesso alcançado pela plataforma Pentaho nos últimos anos. Média de um download a cada 30 segundos; Mais de 10.000 implementações ativas em produção; Mais 1.200 clientes em 65 países Economia de >US$2 bilhões em licenças e manutenção; Apoiado por Benchmark Capital, Index Ventures e NEA. Para montar uma solução completa de Business Intelligence é necessário utilizar diversos componentes. A soma de todos estes componentes é o que chamamos de Pentaho BI Suite, ou seja, uma suíte completa de programas utilizados para a construção de uma solução de BI. Utilizando a suíte é possível realizar a integração de dados, construção de processos de ETL de forma visual, criação de cubos OLAP, consultas e relatórios, relatórios com filtros, relatórios com fórmulas, relatórios com sub-relatórios, relatórios com alertas, relatórios ad-hoc, análises interativas, painéis, mineração de dados, etc. Todas estas possibilidades tornam a plataforma de BI Pentaho a mais popular do mundo Open Source. História Módulo Laboratório de Open Source Business Intelligence 11 De acordo com o site oficial, O Pentaho nasceu do desejo de se alcançar uma mudança positiva no mercado de análise de negócios dominada por megavendedores burocráticos que ofereciam produtos "pesados” baseados em plataformas antigas, direcionados as suas aplicações já existentes e à custa de suas capacidades de inovação na área de BI. Sob esta perspectiva, cinco veteranos da indústria (por isto o nome Penta) fundaram a Pentaho Corporation em 2004. Estes veteranos foram provenientes de empresas como Business Objects, Cognos, Hyperion, JBoss, Oracle, Red Hat e SAS. Essas cinco pessoas tiveram uma grande idéia, iniciaram sua operação através de projetos já desenvolvidos e estáveis, ou seja, agregaram os principais projetos Open Source, contemplando desta forma todo o espectro de uma solução de Business Intelligence. Em 2005 agregou o principal projeto de Olap Open Source, conhecido na época como Mondrian. Atualmente, o fundador do projeto, Mr. Hyde (Julyan Hyde), é o Chief Architect Olap na Pentaho e o projeto foi rebatizado como Pentaho Analysis. Em 2006 agregou o principal projeto de ETL Open Source, conhecido na época comoKettle. Atualmente, o fundador do projeto Mr. Casters (Matt Casters) é o Chief Architect Data Integration na Pentaho e o projeto foi rebatizado como Pentaho Data Integration. Em 2006 agregou o principal projeto de Reporting Open Source, conhecido na época como JFreeReporting. Atualmente, o principal líder do projeto Mr. Morgner (Thomas Morgner) é o Chief Architect Reporting na Pentaho e o projeto foi rebatizado como Pentaho Reporting. Em 2006 agregou o principal projeto de Data Mining Open Source, conhecido na época como Weka. Atualmente, um dos principais desenvolvedores do projeto Mr. Hall (Mark Hall) é o Engenheiro Sênior Data Mining na Pentaho e o projeto foi rebatizado como Pentaho Data Mining. Muitos projetos de Software Livre maduros agregam outros projetos de software livre, porém os criadores destes acabam não participando desta nova combinação. A Pentaho possui em seu time de desenvolvimento os principais lideres destes projetos agregados que compõem a solução de inteligência de negócios em software livre mais utilizada do mundo. Quem é a Pentaho Corporation? A Pentaho Corporation é uma empresa de origem norte-americana que gerencia, facilita, suporta e lidera o papel de desenvolvimento do Projeto Pentaho BI. A empresa possui aportes financeiros de fundos de investimentos como Enterprise Associates, investidores do SugarCRM, Xensource e outros, Index Ventures, investidores do MySQL, Zend e outros. Atualmente a Pentaho é parceira oficial da IBM, Novell, MySQL e JBoss, entre outras grandes empresas fornecedoras de TI. Sua sede está localizada em Orlando na Flórida, com escritórios em São Francisco, Califórnia e por toda a Europa. Módulo Laboratório de Open Source Business Intelligence 12 Quem é Quem na Pentaho? Origem do Nome Além do significado da palavra penta, alega-se que o nome surgiu dos índios Pentaho que viveram na Flórida nos séculos XVIII e XIX e supostamente foram responsáveis pela domesticação do peixe-boi das Índias Ocidentais, até então animais selvagens e agressivos, que de acordo com alguns historiadores chegaram a tornar o comércio e comunicação ao longo das águas da Flórida praticamente impossível. Modelo de Negócios Módulo Laboratório de Open Source Business Intelligence 13 O modelo de negócio adotado pela Pentaho é o que chamamos em inglês de subscription model. Trata-se de uma forma de comercializar o software sem pagar pela licença de uso, onde o fabricante, no caso a Pentaho, provê suporte, serviços e melhorias no software através de uma mensalidade anual. Porém o cliente pode optar por utilizar a versão community onde não existe suporte da Pentaho nem custo anual, uma vez que neste caso o suporte é feito por meio da comunidade de desenvolvedores Pentaho espalhados por todo o mundo. Versões Módulo Laboratório de Open Source Business Intelligence 14 Módulo Laboratório de Open Source Business Intelligence 15 Pentaho e Big Data Pentaho Agile BI O Agile BI da Pentaho oferece uma solução integrada que permite passar diretamente do processo de ETL para a modelagem da informação e exploração de dados. O fluxo de trabalho sugerido começa com a produção de dados e termina com um esquema Mondrian testado que está pronto para ser usado em um relatório ou uma consulta destinada ao usuário final. Segundo o Agile BI da Pentaho o processo acima é integrado na ferramenta de ETL, o PDI. Módulo Laboratório de Open Source Business Intelligence 16 Com isso o projetista de ETL torna-se capaz de manusear os dados conforme o necessário, e com base na entrada de um analista de negócios, pode ir diretamente para a modelagem de dados, visualização dos dados e geração de relatórios e análises. Com a integração do processo de ETL, modelagem, visualização e relatórios em uma única ferramenta os projetistas de ETL e analistas de negócios trabalham de forma integrada e podem fazer as mudanças necessárias nos dados de forma rápida e eficaz. Enquanto constrói o DW, o projetista de ETL pode imediatamente criar um modelo baseado em dados que ele já construiu e assim pode explorar (visualizar) os dados. Por exemplo, em cooperação com um analista de BI, o projetista de ETL pode determinar que certas dimensões não sejam aplicáveis ou que as hierarquias não são mais necessárias. A etapa de visualização também permite que as questões de qualidade de dados sejam identificadas e corrigidas. Neste ponto, o projetista de ETL pode retornar ao PDI e construir hierarquias adicionais, o modelo, e em seguida, visualizar os dados novamente. Ajustes podem ser feitos de forma iterativa até que os dados sejam exatamente o que o analista de BI e usuários finais desejam ver. Arquitetura A plataforma Pentaho de BI é diferente das tradicionais ferramentas de BI. Ela é uma plataforma de BI centrada em processos e orientada a soluções composta por componentes de BI que permitem as organizações desenvolverem uma solução completa e integrada para problemas de BI. A plataforma Pentaho de BI, o elemento central na arquitetura da Pentaho Open BI Suíte, é centrada em processos cujo controle central é realizado através de um mecanismo de workflow. Este mecanismo utiliza definições de processos para determinar os processos de BI que serão executados na plataforma. Os processos podem ser facilmente customizados e novos podem ser facilmente incorporados. A plataforma de BI inclui componentes e relatórios para a análise de desempenho destes processos de BI. Módulo Laboratório de Open Source Business Intelligence 17 A plataforma de BI é orientada a soluções, pois as operações da plataforma são especificadas nas definições de processos e documentos de ação que especificam cada atividade. Estes processos e operações coletivamente definem a solução para um problema de business intelligence. Esta solução de BI pode ser facilmente integrada aos processos de negócios que são externos à plataforma. A definição de uma Solução pode conter qualquer número de processos e operações. A Pentaho Open BI Suite consiste de uma plataforma de BI, com facilidades para o usuário final, e o Pentaho Design Studio: A plataforma disponibiliza uma arquitetura orientada a serviços que inclui auditoria, segurança, escalonamento de tarefas, ETL, serviços de web, repositório de atributos e regras de negócios. As capabilidades para o usuário final incluem relatórios, análise, workflow, dashboards e mineração de dados. O Pentaho Design Studio é um conjunto de ferramentas para o projeto e gestão que são integradas ao ambiente Eclipse. Estas ferramentas permitem ao analista de negócios tanto desenvolver como criar relatórios, dashboards, modelos de análise, regras de negócios e processos de BI. A plataforma de BI e as facilidades para o usuário final criam o Servidor Pentaho. As soluções de BI são projetadas usando o Pentaho Design Studio e desenvolvidas no Servidor Pentaho. O servidor Pentaho é o mecanismo de execução em tempo real, com uma abordagem a workflow, o qual coordena a execução e a comunicação entre os componentes de BI. O controle centralizado através de um mecanismo de workflow é essencial para a arquitetura da plataforma Pentaho de BI: A plataforma é construída em termos de processos e definições de processos. A plataforma de BI entende a natureza dos processos, pois tudo nela é executada como um processo. Os processos são definidos em uma linguagem padronizada de definição de processos que é externamente acessada, editada e customizada. Toda a lógica dos negócios é revelada, e nada é escondido. Serviços, como segurança e auditoria, são construídos no núcleo da plataforma e são utilizados automaticamente para garantira governança e o monitoramento de desempenho dos processos de negócios. A arquitetura é a combinação do código fonte original e de componentes maduros, em código aberto, que integrados formam uma plataforma de BI completa e sofisticada. A plataforma Pentaho de BI é construída tendo como base, servidores, mecanismos e componentes. Eles disponibilizam servidores J2EE, segurança, portais, workflow, regras de negócios, colaboração, gestão de conteúdo, integração de dados, análise e ferramentas de modelagem do sistema em desenvolvimento. Muitos destes componentes são projetos consolidados em código aberto, porém podem ser facilmente substituídos por outros produtos. Para criar uma solução totalmente integrada, o Pentaho adiciona os seguintes atributos: Meta dados comuns para a definição de documentos orientados a soluções. Interfaces comuns a todos os componentes. Módulo Laboratório de Open Source Business Intelligence 18 Segurança. E-mail e notificações. Instalação, integração e validação de componentes. Exemplos de soluções. Conectores de aplicações. Ferramentas de utilização e diagnóstico. Ferramentas de projeto. Configuração e customização. A plataforma Pentaho de BI integra workflow, regras de negócios, notificação e entrega de informações, escalonamento, auditoria, integração de aplicações navegação por conteúdo, interfaces ao usuário, ferramentas de projeto e administração de relatórios, análise, dashboards e componentes de mineração de dados. A arquitetura da Plataforma Pentaho de BI tem muitas vantagens. Especificamente: Pela construção, integração e aperfeiçoamento de componentes de código aberto em uma plataforma integrada, o custo de implementação de BI é drasticamente reduzido. O baixo custo de propriedade significa que recursos podem ser aplicados em outros investimentos, tais como serviços de valor agregado de implementação e customização ou aumentar o escopo de um projeto de BI, pelo desenvolvimento de conteúdos e funcionalidades mais avançados. Em outras palavras, uma mais alta percentagem do orçamento do projeto pode ser gasta na obtenção de requisitos, implementação e serviços, aumentando o sucesso do projeto. Disponibilizando o software sem custo para prototipagem, permite que a mesma seja realizada indefinidamente. Disponibilizando o software sem custo para prototipagem, permite que as iterações para a definição de requisitos de sistema sejam realizadas sem um limite de tempo rígido. Pela construção de uma plataforma baseada em workflow, uma verdadeira arquitetura orientada a serviços é entregue. Pela construção de uma plataforma baseada em workflow, é fácil integrar BI em qualquer processo de negócios. Pela construção de uma plataforma baseada em workflow, é fácil executar clustering. Como o sistema não tem custo, a solução pode ser desenvolvida em qualquer número de servidores sem custos adicionais. Pela construção de uma plataforma baseada em workflow, projetos de Bi podem ser continuamente adaptados e melhorados. Pela construção de mecanismos de notificação de entrega de informação, relatórios, análises, tarefas e pontos de decisão podem ser mapeados para qualquer um envolvido com processos de negócios. Módulo Laboratório de Open Source Business Intelligence 19 Pela construção de múltiplos mecanismos de regras de negócios, todas as lógicas do negócio são customizadas. Pela construção de relatórios, análises e dashboards, um elevado grau de sofisticação é introduzido na solução de BI. Eles podem ser desenvolvidos em uma velocidade que é a mais adequada para uma organização, não sendo restringida por custos adicionais. Pela integração de mineração de dados, as mais avançadas análises sobre dados podem ser realizadas no momento adequado. Entregando uma instalação completa e pronta para rodar de um servidor, juntamente com um conjunto de componentes e mecanismos de execução, é fácil desenvolver e integrar novas configurações. Integrando auditoria e relatórios de auditoria, monitoramento de sistemas e facilidades de administração, o sistema é fácil de manter. Oferecendo interfaces intuitivas e de rápida customização, o sistema é fácil de usar e barato de treinar. Para reproduzir a arquitetura do Pentaho, seria necessário: Definir requisitos para a completa arquitetura. Determinar se o projeto de cada componente será próprio ou terceirizado. Identificar fornecedores para os componentes terceirizados. Executar uma pesquisa detalhada em cada componente. Instalar e configurar cada componente. Projetar e implementar uma camada de integração para cada componente. Projetar e implementar interfaces consistentes para cada componente. Projetar e implementar ferramentas de administração. Projetar e implementar ferramentas de análise e modelagem. Projetar e implementar os serviços comuns e suas infra-estruturas. Projetar e criar repositórios. Projetar e implementar novos componentes ou melhorar os componentes existentes com novas funcionalidades. Integrar segurança. Integrar auditoria. Projetar e implementar relatórios de desempenho de processos. Criar uma linguagem comum para definições. Ter significante experiência com o desenvolvimento deste tipo de produto Módulo Laboratório de Open Source Business Intelligence 20 Devida a sua arquitetura e licenciamento, a utilização de uma plataforma de BI como parte de uma solução de business intelligence oferece as seguintes vantagens: Aumenta o tempo e orçamento disponíveis para a definição de requisitos Aumenta o tempo e orçamento disponíveis para prototipagem Aumenta o tempo e orçamento disponíveis para a implementação e desenvolvimento do projeto Aumenta o tempo e orçamento disponíveis para serviço e treinamento Acelera o começo da fase de implementação Reduz a variedade de habilidade para implementar uma solução Estes fatores combinados reduzem o custo e o risco de um projeto, e aumentam as chances de sucesso de uma solução de BI. Pentaho do Mundo Módulo Laboratório de Open Source Business Intelligence 21 Pentaho no Brasil Sumário de Vantagens do Pentaho Usabilidade A plataforma BI tem componentes prontos para serem executados, é de fácil integração com sistemas externos, e oferece interfaces de fácil customização. Isto resulta em soluções que são muito fáceis de serem usadas. Módulo Laboratório de Open Source Business Intelligence 22 Habilidades A plataforma de BI utiliza reconhecidos padrões, de maneira a facilitar a utilização de ferramentas de parceiros. Customização A plataforma de BI tem mecanismos externos de regras, processos editáveis, disponibilidade de códigos fontes, componentes reutilizáveis de BI e interfaces plenamente customizáveis. A plataforma executa processos editáveis que podem ser integrados com processos de negócios. Isto resulta em soluções altamente customizadas. Orientação a Ferramentas A plataforma de BI é centrada em processos e soluções. Ela não é projetada para ser um conjunto de ferramentas isoladas, mas para ser um sistema completamente integrado. Extensão O código fonte é fornecido. A infraestrutura, componentes, mecanismos e interfaces podem ser facilmente modificados. O dinheiro salvo em gastos com licenças pode ser direcionado para extender a plataforma em uma área específica. A estrutura do produto é pública. Foco em Relatórios e Análise A plataforma de BI é centrada em processos, baseada em workflow e direcionada a regras de negócios. Ela pode ser facilmente integrada aos processos de negócios e tem facilidades para a geração de relatórios. Regras de negócios são usadas para identificarproblemas e exceções; e processos auditados são executados para resolvê-las. Influência em processos A plataforma de BI acompanha a entrega de informações e permite processos de negócios customizados serem iniciados pelos receptores da informação. A entrega de um relatório não é o final da linha. Relatórios de performance de processos e modelos podem ser gerados. Ações tomadas podem ser avaliadas, comparando-as com metas, para mensurar a efetividade do processo. A plataforma oferece facilidades automáticas para realizar esta tarefa. Auditoria A plataforma de BI inclui robustos processos de rastreamento e auditoria. A história de uma situação pode ser acessada, incluindo as ações tomadas, discussões/comentários e informações de suporte. Prototipagem O licenciamento da plataforma permite que a prototipagem seja realizada sem grandes investimentos. Flexibilidade da Licença O licenciamento da plataforma de BI é flexível e oferece valor ao cliente, pois o BI é somente parte de um processo de negócios, adicionando valor incremental. Além disto, o licenciamento por CPU a custos razoáveis abre a possibilidade aplicações extranet que não são realistas com ferramentas tradicionais, baseadas em licenciamento por usuário. Módulo Laboratório de Open Source Business Intelligence 23 Pentaho Business Intelligence: Componentes Pentaho BI Server O Pentaho BI Server é responsável por toda a camada servidora do plataforma do Pentaho e fornece a arquitetura e infraestrutura necessária para a construção de soluções para Business Intelligence (BI). Serviços essenciais do Pentaho BI Server: 1. Autenticação; 2. Logs; 3. Auditoria; 4. Serviços web; 5. Motores de regras de negócio; 6. Mecanismo para integração com relatórios; 7. Mecanismo para integração de analises; 8. Mecanismo para integração com dashboards; 9. Mecanismo para integração com mineração de dados. Módulo Laboratório de Open Source Business Intelligence 24 Sua arquitetura e baseada em plug-in permitindo que a totalidade ou parte da plataforma seja incorporada a aplicações de terceiros. O Pentaho BI Server e composto por diversos outros aplicativos Open Source, entre eles: Apache Tomcat Servidor Web Java, especialista em aplicações J2EE, que é a tecnologia ao qual o Pentaho Bi Server foi desenvolvido, mais especificamente o tomcat é um container de servlets. O Tomcat possui algumas características próprias de um servidor de aplicação, porém não pode ser considerado um servidor de aplicação por não preencher todos os requisitos necessários. Jetty Módulo Laboratório de Open Source Business Intelligence 25 Jetty é um servidor HTTP e Servlet Container 100% escrito em Java. É o grande concorrente do Tomcat que ficou famoso por ser utilizado como o servlet container do JBoss. A grande vantagem do Jetty com relação ao Tomcat é a sua fácil configuração. O mesmo e utilizado em algumas ações especificas do Pentaho BI Server no administrator-console, com isso o mesmo usa dois servidores Web para carregar a aplicação. Spring Security Spring Security é uma aplicação para controle de autenticação forte e altamente personalizável e quadro de controle de acesso. É o padrão de-facto para proteger aplicativos baseados em Spring. O mesmo se integra ao Tomcat e ao Pentaho BI Server para administração da segurança do servidor de aplicação. Hibernate O Hibernate é um framework para o mapeamento objeto-relacional escrito na linguagem Java, mas também é disponível em DotNet como o nome NHibernate. No Pentaho ele e responsável pelo mapeamento das bases de dados para o Data Warehouse. Quartz O quartz é um agendador (scheduler) Open Source, serviço de agendamento de tarefas que podem ser integrados ou utilizados ao longo de praticamente qualquer Java EE ou aplicativo Java SE. Módulo Laboratório de Open Source Business Intelligence 26 Hyper SQL (HSQLDB) O HSQLDB (do inglês Hyperthreaded Structured Query Language Database) é um servidor de banco de dados (SGBD), de código aberto, escrito totalmente na linguagem Java. Não é possível compará-lo, em termos de robustez e segurança com outros servidores SGBD, como Oracle ou Microsoft SQL Server, entretanto o HSQLDB é uma solução simples, que utiliza poucos recursos e que possui bom desempenho. Devido a essas características, ele é bastante utilizado em aplicações que são executadas em desktops e que necessitam interagir com uma camada de persistência através da linguagem SQL. A suíte Office OpenOffice/BrOffice, na sua versão 2.0, inclui o HSQLDB como engine de armazenamento de dados. Pentaho Administration – PAC Interface administrativa do Pentaho. A partir do PAC são definidos usuários, grupos, conexões com bancos de dados e Data Warehouses (JNDI), possui também algumas ferramentas para limpar os caches da suíte, além disso, possibilita a criação de agendamentos públicos nos quais os usuários finais podem subscrever relatórios. Pentaho User Console – PUC Interface para o usuário final, é a partir do PUC que os usuários terão acesso às análises e relatórios criados, poderão ainda - de acordo com as permissões definidas - criar relatórios Ad-Hoc utilizando o WAQR, criar novas visões analíticas utilizando o Jpivot, executar relatórios criados previamente com o PRD (ou outro gerador de relatórios suportado), visualizar dashboards, agendar a execução de relatórios e compartilhar qualquer um desses artefatos com outros usuários. Pentaho Data Integration O Pentaho Data Integration é um projeto Open Source encampado pelo Pentaho em 2006. Foi desenvolvido por Matt Casters e anteriormente era conhecido como Kettle: KDE Extraction, Transportation, Transformation and Loading Environment. Módulo Laboratório de Open Source Business Intelligence 27 As principais funcionalidades do Pentaho Data Integration estão relacionadas à Integração de Dados e ao Processo de ETL. Atividades de Extração: Captura dos dados; Leitura a partir de diversas fontes; Módulo Laboratório de Open Source Business Intelligence 28 Identificação de mudanças desde a última extração. Staging Armazenamento temporário dos dados. Atividades de Transformação: Validação dos dados Verificação se os dados estão corretos e precisos; Filtragem de dados inválidos. Limpeza dos dados Correção de dados inválidos. Decodificação Conversão de atributos (numéricos, categóricos) para adequação a um padrão ou regra. Agregação Geração e gerenciamento de chaves Dimensões identificadas por chaves substitutas (“surrogates”). Atividades de Carregamento: Carregamento das tabelas de fatos Adição de linhas à tabela de fatos; Atualização de atributos de status. Carregamento e manutenção das tabelas de dimensões Adição e atualização de linhas das tabelas de dimensões. Pentaho Analysis Módulo Laboratório de Open Source Business Intelligence 29 Pentaho Schema Workbench O uso da ferramenta Mondrian Schema Workbench e útil para facilitar a criação de esquemas para o Mondrian. Sua interface permite a exploração de todos os recursos disponíveis para a criação do esquema XML. Podemos observar a estrutura do esquema com facilidade, incluindo dimensões, hierarquias, níveis, propriedades e elementos virtuais. Pentaho Aggregation Designer Ferramenta gráfica desenvolvida em Java que ajuda a melhorar a eficiência do cubo Mondrian, criando tabelas agregadas. Módulo Laboratório de Open Source Business Intelligence 30 Mondrian O Mondrian é um servidorOLAP (Online Analytical Processing) escrito em Java. Ele possibilita a análise interativa de uma grande quantidade de dados guardados em bancos SQL sem a necessidade de se escrever consultas SQL. Faz com que consultas escritas na linguagem MDX (Dimensional) sejam convertidas para SQL (Relacional). Jpivot Interface gráfica OLAP, é a interface gráfica para a criação das consultas MDX, permite visualizar o resultado das consultas na forma de tabelas dinâmicas (pivot tables), adicionalmente inclui também a possibilidade de exibir gráficos dinâmicos baseados no conteúdo das tabelas dinâmicas. Saiku É um sistema modular de código aberto, oferecendo suíte de análise OLAP leve que permanece facilmente incorporável, extensível e configurável. O Saiku foi disponibilizado também como um plugin para Pentaho para visualização de cubos Mondrian, anteriormente o Saiku se chamava PAT ( Pentaho Analysis Tool ). Módulo Laboratório de Open Source Business Intelligence 31 O Saiku Reporting é um cliente web disponível como plugin para o Pentaho BI Server. Ele usa o Pentaho Metadata-Layer para proporcionar uma forma fácil de usar o recurso de relatórios ad hoc com uma experiência simples para usuário final. Pentaho Reporting Pentaho MetaData Editor Ferramenta que mapeia os bancos de dados e seu conteúdo em uma visão de negócios a partir da qual usuários podem compor relatórios, via web através do WAQR. Permite adição de uma camada de metadados a uma fonte de dados existente. Normalmente usada para criar uma camada que facilita a criação de relatórios ou analises, porém seu uso não é obrigatório. O padrão de metadados Pentaho é baseado no padrão CWM, que é uma especificação criada e mantida pelo Object Management Group (OMG). É um padrão aberto que permite a partilha e a representação de metadados em plataformas de Business Intelligence ( http://www.omg.org/technology/cwm). http://www.omg.org/technology/cwm Módulo Laboratório de Open Source Business Intelligence 32 Web-based Adhoc Query and Reporting Interface para a criação de relatórios simples diretamente pelo usuário final, é acessado através do PUC e utiliza os metadados publicados pelo PME. Pentaho Report Designer Gerador de relatórios "pixel perfect" da suíte, facilita a criação de relatórios "ricos" com uma aparência mais profissional e personalizada, adicionalmente permite a publicação desses relatórios no PUC, permite inclusive que filtros simples sejam publicados diretamente sem a criação de xactions no PDS. Pentaho Dashboard C**Tools Módulo Laboratório de Open Source Business Intelligence 33 O C**Tools é um conjunto de ferramentas para construção de dashboards para a Suite Pentaho BI Open Source, desenvolvido pela WebDetails. CDF - Community Dashboard Framework Community Dashboard Framework, conhecido como CDF é um framework Open Source com licença GPL desenvolvido pela empresa WebDetails para facilitar a construção de Dashboards no ambiente de Business Intelligence da Pentaho, o mesmo é instalado da mesma forma de um plugin ou extensão da plataforma do Pentaho BI Server. CDA - Community Dashboard Access Estes são vários componentes que dão acesso a diferentes tipos de Data Sources. No entanto, há um aviso de segurança sobre a possibilidade de injeção de SQL, por isso, se você não está em um ambiente seguro não e recomendado seu uso. CDE - Community Dashboard Editor Esta é a interface web que permite criar um layout HTML / CSS e conectá-lo a elementos da página, Data Sources e eventos para que você possa construir seus Dashboards interativos. CCC - Community Chart Components O CCC é uma biblioteca de gráficos em cima do Protovis com o objetivo de fornecer aos desenvolvedores Pentaho um caminho para incluir qualquer tipo de gráfico imaginável em um painel CDF com extensibilidade e flexibilidade como princípio fundamental. Módulo Laboratório de Open Source Business Intelligence 34 CST - Community Startup Tabs Este componente permite que os desenvolvedores Pentaho consigam elaborar um conjunto de regras para definir quais abas serão abertas quando um usuário fizer login no ambiente Pentaho BI Server. Pentaho Data Mining O WEKA é uma suíte de mineração de dados desenvolvida pela Universidade de Waikato na Nova Zelândia; e tem como principal diferencial ser uma ferramenta de uso muito simples; o que não significa que seja de menor qualidade em relação as demais ferramentas Open Source. Pentaho Design Studio Plugin para a plataforma eclipse que funciona como uma interface gráfica para a criação de xactions que são arquivos xml interpretados pelo BI Server, são como instruções "passo-a-passo" que dirigem a execução das atividades pelo BI Server, permitem, por exemplo, a definição de filtros avançados para relatórios e o envio de e-mails com os relatórios executados. Módulo Laboratório de Open Source Business Intelligence 35 Instalação e Configuração do Pentaho Nesta seção iremos tratar de aspectos gerais relacionados à configuração dos componentes do Pentaho que iremos utilizar durante o curso. Download e Instalação Para o download dos pacotes do Pentaho podemos acessar a página Community Projects a partir do portal da Pentaho. Através desta página temos acesso a todos os pacotes relacionados ao Pentaho e as documentações dos projetos. Módulo Laboratório de Open Source Business Intelligence 36 O link direto para o download dos pacotes através do SourceForge é o seguinte: http://sourceforge.net/projects/pentaho/files/. http://sourceforge.net/projects/pentaho/files/ Módulo Laboratório de Open Source Business Intelligence 37 Podemos criar então uma pasta em nosso computador de nome Pentaho, por exemplo, e armazenar cada um dos pacotes baixados. Como o Pentaho não requer instalação, ou seja, na versão Community não existe um instalador, basta apenas descompactar cada um dos pacotes e executar os respectivos arquivos de execução dos pacotes. No caso do Windows para cada pacote irá existir um arquivo .bat e no caso do Linux um arquivo .sh que servirá para a execução de cada aplicativo. BI Server Arquivos: start-pentaho.bat e start-pentaho.sh Administration Console Arquivos: start-pac.bat e start-pac.sh Data Integration Arquivos: Spoon.bat e Spoon.sh Report Designer Arquivos: report-designer.bat e report-designer.sh Schema Workbench Arquivos: workbench.bat e workbench.sh Aggregation Designer Arquivos: startaggregationdesigner.bat e startaggregationdesigner.sh Metadata Editor Módulo Laboratório de Open Source Business Intelligence 38 Arquivos: metadata-editor.bat e metadata-editor.sh Drivers JDBC’s com Pentaho Java Database Connectivity ou JDBC é um conjunto de classes e interfaces (API) escritas em Java que fazem o envio de instruções SQL para qualquer banco de dados relacional; Api de baixo nível e base para Api’s de alto nível; Amplia o que você pode fazer com Java; Possibilita o uso de bancos de dados já instalados; Para cada banco de dados há um driver JDBC que pode cair em três categorias. Driver API-Nativo O driver API-Nativo traduz as chamadas JDBC para as chamadas da API cliente do banco de dados usado. Como a Ponte JDBC-ODBC, pode precisar de software extra instalado na máquina cliente. Driver de Protocolo de Rede Traduz a chamada JDBC para um protocolo de rede independente do banco de dados utilizado, que é traduzido para o protocolo do banco de dados por um servidor. Por utilizar um protocolo independente, pode conectar as aplicações clientes Java a vários bancosde dados diferentes. É o modelo mais flexível e pode ser visto como um driver intermediário, pois também atua como Middleware. É mais utilizado para banco de dados antigos como estatais de governos. Driver Nativo Converte as chamadas JDBC diretamente no protocolo do banco de dados. Implementado em Java, normalmente é independente de plataforma e escrito pelos próprios desenvolvedores. É o tipo mais recomendado para ser usado. Esta é uma lista de drivers JDBC e seus parâmetros de conexão disponíveis para conectar a sua fonte de dados: Progress Open Edge 10.2 A String de conexão (URL): jdbc:datadirect:openedge://<Nome do Host>:<Número da Porta>;databaseName=<Nome do banco de Dados> Nome da classe (Class Name): com.ddtek.jdbc.openedge.OpenEdgeDriver MySQL (Conector/J) String de conexão (URL): jdbc:mysql://<Nome do Host>:<Número da Porta>/<Nome do Banco de Dados> Nome da classe (Class Name): com.mysql.jdbc.Driver IBM DB2 String de conexão (URL): jdbc:db2://<Nome do Host>:<Número da Porta>/<Nome do Banco de Dados> Nome da classe (Class Name): com.ibm.db2.jdbc.app.?DB2Driver Módulo Laboratório de Open Source Business Intelligence 39 JDBC-ODBC Bridge String de conexão (URL): jdbc:odbc:<Nome do Banco de Dados> Nome da classe (Class Name): sun.jdbc.odbc.?JdbcOdbcDriver Microsoft SQL Server String de conexão (URL): jdbc:weblogic:mssqlserver4:?<Nome do Banco de Dados>?@<Nome do Host>:<Número da Porta> Nome da classe (Class Name): weblogic.jdbc.mssqlserver4.Driver Oracle Thin String de conexão (URL): jdbc:oracle:thin:?@<Nome do Host>:port:SID Nome da classe (Class Name): oracle.jdbc.driver.?OracleDriver PointBase Embedded Server String de conexão (URL): jdbc:pointbase://embedded[:<Número da Porta>]/<Nome do Banco de Dados> Nome da classe (Class Name): com.pointbase.jdbc.jdbcUniversalDriver Cloudscape String de conexão (URL): jdbc:cloudscape:<Nome do Banco de Dados> Nome da classe (Class Name): com.cloudscape.core.JDBCDriver Cloudscape RMI String de conexão (URL): jdbc:rmi://<Nome do Host>:<Número da Porta>/jdbc:cloudscape:<Nome do Banco de Dados> Nome da classe (Class Name): RmiJdbc.RJDriver Firebird (JCA/JDBC Driver) String de conexão (URL): jdbc:firebirdsql:[//<Nome do Host>[:<Número da Porta>]/]<Nome do Banco de Dados> Nome da classe (Class Name): org.firebirdsql.jdbc.FBDriver IDS Server String de conexão (URL): jdbc:ids://<Nome do Host>:<Número da Porta>/conn??dsn=’<Nome do DSN ODBC>’ Nome da classe (Class Name): ids.sql.IDSDriver Informix Dynamic Server String de conexão (URL): jdbc:firebirdsql:[//<Nome do Host>[:<Número da Porta>]/]<Nome do Banco de Dados> Nome da classe (Class Name): com.informix.jdbc.IfxDriver InstantDB (v3.13 and earlier) Módulo Laboratório de Open Source Business Intelligence 40 String de conexão (URL): jdbc:idb:<Nome do Banco de Dados> Nome da classe (Class Name): jdbc.idbDriver InstantDB (v3.14 and later) String de conexão (URL): jdbc:idb:<Nome do Banco de Dados> Nome da classe (Class Name): org.enhydra.instantdb.jdbc.idbDriver Interbase (InterClient Driver) String de conexão (URL): jdbc:interbase://<Nome do Host>/<Nome do Banco de Dados> Nome da classe (Class Name): interbase.interclient.Driver Hypersonic SQL (versão 1.2 e anteriores) String de conexão (URL): jdbc:HypersonicSQL:<Nome do Banco de Dados> Nome da classe (Class Name): hSql.hDriver Hypersonic SQL (versão 1.3 e superiores) String de conexão (URL): jdbc:HypersonicSQL:<Nome do Banco de Dados> Nome da classe (Class Name): org.hsql.jdbcDriver Microsoft SQL Server (JTurbo Driver) String de conexão (URL): jdbc:JTurbo://<Nome do Host>:<Número da Porta>/<Nome do Banco de Dados> Nome da classe (Class Name): com.ashna.jturbo.driver.Driver Microsoft SQL Server (Sprinta Driver) String de conexão (URL): jdbc:inetdae:<Nome do Host>:<Número da Porta>?database=<Nome do Banco de Dados> Nome da classe (Class Name): com.inet.tds.TdsDriver Microsoft SQL Server 2000 (Microsoft Driver) String de conexão (URL): jdbc:microsoft:sqlserver://<Nome do Host>:<Número da Porta>[;DatabaseName=<Nome do Banco de Dados>] Nome da classe (Class Name): com.microsoft.sqlserver.jdbc.SQLServerDriver MySQL (MM.MySQL Driver) String de conexão (URL): jdbc:mysql://<Nome do Host>:<Número da Porta>/<Nome do Banco de Dados> Nome da classe (Class Name): org.gjt.mm.mysql.Driver Oracle OCI 8i String de conexão (URL): jdbc:oracle:oci8:@<Nome do SID> Nome da classe (Class Name): oracle.jdbc.driver.OracleDriver Módulo Laboratório de Open Source Business Intelligence 41 Oracle OCI 9i String de conexão (URL): jdbc:oracle:oci:@<Nome do SID> Nome da classe (Class Name): oracle.jdbc.driver.OracleDriver PostgreSQL (versão 6.5 e anteriores) String de conexão (URL): jdbc:postgresql://<Nome do Host>:<Número da Porta>/<Nome do Banco de Dados> Nome da classe (Class Name): postgresql.Driver PostgreSQL (versão 7.0 e superiores) String de conexão (URL): jdbc:postgresql://<Nome do Host>:<Número da Porta>/<Nome do Banco de Dados> Nome da classe (Class Name): org.postgresql.Driver Sybase (jConnect 4.2 e anteriores) String de conexão (URL): jdbc:sybase:Tds:<HOST>:<PORT> Nome da classe (Class Name): com.sybase.jdbc.SybDriver Sybase (jConnect 5.2) String de conexão (URL): jdbc:sybase:Tds:<HOST>:<PORT> Nome da classe (Class Name): com.sybase.jdbc2.jdbc.SybDriver Teradata String de conexão (URL): jdbc:teradata://DatabaseServerName/Param1,Param2,… Nome da classe (Class Name): com.ncr.teradata.TeraDriver Caminhos dos drivers JDBC’s nos softwares Pentaho Os caminhos abaixo devem ser utilizados para que coloquemos o driver do respectivo banco de dados que estamos utilizando no desenvolvimento de nossa solução de BI. Deste modo, devemos baixar o driver e adicionar uma cópia do mesmo em cada uma das pastas abaixo: BI Server Caminho: ../server/biserver-ce/tomcat/lib/ Administration Console Caminho: ../pentaho/server/administration-console/jdbc/ Data Integration Módulo Laboratório de Open Source Business Intelligence 42 Caminho: ../data-integration/libext/JDBC/ Report Designer Caminho: ../report-designer/lib/jdbc/ Schema Workbench Caminho: ../schema-workbench/drivers/ Aggregation Designer Caminho: ../agg-designer/drivers/ Metadata Editor Caminho: ../metadata-editor/libext/JDBC/ Definindo a Senha de Publisher Para que os cubos e relatórios feitos por você possam ser acessados (visualizados) por outras pessoas da rede, é necessário publicar os cubos e metadados no BI Server. O BI Server, por padrão vem com a senha de publicação em branco, assim não sendo possível que alguém publique algum conteúdo no servidor. Também é necessário alterar a senha de publicação dos relatórios no BI Server, abra o diretório: \pentaho\biserver-ce\pentaho-solutions\system\ e edite o arquivo: publisher_config.xml de acordo com o exposto abaixo. Trecho a ser editado: <publisher-config> <publisher-password>sua_senha</publisher-password> </publisher-config> Retirando a mensagem do rodapé do JPivot no Pentaho 4 CE Na versão 4 do Pentaho CE (biserver-ce-3.9) foi adicionada uma mensagem de alerta sobre a descontinuidade do suporte a melhorias ao JPivot nas próximas versão do Pentaho, a mesma se encontra no rodapé do JPivot. Módulo Laboratório de Open Source Business Intelligence 43 Mensagem: JPivot has been replaced by Pentaho Analyzer. It is provided as a convenience but will no longer be enhanced or officially supported by Pentaho. Traduzindo: O JPivot foi substituído pelo Pentaho Analyzer. Ele é fornecido como uma conveniência, mas deixará de ser melhorado ou oficialmente suportado pela Pentaho. Pararetirar está mensagem da apresentação do PUC (Pentaho User Console) edite o arquivo .../biserver- ce/tomcat/webapps/pentaho/jsp/Pivot.jsp procure pela DIV com o deprecatedWarning e comente do inicio da DIV ao final da DIV ou apague este trecho de HTML. Instalação do C**Tools Para copiar a versão mais recente das ferramentas C**Tools acesse o site http://ci.analytical-labs.com/ e clique na aba 'webdetails': CDA, dois arquivos zip: - código: cda-TRUNK-*.zip - exemplos: cda-samples-TRUNK-*.zip CDE, 2 arquivos zip: - código: pentaho-cdf-dd-TRUNK-*.zip - exemplos: pentaho-cdf-dd-solution-TRUNK-*.zip CDF - 2 arquivos zip -código: pentaho-cdf-TRUNK-SNAPSHOT.zip -exemplos: pentaho-cdf-solution-TRUNK-SNAPSHOT.zip Certifique se de parar a execução de seu servidor Pentaho. Faça um backup do diretório do Pentaho BI ../biserver-ce/pentaho-solutions/. Delete os diretórios abaixo (alguns diretórios podem não existir se for a primeira instalação): http://ci.analytical-labs.com/ Módulo Laboratório de Open Source Business Intelligence 44 ../biserver-ce/pentaho-solutions/system/pentaho-cdf ../biserver-ce/pentaho-solutions/system/pentaho-cdf-dd ../biserver-ce/pentaho-solutions/system/cda ../biserver-ce/pentaho-solutions/cdf ../biserver-ce/pentaho-solutions/bi-developers/cda ../biserver-ce/pentaho-solutions/cde_sample Descompacte o CDF (pentaho-cdf-TRUNK-SNAPSHOT.zip) na pasta .../biserver-ce/pentaho- solutions/system/. Descompacte os exemplos CDF (pentaho-cdf-solution-TRUNK-SNAPSHOT.zip) em .../biserver-ce/pentaho- solutions/. Descompacte o CDA (cda-TRUNK-*.zip) em .../biserver-ce/pentaho-solutions/system/. Descompacte os exemplos do CDA (cda-samples-TRUNK-*.zip) na pasta .../biserver-ce/pentaho-solutions/. (exemplos do diretório bi-developers) Descompacte o CDE (pentaho-cdf-dd-TRUNK-*.zip) em .../biserver-ce/pentaho-solutions/system/. Descompacte os exemplos do CDA (pentaho-cdf-dd-solution-TRUNK-*.zip) na pasta .../biserver-ce/pentaho- solutions/. Inicie seu Servidor Pentaho. Existe também a opção de executar um Shell script para fazer a instalação automatizada (ctools-installer): http://pedroalves-bi.blogspot.com/2011/06/ctools-installer-making-things-fast.html. Acesse seu servidor Pentaho e será habilitado um ícone para o CDE no menu superior do Pentaho User Console. Instalando o CDA (Community Data Access) com o CDA-Installer Faça o download da última versão do CDA que pode ser encontrado em http://cda.webdetails.org/ Verifique se o seu servidor Pentaho BI Server está parado (PUC e PAC). http://pedroalves-bi.blogspot.com/2011/06/ctools-installer-making-things-fast.html http://cda.webdetails.org/ Módulo Laboratório de Open Source Business Intelligence 45 Após baixar o .jar do CDA (geralmente cda-installer-latest.jar) execute pelo Shell do seu sistema operacional (DOS para Windows) o comando abaixo: java -jar cda-installer-latest.jar Em alguns sistemas operacionais somente clicar sobre o arquivo .jar já é o suficiente para executar. Siga os 6 passos de Instalação do CDA conforme imagens a seguir, boa parte dos passos é somente informativo sobre o CDA. O primeiro Passo apresenta informações sobre a versão e uma tela de boas vindas. O segundo passo apresenta o que é o CDA e suas funcionalidades. Módulo Laboratório de Open Source Business Intelligence 46 O terceiro passo apresenta as novidades e soluções de bugs realizadas da última versão do CDA. O quarto passo é o mais importante, pois neste passo você deve informar qual é o local do repositório de soluções do Pentaho, Informe o diretório pentaho-solutions do seu Pentaho (biserver-ce/pentaho-solutions) Atenção: caso você já tenha um CDA instalado o mesmo será apagado para ser instalada a nova versão, estão é prudente que realize um backup do seu Pentaho BI Server. Módulo Laboratório de Open Source Business Intelligence 47 Duas barras de progresso apresentarão o andamento da instalação. Pronto uma mensagem de sucesso será emitida. Módulo Laboratório de Open Source Business Intelligence 48 Inicie seu servidor Pentaho agora com o CDA está Instalado. O mesmo pode ser usado para construção de Dashboards com CDF e CDE assim como utilizado para cache e consultas de projetos relacionados ao servidor Saiku. Instalando o C**Tools com o C**Tools Installer Faça o download do CTools Installer em alguma pasta de seu computador através do seguinte link: http://code.google.com/p/guictoolsinstaller/downloads/list. Certifique-se de que o pentaho não está sendo executado, após realizar o download abra a pasta e execute o arquivo GuiCtoolsInstaller.bat. http://code.google.com/p/guictoolsinstaller/downloads/list Módulo Laboratório de Open Source Business Intelligence 49 Para instalar o C** Tools é necessário apontar para a pasta BI Solutions e o tomcat onde o Pentaho está instalado. Clique em Find Pentaho Solutions e localize a pasta “\biserver-ce\pentaho-solutions”, clique em Find Tomcat e selecione a pasta “biserver-ce\tomcat” após configurar clique em Update. O C**Tools já deverá ser configurado. Instalação do Saiku Saiku Plugin Baixe o plug-in do Saiku no endereço abaixo: http://meteorite.bi/saiku/download Descompacte o arquivo saiku-plugin-2.5.zip. Copie a pasta saiku inteira para a pasta biserver-ce/pentaho-solutions/system. Após executar esses passos reinicie seu servidor Pentaho. Saiku Reporting http://meteorite.bi/saiku/download Módulo Laboratório de Open Source Business Intelligence 50 Pare seu servidor Pentaho BI Server (PUC e PAC). Com o CDA instalado agora faça o download do saiku-reporting-plugin-trunk-SNAPSHOT.zip e descompacte-o na pasta biserver-ce/pentaho-solutions/system/, será criado uma pasta com o nome saiku- adhoc. Se você quer exportar as saídas do relatório para formato PRPTs do Saiku-Reporting, copie ou substitua o arquivo pentaho-reporting-engine-classic-extensions-cda-xxx.jar que está em /biserver- ce/tomcat/webapps/pentaho/WEB-INF/lib pelo arquivo que pode ser encontrado em biserver-ce/pentaho- solutions/system/saiku-adhoc/lib (pentaho-reporting-engine-classic-extensions-cda-saiku-SNAPSHOT.jar). Para colocar Saiku Report sob a ACL (Controle de Acesso) do Pentaho, adicionar a extensão .adhoc para a tag acl-files do arquivo pentaho.xml que pode ser encontrado na pasta biserver-ce/pentaho- solutions/system. Edite o mesmo conforme modelo abaixo: ... xaction,url,prpt,prpti,xdash,xcdf,adhoc... Reinicie ser servidor Pentaho Acesse seu PUC e terá mais um ícone no mesmo para o Saiku Report conforme imagem abaixo: Pronto pode utilizar o Saiku Reporting! Clique sobre o mesmo e explore os recursos para geração de relatórios, gere PDFs ou modelos em arquivos PRPT. Módulo Laboratório de Open Source Business Intelligence 51 Customização do Pentaho User Console Retirar Listagem de Usuários Por padrão, o Pentaho vem configurado para versão de demonstração, e quando abrimos sua tela de login aparecem os usuários em um Drop-down (versão 3.8 e anteriores), na versão superior a 4.0, ele aparece se você clicar em evaluation login. Para desativar a listagem de usuários, é necessário alterar o arquivo: pentaho.xml, onde está true, mudar para false. Arquivo: \pentaho\biserver-ce\pentaho-solutions\system\pentaho.xml Trecho de código: <login-show-users-list>true</login-show-users-list> <login-show-sample-users-hint>true</login-show-sample-users-hint> Antes: Módulo Laboratório de Open Source Business Intelligence 52 Depois: Adicionar o Saiku na Tela de Login Para adicionar o Saiku na tela de login
Compartilhar