Buscar

Introdução ao Pentaho Business Intelligence

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 245 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 245 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 245 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
1 
 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
 
 
 
 
 
 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
2 
 
 
Sumário 
Introdução .................................................................................................................................................................................. 7 
O Problema ........................................................................................................................................................................... 7 
Soluções Tradicionais e Suas Limitações ......................................................................................................................... 8 
Pentaho Business Intelligence: Visão Geral ....................................................................................................................... 10 
O que é o Pentaho? .......................................................................................................................................................... 10 
História .................................................................................................................................................................................. 10 
Quem é a Pentaho Corporation? .................................................................................................................................. 11 
Quem é Quem na Pentaho? ........................................................................................................................................... 12 
Origem do Nome ............................................................................................................................................................... 12 
Modelo de Negócios ......................................................................................................................................................... 12 
Versões ................................................................................................................................................................................. 13 
Pentaho e Big Data............................................................................................................................................................ 15 
Pentaho Agile BI ................................................................................................................................................................. 15 
Arquitetura ........................................................................................................................................................................... 16 
Pentaho do Mundo............................................................................................................................................................ 20 
Pentaho no Brasil ................................................................................................................................................................ 21 
Sumário de Vantagens do Pentaho ............................................................................................................................... 21 
Pentaho Business Intelligence: Componentes .................................................................................................................. 23 
Pentaho BI Server................................................................................................................................................................ 23 
Apache Tomcat ............................................................................................................................................................. 24 
Jetty .................................................................................................................................................................................. 24 
Spring Security ................................................................................................................................................................ 25 
Hibernate ......................................................................................................................................................................... 25 
Quartz ............................................................................................................................................................................... 25 
Hyper SQL (HSQLDB) ...................................................................................................................................................... 26 
Pentaho Administration – PAC ......................................................................................................................................... 26 
Pentaho User Console – PUC ........................................................................................................................................... 26 
Pentaho Data Integration ................................................................................................................................................ 26 
Pentaho Analysis ................................................................................................................................................................. 28 
Pentaho Schema Workbench ..................................................................................................................................... 29 
Pentaho Aggregation Designer .................................................................................................................................. 29 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
3 
 
 
Mondrian ......................................................................................................................................................................... 30 
Jpivot ................................................................................................................................................................................ 30 
Saiku.................................................................................................................................................................................. 30 
Pentaho Reporting ............................................................................................................................................................. 31 
Pentaho MetaData Editor ............................................................................................................................................ 31 
Web-based Adhoc Query and Reporting ................................................................................................................ 32 
Pentaho Report Designer ............................................................................................................................................. 32 
Pentaho Dashboard .......................................................................................................................................................... 32 
C**Tools ............................................................................................................................................................................ 32 
CDF - Community Dashboard Framework ................................................................................................................ 33 
CDA - Community Dashboard Access ...................................................................................................................... 33 
CDE - Community Dashboard Editor ......................................................................................................................... 33 
CCC - Community Chart Components.....................................................................................................................33 
CST - Community Startup Tabs .................................................................................................................................... 34 
Pentaho Data Mining ........................................................................................................................................................ 34 
Pentaho Design Studio ...................................................................................................................................................... 34 
Instalação e Configuração do Pentaho ........................................................................................................................... 35 
Download e Instalação .................................................................................................................................................... 35 
Drivers JDBC’s com Pentaho ............................................................................................................................................ 38 
Caminhos dos drivers JDBC’s nos softwares Pentaho ............................................................................................ 41 
Definindo a Senha de Publisher ...................................................................................................................................... 42 
Retirando a mensagem do rodapé do JPivot no Pentaho 4 CE ............................................................................. 42 
Instalação do C**Tools ...................................................................................................................................................... 43 
Instalando o CDA (Community Data Access) com o CDA-Installer ................................................................... 44 
Instalando o C**Tools com o C**Tools Installer ........................................................................................................ 48 
Instalação do Saiku............................................................................................................................................................ 49 
Saiku Plugin ...................................................................................................................................................................... 49 
Saiku Reporting ............................................................................................................................................................... 49 
Customização do Pentaho User Console ..................................................................................................................... 51 
Retirar Listagem de Usuários ........................................................................................................................................ 51 
Adicionar o Saiku na Tela de Login ............................................................................................................................ 52 
Pentaho Administration Console ......................................................................................................................................... 53 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
4 
 
 
Pentaho Data Integration ..................................................................................................................................................... 55 
PDI e Expressões Regulares ............................................................................................................................................... 59 
PDI e Principais Steps (Transformations) ......................................................................................................................... 59 
Categoria Input .............................................................................................................................................................. 60 
Categoria Output .......................................................................................................................................................... 63 
Categoria Transform...................................................................................................................................................... 64 
Categoria Utility .............................................................................................................................................................. 65 
Categoria Flow ............................................................................................................................................................... 66 
Categoria Scripting ....................................................................................................................................................... 67 
Categoria Lookup.......................................................................................................................................................... 68 
Categoria Joins .............................................................................................................................................................. 69 
Categoria Data Warehouse ........................................................................................................................................ 70 
Categoria Statistics ........................................................................................................................................................ 71 
Categoria Job ................................................................................................................................................................ 72 
Categoria Bulk loading ................................................................................................................................................. 73 
Categoria Inline.............................................................................................................................................................. 73 
Categoria Deprecated ................................................................................................................................................ 74 
PDI e Principais Steps (Jobs) ............................................................................................................................................. 75 
Categoria General ........................................................................................................................................................ 76 
Categoria Mail ............................................................................................................................................................... 77 
Categoria File management....................................................................................................................................... 78 
Categoria Condições ................................................................................................................................................... 80 
Categoria Scripting ....................................................................................................................................................... 80 
Categoria Bulk loading ................................................................................................................................................. 81 
Categoria XML ............................................................................................................................................................... 82 
Categoria Utility .............................................................................................................................................................. 83 
Categoria File transfer................................................................................................................................................... 84 
SchemaWorkbench............................................................................................................................................................... 85 
Introdução ........................................................................................................................................................................... 86 
Objetivos .............................................................................................................................................................................. 86 
Criando uma conexão com o Banco de dados ........................................................................................................ 87 
Navegação ......................................................................................................................................................................... 87 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
5 
 
 
Criando um Schema para identificação de um cubo .............................................................................................. 88 
Publicando o Schema criado para o "Pentaho New Analysis" ................................................................................ 89 
Pentaho Metadata Editor ..................................................................................................................................................... 90 
Configuração inicial .......................................................................................................................................................... 91 
Ativando as conexões do banco de dados ................................................................................................................ 91 
Importando Tabelas Físicas e Colunas: Camada Física ............................................................................................. 92 
Criando Modelo de Negócios: Camada de Lógica .................................................................................................. 92 
Criando Tabelas e Colunas de Negócios ................................................................................................................. 92 
Removendo Colunas Indesejáveis ao Modelo de Negócios ............................................................................... 93 
Relacionando Tabelas e Colunas .............................................................................................................................. 93 
Criando uma Visão de Negócios: Camada de Entrega ........................................................................................... 93 
Agrupando Colunas em Categorias ......................................................................................................................... 94 
Configurar os Locales no Editor de Idiomas ................................................................................................................. 94 
Adicionando Segurança aos Objetos do Metadata Business.................................................................................. 94 
Modificando Segurança de Conteúdos .................................................................................................................. 95 
Configurando o Pentaho BI Server para Segurança ............................................................................................. 96 
Backups e Recuperação de Domínio ........................................................................................................................... 96 
Exportando Domínios......................................................................................................................................................... 96 
Importando Domínios ........................................................................................................................................................ 96 
Testando o Meta-Modelo ................................................................................................................................................. 97 
Publicando um Domínio para o Pentaho BI Server ..................................................................................................... 97 
Análise de Dados com o JPivot ........................................................................................................................................... 98 
Análise de Dados com o Saiku .......................................................................................................................................... 114 
Criação de Relatórios no WAQR ....................................................................................................................................... 123 
Trabalho Prático .................................................................................................................................................................... 127 
Staging Área e Script de Criação do Banco.............................................................................................................. 128 
Modelo Dimensional e Script de Criação do Banco ................................................................................................ 129 
Criação de Repositório no Pentaho Data Integration ............................................................................................. 131 
Criação da Transformation da Staging ....................................................................................................................... 146 
Carga da Dimensão Tempo .......................................................................................................................................... 188 
Carga da Dimensão Município ..................................................................................................................................... 199 
Carga da Dimensão Ocorrência .................................................................................................................................. 202 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
6 
 
 
Carga da Fato Criminalidade ....................................................................................................................................... 205 
Criação de Usuário, Data Source no PAC e Configuração da Senha de Publisher ......................................... 215 
Montagem do Cubo no Schema Workbench ........................................................................................................... 218 
Montagem de Modelo de Metadados no Metadata Editor .................................................................................. 236 
Referências............................................................................................................................................................................. 244 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
7 
 
 
Introdução 
 
As organizações estão sempre procurando aumentar seu faturamento, diminuir despesas e melhorar sua 
lucratividade pelo aumento da eficiência e eficácia de seus processos de negócio. Os vendedores de 
softwares de Business Intelligence (BI) afirmam que eles possuem a tecnologia que pode oferecer estas 
melhorias. Vendedores concentram-se em vender produtos ou ferramentas que podem ser usadas para 
construir estas soluções, mas raramente se concentram nos problemas que seus clientes estão tentando 
resolver. Devido a constante dinâmica de operação das organizações, novos requisitos são percebidos 
frequentemente, trazendo novos vendedores de softwares ao mercado, com novos produtos e consultores 
para fazê-las funcionar. Eventualmente, a iniciativa de instalar um BI corporativo se torna uma coleção de 
soluções disjuntas usando uma combinação de aplicaçõescomerciais caras, fechadas e de difícil 
manutenção. 
Dentro desta perspectiva, cada ferramenta é projetada para operar em uma tarefa muito específica. Os 
processos de negócios devem ser quebrados em pedaços e segregados em tarefas tais como geração de 
relatórios, análise, mineração de dados, workflow, etc. Não existe uma plataforma responsável pela gestão, 
verificação e coordenação destas tarefas. Pessoas e procedimentos são chamados para resolver estas 
deficiências. 
 
O Problema 
 
Ferramentas tradicionais de Business Inteligente são caras, complexas e falhas em termos de 
proporcionarem às empresas os benefícios prometidos em relação a ganhos de eficiência e eficácia. 
Empresas de software de BI prometem que seus produtos irão fornecer a agregação, análise e relatórios que 
transforma dados em informação de alto valor agregado que permitem a melhora dos processos decisórios 
nas organizações. Infelizmente, a maioria se limita a gerar relatórios, o que é muito pouco. 
Quando um relatório é entregue ou uma situação particular é encontrada nos dados, algumas 
necessidades específicas ocorrem: uma decisão deve ser feita, causas devem ser descobertas, ou um 
processo deve ser iniciado. Nestes casos, a apresentação da informação, análise, e a realização de business 
intelligence são elementos de um processo maior. Este processo existe para resolver o problema relacionado 
ao negócio. 
Clarificando: 
 Frequentemente, a solução para um problema de negócios é um processo que inclui Business 
Intelligence (BI). 
 BI sozinho, raramente, é a completa solução de um problema. 
 Se BI é parte de um processo, então ferramentas de BI são inevitavelmente, também parte do 
processo. 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
8 
 
 
 Uma ferramenta de BI que não entende processos, ou como ser parte deles, dificilmente será 
integrada a uma solução mais ampla. 
Uma empresa pode maximizar o valor dos negócios disponibilizando informações aos trabalhadores que as 
utilizam para impactar o modo como ele opera. Benefícios serão obtidos quando a empresa otimiza os 
vários processos que afetam os indicadores chaves de desempenho (ICD), métricas que os gestores 
monitoram, relatam e analisam. 
 
As implementações de BI, tipicamente, apresentam os seguintes estágios: 
1. Desenvolvendo relatórios e identificando a necessidade de informações. 
2. Dashboards e a apresentação dos KPI's. 
3. Análise avançada das causas prováveis de exceções. 
4. Integração de relatórios com a Gestão de Processos/Workflow. 
5. Avaliação e correção destes processos. 
Infelizmente, muitas organizações só atingem o estágio de implementação de relatórios. A falta de uma 
gestão de processo/workflow adequada associada com a ausência de metodologias impedem as 
organizações de avançarem no processo de implementação de BI. Elas gastam excessivas quantidades de 
dinheiro em soluções proprietárias de BI na esperança que estes softwares irão ajudar. Infelizmente, 
ferramentas tradicionais de BI não atendem às necessidades das organizações. 
 
Soluções Tradicionais e Suas Limitações 
 
Preço 
A licença, manutenção, suporte e serviços relacionados ao software são bastante caros. 
Usabilidade 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
9 
 
 
Muito difícil para a maioria dos usuários. 
Habilidades 
Dificuldade de transferência do vendedor para o cliente. Ausência de metodologias de implementação. 
Customização 
Bastante difícil para clientes desenvolverem soluções e as integrarem as regras de negócios. 
Orientação a Ferramentas 
As soluções são conjuntos de ferramentas e não uma solução integrada. 
Extensão 
As soluções são proprietárias e difíceis, ou até impossíveis, para os clientes ou consultores externos 
expandirem as funcionalidades do sistema. Clientes não compram o software, mas sim pagam adiantado 
pelo direito de usá-lo. Isto é como fazer um leasing em um carro, mas realizando todos os pagamentos no 
primeiro dia. Este é o pior dos mundos. 
Foco em Relatórios e Análise 
As soluções são focadas em apresentação e análise de ICD, ignorando o desempenho do processo que 
afeta a métrica. 
Influência em processos 
Elas são incapazes de assegurar mudanças importantes nos processos de negócios. Elas assumem que a 
entrega de um relatório terá um efeito colateral de influenciar um processo. 
Auditoria 
Elas são incapazes de prover ferramentas para a realização de uma auditoria completa. Quem obteve um 
relatório? Que ações elas fizeram? Quanto tempo levou? Um processo teve início? Qual é o desempenho 
do processo? 
Prototipagem 
O elevado custo das ferramentas não permite a realização de prototipagem, necessária para assegurar o 
sucesso de projetos de Business Intelligence. Contratos e acordos financeiros de altos valores financeiros 
devem ser firmados ante de qualquer avaliação e prototipagem. 
Flexibilidade da Licença 
Ferramentas tradicionais de BI são construídas assumindo que um usuário utilizará na maior parte do seu dia 
um sistema de BI como uma ferramenta isolada. O melhor exemplo de que isto não é verdade ocorre 
durante o desenvolvimento de um extranet para usuários externos, infrequentes ou casuais, fora do firewall, 
onde uma licença, envolvendo milhares de dólares, precisa ser obtida. 
 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
10 
 
 
Pentaho Business Intelligence: Visão Geral 
 
O que é o Pentaho? 
 
O Pentaho é atualmente a plataforma Open Source de Inteligência de Negócios (BI) e Integração de 
Dados mais popular e poderosa no mundo. Os dados abaixo confirmam o sucesso alcançado pela 
plataforma Pentaho nos últimos anos. 
 Média de um download a cada 30 segundos; 
 Mais de 10.000 implementações ativas em produção; 
 Mais 1.200 clientes em 65 países 
 Economia de >US$2 bilhões em licenças e manutenção; 
 Apoiado por Benchmark Capital, Index Ventures e NEA. 
 
Para montar uma solução completa de Business Intelligence é necessário utilizar diversos componentes. A 
soma de todos estes componentes é o que chamamos de Pentaho BI Suite, ou seja, uma suíte completa de 
programas utilizados para a construção de uma solução de BI. 
Utilizando a suíte é possível realizar a integração de dados, construção de processos de ETL de forma visual, 
criação de cubos OLAP, consultas e relatórios, relatórios com filtros, relatórios com fórmulas, relatórios com 
sub-relatórios, relatórios com alertas, relatórios ad-hoc, análises interativas, painéis, mineração de dados, etc. 
Todas estas possibilidades tornam a plataforma de BI Pentaho a mais popular do mundo Open Source. 
 
História 
 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
11 
 
 
De acordo com o site oficial, O Pentaho nasceu do desejo de se alcançar uma mudança positiva no 
mercado de análise de negócios dominada por megavendedores burocráticos que ofereciam produtos 
"pesados” baseados em plataformas antigas, direcionados as suas aplicações já existentes e à custa de suas 
capacidades de inovação na área de BI. 
Sob esta perspectiva, cinco veteranos da indústria (por isto o nome Penta) fundaram a Pentaho Corporation 
em 2004. Estes veteranos foram provenientes de empresas como Business Objects, Cognos, Hyperion, JBoss, 
Oracle, Red Hat e SAS. 
Essas cinco pessoas tiveram uma grande idéia, iniciaram sua operação através de projetos já desenvolvidos 
e estáveis, ou seja, agregaram os principais projetos Open Source, contemplando desta forma todo o 
espectro de uma solução de Business Intelligence. 
Em 2005 agregou o principal projeto de Olap Open Source, conhecido na época como Mondrian. 
Atualmente, o fundador do projeto, Mr. Hyde (Julyan Hyde), é o Chief Architect Olap na Pentaho e o projeto 
foi rebatizado como Pentaho Analysis. 
Em 2006 agregou o principal projeto de ETL Open Source, conhecido na época comoKettle. Atualmente, o 
fundador do projeto Mr. Casters (Matt Casters) é o Chief Architect Data Integration na Pentaho e o projeto 
foi rebatizado como Pentaho Data Integration. 
Em 2006 agregou o principal projeto de Reporting Open Source, conhecido na época como JFreeReporting. 
Atualmente, o principal líder do projeto Mr. Morgner (Thomas Morgner) é o Chief Architect Reporting na 
Pentaho e o projeto foi rebatizado como Pentaho Reporting. 
Em 2006 agregou o principal projeto de Data Mining Open Source, conhecido na época como Weka. 
Atualmente, um dos principais desenvolvedores do projeto Mr. Hall (Mark Hall) é o Engenheiro Sênior Data 
Mining na Pentaho e o projeto foi rebatizado como Pentaho Data Mining. 
Muitos projetos de Software Livre maduros agregam outros projetos de software livre, porém os criadores 
destes acabam não participando desta nova combinação. 
A Pentaho possui em seu time de desenvolvimento os principais lideres destes projetos agregados que 
compõem a solução de inteligência de negócios em software livre mais utilizada do mundo. 
 
Quem é a Pentaho Corporation? 
 
A Pentaho Corporation é uma empresa de origem norte-americana que gerencia, facilita, suporta e lidera o 
papel de desenvolvimento do Projeto Pentaho BI. A empresa possui aportes financeiros de fundos de 
investimentos como Enterprise Associates, investidores do SugarCRM, Xensource e outros, Index Ventures, 
investidores do MySQL, Zend e outros. Atualmente a Pentaho é parceira oficial da IBM, Novell, MySQL e JBoss, 
entre outras grandes empresas fornecedoras de TI. Sua sede está localizada em Orlando na Flórida, com 
escritórios em São Francisco, Califórnia e por toda a Europa. 
 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
12 
 
 
Quem é Quem na Pentaho? 
 
 
 
Origem do Nome 
 
Além do significado da palavra penta, alega-se que o nome surgiu dos índios Pentaho que viveram na 
Flórida nos séculos XVIII e XIX e supostamente foram responsáveis pela domesticação do peixe-boi das Índias 
Ocidentais, até então animais selvagens e agressivos, que de acordo com alguns historiadores chegaram a 
tornar o comércio e comunicação ao longo das águas da Flórida praticamente impossível. 
 
Modelo de Negócios 
 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
13 
 
 
O modelo de negócio adotado pela Pentaho é o que chamamos em inglês de subscription model. Trata-se 
de uma forma de comercializar o software sem pagar pela licença de uso, onde o fabricante, no caso a 
Pentaho, provê suporte, serviços e melhorias no software através de uma mensalidade anual. 
Porém o cliente pode optar por utilizar a versão community onde não existe suporte da Pentaho nem custo 
anual, uma vez que neste caso o suporte é feito por meio da comunidade de desenvolvedores Pentaho 
espalhados por todo o mundo. 
 
Versões 
 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
14 
 
 
 
 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
15 
 
 
Pentaho e Big Data 
 
 
 
Pentaho Agile BI 
 
O Agile BI da Pentaho oferece uma solução integrada que permite passar diretamente do processo de ETL 
para a modelagem da informação e exploração de dados. O fluxo de trabalho sugerido começa com a 
produção de dados e termina com um esquema Mondrian testado que está pronto para ser usado em um 
relatório ou uma consulta destinada ao usuário final. 
Segundo o Agile BI da Pentaho o processo acima é integrado na ferramenta de ETL, o PDI. 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
16 
 
 
Com isso o projetista de ETL torna-se capaz de manusear os dados conforme o necessário, e com base na 
entrada de um analista de negócios, pode ir diretamente para a modelagem de dados, visualização dos 
dados e geração de relatórios e análises. Com a integração do processo de ETL, modelagem, visualização e 
relatórios em uma única ferramenta os projetistas de ETL e analistas de negócios trabalham de forma 
integrada e podem fazer as mudanças necessárias nos dados de forma rápida e eficaz. 
Enquanto constrói o DW, o projetista de ETL pode imediatamente criar um modelo baseado em dados que 
ele já construiu e assim pode explorar (visualizar) os dados. Por exemplo, em cooperação com um analista 
de BI, o projetista de ETL pode determinar que certas dimensões não sejam aplicáveis ou que as hierarquias 
não são mais necessárias. A etapa de visualização também permite que as questões de qualidade de 
dados sejam identificadas e corrigidas. Neste ponto, o projetista de ETL pode retornar ao PDI e construir 
hierarquias adicionais, o modelo, e em seguida, visualizar os dados novamente. Ajustes podem ser feitos de 
forma iterativa até que os dados sejam exatamente o que o analista de BI e usuários finais desejam ver. 
 
 
Arquitetura 
 
A plataforma Pentaho de BI é diferente das tradicionais ferramentas de BI. Ela é uma plataforma de BI 
centrada em processos e orientada a soluções composta por componentes de BI que permitem as 
organizações desenvolverem uma solução completa e integrada para problemas de BI. 
A plataforma Pentaho de BI, o elemento central na arquitetura da Pentaho Open BI Suíte, é centrada em 
processos cujo controle central é realizado através de um mecanismo de workflow. Este mecanismo utiliza 
definições de processos para determinar os processos de BI que serão executados na plataforma. Os 
processos podem ser facilmente customizados e novos podem ser facilmente incorporados. A plataforma de 
BI inclui componentes e relatórios para a análise de desempenho destes processos de BI. 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
17 
 
 
A plataforma de BI é orientada a soluções, pois as operações da plataforma são especificadas nas 
definições de processos e documentos de ação que especificam cada atividade. Estes processos e 
operações coletivamente definem a solução para um problema de business intelligence. Esta solução de BI 
pode ser facilmente integrada aos processos de negócios que são externos à plataforma. A definição de 
uma Solução pode conter qualquer número de processos e operações. 
A Pentaho Open BI Suite consiste de uma plataforma de BI, com facilidades para o usuário final, e o Pentaho 
Design Studio: 
 A plataforma disponibiliza uma arquitetura orientada a serviços que inclui auditoria, segurança, 
escalonamento de tarefas, ETL, serviços de web, repositório de atributos e regras de negócios. 
 As capabilidades para o usuário final incluem relatórios, análise, workflow, dashboards e mineração 
de dados. 
 O Pentaho Design Studio é um conjunto de ferramentas para o projeto e gestão que são integradas 
ao ambiente Eclipse. Estas ferramentas permitem ao analista de negócios tanto desenvolver como 
criar relatórios, dashboards, modelos de análise, regras de negócios e processos de BI. 
 A plataforma de BI e as facilidades para o usuário final criam o Servidor Pentaho. As soluções de BI 
são projetadas usando o Pentaho Design Studio e desenvolvidas no Servidor Pentaho. O servidor 
Pentaho é o mecanismo de execução em tempo real, com uma abordagem a workflow, o qual 
coordena a execução e a comunicação entre os componentes de BI. 
O controle centralizado através de um mecanismo de workflow é essencial para a arquitetura da 
plataforma Pentaho de BI: 
 A plataforma é construída em termos de processos e definições de processos. A plataforma de BI 
entende a natureza dos processos, pois tudo nela é executada como um processo. 
 Os processos são definidos em uma linguagem padronizada de definição de processos que é 
externamente acessada, editada e customizada. Toda a lógica dos negócios é revelada, e nada é 
escondido. 
 Serviços, como segurança e auditoria, são construídos no núcleo da plataforma e são utilizados 
automaticamente para garantira governança e o monitoramento de desempenho dos processos 
de negócios. 
A arquitetura é a combinação do código fonte original e de componentes maduros, em código aberto, 
que integrados formam uma plataforma de BI completa e sofisticada. 
A plataforma Pentaho de BI é construída tendo como base, servidores, mecanismos e componentes. Eles 
disponibilizam servidores J2EE, segurança, portais, workflow, regras de negócios, colaboração, gestão de 
conteúdo, integração de dados, análise e ferramentas de modelagem do sistema em desenvolvimento. 
Muitos destes componentes são projetos consolidados em código aberto, porém podem ser facilmente 
substituídos por outros produtos. 
Para criar uma solução totalmente integrada, o Pentaho adiciona os seguintes atributos: 
 Meta dados comuns para a definição de documentos orientados a soluções. 
 Interfaces comuns a todos os componentes. 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
18 
 
 
 Segurança. 
 E-mail e notificações. 
 Instalação, integração e validação de componentes. 
 Exemplos de soluções. 
 Conectores de aplicações. 
 Ferramentas de utilização e diagnóstico. 
 Ferramentas de projeto. 
 Configuração e customização. 
A plataforma Pentaho de BI integra workflow, regras de negócios, notificação e entrega de informações, 
escalonamento, auditoria, integração de aplicações navegação por conteúdo, interfaces ao usuário, 
ferramentas de projeto e administração de relatórios, análise, dashboards e componentes de mineração de 
dados. 
A arquitetura da Plataforma Pentaho de BI tem muitas vantagens. Especificamente: 
 Pela construção, integração e aperfeiçoamento de componentes de código aberto em uma 
plataforma integrada, o custo de implementação de BI é drasticamente reduzido. 
 O baixo custo de propriedade significa que recursos podem ser aplicados em outros investimentos, 
tais como serviços de valor agregado de implementação e customização ou aumentar o escopo de 
um projeto de BI, pelo desenvolvimento de conteúdos e funcionalidades mais avançados. Em outras 
palavras, uma mais alta percentagem do orçamento do projeto pode ser gasta na obtenção de 
requisitos, implementação e serviços, aumentando o sucesso do projeto. 
 Disponibilizando o software sem custo para prototipagem, permite que a mesma seja realizada 
indefinidamente. 
 Disponibilizando o software sem custo para prototipagem, permite que as iterações para a definição 
de requisitos de sistema sejam realizadas sem um limite de tempo rígido. 
 Pela construção de uma plataforma baseada em workflow, uma verdadeira arquitetura orientada a 
serviços é entregue. 
 Pela construção de uma plataforma baseada em workflow, é fácil integrar BI em qualquer processo 
de negócios. 
 Pela construção de uma plataforma baseada em workflow, é fácil executar clustering. Como o 
sistema não tem custo, a solução pode ser desenvolvida em qualquer número de servidores sem 
custos adicionais. 
 Pela construção de uma plataforma baseada em workflow, projetos de Bi podem ser continuamente 
adaptados e melhorados. 
 Pela construção de mecanismos de notificação de entrega de informação, relatórios, análises, 
tarefas e pontos de decisão podem ser mapeados para qualquer um envolvido com processos de 
negócios. 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
19 
 
 
 Pela construção de múltiplos mecanismos de regras de negócios, todas as lógicas do negócio são 
customizadas. 
 Pela construção de relatórios, análises e dashboards, um elevado grau de sofisticação é introduzido 
na solução de BI. Eles podem ser desenvolvidos em uma velocidade que é a mais adequada para 
uma organização, não sendo restringida por custos adicionais. 
 Pela integração de mineração de dados, as mais avançadas análises sobre dados podem ser 
realizadas no momento adequado. 
 Entregando uma instalação completa e pronta para rodar de um servidor, juntamente com um 
conjunto de componentes e mecanismos de execução, é fácil desenvolver e integrar novas 
configurações. 
 Integrando auditoria e relatórios de auditoria, monitoramento de sistemas e facilidades de 
administração, o sistema é fácil de manter. 
 Oferecendo interfaces intuitivas e de rápida customização, o sistema é fácil de usar e barato de 
treinar. 
Para reproduzir a arquitetura do Pentaho, seria necessário: 
 Definir requisitos para a completa arquitetura. 
 Determinar se o projeto de cada componente será próprio ou terceirizado. 
 Identificar fornecedores para os componentes terceirizados. 
 Executar uma pesquisa detalhada em cada componente. 
 Instalar e configurar cada componente. 
 Projetar e implementar uma camada de integração para cada componente. 
 Projetar e implementar interfaces consistentes para cada componente. 
 Projetar e implementar ferramentas de administração. 
 Projetar e implementar ferramentas de análise e modelagem. 
 Projetar e implementar os serviços comuns e suas infra-estruturas. 
 Projetar e criar repositórios. 
 Projetar e implementar novos componentes ou melhorar os componentes existentes com novas 
funcionalidades. 
 Integrar segurança. 
 Integrar auditoria. 
 Projetar e implementar relatórios de desempenho de processos. 
 Criar uma linguagem comum para definições. 
 Ter significante experiência com o desenvolvimento deste tipo de produto 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
20 
 
 
Devida a sua arquitetura e licenciamento, a utilização de uma plataforma de BI como parte de uma 
solução de business intelligence oferece as seguintes vantagens: 
 Aumenta o tempo e orçamento disponíveis para a definição de requisitos 
 Aumenta o tempo e orçamento disponíveis para prototipagem 
 Aumenta o tempo e orçamento disponíveis para a implementação e desenvolvimento do projeto 
 Aumenta o tempo e orçamento disponíveis para serviço e treinamento 
 Acelera o começo da fase de implementação 
 Reduz a variedade de habilidade para implementar uma solução 
 Estes fatores combinados reduzem o custo e o risco de um projeto, e aumentam as chances de 
sucesso de uma solução de BI. 
 
 
 
 
 
 
 
 
 
 
 
 
Pentaho do Mundo 
 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
21 
 
 
 
Pentaho no Brasil 
 
 
Sumário de Vantagens do Pentaho 
 
Usabilidade 
A plataforma BI tem componentes prontos para serem executados, é de fácil integração com sistemas 
externos, e oferece interfaces de fácil customização. Isto resulta em soluções que são muito fáceis de serem 
usadas. 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
22 
 
 
Habilidades 
A plataforma de BI utiliza reconhecidos padrões, de maneira a facilitar a utilização de ferramentas de 
parceiros. 
Customização 
A plataforma de BI tem mecanismos externos de regras, processos editáveis, disponibilidade de códigos 
fontes, componentes reutilizáveis de BI e interfaces plenamente customizáveis. A plataforma executa 
processos editáveis que podem ser integrados com processos de negócios. Isto resulta em soluções 
altamente customizadas. 
Orientação a Ferramentas 
A plataforma de BI é centrada em processos e soluções. Ela não é projetada para ser um conjunto de 
ferramentas isoladas, mas para ser um sistema completamente integrado. 
Extensão 
O código fonte é fornecido. A infraestrutura, componentes, mecanismos e interfaces podem ser facilmente 
modificados. O dinheiro salvo em gastos com licenças pode ser direcionado para extender a plataforma em 
uma área específica. A estrutura do produto é pública. 
Foco em Relatórios e Análise 
A plataforma de BI é centrada em processos, baseada em workflow e direcionada a regras de negócios. Ela 
pode ser facilmente integrada aos processos de negócios e tem facilidades para a geração de relatórios. 
Regras de negócios são usadas para identificarproblemas e exceções; e processos auditados são 
executados para resolvê-las. 
Influência em processos 
A plataforma de BI acompanha a entrega de informações e permite processos de negócios customizados 
serem iniciados pelos receptores da informação. A entrega de um relatório não é o final da linha. Relatórios 
de performance de processos e modelos podem ser gerados. Ações tomadas podem ser avaliadas, 
comparando-as com metas, para mensurar a efetividade do processo. A plataforma oferece facilidades 
automáticas para realizar esta tarefa. 
Auditoria 
A plataforma de BI inclui robustos processos de rastreamento e auditoria. A história de uma situação pode 
ser acessada, incluindo as ações tomadas, discussões/comentários e informações de suporte. 
Prototipagem 
O licenciamento da plataforma permite que a prototipagem seja realizada sem grandes investimentos. 
Flexibilidade da Licença 
O licenciamento da plataforma de BI é flexível e oferece valor ao cliente, pois o BI é somente parte de um 
processo de negócios, adicionando valor incremental. Além disto, o licenciamento por CPU a custos 
razoáveis abre a possibilidade aplicações extranet que não são realistas com ferramentas tradicionais, 
baseadas em licenciamento por usuário. 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
23 
 
 
 
Pentaho Business Intelligence: Componentes 
 
Pentaho BI Server 
 
O Pentaho BI Server é responsável por toda a camada servidora do plataforma do Pentaho e fornece a 
arquitetura e infraestrutura necessária para a construção de soluções para Business Intelligence (BI). Serviços 
essenciais do Pentaho BI Server: 
1. Autenticação; 
2. Logs; 
3. Auditoria; 
4. Serviços web; 
5. Motores de regras de negócio; 
6. Mecanismo para integração com relatórios; 
7. Mecanismo para integração de analises; 
8. Mecanismo para integração com dashboards; 
9. Mecanismo para integração com mineração de dados. 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
24 
 
 
 
 
Sua arquitetura e baseada em plug-in permitindo que a totalidade ou parte da plataforma seja incorporada 
a aplicações de terceiros. O Pentaho BI Server e composto por diversos outros aplicativos Open Source, 
entre eles: 
 
Apache Tomcat 
 
 
Servidor Web Java, especialista em aplicações J2EE, que é a tecnologia ao qual 
o Pentaho Bi Server foi desenvolvido, mais especificamente o tomcat é um 
container de servlets. O Tomcat possui algumas características próprias de um servidor de aplicação, porém 
não pode ser considerado um servidor de aplicação por não preencher todos os requisitos necessários. 
 
Jetty 
 
 
 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
25 
 
 
Jetty é um servidor HTTP e Servlet Container 100% escrito em Java. É o grande concorrente do Tomcat que 
ficou famoso por ser utilizado como o servlet container do JBoss. A grande vantagem do Jetty com relação 
ao Tomcat é a sua fácil configuração. O mesmo e utilizado em algumas ações especificas do Pentaho BI 
Server no administrator-console, com isso o mesmo usa dois servidores Web para carregar a aplicação. 
 
Spring Security 
 
 
 
 
Spring Security é uma aplicação para controle de autenticação forte e altamente 
personalizável e quadro de controle de acesso. É o padrão de-facto para proteger aplicativos baseados 
em Spring. O mesmo se integra ao Tomcat e ao Pentaho BI Server para administração da segurança do 
servidor de aplicação. 
 
Hibernate 
 
O Hibernate é um framework para o mapeamento objeto-relacional escrito na 
linguagem Java, mas também é disponível em DotNet como o nome NHibernate. No Pentaho ele e 
responsável pelo mapeamento das bases de dados para o Data Warehouse. 
 
Quartz 
 
 
 
 
O quartz é um agendador (scheduler) Open Source, serviço de agendamento de 
tarefas que podem ser integrados ou utilizados ao longo de praticamente qualquer Java EE ou aplicativo 
Java SE. 
 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
26 
 
 
Hyper SQL (HSQLDB) 
 
 
 
O HSQLDB (do inglês Hyperthreaded Structured Query Language Database) é um servidor de banco de 
dados (SGBD), de código aberto, escrito totalmente na linguagem Java. Não é possível compará-lo, em 
termos de robustez e segurança com outros servidores SGBD, como Oracle ou Microsoft SQL Server, 
entretanto o HSQLDB é uma solução simples, que utiliza poucos recursos e que possui bom desempenho. 
Devido a essas características, ele é bastante utilizado em aplicações que são executadas em desktops e 
que necessitam interagir com uma camada de persistência através da linguagem SQL. A suíte Office 
OpenOffice/BrOffice, na sua versão 2.0, inclui o HSQLDB como engine de armazenamento de dados. 
 
Pentaho Administration – PAC 
 
Interface administrativa do Pentaho. A partir do PAC são definidos usuários, grupos, conexões com bancos 
de dados e Data Warehouses (JNDI), possui também algumas ferramentas para limpar os caches da suíte, 
além disso, possibilita a criação de agendamentos públicos nos quais os usuários finais podem subscrever 
relatórios. 
 
Pentaho User Console – PUC 
 
Interface para o usuário final, é a partir do PUC que os usuários terão acesso às análises e relatórios criados, 
poderão ainda - de acordo com as permissões definidas - criar relatórios Ad-Hoc utilizando o WAQR, criar 
novas visões analíticas utilizando o Jpivot, executar relatórios criados previamente com o PRD (ou outro 
gerador de relatórios suportado), visualizar dashboards, agendar a execução de relatórios e compartilhar 
qualquer um desses artefatos com outros usuários. 
 
Pentaho Data Integration 
 
O Pentaho Data Integration é um projeto Open Source encampado pelo Pentaho em 2006. Foi 
desenvolvido por Matt Casters e anteriormente era conhecido como Kettle: KDE Extraction, Transportation, 
Transformation and Loading Environment. 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
27 
 
 
 
As principais funcionalidades do Pentaho Data Integration estão relacionadas à Integração de Dados e ao 
Processo de ETL. 
 
 
 
Atividades de Extração: 
 Captura dos dados; 
 Leitura a partir de diversas fontes; 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
28 
 
 
 Identificação de mudanças desde a última extração. 
 Staging 
 Armazenamento temporário dos dados. 
 
Atividades de Transformação: 
 Validação dos dados 
 Verificação se os dados estão corretos e precisos; 
 Filtragem de dados inválidos. 
 Limpeza dos dados 
 Correção de dados inválidos. 
 Decodificação 
 Conversão de atributos (numéricos, categóricos) para adequação a um padrão ou regra. 
 Agregação 
 Geração e gerenciamento de chaves 
 Dimensões identificadas por chaves substitutas (“surrogates”). 
 
Atividades de Carregamento: 
 Carregamento das tabelas de fatos 
 Adição de linhas à tabela de fatos; 
 Atualização de atributos de status. 
 Carregamento e manutenção das tabelas de dimensões 
 Adição e atualização de linhas das tabelas de dimensões. 
 
Pentaho Analysis 
 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
29 
 
 
 
 
Pentaho Schema Workbench 
 
O uso da ferramenta Mondrian Schema Workbench e útil para facilitar a criação de esquemas para o 
Mondrian. Sua interface permite a exploração de todos os recursos disponíveis para a criação do esquema 
XML. 
Podemos observar a estrutura do esquema com facilidade, incluindo dimensões, hierarquias, níveis, 
propriedades e elementos virtuais. 
 
Pentaho Aggregation Designer 
 
Ferramenta gráfica desenvolvida em Java que ajuda a melhorar a eficiência do cubo Mondrian, criando 
tabelas agregadas. 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
30 
 
 
 
 
Mondrian 
 
O Mondrian é um servidorOLAP (Online Analytical Processing) escrito em Java. 
Ele possibilita a análise interativa de uma grande quantidade de dados guardados em bancos SQL sem a 
necessidade de se escrever consultas SQL. 
Faz com que consultas escritas na linguagem MDX (Dimensional) sejam convertidas para SQL (Relacional). 
 
Jpivot 
 
Interface gráfica OLAP, é a interface gráfica para a criação das consultas MDX, permite visualizar o 
resultado das consultas na forma de tabelas dinâmicas (pivot tables), adicionalmente inclui também a 
possibilidade de exibir gráficos dinâmicos baseados no conteúdo das tabelas dinâmicas. 
 
Saiku 
 
É um sistema modular de código aberto, oferecendo suíte de análise OLAP leve que permanece facilmente 
incorporável, extensível e configurável. O Saiku foi disponibilizado também como um plugin para Pentaho 
para visualização de cubos Mondrian, anteriormente o Saiku se chamava PAT ( Pentaho Analysis Tool ). 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
31 
 
 
O Saiku Reporting é um cliente web disponível como plugin para o Pentaho BI Server. Ele usa o 
Pentaho Metadata-Layer para proporcionar uma forma fácil de usar o recurso de relatórios ad hoc com 
uma experiência simples para usuário final. 
 
Pentaho Reporting 
 
 
 
Pentaho MetaData Editor 
 
Ferramenta que mapeia os bancos de dados e seu conteúdo em uma visão de negócios a partir da qual 
usuários podem compor relatórios, via web através do WAQR. Permite adição de uma camada de 
metadados a uma fonte de dados existente. Normalmente usada para criar uma camada que facilita a 
criação de relatórios ou analises, porém seu uso não é obrigatório. 
O padrão de metadados Pentaho é baseado no padrão CWM, que é uma especificação criada e mantida 
pelo Object Management Group (OMG). É um padrão aberto que permite a partilha e a representação de 
metadados em plataformas de Business Intelligence ( http://www.omg.org/technology/cwm). 
 
http://www.omg.org/technology/cwm
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
32 
 
 
Web-based Adhoc Query and Reporting 
 
Interface para a criação de relatórios simples diretamente pelo usuário final, é acessado através do PUC e 
utiliza os metadados publicados pelo PME. 
 
Pentaho Report Designer 
 
Gerador de relatórios "pixel perfect" da suíte, facilita a criação de relatórios "ricos" com uma aparência mais 
profissional e personalizada, adicionalmente permite a publicação desses relatórios no PUC, permite 
inclusive que filtros simples sejam publicados diretamente sem a criação de xactions no PDS. 
 
Pentaho Dashboard 
 
C**Tools 
 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
33 
 
 
 
O C**Tools é um conjunto de ferramentas para construção de dashboards para a Suite Pentaho BI Open 
Source, desenvolvido pela WebDetails. 
 
CDF - Community Dashboard Framework 
 
Community Dashboard Framework, conhecido como CDF é um framework Open Source com licença GPL 
desenvolvido pela empresa WebDetails para facilitar a construção de Dashboards no ambiente de Business 
Intelligence da Pentaho, o mesmo é instalado da mesma forma de um plugin ou extensão da plataforma do 
Pentaho BI Server. 
 
CDA - Community Dashboard Access 
 
Estes são vários componentes que dão acesso a diferentes tipos de Data Sources. No entanto, há um aviso 
de segurança sobre a possibilidade de injeção de SQL, por isso, se você não está em um ambiente seguro 
não e recomendado seu uso. 
 
CDE - Community Dashboard Editor 
 
Esta é a interface web que permite criar um layout HTML / CSS e conectá-lo a elementos da página, Data 
Sources e eventos para que você possa construir seus Dashboards interativos. 
 
CCC - Community Chart Components 
 
O CCC é uma biblioteca de gráficos em cima do Protovis com o objetivo de fornecer aos desenvolvedores 
Pentaho um caminho para incluir qualquer tipo de gráfico imaginável em um painel CDF com 
extensibilidade e flexibilidade como princípio fundamental. 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
34 
 
 
 
CST - Community Startup Tabs 
 
Este componente permite que os desenvolvedores Pentaho consigam elaborar um conjunto de regras para 
definir quais abas serão abertas quando um usuário fizer login no ambiente Pentaho BI Server. 
 
Pentaho Data Mining 
 
O WEKA é uma suíte de mineração de dados desenvolvida pela Universidade de Waikato na Nova Zelândia; 
e tem como principal diferencial ser uma ferramenta de uso muito simples; o que não significa que seja de 
menor qualidade em relação as demais ferramentas Open Source. 
 
 
Pentaho Design Studio 
 
Plugin para a plataforma eclipse que funciona como uma interface gráfica para a criação de xactions que 
são arquivos xml interpretados pelo BI Server, são como instruções "passo-a-passo" que dirigem a execução 
das atividades pelo BI Server, permitem, por exemplo, a definição de filtros avançados para relatórios e o 
envio de e-mails com os relatórios executados. 
 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
35 
 
 
Instalação e Configuração do Pentaho 
 
Nesta seção iremos tratar de aspectos gerais relacionados à configuração dos componentes do Pentaho 
que iremos utilizar durante o curso. 
 
Download e Instalação 
 
Para o download dos pacotes do Pentaho podemos acessar a página Community Projects a partir do portal 
da Pentaho. 
 
 
Através desta página temos acesso a todos os pacotes relacionados ao Pentaho e as documentações dos 
projetos. 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
36 
 
 
 
O link direto para o download dos pacotes através do SourceForge é o seguinte: 
http://sourceforge.net/projects/pentaho/files/. 
http://sourceforge.net/projects/pentaho/files/
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
37 
 
 
 
Podemos criar então uma pasta em nosso computador de nome Pentaho, por exemplo, e armazenar cada 
um dos pacotes baixados. Como o Pentaho não requer instalação, ou seja, na versão Community não existe 
um instalador, basta apenas descompactar cada um dos pacotes e executar os respectivos arquivos de 
execução dos pacotes. 
No caso do Windows para cada pacote irá existir um arquivo .bat e no caso do Linux um arquivo .sh que 
servirá para a execução de cada aplicativo. 
BI Server 
Arquivos: start-pentaho.bat e start-pentaho.sh 
Administration Console 
Arquivos: start-pac.bat e start-pac.sh 
Data Integration 
Arquivos: Spoon.bat e Spoon.sh 
Report Designer 
Arquivos: report-designer.bat e report-designer.sh 
Schema Workbench 
Arquivos: workbench.bat e workbench.sh 
Aggregation Designer 
Arquivos: startaggregationdesigner.bat e startaggregationdesigner.sh 
Metadata Editor 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
38 
 
 
Arquivos: metadata-editor.bat e metadata-editor.sh 
 
Drivers JDBC’s com Pentaho 
 
Java Database Connectivity ou JDBC é um conjunto de classes e interfaces (API) escritas em Java que 
fazem o envio de instruções SQL para qualquer banco de dados relacional; Api de baixo nível e base para 
Api’s de alto nível; Amplia o que você pode fazer com Java; Possibilita o uso de bancos de dados já 
instalados; Para cada banco de dados há um driver JDBC que pode cair em três categorias. 
Driver API-Nativo 
O driver API-Nativo traduz as chamadas JDBC para as chamadas da API cliente do banco de dados usado. 
Como a Ponte JDBC-ODBC, pode precisar de software extra instalado na máquina cliente. 
Driver de Protocolo de Rede 
Traduz a chamada JDBC para um protocolo de rede independente do banco de dados utilizado, que é 
traduzido para o protocolo do banco de dados por um servidor. Por utilizar um protocolo independente, 
pode conectar as aplicações clientes Java a vários bancosde dados diferentes. É o modelo mais flexível e 
pode ser visto como um driver intermediário, pois também atua como Middleware. É mais utilizado para 
banco de dados antigos como estatais de governos. 
Driver Nativo 
Converte as chamadas JDBC diretamente no protocolo do banco de dados. Implementado em Java, 
normalmente é independente de plataforma e escrito pelos próprios desenvolvedores. É o tipo mais 
recomendado para ser usado. 
Esta é uma lista de drivers JDBC e seus parâmetros de conexão disponíveis para conectar a sua fonte de 
dados: 
Progress Open Edge 10.2 A 
String de conexão (URL): jdbc:datadirect:openedge://<Nome do Host>:<Número da 
Porta>;databaseName=<Nome do banco de Dados> 
Nome da classe (Class Name): com.ddtek.jdbc.openedge.OpenEdgeDriver 
MySQL (Conector/J) 
String de conexão (URL): jdbc:mysql://<Nome do Host>:<Número da Porta>/<Nome do Banco de Dados> 
Nome da classe (Class Name): com.mysql.jdbc.Driver 
IBM DB2 
String de conexão (URL): jdbc:db2://<Nome do Host>:<Número da Porta>/<Nome do Banco de Dados> 
Nome da classe (Class Name): com.ibm.db2.jdbc.app.?DB2Driver 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
39 
 
 
JDBC-ODBC Bridge 
String de conexão (URL): jdbc:odbc:<Nome do Banco de Dados> 
Nome da classe (Class Name): sun.jdbc.odbc.?JdbcOdbcDriver 
Microsoft SQL Server 
String de conexão (URL): jdbc:weblogic:mssqlserver4:?<Nome do Banco de Dados>?@<Nome do 
Host>:<Número da Porta> 
Nome da classe (Class Name): weblogic.jdbc.mssqlserver4.Driver 
Oracle Thin 
String de conexão (URL): jdbc:oracle:thin:?@<Nome do Host>:port:SID 
Nome da classe (Class Name): oracle.jdbc.driver.?OracleDriver 
PointBase Embedded Server 
String de conexão (URL): jdbc:pointbase://embedded[:<Número da Porta>]/<Nome do Banco de Dados> 
Nome da classe (Class Name): com.pointbase.jdbc.jdbcUniversalDriver 
Cloudscape 
String de conexão (URL): jdbc:cloudscape:<Nome do Banco de Dados> 
Nome da classe (Class Name): com.cloudscape.core.JDBCDriver 
Cloudscape RMI 
String de conexão (URL): jdbc:rmi://<Nome do Host>:<Número da Porta>/jdbc:cloudscape:<Nome do Banco 
de Dados> 
Nome da classe (Class Name): RmiJdbc.RJDriver 
Firebird (JCA/JDBC Driver) 
String de conexão (URL): jdbc:firebirdsql:[//<Nome do Host>[:<Número da Porta>]/]<Nome do Banco de 
Dados> 
Nome da classe (Class Name): org.firebirdsql.jdbc.FBDriver 
IDS Server 
String de conexão (URL): jdbc:ids://<Nome do Host>:<Número da Porta>/conn??dsn=’<Nome do DSN ODBC>’ 
Nome da classe (Class Name): ids.sql.IDSDriver 
Informix Dynamic Server 
String de conexão (URL): jdbc:firebirdsql:[//<Nome do Host>[:<Número da Porta>]/]<Nome do Banco de 
Dados> 
Nome da classe (Class Name): com.informix.jdbc.IfxDriver 
InstantDB (v3.13 and earlier) 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
40 
 
 
String de conexão (URL): jdbc:idb:<Nome do Banco de Dados> 
Nome da classe (Class Name): jdbc.idbDriver 
InstantDB (v3.14 and later) 
String de conexão (URL): jdbc:idb:<Nome do Banco de Dados> 
Nome da classe (Class Name): org.enhydra.instantdb.jdbc.idbDriver 
Interbase (InterClient Driver) 
String de conexão (URL): jdbc:interbase://<Nome do Host>/<Nome do Banco de Dados> 
Nome da classe (Class Name): interbase.interclient.Driver 
Hypersonic SQL (versão 1.2 e anteriores) 
String de conexão (URL): jdbc:HypersonicSQL:<Nome do Banco de Dados> 
Nome da classe (Class Name): hSql.hDriver 
Hypersonic SQL (versão 1.3 e superiores) 
String de conexão (URL): jdbc:HypersonicSQL:<Nome do Banco de Dados> 
Nome da classe (Class Name): org.hsql.jdbcDriver 
Microsoft SQL Server (JTurbo Driver) 
String de conexão (URL): jdbc:JTurbo://<Nome do Host>:<Número da Porta>/<Nome do Banco de Dados> 
Nome da classe (Class Name): com.ashna.jturbo.driver.Driver 
Microsoft SQL Server (Sprinta Driver) 
String de conexão (URL): jdbc:inetdae:<Nome do Host>:<Número da Porta>?database=<Nome do Banco de 
Dados> 
Nome da classe (Class Name): com.inet.tds.TdsDriver 
Microsoft SQL Server 2000 (Microsoft Driver) 
String de conexão (URL): jdbc:microsoft:sqlserver://<Nome do Host>:<Número da 
Porta>[;DatabaseName=<Nome do Banco de Dados>] 
Nome da classe (Class Name): com.microsoft.sqlserver.jdbc.SQLServerDriver 
MySQL (MM.MySQL Driver) 
String de conexão (URL): jdbc:mysql://<Nome do Host>:<Número da Porta>/<Nome do Banco de Dados> 
Nome da classe (Class Name): org.gjt.mm.mysql.Driver 
Oracle OCI 8i 
String de conexão (URL): jdbc:oracle:oci8:@<Nome do SID> 
Nome da classe (Class Name): oracle.jdbc.driver.OracleDriver 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
41 
 
 
Oracle OCI 9i 
String de conexão (URL): jdbc:oracle:oci:@<Nome do SID> 
Nome da classe (Class Name): oracle.jdbc.driver.OracleDriver 
PostgreSQL (versão 6.5 e anteriores) 
String de conexão (URL): jdbc:postgresql://<Nome do Host>:<Número da Porta>/<Nome do Banco de 
Dados> 
Nome da classe (Class Name): postgresql.Driver 
PostgreSQL (versão 7.0 e superiores) 
String de conexão (URL): jdbc:postgresql://<Nome do Host>:<Número da Porta>/<Nome do Banco de 
Dados> 
Nome da classe (Class Name): org.postgresql.Driver 
Sybase (jConnect 4.2 e anteriores) 
String de conexão (URL): jdbc:sybase:Tds:<HOST>:<PORT> 
Nome da classe (Class Name): com.sybase.jdbc.SybDriver 
Sybase (jConnect 5.2) 
String de conexão (URL): jdbc:sybase:Tds:<HOST>:<PORT> 
Nome da classe (Class Name): com.sybase.jdbc2.jdbc.SybDriver 
Teradata 
String de conexão (URL): jdbc:teradata://DatabaseServerName/Param1,Param2,… 
Nome da classe (Class Name): com.ncr.teradata.TeraDriver 
 
Caminhos dos drivers JDBC’s nos softwares Pentaho 
 
Os caminhos abaixo devem ser utilizados para que coloquemos o driver do respectivo banco de dados que 
estamos utilizando no desenvolvimento de nossa solução de BI. Deste modo, devemos baixar o driver e 
adicionar uma cópia do mesmo em cada uma das pastas abaixo: 
BI Server 
Caminho: ../server/biserver-ce/tomcat/lib/ 
Administration Console 
Caminho: ../pentaho/server/administration-console/jdbc/ 
Data Integration 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
42 
 
 
Caminho: ../data-integration/libext/JDBC/ 
Report Designer 
Caminho: ../report-designer/lib/jdbc/ 
Schema Workbench 
Caminho: ../schema-workbench/drivers/ 
Aggregation Designer 
Caminho: ../agg-designer/drivers/ 
Metadata Editor 
Caminho: ../metadata-editor/libext/JDBC/ 
 
Definindo a Senha de Publisher 
 
Para que os cubos e relatórios feitos por você possam ser acessados (visualizados) por outras pessoas da 
rede, é necessário publicar os cubos e metadados no BI Server. 
O BI Server, por padrão vem com a senha de publicação em branco, assim não sendo possível que alguém 
publique algum conteúdo no servidor. Também é necessário alterar a senha de publicação dos relatórios no 
BI Server, abra o diretório: \pentaho\biserver-ce\pentaho-solutions\system\ e edite o arquivo: 
publisher_config.xml de acordo com o exposto abaixo. 
Trecho a ser editado: 
<publisher-config> 
 <publisher-password>sua_senha</publisher-password> 
</publisher-config> 
 
Retirando a mensagem do rodapé do JPivot no Pentaho 4 CE 
 
Na versão 4 do Pentaho CE (biserver-ce-3.9) foi adicionada uma mensagem de alerta sobre a 
descontinuidade do suporte a melhorias ao JPivot nas próximas versão do Pentaho, a mesma se encontra 
no rodapé do JPivot. 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
43 
 
 
 
Mensagem: 
JPivot has been replaced by Pentaho Analyzer. It is provided as a convenience but will no longer be 
enhanced or officially supported by Pentaho. 
 Traduzindo: 
O JPivot foi substituído pelo Pentaho Analyzer. Ele é fornecido como uma conveniência, mas deixará de ser 
melhorado ou oficialmente suportado pela Pentaho. 
Pararetirar está mensagem da apresentação do PUC (Pentaho User Console) edite o arquivo .../biserver-
ce/tomcat/webapps/pentaho/jsp/Pivot.jsp procure pela DIV com o deprecatedWarning e comente do inicio 
da DIV ao final da DIV ou apague este trecho de HTML. 
 
Instalação do C**Tools 
 
Para copiar a versão mais recente das ferramentas C**Tools acesse o site http://ci.analytical-labs.com/ e 
clique na aba 'webdetails': 
CDA, dois arquivos zip: 
- código: cda-TRUNK-*.zip 
- exemplos: cda-samples-TRUNK-*.zip 
CDE, 2 arquivos zip: 
- código: pentaho-cdf-dd-TRUNK-*.zip 
- exemplos: pentaho-cdf-dd-solution-TRUNK-*.zip 
CDF - 2 arquivos zip 
-código: pentaho-cdf-TRUNK-SNAPSHOT.zip 
-exemplos: pentaho-cdf-solution-TRUNK-SNAPSHOT.zip 
Certifique se de parar a execução de seu servidor Pentaho. 
Faça um backup do diretório do Pentaho BI ../biserver-ce/pentaho-solutions/. 
Delete os diretórios abaixo (alguns diretórios podem não existir se for a primeira instalação): 
http://ci.analytical-labs.com/
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
44 
 
 
../biserver-ce/pentaho-solutions/system/pentaho-cdf 
../biserver-ce/pentaho-solutions/system/pentaho-cdf-dd 
../biserver-ce/pentaho-solutions/system/cda 
../biserver-ce/pentaho-solutions/cdf 
../biserver-ce/pentaho-solutions/bi-developers/cda 
../biserver-ce/pentaho-solutions/cde_sample 
Descompacte o CDF (pentaho-cdf-TRUNK-SNAPSHOT.zip) na pasta .../biserver-ce/pentaho-
solutions/system/. 
 Descompacte os exemplos CDF (pentaho-cdf-solution-TRUNK-SNAPSHOT.zip) em .../biserver-ce/pentaho-
solutions/. 
Descompacte o CDA (cda-TRUNK-*.zip) em .../biserver-ce/pentaho-solutions/system/. 
Descompacte os exemplos do CDA (cda-samples-TRUNK-*.zip) na pasta .../biserver-ce/pentaho-solutions/. 
(exemplos do diretório bi-developers) 
Descompacte o CDE (pentaho-cdf-dd-TRUNK-*.zip) em .../biserver-ce/pentaho-solutions/system/. 
Descompacte os exemplos do CDA (pentaho-cdf-dd-solution-TRUNK-*.zip) na pasta .../biserver-ce/pentaho-
solutions/. 
Inicie seu Servidor Pentaho. 
Existe também a opção de executar um Shell script para fazer a instalação automatizada (ctools-installer): 
http://pedroalves-bi.blogspot.com/2011/06/ctools-installer-making-things-fast.html. 
Acesse seu servidor Pentaho e será habilitado um ícone para o CDE no menu superior do Pentaho User 
Console. 
 
 
Instalando o CDA (Community Data Access) com o CDA-Installer 
 
Faça o download da última versão do CDA que pode ser encontrado em http://cda.webdetails.org/ 
Verifique se o seu servidor Pentaho BI Server está parado (PUC e PAC). 
http://pedroalves-bi.blogspot.com/2011/06/ctools-installer-making-things-fast.html
http://cda.webdetails.org/
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
45 
 
 
Após baixar o .jar do CDA (geralmente cda-installer-latest.jar) execute pelo Shell do seu sistema operacional 
(DOS para Windows) o comando abaixo: 
java -jar cda-installer-latest.jar 
Em alguns sistemas operacionais somente clicar sobre o arquivo .jar já é o suficiente para executar. 
Siga os 6 passos de Instalação do CDA conforme imagens a seguir, boa parte dos passos é somente 
informativo sobre o CDA. O primeiro Passo apresenta informações sobre a versão e uma tela de boas vindas. 
 
O segundo passo apresenta o que é o CDA e suas funcionalidades. 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
46 
 
 
 
O terceiro passo apresenta as novidades e soluções de bugs realizadas da última versão do CDA. 
 
 
 
O quarto passo é o mais importante, pois neste passo você deve informar qual é o local do repositório de 
soluções do Pentaho, Informe o diretório pentaho-solutions do seu Pentaho (biserver-ce/pentaho-solutions) 
Atenção: caso você já tenha um CDA instalado o mesmo será apagado para ser instalada a nova versão, 
estão é prudente que realize um backup do seu Pentaho BI Server. 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
47 
 
 
 
 
Duas barras de progresso apresentarão o andamento da instalação. 
 
Pronto uma mensagem de sucesso será emitida. 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
48 
 
 
 
Inicie seu servidor Pentaho agora com o CDA está Instalado. O mesmo pode ser usado para construção de 
Dashboards com CDF e CDE assim como utilizado para cache e consultas de projetos relacionados ao 
servidor Saiku. 
 
Instalando o C**Tools com o C**Tools Installer 
 
Faça o download do CTools Installer em alguma pasta de seu computador através do seguinte link: 
http://code.google.com/p/guictoolsinstaller/downloads/list. 
Certifique-se de que o pentaho não está sendo executado, após realizar o download abra a pasta e 
execute o arquivo GuiCtoolsInstaller.bat. 
http://code.google.com/p/guictoolsinstaller/downloads/list
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
49 
 
 
 
Para instalar o C** Tools é necessário apontar para a pasta BI Solutions e o tomcat onde o Pentaho está 
instalado. Clique em Find Pentaho Solutions e localize a pasta “\biserver-ce\pentaho-solutions”, clique em 
Find Tomcat e selecione a pasta “biserver-ce\tomcat” após configurar clique em Update. O C**Tools já 
deverá ser configurado. 
 
Instalação do Saiku 
 
Saiku Plugin 
 
Baixe o plug-in do Saiku no endereço abaixo: 
http://meteorite.bi/saiku/download 
Descompacte o arquivo saiku-plugin-2.5.zip. 
Copie a pasta saiku inteira para a pasta biserver-ce/pentaho-solutions/system. 
Após executar esses passos reinicie seu servidor Pentaho. 
 
Saiku Reporting 
 
http://meteorite.bi/saiku/download
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
50 
 
 
Pare seu servidor Pentaho BI Server (PUC e PAC). 
Com o CDA instalado agora faça o download do saiku-reporting-plugin-trunk-SNAPSHOT.zip e 
descompacte-o na pasta biserver-ce/pentaho-solutions/system/, será criado uma pasta com o nome saiku-
adhoc. 
Se você quer exportar as saídas do relatório para formato PRPTs do Saiku-Reporting, copie ou substitua o 
arquivo pentaho-reporting-engine-classic-extensions-cda-xxx.jar que está em /biserver-
ce/tomcat/webapps/pentaho/WEB-INF/lib pelo arquivo que pode ser encontrado em biserver-ce/pentaho-
solutions/system/saiku-adhoc/lib (pentaho-reporting-engine-classic-extensions-cda-saiku-SNAPSHOT.jar). 
Para colocar Saiku Report sob a ACL (Controle de Acesso) do Pentaho, adicionar a extensão .adhoc para a 
tag acl-files do arquivo pentaho.xml que pode ser encontrado na pasta biserver-ce/pentaho-
solutions/system. Edite o mesmo conforme modelo abaixo: 
... xaction,url,prpt,prpti,xdash,xcdf,adhoc... 
Reinicie ser servidor Pentaho 
Acesse seu PUC e terá mais um ícone no mesmo para o Saiku Report conforme imagem abaixo: 
 
 
Pronto pode utilizar o Saiku Reporting! Clique sobre o mesmo e explore os recursos para geração de 
relatórios, gere PDFs ou modelos em arquivos PRPT. 
 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
51 
 
 
 
 
Customização do Pentaho User Console 
 
Retirar Listagem de Usuários 
 
Por padrão, o Pentaho vem configurado para versão de demonstração, e quando abrimos sua tela de login 
aparecem os usuários em um Drop-down (versão 3.8 e anteriores), na versão superior a 4.0, ele aparece se 
você clicar em evaluation login. 
Para desativar a listagem de usuários, é necessário alterar o arquivo: pentaho.xml, onde está true, mudar 
para false. 
Arquivo: \pentaho\biserver-ce\pentaho-solutions\system\pentaho.xml 
Trecho de código: 
 <login-show-users-list>true</login-show-users-list> 
 <login-show-sample-users-hint>true</login-show-sample-users-hint> 
Antes: 
 
Módulo 
Laboratório de Open Source Business Intelligence 
 
 
 
 
 
52 
 
 
 
Depois: 
 
 
Adicionar o Saiku na Tela de Login 
 
Para adicionar o Saiku na tela de login

Outros materiais