Baixe o app para aproveitar ainda mais
Prévia do material em texto
CONCEITOS E TÉCNICAS EM INTELIGÊNCIA DE NEGÓCIOS Prof. Sérgio Luiz de Oliveira Assis 1 1. O AMBIENTE DA INTELIGÊNCIA DE NEGÓCIOS O Gartner Group define Inteligência de Negócios como sendo “o conjunto de conceitos, métodos e recursos tecnológicos que habilitam a obtenção, armazenamento e distribuição de informações geradas a partir de dados operacionais, históricos e externos visando proporcionar subsídios para a tomada de decisões gerenciais e estratégicas”. Interpretando-se esta definição pode-se afirmar que a inteligência de negócios visa dotar a empresa de competência informacional coletiva, baseada no entendimento, consolidação e disponibilização de informações voltadas à melhoria dos processos decisórios da organização. Mas por que esta disciplina assumiu tanta relevância no planejamento estratégico e tático das empresas modernas? Isto decorre do fato que as organizações atualmente enfrentam um ambiente extremamente competitivo. Como resposta a estas pressões competitivas, seus gestores precisam adequar seus modelos de decisão e de acompanhamento das ações gerenciais de forma a se concentrar no entendimento das motivações e do comportamento do mercado, no rastreamento das necessidades e percepções dos clientes, bem como na adaptação ágil e oportuna dos produtos e serviços oferecidos pela empresa. O paradigma atual tem como base a gestão orientada a resultados. Esta gestão e as tarefas estratégicas que a suportam requerem a análise de inúmeras informações relativas aos fatores críticos de sucesso do negócio e à utilização dos recursos da organização. Portanto, o estabelecimento de uma plataforma de informações confiáveis e disponíveis quando requeridas, figura hoje como tópico prioritário na agenda de praticamente todas as organizações. Esta plataforma informacional deve propiciar apoio aos gestores para a condução eficaz dos processos de negócio e para o acompanhamento das ações competitivas, fornecendo uma clara visão da posição interna e externa da organização, tendências e situações relevantes. A arquitetura de apoio à análise da informação pode ser construída com as mais diversas ferramentas em termos de equipamentos, ambientes e sistemas. Contudo, o aspecto fundamental não é a tecnologia propriamente dita, mas sim a eficácia e a rapidez com que a organização está capacitada a avaliar e rastrear as situações a partir das informações gerenciais disponíveis. A aplicação intensiva de tecnologia da informação é hoje um imperativo, pois a organização que não detém forte domínio dos aspectos estratégicos da tecnologia de informação não consegue sobreviver, a longo prazo, em um mercado cada vez mais dinâmico e competitivo. No entanto, a utilização da tecnologia da informação não garante, por si, o atendimento aos objetivos estratégicos da organização que resultem em sucesso e tragam lucratividade. A tecnologia é hoje um insumo universal, com poucas barreiras de acesso, que pode ser copiada, imitada ou adquirida dependendo do esforço e dos recursos de quem se dispõe a copiá-la. É a combinação inteligente e balanceada das diversas competências organizacionais – excelência nos processos produtivos, relacionamento dinâmico com clientes e fornecedores, motivação dos recursos humanos, alianças com parceiros, simplificação dos métodos gerenciais e disseminação rápida de conhecimentos – que enseja o desenrolar de estratégias competitivas duradouras e rentáveis. 2 Em um mercado cada vez mais ágil e interligado, torna-se difícil criar vantagens competitivas sustentáveis baseadas exclusivamente no volume produtivo ou no domínio exclusivo de determinada tecnologia. É necessário estender e complementar estes aspectos através de meios alternativos de atuação no mercado, bem como dotar de inteligência, flexibilidade e autonomia os processos gerenciais da organização. A inteligência de negócios suporta a gestão eficaz dos processos produtivos e gerenciais apoiando o planejamento estratégico e tático, em diversas dimensões. Permite a precisa identificação de oportunidades de negócios, acompanhando e interpretando o comportamento interno da empresa, do mercado e dos competidores. Esta forma de utilização da tecnologia visa alavancar a capacidade intelectual e não os recursos físicos da organização, permitindo que a empresa possa rastrear e reagir prontamente às demandas externas e rearranjar seus recursos e estratégias de forma ágil e dinâmica. Conduzir a esta simbiose formada por um sistema de informação capaz de interpretar e antecipar eventos e tendências, acoplado a um processo ágil e inteligente de gestão, é o objetivo final da inteligência de negócios, ou business intelligence – BI, fundação essencial para uma gestão eficaz orientada a resultados. 1.1 Sistemas Transacionais e Sistemas de Inteligência de Negócios É também importante registrar-se que os sistemas do ambiente analítico, ou seja aqueles utilizados nas aplicações de inteligência de negócios são intrinsecamente distintos dos que suportam as operações do dia a dia das organizações, os assim denominados “sistemas transacionais”. Os sistemas transacionais são geralmente desenvolvidos à luz da filosofia de controle das transações com clientes, fornecedores, funcionários e outros stakeholders e manipulam as transações e dados que se originam a partir dos diversos canais de comercialização, produção e distribuição da empresa. Registram e controlam os fatos e procedimentos relativos à operação das linhas de negócio tais como vendas, faturamento, logística, gestão de instalações físicas e de seus processos auxiliares (gestão de recursos humanos, apuração contábil, controle de custos, gestão tecnológica, entre outros). Os sistemas de inteligência de negócios buscam facilitar a exploração e análise das informações táticas e gerenciais da organização. Os dados e métricas elementares enviados para seu ambiente não devem ser alterados após terem absorvidos pelo mesmo, permanecendo indeléveis, para que possam ser utilizados em projeções e simulações de forma confiável e rastreável. Este ambiente, portanto, não gera eventos de negócio. No entanto, pode criar novas visões ou perspectivas gerenciais, através da transformação das variáveis nele armazenadas. O ambiente analítico uniformiza e padroniza a obtenção de informações, evitando que os gestores tenham que “varrer” diversos sistemas na busca de informações. A redução do esforço consumido na localização, obtenção e interpretação de informações adequadas é atualmente o maior desafio de muitas organizações. Quanto menor for o tempo for gasto na obtenção de informações relevantes, maior será o tempo que poderá ser destinado à análise de problemas e alternativas, fundamentais aos processos decisórios. 3 A seguinte tabela resume as principais características e diferenças entre estas duas categorias de sistemas de informação. Aspecto Sistemas Transacionais Sistemas de Inteligência de Negócios Objetivo Registro e controle de fatos e procedimentos relativos à operação e atividades produtivas da empresa e de seus processos auxiliares Exploração e análise de informações táticas e estratégicas da organização Modelagem Modelos de dados relacionais, baseados em entidades e relacionamentos que refletem as regras do negócio Modelos de dados dimensionais, baseados em fatos e dimensões,auxiliando os usuários a entender, otimizar e orientar suas atividades Transações Operações atômicas, pré definidas e repetitivas Consultas complexas para planejamento estratégico e tático Usuários Muitas pessoas executando repetida e concorrentemente as mesmas operações Poucas pessoas executando consultas planejadas e ad‐hoc Tempo de Resposta Transações curtas operando sobre poucos dados, consumindo poucos segundos Consultas longas operando em grande volume de dados, podendo consumir vários segundos e até minutos Redundância Modelos normalizados com mínima redundância de dados em uma aplicação Redundância planejada de dados para facilitar consultas e melhorar o desempenho Acesso Leitura e gravação na base de dados Dados somente para leitura, dispensando o controle de concorrência Demanda sobre servidores Estável Cíclica As características distintas entre os sistemas transacionais e aqueles do ambiente de inteligência de negócios tornam indesejável a convivência das duas modalidades na mesma plataforma computacional. As aplicações analíticas são geralmente implantadas em uma plataforma dedicada, de forma a evitar que as características de uma categoria causem impactos negativos na outra. Além disto, as diferenças acima apontadas deixam antever que também as metodologias aplicáveis ao desenvolvimento destas duas classes de sistemas se afastam de forma significativa. Tradicionalmente, os projetos de desenvolvimento de sistemas transacionais utilizavam-se de metodologias aderentes a seu ciclo de vida, em que cada etapa era executada em sequência, naquilo que se convencionou chamar-se de desenvolvimento em “cascata” – waterfall deployment. 4 Esta técnica mostrava-se adequada para sistemas isolados e voltados a equacionar problemas de uma comunidade usuária ou de uma linha de negócio. Embora muito aplicada para sistemas isolados, esta metodologia não contempla o planejamento estratégico, as intercorrências organizacionais, a visão de processos interdepartamentais e o conceito de liberação por versionamento. Para o ambiente analítico, voltado a sistemas dinâmicos de suporte á decisão, uma outra metáfora é necessária. A disponibilização de informações e das funcionalidades que lhe dão suporte devem ser liberadas em versões iterativas, onde cada implementação dá margem à necessidade de novos requisitos que serão contemplados em uma próxima versão do sistema. Além disto, são características do ambiente analítico: As aplicações de inteligência empresarial são mais motivadas por oportunidades de negócio do que por necessidades específicas; A visão é a estratégia corporativa e não as necessidades departamentais; Os requisitos de suporte à decisão originam-se de necessidades de informações estratégicas e não de requisitos funcionais; Os projetos de inteligência de negócios dão ênfase à análise das estratégias negociais e não à análise dos processos a serem suportados pelos sistemas a serem desenvolvidos; As aplicações de inteligência de negócios baseiam-se no desenvolvimento iterativo e no versionamento e não no conceito de big-bang – implantação em uma única fase; Como decorrência, a figura 1.1 representa o ciclo iterativo que prevalece no desenvolvimento das aplicações de inteligência de negócios comumente encontradas no ambiente analítico. 1.2 As dimensões do ambiente analítico Um projeto de inteligência de negócios apresenta três trilhas ou dimensões a serem consideradas em seu desenvolvimento, a saber: Trilha de gestão, que é focada na identificação das premissas estratégicas e nas questões críticas do negócio; FIGURA 1.1 CICLO ITERATIVO DE DESENVOLVIMENTO 5 Trilha da Informação, relacionada com a modelagem das regras de negócio e identificação de métricas e indicadores a serem utilizados pelos gestores como suporte a seus processos decisórios; Trilha tecnológica, preocupada com os requisitos do ambiente de software a ser adotado, bem como com o desenvolvimento do sistema de informações e da infraestrutura que deve apoiar estar disponível para a implementação da solução. Por estas trilhas fluem as atividades que conduzem à liberação do sistema quais sejam o planejamento do projeto, sua construção e implantação e à alavancagem decorrente de sua plena utilização pelos gestores, conforme representado na ilustração da figura 1.2. 1.3 Fases de um projeto de inteligência de negócios Uma vez entendidas as diferenças entre o desenvolvimento de um sistema transacional e uma aplicação para o ambiente de inteligência de negócios, é possível identificar quais as melhores práticas que devem orientar a conceituação e construção dos sistemas de informações a serem utilizados neste ambiente. Estas melhores práticas resultam em uma metodologia integrada por 9 fases coerentes com as três dimensões apresentadas na página anterior, e que estão resumidamente descritas a seguir. Fases integrantes da Trilha de Gestão Fase I – Planejamento estratégico da aplicação ou do ambiente analítico Este planejamento contempla o entendimento das características da organização para a qual o sistema será concebido, bem como com a definição inequívoca da proposta de valor para o negócio decorrente dos investimentos previstos no desenvolvimento, implementação e suporte de solução específica ou global que se pretende implementar. O conhecimento da organização analisa diversas dimensões tais como o mercado em que a empresa atua, a forma pela qual a mesma adiciona valor a este mercado através da oferta de seus produtos e serviços e os fatores determinantes para o sucesso desta atuação. Já a análise da proposta de valor para o negócio preocupa-se em garantir que os objetivos da aplicação de inteligência de negócios estejam alinhados com os objetivos estratégicos da organização, que os custos a serem incorridos sejam justificados pelos benefícios esperados e que os riscos inerentes ao projeto sejam identificados e avaliados. 6 Resumindo, o planejamento estratégico para o ambiente analítico deve garantir que os esforços a serem empreendidos tenham o claro objetivo de solucionar um problema ligado à estratégia do negócio ou à obtenção de vantagens competitivas a partir de uma oportunidade de mercado. Fase II – Planejamento tático O planejamento tático tem como objetivo garantir que as condições necessárias e suficientes para a execução do projeto de inteligência de negócios estejam presentes nos momentos em que forem demandadas. Assim são necessários um escopo do projeto que seja gerenciável e claramente estabelecido, a formulação da estrutura interna do projeto com seus integrantes e responsabilidades, a identificação das atividades a serem executadas e seu cronograma, e finalmente a avaliação da infraestrutura disponível, em seus aspectos técnicos e não técnicos É comum encontrar-se situações na prática em que as tarefas do planejamento tático não são executadas ou o são de maneira superficial e incompleta. Nestes casos, pode-se afirmar que um dos fatores críticos de sucesso para o projeto está sendo desconsiderado, e que este afastamento de práticas adequadas poderá ter consequências desfavoráveis para que sejam alcançados os resultados desejados.As técnicas de gerenciamento de projetos, derivadas dos processos definidos pelo Project Management Institute – PMI fornecem as diretrizes a serem seguidas para que este planejamento seja executado de forma adequada. Fase III – Obtenção dos requisitos de informação De uma forma geral, os requisitos permitem a definição das características do sistema para atender às necessidades de seus usuários e stakeholders. Todos os projetos de desenvolvimento possuem requisitos que se constituem na base para a formulação de sua arquitetura e características técnicas, informacionais e funcionais. No caso dos projetos de inteligência de negócios, o foco é a resposta para algumas perguntas básicas que permeiam as necessidades dos executivos, denominadas questões críticas do negócio. A fase de determinação dos requisitos de informação compreende um conjunto de métodos e procedimentos que objetivam encontrar de forma sistematizada as respostas adequadas a estas perguntas, sempre tendo em vista o necessário alinhamento com os objetivos estratégicos da organização. Fases integrantes da Trilha Informacional Fase IV – Modelagem As necessidades de informação identificadas na etapa de obtenção dos requisitos são derivadas de diversas fontes e origens em que o critério é selecionar aquelas que podem contribuir para o processo decisório da organização, sem preocupação em classificá-las e organizá-las em classes de dados visando seu armazenamento e posterior recuperação. 7 Este último aspecto é objeto de tratamento na etapa de modelagem, em que os dados são agrupados em entidades e dimensões de análise sendo associados a atributos destas entidades, diretamente ou através de outros elementos que permitam sua obtenção com o auxílio de fórmulas. No ambiente analítico são usualmente empregadas duas técnicas distintas para esta modelagem, a modelagem relacional e a modelagem dimensional, sendo que esta última será abordada detalhadamente em um capítulo posterior deste livro. Fase V – Projeto físico das bases de dados Esta fase consiste na tradução do projeto lógico para o banco de dados, resultante da fase de modelagem, em uma estrutura física a ser adotada para o banco, com especial ênfase no desempenho. Entre outros, são aspectos a serem considerados a opção entre um sistema gerenciador relacional ou dimensional, as estratégias de indexação e agregação, e a política de limpeza periódica da base de dados. Nesta fase o projeto de inteligência de negócios é altamente dependente de disciplinas voltadas ao gerenciamento de bases de dados e que usualmente estão disponíveis no ambiente dos sistemas transacionais. Fase VI – Obtenção dos dados Os sistemas de inteligência de negócio não criam informações de moto próprio. Eles dependem fundamentalmente do acesso e captura das informações disponíveis internamente nos sistemas transacionais, coletadas e tratadas por usuários ou adquiridas externamente à organização. Esta captura é efetuada por um processo de obtenção de dados que possui técnicas e características próprias e que também serão discutidas em capítulo específico para tal fim. Fase VII – Definição e construção da camada de exploração Nos sistemas de inteligência de negócios, a exploração das informações é acionada por artefatos específicos, que atuam sobre os dados disponíveis acessando, manuseando e apresentando as mesmas aos administradores envolvidos nos processos de tomada de decisão. Estes artefatos são característicos daquilo que se convencionou denominar “camada de exploração ou visualização” do ambiente analítico. Esta camada permite a consulta aos dados, a formatação de relatórios e o disparo programado de alertas ou mensagens, de acordo com determinados parâmetros ou limites. Cada ferramenta de exploração possui sua forma peculiar de acessar e manusear os dados existentes para que o administrador possa visualizá-los, de acordo com as suas necessidades bem como montar consultas específicas, conforme as suas habilidades e nível de autorização de acesso aos dados. 8 Fases integrantes da Trilha Tecnológica Fase VIII– Arquitetura do ambiente O ambiente utilizado para hospedagem das aplicações de inteligência de negócios é integrado por diversos componentes, alguns provenientes dos sistemas transacionais, outros específicos para suas aplicações. Em linhas gerais estes componentes abrangem a plataforma de processamento, o software básico para gestão desta plataforma e o software de apoio, do qual o principal integrante é o sistema gerenciador de base de dados, em suas diversas modalidades – relacional ou dimensional. Como será discutido mais adiante, as características específicas do ambiente analítico fazem com que o mesmo seja usualmente segregado daquele em que são processados os sistemas transacionais. É também possível que esta arquitetura utilize recursos e software de terceiros localizados na “nuvem”, naquilo que está sendo denominado na literatura como “Cloud BI”. Fase IX – Ferramentas Além dos gerenciadores de bancos de dados, o ambiente analítico utiliza-se principalmente de sistemas para transformação e carga de dados, designados genericamente como ETL – Extraction, Transformation & Load, e de artefatos para visualização e divulgação de dados. Outra ferramenta de destaque consiste nos sistemas gerenciadores de metadados. Observe-se que diversos artefatos para ETL e para exploração possuem capacidade de gerenciar metadados o que, em vez de ser uma solução pode gerar um problema, devido à frequente incompatibilidade entre os mesmos e considerando que devem residir em um único ambiente. Além dos artefatos de exploração acima mencionados, o ambiente analítico pode ser integrado por técnicas analíticas com objetivos específicos – clusterização, mineração de dados, análises estatísticas, entre outras estão com frequência presentes na trilha tecnológica das aplicações de inteligência de negócios. Esta integração torna-se ainda mais relevante com o advento da necessidade de captura e tratamento de grandes volumes de dados – big data. As fases sumarizadas nos parágrafos anteriores devem ser complementadas por duas disciplinas de fundamental importância para que o sistema a ser desenvolvido atinja a plenitude de seus objetivos – uma camada consistente de metadados e uma disciplina de gerenciamento de projetos, aderente às práticas do PmBok® do Project Management Institute. O conjunto destas fases, destas disciplinas complementares e do resultado desejado, qual seja a implementação do sistema, estão ilustrados na figura 1.3 apresentada a seguir. 9 Observe-se que o objetivo da figura é fornecer uma visão didática do conjunto das fases e não estabelecer precedências rígidas entre as mesmas, já que a ordem de execução poderá variar de projeto a projeto. Como exemplo desta ressalva, pode-se citar a utilização das práticas do PmBok®, que devem ocorrer durante todo o ciclo de vida do projeto. . 1.4 Dois conceitos básicos – data warehouses e data marts Os estudiosos dos sistemas de inteligência de negócios passam obrigatoriamente pelos trabalhos de dois pioneiros desta área – Bill Inmon e Ralph Kimball, autores de um vasto acervo de obras que serviram de base para o desenvolvimento de conceitos e metodologias hoje amplamenteutilizadas no ambiente analítico. Destes conceitos, dois são fundamentais – o data warehouse e o data mart. Segundo Inmon, o data warehouse é um repositório de dados integrado, não volátil e variante no tempo para armazenamento de dados destinados ao suporte às decisões gerenciais e estratégicas da organização. Esta definição implica que além de ser destinado ao suporte a decisões gerenciais, este repositório difere dos demais por ser qualificado através de três características básicas – ser integrado, não volátil e variante no tempo. Integrado, já que objetiva armazenar, em uma única estrutura de dados, todas as informações referentes aos processos negociais sendo eles provenientes de diferentes áreas de uma organização – vendas e marketing, logística, produção, finanças, recursos humanos, entre outras. O data warehouse é integrado desde o inicio e construído, ou ao menos planejado, de uma só vez. Não volátil por que seu conteúdo é carregado periodicamente não sendo atualizado em tempo real como nos sistemas do ambiente transacional. As cargas são planejadas e ocorrem com frequência determinada pelas necessidades dos processos decisórios que se destinam a suportar – com ciclo horário, diário, semanal, quinzenal, mensal e até em “tempo quase real”, ou aquele que melhor se adeque à volatilidade das informações que devem ser veiculadas. FIGURA 1.3 FASES DE UM PROJETO DE INTELIGÊNCIA DE NEGÓCIOS 10 Variante no tempo por que, diferentemente dos sistemas transacionais, está preocupado em permitir a análise dos dados históricos e de sua evolução ao longo do tempo. Assim, ainda de acordo com Inmon1, o data warehouse apresenta as seguintes características: Deve ser o repositório dos dados corporativos de uma organização; Suas informações são consistentes entre si e possuem um significado uniforme reconhecido pela comunidade usuária; É a base adequada para suporte aos processos decisórios. Já o data mart, conforme conceituado por Kimball2, é uma coleção de dados referentes a assuntos organizados para suportar as decisões de um segmento da organização. A visão convencional de um data mart é a de uma fonte de dados focada e mais facilmente consultável, destinada à geração de relatórios e consultas ad-hoc de informações atuais e históricas, visando suportar os processos de tomada de decisão de uma área específica do negócio. Aqueles que se derem ao cuidado de consultar os trabalhos de Inmon e Kimball vão perceber que, em sua origem, as posições destes dois autores diferiam. De forma simplista, para Kimball a construção do data warehouse seria desnecessária já que o conjunto dos data marts – por ele denominado supermart – desempenharia o papel de data warehouse na organização. Já para Inmon a estruturação do data warehouse deveria constituir-se no primeiro passo na implantação dos sistemas de inteligência de negócios. Em realidade, com a evolução do emprego dos sistemas de inteligência de negócios nas organizações, estas duas linhas convergiram para metodologias em que são aproveitados os pontos fortes das duas abordagens acima mencionadas. 1.5 A infraestrutura para o ambiente analítico Uma vez identificados dois dos pilares que caracterizam o ambiente analítico – data warehouse e data marts, é possível apresentar a estrutura que se constitui em uma “melhor prática” para a estruturação deste ambiente. Esta estrutura é integrada por diversos componentes, a saber: As fontes de dados; Os mecanismos de obtenção de dados; A área de depuração – staging área A transformação dos dados O armazenamento corporativo dos dados – data warehouse; Os mecanismos de distribuição de dados; O armazenamento de dados setoriais – data marts; Os artefatos para exploração dos dados pelos usuários visando obter o produto final do processo – a informação. 1 Building the data warehouse – Bill Inmon - Wiley 2 The data warehouse toolkit – Ralph Kimball - Wiley 11 As fontes de dados Conforme já mencionado, os dados que se constituem na matéria prima para os sistemas de inteligência de negócios são provenientes sistemas transacionais internos, de artefatos preparados para captura de informações especiais junto a usuários ou de fontes externas. Os sistemas transacionais são usualmente a principal fonte para captura destas informações, já que os procedimentos operacionais da empresa são por eles suportados. Muitas vezes a organização dispõe sistemas integrados de gestão – ERP’s que, em suas bases de dados armazenam informações e transações. Sistemas que complementam ERP’s tais como CRM’s – Customer Relationship Management, SCM – Supply Chain Management, entre outros, também podem se constituir em provedores de informações para o ambiente analítico. Em outros casos, a organização dispõe de sistemas desenvolvidos internamente com objetivos específicos ou então possui sistemas que suprem a ausência de soluções mais integradas como são os ERP’s. Neste caso, os dados desejados podem ser extraídos destes sistemas. É também viável a construção de artefatos específicos destinados à alimentação de dados disponíveis na organização, mas que são possuem tratamento informatizado, sendo que neste caso esta alimentação é feita diretamente pelos usuários. No extremo, dados podem ser capturados de planilhas eletrônicas e arquivos de sistemas pessoais, alternativa esta que padece do fato de estar sob completo controle de seus usuários ou desenvolvedores que podem alterar sua estrutura ou conteúdo prejudicando sua integridade e confiabilidade, sem controle dos gestores de informação. Provedores externos de informação podem também disponibilizar dados a serem incorporados ao ambiente analítico – são exemplos cotações de bolsas, índices econômico financeiros, dados demográficos e informações veiculadas por institutos de pesquisa, entre outros. Finalmente a Internet tem se mostrado profícua para a captura de transações e click streams que podem ter valor estratégico para a organização. A obtenção de dados Uma vez identificadas as fontes de dados, o próximo componente contempla a captura destes dados que sejam relevantes aos processos decisórios da empresa, departamento ou usuário específico. Este componente é denominado de ETL, acrônimo de Extration, Transformation and Load, sendo a fase de captura representada pelo “E” (extração) do ETL e dispondo de capacidade de acessar múltiplas origens de dados, seguindo a regras predefinidas a partir das características do negócio. A depuração dos dados obtidos Uma vez capturados os dados, o componente seguinte consiste na área de depuração – staging área, na qual os dados são inicialmente armazenados. 12 É uma área de trabalho, temporária e descartável, utilizada para guardar os dados que serão submetidos à limpeza e transformações visando garantir a qualidade dos dados que serão, futuramente, incorporados ao data warehouse. A transformação dos dados O componente seguinte é responsável pela aplicação sistemática de regras de negócio, visando a integração, consolidação, padronização e uniformização dos dados obtidos de fontes distintas, muitas vezes internas e externas. É o “T” do ETL, sendo o elemento final de garantia da qualidade das informações que serão alimentadas no data warehouse. O data warehouse É onde são guardadasas informações históricas, detalhadas, consolidadas e coerentes oriundas do componente de transformação de dados, sendo o repositório dos dados corporativos de uma organização. Tem como objetivos garantir a segurança no armazenamento e no acesso às informações, que por sua natureza são consistentes entre si e possuem um significado uniforme reconhecido pela comunidade usuária. Por estas características, o data warehouse é a base adequada a partir da qual serão construídos os meios para suporte aos processos decisórios. A distribuição dos dados Este componente é responsável por distribuir as informações, já tratadas e armazenadas no data warehouse para que as mesmas possam vir a ser disponibilizadas aos usuários finais. Transporta as informações aos locais específicos nos quais as mesmas serão consumidas pelos usuários que tenham as mesmas como seu foco de interesse, segundo regras que definem suas necessidades. É o “L” do ETL, primeira letra da palavra “Load”, termo inglês para a palavra carga. Devido a este fato, em algumas ocasiões a sigla ETL é substituída por ETC. Os data marts São os locais onde os executivos e usuários obtém as informações específicas voltadas ao suporte de seus processos decisórios. Usualmente existem vários data marts, cada um visando atender a diferentes comunidades de usuários que apresentem interesses distintos na busca de informações. A exploração dos dados É constituída pelos artefatos e processos pelos quais os usuários obtém as informações para atender às suas necessidades de negócio. Envolve diversas formas e ferramentas, combinadas para atender a requisitos específicos de cada interessado. 13 O produto final Estes componentes atuando de forma harmônica resultam no produto final do ambiente analítico – a informação, conforme solicitada pelo usuário, no formato desejado, no momento certo de forma a provê-lo dos recursos necessários para desempenhar, de forma adequada, suas funções no processo decisório. A figura 1.4 contém uma metáfora gráfica para estes diversos componentes. Sob a perspectiva tecnológica, estes componentes organizam-se em diversas formas, a saber: Fontes – Processadas a partir de sistemas transacionais nos servidores corporativos, de aplicações externas ou pessoais; Staging – Área transitória e descartável, residente em servidores do ambiente analítico; Data warehouse – Gerenciador de base de dados dedicado a aplicações de inteligência de negócios; Data marts – Outras instâncias do gerenciador dedicado, ou gerenciador específico no caso de ser utilizada a variante multidimensional; Camada de exploração – Estações de trabalho com acesso ao ambiente analítico, disponibilizadas para a comunidade usuária. Como resultado, o ambiente analítico em uma visão usual para a área da tecnologia da informação pode ser representado conforme a figura 1.5. FIGURA 1.4 COMPONENTES DO AMBIENTE ANALÍTICO 14 Em se tratando de um livro versando sobre inteligência de negócios e como o foco dos negócios reside nas organizações que os praticam, não é possível aplicar esta disciplina sem explorar as metodologias que possibilitem melhor entender os fatores determinantes para que uma empresa atinja suas metas e alcance seus objetivos. E estes fatores serão explorados no próximo capítulo – Entendendo as Organizações. FIGURA 1.5 PERSPECTIVA TECNOLÓGICA DO AMBIENTE ANALÍTICO
Compartilhar