Buscar

Data Warehouse e Data Mart

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 25 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 25 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 25 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Universidade Federal de Uberlândia - UFU 
Monte Carmelo 
Sistemas de Informação 
 
 
 
 
Data Warehouse e Data Mart 
 
 
 
 
 
 
 
 
Adelson Pacheco dos Reis 
Bruno Kamino Yamamoto 
Lucas Rodriguês da Cunha 
Raphael Araújo de Faria 
 
 
 
 
 
 
 
 
 
 
 
Monte Carmelo 
2012 
Adelson Pacheco dos Reis 
Bruno Kamino Yamamoto 
Lucas Rodriguês da Cunha 
Raphael Araújo de Faria 
 
 
 
 
Data Warehouse e Data Mart 
 
 
 
 
Monografia apresentada como exigência 
para obtenção do grau de Bacharelado 
em Sistemas de Informação da 
Universidade Federal de Uberlândia - 
UFU. 
Orientador: Daniel Duarte Abdala 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Monte Carmelo 
2012 
RESUMO 
 
 
 
Desde a década de 1960 ,quando surgíramos primeiros sistemas para auxilio no 
fluxo dos dados nas organizações, as dificuldades no armazenamento, 
gerenciamento e transformação desses dados em informações esteve presente 
como obstáculo em praticamente todas as empresas. De acordo com esse contexto, 
surge uma ferramenta eficiente para suporte à tomada de decisões organizacionais 
que é responsável em armazenar e analisar dados, os Data Warehouse. 
Incorporados a esses sistemas organizacionais, existem outros sistemas menores 
de nível departamental, chamados Data Marts. 
 
Palavras-chave: Data Warehouse, Data Mart, dados. 
SUMÁRIO 
 
 
1 JUSTIFICATIVA ....................................................................................................... 4 
2 INTRODUÇÃO ......................................................................................................... 5 
3 DEFINIÇÃO .............................................................................................................. 6 
3.1 O que é um Data Warehouse............................................................................. 6 
3.2 O que é um Data Mart ........................................................................................ 8 
4 HISTÓRIA ................................................................................................................ 9 
5 ARQUITETURA ...................................................................................................... 12 
5.1 Modelo Top-Down ............................................................................................ 12 
5.2 Modelo Bottom-up ............................................................................................ 12 
5.3 Modelo Híbrido ................................................................................................. 12 
5.4 Modelo Federado ............................................................................................. 13 
6 PROCESSO DE CRIAÇÃO DE DATA MART ........................................................ 14 
7 INFRAESTRUTURA DOS DATA WAREHOUSE ................................................... 15 
7.1 Ferramentas ..................................................................................................... 15 
7.1.1 OLAP ......................................................................................................... 16 
7.1.1.1 ROLAP - Relational On Line Analytical Processing ............................. 16 
7.1.1.2 MOLAP - Multidimensional On Line Analytical Processing .................. 16 
7.1.1.3 HOLAP - Hybrid On Line Analytical Processing .................................. 16 
7.1.2 Data Mining ................................................................................................ 17 
7.2 Modelagem Multidimensional ........................................................................... 17 
7.3 Metadados ....................................................................................................... 17 
8 SEGURANÇA ......................................................................................................... 18 
9 PROJETOS DE DATA WAREHOUSE ................................................................... 19 
10 CICLO DE VIDA DOS DATA WAREHOUSE ....................................................... 20 
11 EXEMPLOS DA UTILIZAÇÃO DOS DATA WAREHOUSE .................................. 21 
12 CONCLUSÃO ....................................................................................................... 22 
REFERÊNCIAS ......................................................................................................... 23 
 
4 
1 JUSTIFICATIVA 
Aplicações OLAP (On-line Analytical Processing ), são ferramentas a cada dia 
mais úteis no mundo dos negócios, e ,nada melhor para nós, que somos 
universitários e iniciantes no mundo de TI, do que desde inicio, ficar inteirados da 
vasta gama de áreas da computação, principalmente do ramo dos negócios , área a 
qual o curso de Sistemas de Informações tem grande relação. 
5 
2 INTRODUÇÃO 
Frente ao grande número de empresas e a grande concorrência no cenário 
mundial atual, qualquer erro na administração, uma informação errada, pode 
significar um grande prejuízo, e dependendo do erro, pode resultar na falência de tal 
empresa. Nesse contexto surge a Business Intelligence, que em súmula, seria o uso 
da tecnologia, aliada aos dados de uma empresa, resultando em gráficos, relatórios 
e informações úteis, que auxiliam gestores a tomar decisões difíceis da melhor 
maneira. 
Os Data Warehouse e Data Marts, são algumas das mais importantes e mais 
difundidas dessas ferramentas, que a cada dia se tornam mais comuns nas grandes 
empresas. Elas são responsáveis por analisar e comparar dados, revelando 
informações que antes passariam despercebidas (como por exemplo, a relação na 
venda de fraldas e de cervejas), mas que, se utilizadas corretamente, pode resultar 
no sucesso da empresa. 
 
6 
3 DEFINIÇÃO 
 
3.1 O que é um Data Warehouse 
As empresas modernas, seguindo o ritmo da globalização, têm investido em 
sistemas que as auxiliem, no processo de armazenamento, cruzamento de dados, 
análise, e obtenção de informação para sobressair funcionalmente em relação às 
suas concorrentes. E para isso, elas contam com o uso dos recursos de TI – 
sistemas de informação – em diversas aplicações. 
Esses sistemas muita das vezes rodam em um banco de dados transacional 
(sistema que contém informações detalhadas, que permite às empresas controlarem 
seus processos organizacionais). Mas sentiam carência de sistemas que 
suportassem e auxiliassem as áreas estratégicas e administrativas das 
organizações. Os chamados Data Warehouse foram concebidos com o propósito de 
atuar nessas áreas. 
Um Data Warehouse (armazém de dados), segundo W. H. Inmon é uma coleção 
de dados orientada por assuntos, integrada, variante no tempo e não volátil, que tem 
por objetivo dar suporte aos processos de tomada de decisão. 
As principais diferenças entre os bancos de dados transacionais e os Data 
Warehouse são vistas na tabela a seguir: 
 
Características Banco de Dados 
Tradicional 
Banco de Dados Suporte 
Decisão 
Objetivo Atividades cotidianas Análise de negócio 
Uso Operacional Informativo 
Processamento OLTP OLAP 
Unidade de 
trabalho 
Inclusão, alteração, 
exclusão 
Carga e consulta 
Usuários Operadores (Muitas 
pessoas) 
Gerência (poucas 
pessoas) 
7 
Dados Operacionais Analíticos 
Granularidade Detalhada (baixa) Detalhada e consolidada 
(alta) 
Redundância Não ocorre Pode ocorrer 
Manutenção Raramente Constantemente 
Estrutura Estática Variável 
Atualização Contínua Periódica 
Índices Poucos Muitos 
Função dos índices Localizar um registro Agilizar consultas 
 
Os DW são a solução para alguns problemas, como: 
• A falta de padrão dos dados: os DW têm a função de padronizar dados,já que 
cada área da empresa gera um tipo de dado, que precisa ser convertido para um 
formato único, evitando assim discrepâncias. Um a decisão tem que ser tomada com 
base em dados sólidos, concisos, que sejam confiáveis. 
• Facilitar o acesso a informações: em uma empresa, os dados são 
armazenados em vários locais, o que torna o seu acesso mais difícil. Nos DW, os 
dados são armazenados em um único lugar, ou separados por área, o que resulta 
em um acesso mais rápido e mais fácil. 
• Eliminar informações repetidas e desnecessárias: no momento da assimilação 
dos dados ao DW, o sistema executa uma limpeza em dados repetidos, 
desnecessários, os quais poderiam resultar em equívocos. 
 
Os DW ainda possuem quatro características marcantes: 
• Variável com o tempo; 
• Integrado; 
• Orientado por assunto; 
• Não volátil. 
 
8 
3.2 O que é um Data Mart 
Um Data Mart é necessariamente uma parte funcional do Data Warehouse, de 
escopo limitado, projetados de acordo com a necessidade de seus usuários e 
voltado para um departamento ou área especifica da empresa. 
Um DW é um sistema integrado, não volátil, utilizado no processo de tomada de 
decisões estratégicas em nível executivo e de gerência de uma organização. O Data 
Mart melhora esse processo, pois foca na gerência sumarizada, dados 
exemplificativos e não em dados históricos. 
No passado, os DM eram desenvolvidos de forma rígida e conseguiam responder 
a um número limitado de questões. Hoje, com o necessidade das empresas, esse 
método não é mais utilizado, agora eles estão mais flexíveis. 
 As principais diferenças entre Data Warehouse e Data Mart estão relacionadas 
na tabela abaixo: 
 
Data Warehouse Data Mart 
Corporativo Departamental 
Altamente granular Sumarizado e Agregado 
Dados Históricos Dados Recentes 
Grandes Volumes de Dados Volumes de Dados Limitados 
Versatilidade Especificidade 
 
 
 
9 
4 HISTÓRIA 
Para que se possa compreender melhor a utilização dos Data Warehouse, 
devemos voltar a década de 60, quando os computadores passaram a ser uma 
ferramenta essencial dentro de uma grande empresa. 
As configurações das maquinas daquela época, são hoje motivo de riso pela 
baixa capacidade de armazenamento e processamento. Eram capazes de executar 
apenas um programa de cada vez, mas para aquela época, isso era algo fantástico, 
que realizava o trabalho de vários funcionários. 
Os dados inicialmente eram armazenados em fitas magnéticas, que eram de 
baixo custo, mas de difícil acesso, que era feito de maneira seqüencial. Se fez 
necessário, uma nova forma de armazenar os dados. 
Na década de 70, surge uma nova forma de armazenar dados: armazenamento 
em disco. Paralelo a isso surge à idéia de “banco de dados”, um local onde se 
armazenaria todos os dados de uma empresa, para que depois eles fossem 
transformados em informações, que resultariam em alguma vantagem para a 
empresa frente a concorrência. 
Os anos seguintes foram de grande crescimento da área da computação. 
Computadores mais modernos, mais eficientes e consequentemente novos 
softwares. Inicialmente esses softwares foram suficientes para atender as 
necessidades das empresas nas transações, mas não ajudavam muito no apoio a 
decisões. Não que os sistemas não fossem capazes de cumprir tal tarefa, mas como 
essa não era a função principal deles, havia muitas falhas, como dados 
equivocados, dificuldade de lidar com grandes quantidades de dados. 
 Surgiram idéias a respeito de sistemas com a finalidade especifica de analisar 
dados, e, retornar informações úteis para as decisões que deveriam ser tomadas 
nas empresas. Os sistemas empresariais passaram a ser divididos em dois grupos: 
Sistemas operacionais (On-line Transaction Processing - OLTP): sistemas que 
dão suporte ao dia a dia do negócio da empresa, que mantém a empresa em 
funcionamento e são chamados de sistemas de produção; 
 Sistemas informacionais (On-line Analitycal Processing - OLAP): sistemas que 
dão suporte aos processos decisórios da empresa, que irão dar subsídios para as 
decisões estratégias da empresa e compreendem os SADs e os SIGs. 
10 
Ainda na década de 70, Bill Inmom começa a usar o termo Data Warehouse, um 
sistema separado do sistema operacional, o qual teria a função de armazenar todos 
os dados que eram gerados pelos sistemas operacionais da empresa. Nesse novo 
sistema, os dados não seriam alterados, mas armazenados com sua essência fiel e 
não poderiam ser modificados, apenas consultados. 
Essa tecnologia foi, e ainda é fundamental para o sucesso de grandes marcas, 
frente a um mundo globalizado de alta concorrência. 
Abaixo, segue uma estrutura com algumas datas do advento dos Data 
Warehouse. 
• 1960 - General Mills e Dartmouth College , em um projeto de pesquisa 
conjunta, desenvolver as dimensões termos e fatos. 
• 1970 - ACNielsen e IRI fornecer Data Marts dimensionais para as vendas no 
varejo. 
• 1970 - Bill Inmon começa a definir e discutir o termo: Data Warehouse 
• 1975 - Sperry Univac Introduzir MAPPER (manter, preparar e produzir 
relatórios executivos) é uma gestão de dados e sistema de comunicação que inclui 
4GL primeiros do mundo. Foi a primeira plataforma projetada especificamente para a 
construção de Centros de Informação (um precursor das atuais plataformas 
empresariais de Armazenamento de Dados) 
• 1983 - Teradata apresenta um sistema de gerenciamento de banco de dados 
projetado especificamente para apoio à decisão. 
• 1983 - Sperry Corporation Martyn Richard Jones define a abordagem Sperry 
Information Center, que embora não sendo um DW verdade no sentido Inmon, que 
contém muitas das características das estruturas de DW e processo, tal como 
definido anteriormente por Inmon, e mais tarde por Devlin. Usado pela primeira vez 
na Inglaterra e País de Gales TSB 
• 1984 - Sistemas de Computação Metáfora, fundada por David Liddle e 
Massaro Don, lançamentos Sistema de Interpretação de Dados (DIS). DIS era um 
pacote de hardware / software e interface gráfica para usuários de negócios para 
criar um sistema de gerenciamento de banco de dados e analítica. 
• 1988 - Barry Devlin e Paul Murphy publicar o artigo Uma arquitetura para um 
negócio e sistema de informação no IBM Systems Journal, onde introduzem o termo 
"business warehouse". 
• 1990 - Sistemas Red Brick, fundada por Ralph Kimball , introduz Red 
11 
armazém de tijolo, um sistema de gerenciamento de banco de dados 
especificamente para armazenamento de dados. 
• 1991 - Soluções de prisma, fundada por Bill Inmon , introduz Prism 
Warehouse Manager, software para o desenvolvimento de um data warehouse. 
• 1992 - Bill Inmon publica o livro Construindo o Data Warehouse. 
• 1995 - O Data Warehousing Institute, uma organização sem fins lucrativos 
que promove o armazenamento de dados, é fundada. 
• 1996 - Ralph Kimball publica o livro The Data Warehouse Toolkit. 
• 2000 - Daniel Linstedt libera o cofre de dados, permitindo em tempo real 
auditável, acesso aos Data warehouse . 
 
12 
5 ARQUITETURA 
Os sistemas OLTP, no geral são feitos seguindo uma base, um molde único, é 
usado em vários sistemas. Um DW é feito de maneira diferente, onde cada um é 
feito de acordo com as necessidades da empresa. 
Embora cada armazém seja feita de uma maneira, existe alguns moldes que são 
os mais utilizados. Tais como, Top-Down, Bottom-up, Híbrido e Federado. 
 
5.1 Modelo Top-Down 
Modelo proposto por Inmon, o qual se baseia em uma única máquina que possui 
um sistema paralelo ao sistema transacional, onde todos os dados que circulam na 
empresa são armazenados. Tem como prós, a maximização do processamentoe 
busca de dados. Como contras, podemos citar o alto investimento em uma máquina 
com grande capacidade de armazenamento e processamento. 
5.2 Modelo Bottom-up 
Modelo proposto por Kimball, que consiste em vários Data Marts, espalhados por 
áreas chave da empresa (cada um referente à apenas sua área), e conectados a um 
servidor Data Warehouse, ou considera-se como Data Warehouse a união de todos 
os Data Marts. 
5.3 Modelo Híbrido 
Um modelo que consiste em uma mistura dos dois citados anteriormente. Iniciada 
por Hackney, esse modelo tende a aproveitar os prós de ambos os modelos 
anteriores: a rapidez do Top-down e a praticidade oferecida pelo modelo Bottom-up. 
13 
5.4 Modelo Federado 
O modelo Federado propõe a divisão do Data Warehouse por níveis. Podemos 
colocar em um nível, dados de uma determinada área da empresa, como por 
exemplo, vendas, em outro, compras, e utilizar um software que faz a conversão de 
um armazém para o outro, quando for necessária a análise de todos os dados. 
14 
6 PROCESSO DE CRIAÇÃO DE DATA MART 
As fases de criação e atualização de um Data Warehouse são: 
I. Extração; 
II. Transformação; 
III. Leitura de dados. 
A quantidade de sistemas transacionais implicados, suas estruturas de dados, e 
quantidade de documentação impactam diretamente no tamanho do Data Mart. 
Também influenciam no tamanho do Data Marts, as regras de negócio dos sistemas 
transacionais e sua forma de extração. 
Em I, é feita a extração, leitura e compreensão dos dados. Esses dados são 
copiados para uma staging area para serem utilizados posteriormente. Os dados 
armazenados em sistemas diferentes quase não se relacionam, pois as aplicações 
dos sistemas que os contém não são integradas. A integração desses sistemas é a 
parte mais difícil da construção de um Data Warehouse. 
Na fase II é implantada a mudança na estrutura do armazenamento dos dados e 
ocorrem alterações como filtragem de dados (verificação de similaridade de dados, 
erros de digitação, implementação de formatos padrão). Nesta fase também esta 
presente a desnormalização e renormalização (que basicamente é separação de 
dados por normas), combinação e auditoria, que contribuem também no tamanho do 
Data Mart. A fase III é a utilização real do Sistema, é nesse momento que os dados 
são inseridos, atualizados ou implementados. Alterações na fonte dos dados 
refletem diretamente na leitura final. A leitura final dos dados é a última parte da fase 
III e é nessa parte que os dados são cuidadosamente analisados e com base neles, 
são implantadas as soluções de negócio da empresa. 
 
15 
7 INFRAESTRUTURA DOS DATA WAREHOUSE 
A infraestrutura dos Data Warehouse está restritamente relacionada com a sua 
arquitetura e deve suportar um aumento dos dados, consultas complexas e não 
previstas, várias integrações e tecnologias distintas. São componentes da 
infraestrutura: Treinamento de pessoal, Hardware e Software. 
Suas ferramentas, talvez, sejam as que merecem menos atenção. A grande 
preocupação é com a integração com diversas plataformas, organização dos dados 
e disponibilização de informações. Para isso devem-se considerar algumas 
características, tais como: 
• O sistema deve facilitar a migração dos dados de uma plataforma para outra, 
pois com o passar do tempo, e por questões de custo, pode ser viável trocá-la; 
• Deve ser uma combinação da integração de bancos de dados relacionais e 
fornecedores diferentes; 
• Sua estrutura deve ser capaz de armazenar, processar e analisar enormes 
quantidades de dados, por causa do aumento exponencial com o tempo; 
• Deve suportar consultas imprevistas e dar respostas rápidas. Para isso, 
conta-se com as ferramentas OLAP – responsáveis em gerenciar dados – que 
auxiliam no trabalho de associação e visualização das informações; 
• Treinamento de equipe em tecnologia Data Warehouse e habilidade na 
administração de banco de dados; 
• Instalação, configuração e manutenção de uma infra-estrutura de rede e 
comunicação. 
 Como se pode perceber uma boa escolha da infraestrutura para um Data 
Warehouse é um passo importante para seu sucesso. 
 
7.1 Ferramentas 
Para realizar a analise dos dados e obter as informações desejadas, é necessária 
a utilização de ferramentas que irão disponibilizar os relatórios de forma dinâmica e 
fornece os tratamentos de analises. 
16 
Essas ferramentas podem ser: OLAP, Data Mining ou Metadados. 
 
7.1.1 OLAP 
A tecnologia OLAP, como já descrita anteriormente, consiste em uma ferramenta 
de suporte a decisões. Classifica-se em ROLAP, DOLAP, MOLAP. 
7.1.1.1 ROLAP - Relational On Line Analytical Processing 
São um conjunto de interface para o usuário e aplicações que dão aos SGBDs 
relacionais uma aparência de dimensional. 
São um conjunto de ferramentas que enviam solicitações diretamente no servidor 
de banco de dados, garantindo um melhor desempenho 
7.1.1.2 MOLAP - Multidimensional On Line Analytical Processing 
São um conjunto de ferramentas que enviam solicitações diretamente no servidor 
de banco de dados, garantindo um melhor desempenho. 
7.1.1.3 HOLAP - Hybrid On Line Analytical Processing 
É uma mesclar do Rolap e do Molap. Utiliza-se o melhor de cada uma dessas 
ferramentas, ou seja, a escalabilidade do Molap e o desempenho do Rolap. 
 
17 
7.1.2 Data Mining 
Ferramenta criada para o explorar um banco de dados a fim de encontrar 
padrões consistentes entre dados. 
7.2 Modelagem Multidimensional 
Através de uma modelagem multidimensional, consegue-se realizar pesquisas 
em mais de uma dimensão e facilita para um melhor entendimento das informações 
da base de dados. 
7.3 Metadados 
Os metadados são basicamente dados que facilitam o entendimento de outros 
dados, ou seja, resumos de informativos de uma fonte ou conteúdo. É muito utilizado 
na Web Semântica, podendo ser aproveitado como método de pesquisa. A 
importância dos metadados nessa área é a facilidade na recuperação de dados de 
documentos catalogados. Para isso, deve existir uma ficha que contenha 
informações referentes ao assunto que se queria recuperar, chamada ficha de 
catálogos. Por exemplo, nome, diretor e atores principais em relação a um filme. 
18 
8 SEGURANÇA 
O DW é projetado para se ter uma maior segurança nos dados, não só nas 
analises, mas também para que eles não se percam. Para que isso aconteça, 
existem alguns passos propostos por Inmom, para que se tenha um bom nível de 
segurança, e evitar problemas. 
1) Análise de Dados: Elaborar o modelo de dados para o DW; 
2) Dimensionamento: Estimar o volume de dados do DW; 
3) Avaliação Técnica: Definição das configurações técnicas; 
4)Preparação do Ambiente Técnico: Identificar, tecnicamente, como a 
configuração definida será acomodada; 
5) Análise das áreas de Interesse: Seleção da área de negócio para ser povoada; 
6) Projeto do DW: Projeto físico do banco de dados; 
7) Análise do Sistema Fonte: Identificar, nos sistemas existentes, a fonte de 
dados para o DW, e efetuar um mapeamento entre eles; 
8) Especificações: Definir em especificações de programas de rotinas para carga 
dos dados; 
9) Programação: Codificação das especificações para as rotinas de carga; 
10) Povoamento: Execução das rotinas de carga do DW. 
 
19 
9 PROJETOS DE DATA WAREHOUSE 
Os Data Warehouse de sucesso não possuem etapas de desenvolvimento, pois 
devem ser projetados de acordo com as necessidades das empresas. 
Muitas organizações utilizam-se dos métodos de criação de um sistema que 
abrange um departamento com carência no fluxo de dados – Data Mart – para que 
aos poucos, o sistema seja implantado por completo em todos seus setores.Outras criam protótipos de pequenas amostras do sistema e disponibilizam 
alguns funcionários para fazer testes, quando o projeto do Data Warehouse chega 
em um nível de boa aceitação e realizando todas as atividades designadas, ele é 
implementado. 
Segundo Inmon, é um erro criar métodos de projeto e concepção de Data 
Warehouse, pois só é possível saber todos os requisitos necessários a ele, quando o 
mesmo estiver em uso. 
Outra preocupação que se deve ter no projeto é a adequação ao sistema OLTP. 
A modelagem deve ser feita de forma que não haja redundância de dados e que as 
transições que causam mudanças no estado do banco de dados sejam feitas no 
menor tempo possível. Com isso, as metodologias do projeto devem ser divididas 
em várias tabelas, o que torna bem complexo a consulta do usuário final. Dada essa 
complexidade não é viável a utilização desse processo. 
No mercado, ainda não é encontrado um método funcional de criação de Data 
Warehouse. De toda maneira, seu procedimento de criação ainda pende ao 
ambiente escolhido. 
 
20 
10 CICLO DE VIDA DOS DATA WAREHOUSE 
O ciclo de vida começa com um diálogo para determinar o plano de projetos e as 
necessidades de negócios. 
Quando o plano e as necessidades são alinhados, o projeto e a implementação 
podem prosseguir. 
Após a fase de implementação e manutenção para detectar mudanças nos 
requisitos, caso seja necessário fazer ajustes, retornamos para a fase inicial. 
 
21 
11 EXEMPLOS DA UTILIZAÇÃO DOS DATA WAREHOUSE 
Abaixo, encontra-se listados alguns exemplos da utilização de DW em empresas, 
onde elas obtiveram grande êxito: 
• Uma grande rede de varejo americana, encontrou em seu gigantesco armazém 
de dados que a venda de fraudas estava relaciona a venda de cerveja. Em geral, os 
compradores eram homens, que saíam à noite para comprar fraldas e aproveitavam 
para levar algumas latinhas para casa. Os produtos foram postos lado a lado. 
Resultado: a venda de fraldas e cervejas disparou. 
• O banco Itaú, pioneiro no uso de data warehouse no Brasil, costumava enviar 
mais de 1 milhão de malas diretas, para todos os correntistas. No máximo 2% deles 
respondiam às promoções. Hoje, o banco tem armazenada toda a movimentação 
financeira de seus 3 milhões de clientes nos últimos 18 meses. A análise desses 
dados permite que cartas sejam enviadas apenas a quem tem maior chance de 
responder. A taxa de retorno subiu para 30%. A conta do correio foi reduzida a um 
quinto. 
• A Sprint, um dos líderes no mercado americano de telefonia de longa distância, 
desenvolveu, com base no seu armazém de dados, um método capaz de prever com 
61% de segurança se um consumidor trocaria de companhia telefônica dentro de um 
período de dois meses. Com um marketing agressivo, conseguiu evitar a deserção 
de 120 000 clientes e uma perda de 35 milhões de dólares em faturamento. 
• O governo de Massachusetts, nos Estados Unidos, compilava informações 
financeiras imprimindo telas e mais telas de terminais dos computadores de grande 
porte. Era preciso seis pessoas só para reunir os relatórios necessários ao 
orçamento anual. Com o armazém de dados, informações atualizadas estão 
disponíveis on-line para 1 300 usuários. Só em papel, economizam-se 250 000 
dólares por ano. Em 1995, pela primeira vez em dez anos, o orçamento estadual foi 
assinado antes do início do ano fiscal. 
• O Brasil quer a mesma agilidade. O Serpro, órgão responsável pelo 
processamento dos dados do governo federal, já investiu 2 milhões no seu projeto 
de data warehouse, desenvolvido com a Oracle. Só consolidou 5% de suas 
informações, mas já é possível fazer em cinco minutos cruzamentos de dados que 
antes demandavam quinze dias de trabalho.
22 
12 CONCLUSÃO 
 
Neste trabalho foram abordados os temas Data Warehouse, Data Mart. 
As organizações atuais estão sempre procurando vantagens competitivas. E a 
solução para estar na frente no mundo dos negócios é informação. 
Por isso, as organizações se vêem com a necessidade de organizar e utilizar 
bem os dados coletados. Mas como fazer isso em meio a uma montanha de dados? 
Como resposta surgiu os Data Warehouse. Uma ferramenta alternativa que auxilia a 
busca de informações. 
 
23 
REFERÊNCIAS 
 
INMON, William H. The Data Warehouse Budget. 
 
Junior, Arnaldo dos Santos Colinski. Business Intelligence – Sistema de Apoio 
Gerencial Data Warehouse. São Paulo: UNIP, 2009. 
 
Teorey, Toby; Lightstone, Sam; Nadeau, Tom. Projeto e Modelagem de Bancos de 
Dados. Tradução da Quarta Edição. 2ª Tiragem. Editora Campus/ Elsevier. 2007. 
 
Mussi, Camilo. Data Warehouse – Da modelagem a Implantação. 
 
Data Warehouse from Wikipedia. Disponível em: 
<http://en.wikipedia.org/wiki/Data_warehouse>. 
Acesso em: 21/06/2012. 
 
Amaral, Glenda Carla Moura. Aquaware: Um Ambiente de Suporte á Qualidade de 
Dados em Data Warehouse. Disponível em: 
<http://teses2.ufrj.br/Teses/NCE_M/GlendaCarlaMouraAmaral.pdf>. 
Acesso em: 25/06/2012. 
 
KIMBALL, R., ROSS, M. Data warehouse toolkit: o guia completo para modelagem 
multidimensional. Rio de Janeiro: Campus, 2002. 494 p. 
 
Data Mining , origem Wikipedia. Disponível em: 
<http://pt.wikipedia.org/wiki/Data_Mining>, 
Acesso em: 25/06/2012. 
 
Gurovitz, Helio. O que cerveja tem a ver com fraldas? 
 
Fileto, Renato. Data Warehouses: Fundamentos, Ferramentas e Tendências Atuais. 
Departamento de Informática e Estatística (INE). Universidade Federal de Santa 
Catarina (UFSC). 2009. 
 
24 
NERI, F. Tecnologia e Projeto de Data Warehouse. Editora Érica, 2004. 
 
INMON, W. H. Building the Data Warehouse, 2a ed., Wiley, 1996. 
 
INMON, William H. Data Mart Does Not Equal Data Warehouse. DMReview.com, 
07/2000. 
 
Machado, F. N. R. (2000). Projeto de Data Warehouse: Uma Visão Multidimensional. 
Érica, São Paulo.

Outros materiais