Buscar

Material Exclsuivo -Mineração de dados e Cia Parte 2

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

____________________________________PROF WASHINGTON_____________________________INFORMÁTICA 
__________________________________________________________________________________________________________________________ 
AUTORIA: PROF. WASHINGTON LUIS – INFORMÁTICA PARA CONCURSOS – wasfloripa@hotmail.com 
1 
 
MATERIAL EXCLUSIVO PD 
 
 
DATA WAREHOUSE E DATA MART 
CARACTERÍSTICAS 
 
Data Warehouse: Um Data Warehouse é uma coleção de dados 
orientados a assuntos, integrados, variáveis com o tempo e 
não voláteis para suporte ao processo gerencial de decisão 
(Inmon, 1997). 
 
Características importantes para você anotar: Portanto é 
importante frisar que além de armazenar os dados de forma 
estruturada por assunto, os dados são variáveis com o tempo 
pois sofrem atualizações constantes vindos das OLTPS e não 
voláteis ou seja não se perdem com o tempo e os dados são 
de apenas Consultas portanto não sofrem atualizações não é 
possível um usuário fazer mudanças em um DW. 
 
Então em resumo as características são: 
• NÃO VOLÁTIL 
• SOMENTE LEITURA 
• DADOS VARIÁVEIS 
• ARMAZENA DE FORMA ESTRUTURADA 
 
Importante gravar isso para os concursos! 
 
Uma vez que os dados estão todos estruturados, precisamos 
de ferramentas especializadas na leitura desses dados, pois no 
DW os dados ficam dispostos de uma maneira diferente que 
visa a alta performance de leitura e gravação. Essas 
ferramentas são as aplicações OLAP, DATA MINING ETC, que 
se conectam ao DW provendo múltiplas visões dos dados 
facilitando e muito a interpretação destes. 
Quais são os benefícios de usar um data warehouse? 
• Tomada de decisão adequada usando DATA MINING 
E OLAP 
• Dados consolidados de várias fontes 
• Análise de dados históricos 
• Qualidade, consistência e precisão de dados 
• Separação do processamento analítico dos bancos 
de dados transacionais, o que melhora o 
desempenho dos dois sistemas 
 
Então é isso, DW é repositório, de informações vindas de 
várias fontes de dados. Para que possamos fazer as 
minerações e seleções de dados ( OLAP E DATA MINING) 
 
DATA MART – O PEQUENO 
DATAWAREHOUSE 
Um data mart é um pequeno data warehouse, como se fosse 
um mini DW que atende as necessidades de uma equipe ou 
setor da empresa de forma específica pois conterá apenas 
dados daquele setor como financeiro, estoque, marketing, 
vendas etc. O data Mart é menor, mais focado e pode conter 
resumos de dados para atender melhor a comunidade de 
usuários. Um data mart também pode ser parte de um data 
warehouse. 
 
Um Data Mart facilita mais ainda a Mineração ou o encontro de 
informações dentro da base pois além de estruturados como os 
DW os dados são mais direcionados ao departamento. Exemplo 
se você deseja fazer uma mineração das vendas realizadas 
pela empresa uma DATA MART do setor de VENDAS já teria 
estes dados prontos e direcionados. 
 
 
Veja o gráfico abaixo onde podemos ver um esquema de rede 
onde temos um DATA WAREHOUSE gerando DATA MART´s e 
as MINERAÇÕES sendo feitas nestes clones. 
 
 
 
Muito bem, como sabemos tanto os DW quanto os DM´s não 
conseguem gerar relatórios satisfatórios de pesquisa e 
detalhamentos dos dados, as vezes precisamos de filtragens 
específicas como nome , bairro, local de compra , produto 
comprado, data , loja que vendeu, quais são os produtos mais 
procurados por pessoas específicas e ou idades e esse tipo de 
filtro não se faz com um DATA WAREHOUSE OU DATA MART 
e é ai que entram as ferramentas de BI ( BUSSINES 
INTELIGENCE) que iremos ver na fase 5. 
 
Mas antes precisamos saber como os dados chegam em 
um DATAWAREHOUSE e quais os processos antes disso. 
 
Veja abaixo na figura como os dados chegam no 
DATAWAREHOUSE . 
 
 
 
Primeiramente tudo que uma empresa registra de informações 
chamamos de OLTP após isso os dados são tratados com ETL 
e só então entram no DW. Vamos então entender como 
funciona a sequência e com isso será mais fácil entender. 
Começando então com OLTP. 
 
 
Continuamos no próximo material galera.. 
 
Prof. Washington 
 
 
 
 
 
 
 
 
mailto:wasfloripa@hotmail.com

Outros materiais