Buscar

Sistemas Computacionais 2017.1 Parte 7 Data Warehouse Data Mart e Data Mining

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 13 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 13 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 13 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

Prof. Ricardo Baudel
ricardo.baudel@gmail.com
Sistemas Computacionais
DATA WAREHOUSE,
 DATA MARTS 
e DATA MINING
Sistemas Computacionais
• Os dados de uma instituição costumam estar 
espalhados em diversos locais
• No caso de dados em computadores, podem estar 
em diversas tabelas diferentes no banco de dados
• Podem até mesmo estar em bancos de dados 
diferentes
• Uma decisão de alto nível precisa estar embasada 
em dados sólidos
• Esses dados nem sempre estão disponíveis de 
forma imediata
Data Warehouse
• Esses dados entram no sistema através de SPT
• Só que os SPT não são feitos para análises de 
dados, mas apenas para o seu registro 
informacional
• É interessante agregar esses dados de outras 
formas, e disponibilizá-los para os gestores de nível 
mais alto
• Pode-se pesquisar dados históricos a fim de avaliar 
tendências
• Isso não deve ser feito no mesmo banco de dados 
de transações diárias
Data Warehouse
• Para isso existe o Data Warehouse
• Ele é criado através de uma “varredura” no banco 
de dados de operações diárias
• Os dados são copiados em outro banco, 
independente
• Com isso, não sobrecarrega o banco original
• Esse novo banco de dados serve para pesquisas que 
dão suporte à decisão
Data Warehouse
• Nele são armazenados dados históricos extraídos 
dos bancos de dados corporativos e fontes externas
• Em geral,mantém-se 5 a 10 anos de dados
• Os dados são tratados e integrados para formar um 
novo banco de dados para análise corporativa
• Podem conter centenas de milhões de registros de 
dados 
Data Warehouse
• Essa base de dados deve ser atualizada 
periodicamente, limpando dados mais antigos e 
inserindo dados mais novos
• Essa atualização deve ser automatizada e eficiente.
• Deve ser projetado de forma cuidadosa
• Antes de ser implementado, deve ter suas metas e 
objetivos bem definidos
• Deve ser avaliado continuamente avaliado quanto à 
sua utilidade e eficiência
• Está sendo útil ?
Data Warehouse
• É um subconjunto do Data Warehouse
• É um conjunto de dados que trata de um aspecto 
específico dos dados contidos no Data Warehouse
• Está mais adaptado para tratar dados específicos do 
que o data warehouse, que contém tudo
• São mais úteis para grupos de decisores que 
precisam de dados mais detalhados, por exemplo:
• Finanças
• Estoque 
• pessoal
Data Mart
• Costuma ter algumas dezenas de gigabytes de 
dados
• Os data warehouse contém alguns terabytes de 
dados
• Com isso, o Data Mart pode ser mais ágil
• Pode ser usado em máquinas mais simples
• Com isso, mais tomadores de decisão têm boas 
informações em mãos.
• São data warehouses menores.
Data Mart
• É mais uma ferramenta de análise de dados
• Mineração
• Procura identificar padrões e relacionamentos 
dentro do banco de dados
• Descobre fatos dentro do banco de dados
• Ele analisa os dados e tenta fazer previsões
Data Mining
• O objetivo dele é extrair padrões, tendências e 
regras dos data warehouses, para avaliar e propor 
regras de negócios
• Exemplo : análise de crédito pelos bancos
• Com base no comportamento padrão dos outros 
clientes, pode conceder ou não o empréstimo a 
aquele cliente
• Se ele corresponder ao padrão dos que não 
pagam, o sistema recomenda não emprestar
• Caso contrário, o sistema propõe emprestar
Data Mining
• A tentativa de identificar padrões serve para várias 
finalidades, entre outros:
• Identificar fraudes em uso de cartão de crédito
• Identificar clonagens de telefones
• Análise de comportamento de clientes
• Permite prever o comportamento de outros 
clientes e aumentar as vendas
Data Mining
Final da parte 7
 
Sistemas Computacionais
	Slide 1
	Slide 2
	Slide 3
	Slide 4
	Slide 5
	Slide 6
	Slide 7
	Slide 8
	Slide 9
	Slide 10
	Slide 11
	Slide 12
	Slide 13

Outros materiais