Baixe o app para aproveitar ainda mais
Prévia do material em texto
Prof. Ricardo Baudel ricardo.baudel@gmail.com Sistemas Computacionais DATA WAREHOUSE, DATA MARTS e DATA MINING Sistemas Computacionais • Os dados de uma instituição costumam estar espalhados em diversos locais • No caso de dados em computadores, podem estar em diversas tabelas diferentes no banco de dados • Podem até mesmo estar em bancos de dados diferentes • Uma decisão de alto nível precisa estar embasada em dados sólidos • Esses dados nem sempre estão disponíveis de forma imediata Data Warehouse • Esses dados entram no sistema através de SPT • Só que os SPT não são feitos para análises de dados, mas apenas para o seu registro informacional • É interessante agregar esses dados de outras formas, e disponibilizá-los para os gestores de nível mais alto • Pode-se pesquisar dados históricos a fim de avaliar tendências • Isso não deve ser feito no mesmo banco de dados de transações diárias Data Warehouse • Para isso existe o Data Warehouse • Ele é criado através de uma “varredura” no banco de dados de operações diárias • Os dados são copiados em outro banco, independente • Com isso, não sobrecarrega o banco original • Esse novo banco de dados serve para pesquisas que dão suporte à decisão Data Warehouse • Nele são armazenados dados históricos extraídos dos bancos de dados corporativos e fontes externas • Em geral,mantém-se 5 a 10 anos de dados • Os dados são tratados e integrados para formar um novo banco de dados para análise corporativa • Podem conter centenas de milhões de registros de dados Data Warehouse • Essa base de dados deve ser atualizada periodicamente, limpando dados mais antigos e inserindo dados mais novos • Essa atualização deve ser automatizada e eficiente. • Deve ser projetado de forma cuidadosa • Antes de ser implementado, deve ter suas metas e objetivos bem definidos • Deve ser avaliado continuamente avaliado quanto à sua utilidade e eficiência • Está sendo útil ? Data Warehouse • É um subconjunto do Data Warehouse • É um conjunto de dados que trata de um aspecto específico dos dados contidos no Data Warehouse • Está mais adaptado para tratar dados específicos do que o data warehouse, que contém tudo • São mais úteis para grupos de decisores que precisam de dados mais detalhados, por exemplo: • Finanças • Estoque • pessoal Data Mart • Costuma ter algumas dezenas de gigabytes de dados • Os data warehouse contém alguns terabytes de dados • Com isso, o Data Mart pode ser mais ágil • Pode ser usado em máquinas mais simples • Com isso, mais tomadores de decisão têm boas informações em mãos. • São data warehouses menores. Data Mart • É mais uma ferramenta de análise de dados • Mineração • Procura identificar padrões e relacionamentos dentro do banco de dados • Descobre fatos dentro do banco de dados • Ele analisa os dados e tenta fazer previsões Data Mining • O objetivo dele é extrair padrões, tendências e regras dos data warehouses, para avaliar e propor regras de negócios • Exemplo : análise de crédito pelos bancos • Com base no comportamento padrão dos outros clientes, pode conceder ou não o empréstimo a aquele cliente • Se ele corresponder ao padrão dos que não pagam, o sistema recomenda não emprestar • Caso contrário, o sistema propõe emprestar Data Mining • A tentativa de identificar padrões serve para várias finalidades, entre outros: • Identificar fraudes em uso de cartão de crédito • Identificar clonagens de telefones • Análise de comportamento de clientes • Permite prever o comportamento de outros clientes e aumentar as vendas Data Mining Final da parte 7 Sistemas Computacionais Slide 1 Slide 2 Slide 3 Slide 4 Slide 5 Slide 6 Slide 7 Slide 8 Slide 9 Slide 10 Slide 11 Slide 12 Slide 13
Compartilhar