Baixe o app para aproveitar ainda mais
Prévia do material em texto
____________________________________PROF WASHINGTON_____________________________INFORMÁTICA __________________________________________________________________________________________________________________________ AUTORIA: PROF. WASHINGTON LUIS – INFORMÁTICA PARA CONCURSOS – wasfloripa@hotmail.com 1 MATERIAL EXCLUSIVO PD SISTEMAS DA INFORMAÇÃO DATA WAREHOUSE / OLAP / OLPT / DATA MINING – BIG DATA – BUSSINES INTELLIGENCE - DATA MART – ETL MINERAÇÃO DE DADOS Conceito de Mineração de dados: Refere-se a descoberta de padrões e regras em uma grande base de dados. Esses padrões podem ajudar para que a empresa possa definir estratégias de vendas, de atendimento de disponibilização de produtos em prateleiras, ou até mesmo para conceder limite para cartão de crédito, analisar o perfil do cliente se bom ou mal pagador ou até mesmo descobrir através de escolhas de produtos, itens semelhantes. Quem nunca clicou em um produto ou serviço na internet e depois recebeu uma enxurrada de mensagens com aquele produto. Mas antes de falarmos em Mineração propriamente dita iremos falar de fontes de onde estes dados podem vir. Pois a mineração é a fase final de um processo maior, os elementos que iremos falar são interligados e fazem parte da mineração e por isso é fundamental em seu concurso você saber! Então, pense assim, o processo de minerar, consiste em fases, claro que não é obrigatório mas em concursos públicos estas fases ou termos são pedidos nas questões que envolvem mineração, portanto é necessário sabermos destas fases primeiramente. • FASE 1 – RECEBENDO DADOS DE DIVERSAS FONTES: OLTP , CRM, ERP, BANCO DADOS OPERACIONAIS: Processamento dos dados da empresa. Aqui os dados de várias fontes como CRM, ERP, Banco de dados operacionais são processados. • FASE 2 – EXTRAINDO OS DADOS DAS DIVERSAS FONTES DE DADOS: ETL´s : Extração e preparação dos dados. Nesta fase os dados serão extraídos das mais diversas bases de dados para serem enviados para a FASE 3 o DATA WAREHOUSE. • FASE 3 – ARMAZENANDO OS DADOS EM CATEGORIAS PARA DEPOIS SEREM USADOS PARA PESQUISAS E MINERAÇÃO: DATA WAREHOUSE e DATA MART: Armazenamento dos dados. Aqui os dados são armazenados em um grande repositório, organizados em categorias. • FASE 4 - KDD – PREPARANDO OS DADOS ANTES DA MINERAÇÃO E PESQUISA : Aqui os dados são preparados, limpos, é onde também são inclusas novas informações é a fase de organização das informações para serem MINERADAS. • FASE 5 – PESQUISANDO PARA ENCONTRAR PADRÕES E REGRAS MINERANDO: DATA MINING e OLAP : Mineração de dados. Aqui sim, começa a mineração, onde serão extraídos os dados para fazermos análises, acharmos padrões e regras . Portanto como vimos, é necessário entendermos o que são OLTPS, CRM, ERP, DATAWAREHOUSE, KDD, BUSSINESS INTELIGENCE , DATA MART pois é necessário termos conhecimento pois mesmo a prova pedindo MINERAÇÃO apenas, não se tem como entender sem antes sabermos de onde vem os dados pois são assuntos interligados com a Mineração e são pedidos em concursos. Confira a imagem abaixo para entender o processo nas fases 1, 2, 3, 4 e 5 Agora que já sabemos para que serve um Data mining e quais as bases de dados e sistemas que fazem parte dele até iniciarmos a extração de conhecimento vamos entender o que são cada termo, DIDATICAMENTE VAMOS COMEÇAR NA SEGUINTE ORDEM: Vou inverter a Fase 2 com 3 para entendermos melhor, pois é fundamental entender o que é DATAWHAREHOUSE antes de tudo! 1 – Fase 3) O que são DataWharehouse e Data Mart 2 - Fase 1) OLTP´s 3 – Fase 2) ETL : Extraindo dados 4 – Fase 4) KDD : Preparando Dados 5 – Fase 5 ) BUSSINESS INTELLIGENCE : OLAP E DATA MINING: Minerando. DATA WAREHOUSE VAMOS ARMAZENAR UMA GRANDE QUANTIDADE DE INFORMAÇÕES. Primeiramente vamos entender o que são Data Warehouse pois sem isso não conseguimos seguir didaticamente no assunto: No mundo moderno a quantidade de informações armazenadas nos sistemas de banco de dados é gigantesca. Estamos falando em TeraFlops de dados. Pense uma grande rede de supermercados ter que armazenar seus dados de vendas, clientes, estoques, relatórios gerenciais e muito mais. Pensa agora essa mesma empresa como a WALMART localizada no TEXAS – EUA ter que se comunicar com outras lojas em cidades diferentes, agora pense essa ligação com todas as lojas do mundo. Agora imagine a Walmart ter que precisar criar uma pesquisa em cima do seu banco de dados, coletando por exemplo os clientes que pagaram em dia e qual a faixa etária etc. O armazenamento de grandes informações, escalonadas e divididas em categorias em um único banco é chamado de DATA WHAREHOUSE e é através destes dados já divididos em assuntos que é possível fazer pesquisas mais detalhadas como DATA MINING ou OLAP. Continuamos no próximo material galera! Prof. Washington mailto:wasfloripa@hotmail.com
Compartilhar