A maior rede de estudos do Brasil

Grátis
1 pág.
Material Exclsuivo - Mineração de dados e Cia Parte 1

Pré-visualização | Página 1 de 1

____________________________________PROF WASHINGTON_____________________________INFORMÁTICA 
__________________________________________________________________________________________________________________________ 
AUTORIA: PROF. WASHINGTON LUIS – INFORMÁTICA PARA CONCURSOS – wasfloripa@hotmail.com 
1 
MATERIAL EXCLUSIVO PD 
 
 
 
 
 SISTEMAS DA INFORMAÇÃO 
DATA WAREHOUSE / OLAP / OLPT / DATA 
MINING – BIG DATA – BUSSINES 
INTELLIGENCE - DATA MART – ETL 
 
MINERAÇÃO DE DADOS 
 
Conceito de Mineração de dados: 
Refere-se a descoberta de padrões e regras em uma grande base de 
dados. Esses padrões podem ajudar para que a empresa possa definir 
estratégias de vendas, de atendimento de disponibilização de produtos 
em prateleiras, ou até mesmo para conceder limite para cartão de 
crédito, analisar o perfil do cliente se bom ou mal pagador ou até 
mesmo descobrir através de escolhas de produtos, itens semelhantes. 
Quem nunca clicou em um produto ou serviço na internet e depois 
recebeu uma enxurrada de mensagens com aquele produto. 
 
Mas antes de falarmos em Mineração propriamente dita 
iremos falar de fontes de onde estes dados podem vir. Pois a 
mineração é a fase final de um processo maior, os elementos 
que iremos falar são interligados e fazem parte da mineração e 
por isso é fundamental em seu concurso você saber! 
 
Então, pense assim, o processo de minerar, consiste em 
fases, claro que não é obrigatório mas em concursos 
públicos estas fases ou termos são pedidos nas questões 
que envolvem mineração, portanto é necessário sabermos 
destas fases primeiramente. 
 
• FASE 1 – RECEBENDO DADOS DE DIVERSAS 
FONTES: OLTP , CRM, ERP, BANCO DADOS 
OPERACIONAIS: Processamento dos dados da 
empresa. Aqui os dados de várias fontes como CRM, 
ERP, Banco de dados operacionais são processados. 
 
• FASE 2 – EXTRAINDO OS DADOS DAS DIVERSAS 
FONTES DE DADOS: ETL´s : Extração e preparação 
dos dados. Nesta fase os dados serão extraídos das 
mais diversas bases de dados para serem enviados 
para a FASE 3 o DATA WAREHOUSE. 
 
• FASE 3 – ARMAZENANDO OS DADOS EM 
CATEGORIAS PARA DEPOIS SEREM USADOS 
PARA PESQUISAS E MINERAÇÃO: DATA 
WAREHOUSE e DATA MART: Armazenamento dos 
dados. Aqui os dados são armazenados em um grande 
repositório, organizados em categorias. 
 
• FASE 4 - KDD – PREPARANDO OS DADOS ANTES 
DA MINERAÇÃO E PESQUISA : Aqui os dados são 
preparados, limpos, é onde também são inclusas novas 
informações é a fase de organização das informações 
para serem MINERADAS. 
 
• FASE 5 – PESQUISANDO PARA ENCONTRAR 
PADRÕES E REGRAS MINERANDO: DATA MINING 
e OLAP : Mineração de dados. Aqui sim, começa a 
mineração, onde serão extraídos os dados para 
fazermos análises, acharmos padrões e regras . 
 
Portanto como vimos, é necessário entendermos o que são 
OLTPS, CRM, ERP, DATAWAREHOUSE, KDD, BUSSINESS 
INTELIGENCE , DATA MART pois é necessário termos 
conhecimento pois mesmo a prova pedindo MINERAÇÃO 
apenas, não se tem como entender sem antes sabermos de 
onde vem os dados pois são assuntos interligados com a 
Mineração e são pedidos em concursos. 
 
Confira a imagem abaixo para entender o 
processo nas fases 1, 2, 3, 4 e 5 
 
 
Agora que já sabemos para que serve um Data mining e quais 
as bases de dados e sistemas que fazem parte dele até 
iniciarmos a extração de conhecimento vamos entender o que 
são cada termo, 
 
DIDATICAMENTE VAMOS COMEÇAR NA SEGUINTE 
ORDEM: Vou inverter a Fase 2 com 3 para entendermos 
melhor, pois é fundamental entender o que é 
DATAWHAREHOUSE antes de tudo! 
 
1 – Fase 3) O que são DataWharehouse e Data Mart 
2 - Fase 1) OLTP´s 
3 – Fase 2) ETL : Extraindo dados 
4 – Fase 4) KDD : Preparando Dados 
5 – Fase 5 ) BUSSINESS INTELLIGENCE : OLAP E DATA 
MINING: Minerando. 
 
DATA WAREHOUSE 
VAMOS ARMAZENAR UMA GRANDE QUANTIDADE 
DE INFORMAÇÕES. 
 
Primeiramente vamos entender o que são Data Warehouse pois 
sem isso não conseguimos seguir didaticamente no assunto: 
 
No mundo moderno a quantidade de informações 
armazenadas nos sistemas de banco de dados é gigantesca. 
Estamos falando em TeraFlops de dados. Pense uma grande 
rede de supermercados ter que armazenar seus dados de 
vendas, clientes, estoques, relatórios gerenciais e muito mais. 
Pensa agora essa mesma empresa como a WALMART 
localizada no TEXAS – EUA ter que se comunicar com outras 
lojas em cidades diferentes, agora pense essa ligação com 
todas as lojas do mundo. 
 
Agora imagine a Walmart ter que precisar criar uma pesquisa 
em cima do seu banco de dados, coletando por exemplo os 
clientes que pagaram em dia e qual a faixa etária etc. 
 
O armazenamento de grandes informações, escalonadas e 
divididas em categorias em um único banco é chamado de 
DATA WHAREHOUSE e é através destes dados já divididos 
em assuntos que é possível fazer pesquisas mais detalhadas 
como DATA MINING ou OLAP. 
 
Continuamos no próximo material galera! 
 
Prof. 
Washington 
mailto:wasfloripa@hotmail.com