Buscar

Mineração de Dados

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 16 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

FACULDADE RUY BARBOSA 
 
 
 
BANCO DE DADOS 
 
 
 
Mineração de Dados 
 
 
 
 
 
 
 
Larissa de Oliveira Pinheiro 
Viliane de Souza Oliveira 
Wagner Nevony 
 
Salvador, novembro de 2012 
 
 
 
 
 
 
 
BANCO DE DADOS 
 
 
 
Mineração de Dados 
 
 
 
Trabalho apresentado para avaliação do 
rendimento acadêmico na disciplina 
Banco de Dados do curso de Ciência da 
Computação, ministrada pelo professor 
Rodrigo Spínola. 
 
 
 
 
 
 
 
Larissa de Oliveira Pinheiro 
Viliane de Souza Oliveira 
Wagner Nevony 
 
Salvador, novembro de 2012 
 
3 
 
 
MINERAÇÃO DE DADOS 
 
Larissa de Oliveira Pinheiro1 
Viliane de Souza Oliveira2 
Wagner Nevony3 
RESUMO 
A mineração de dados é uma das etapas pelo qual está inserido no conceito do processo 
de descoberta de conhecimento (KDD). O KDD é um processo computacional que 
permite extrair conhecimento de informações armazenadas em grandes bases de dados 
especializadas. Contudo, era necessário transformar essa quantidade de informação em 
conhecimento, para serem utilizadas em atividades comerciais ou científicas. Este artigo 
tem o objetivo de definir mineração de dados, abordar suas técnicas e tarefas e além de 
descrever como ela contribuiu para o processo de descoberta do conhecimento. 
 
Palavras-chaves: Mineração de Dados, KDD, Dados, Informação. 
ABSTRACT 
Data mining is one of the steps by which the concept is embedded in the process of 
knowledge discovery (KDD). KDD is a computational process that extracts knowledge 
from large data stored in specialized databases. However, this amount was necessary to 
transform information into knowledge to be used in commercial or scientific activities. 
This article aims to define data mining, and address their tasks and techniques and 
describe how it contributed to the process of knowledge discovery. 
 
Keywords: Data Mining, KDD, Data, Information. 
 
INTRODUÇÃO 
 
Atualmente, empresas de qualquer setor empresarial têm a necessidade de 
armazenar seus dados. Devido aos avanços tecnológicos, essa técnica tornou-se 
indispensável. A partir disso, a quantidade de dados armazenados se tornou problema, 
pois, onde armazenar tantos dados sem afetar o desempenho do sistema, a integridade 
destes e os custos elevados de hardware na tentativa de facilitar o armazenamento de 
grandes quantidades de dados. Assim surgiu o termo Mineração de Dados (Data 
Mining). 
 
1 Acadêmico do Curso de bacharel em Ciência da Computação da Faculdade Ruy Barbosa. 
2 Acadêmico do Curso de bacharel em Ciência da Computação da Faculdade Ruy Barbosa. 
3 Acadêmico do Curso de bacharel em Ciência da Computação da Faculdade Ruy Barbosa. 
4 
 
Segundo Sferra e Corrêa (2003) Data Mining é uma tecnologia que emergiu da 
intersecção de três áreas: estatística clássica, inteligência artificial e aprendizado de 
máquina, sendo a primeira a mais antiga delas. 
 A mineração de dados é das tecnologias mais promissoras da atualidade. Esse 
conceito se deu por conta da Descoberta de Conhecimentos em Base de Dados (KDD- 
Knowledge Discovery in Databases). O KDD são processos a fim de solucionar 
problemas da sobrecarga de dados (CAMILO; SILVA, 2009). 
De Acordo com Camilo e Silva (2009) existem algumas áreas que utilizaram a 
mineração de dados, são elas: 
Bancos: identificar padrões para auxiliar no gerenciamento de 
relacionamento com o cliente; 
Cartão de Crédito: identificar segmentos de mercado, identificar 
padrões de rotatividade; 
Cobrança: detecção de fraudes; 
Medicina: indicação de diagnósticos mais precisos; 
Segurança: na detecção de atividades terroristas e criminais; 
Auxílio em pesquisas biométricas; 
RH: identificação de competências em currículos; 
Um supermercado melhore a disposição de seus produtos nas 
prateleiras, através do padrão de consumo de seus clientes; 
 
Diante deste artigo serão abordados aspectos importantes relacionados à 
mineração de dados, são eles: definição, mineração de dados como campo 
multidisciplinar, descoberta de conhecimento em base de dados (KDD), tarefas, 
técnicas. 
 
DEFINIÇÃO DE MINERAÇÃO DE DADOS 
 
Por conta do desenvolvimento tecnológico, a facilidade de obter informações 
está cada vez mais acessíveis, assim organizações administram numerosas quantidades 
de dados decorrentes por pesquisas cientificas ou por causa da coleta de informações 
diárias. O problema decorrente disso, é que não há a transformação dessas quantidades 
de informações em conhecimento, que possam ser utilizados em atividades tanto 
comerciais quanto científica. Com isso surgiu o conceito de Data Mining (CÔRTES et. 
al, 2002). 
Para Amo (S/D), 
É um ramo da computação que teve início nos anos 80, quando os 
profissionais das empresas e organizações começaram a se preocupar 
com os grandes volumes de dados informáticos estocados e 
inutilizados dentro da empresa. Nesta época, Data Mining consistia 
essencialmente em extrair informação de gigantescas bases de dados 
5 
 
da maneira mais automatizada possível. Atualmente, Data Mining 
consiste, sobretudo na análise dos dados após a extração, buscando-se, 
por exemplo, levantar as necessidades reais e hipotéticas de cada 
cliente para realizar campanhas de marketing. 
 
Como citado acima, atualmente a mineração de dados consiste na manipulação 
de grandes quantidades de dados. 
Segundo Côrtes et. al (2002) é a exploração e a análise de dados, por meios 
automáticos ou semi-automáticos, em grandes quantidades de dados com o objetivo de 
descobrir regras e padrões interessantes. 
Muitos autores descreve a mineração de dados como KDD. Contudo, a relação 
da mineração de dados com o KDD é que a mineração faz parte da descoberta de 
conhecimento, pois possui técnicas para a busca do conhecimento. 
Segundo AMO (S/D) o KDD é um processo mais amplo possuindo várias 
etapas, na qual serão descrita ao decorrer do artigo. 
 
MINERAÇÃO DE DADOS COMO CAMPO MULTIDISCIPLINAR 
 
Por existir técnicas para a busca do conhecimento, a mineração de dados está 
presente em diversas áreas do conhecimento, por isso que ela engloba um campo 
multidisciplinar. Ela está inserida na área da estatística, inteligência artificial e banco de 
dados. 
Em relação à estatística, é comum visualizar a mineração de dados na avaliação 
e validação de resultados (SILVA, 2004). 
“Mineração de dados é a análise de grandes conjuntos de dados a fim de 
encontrar relacionamentos inesperados e de resumir os dados de uma forma que eles 
sejam tanto úteis quanto compreensíveis ao dono dos dados (CAMILO e SILVA, 
2009)”. 
Na área da inteligência artificial ou aprendizado de máquina, a mineração de 
dados trabalha juntamente com o KDD, é a realização da descoberta de dados a partir de 
algoritmos computacionais a fim de desenvolver conjunto de padrões para certos dados 
(CAMILO e SILVA, 2009). 
No que diz respeito à área de banco de dados, a mineração de dados forma um 
campo multidisciplinar, pois junta todas as áreas (estatística, aprendizado de máquina) 
para extrair quantidades de informações nas grandes bases de dados (CAMILO e 
SILVA, 2009). 
 
6 
 
DESCOBERTA DE CONHECIMENTO EM BASE DE DADOS (KNOWLEDGE 
DISCOVERY IN DATABASE - KDD 
Segundo Boente et. al (2007) a descoberta de conhecimento em bases de dados 
é um processo computacional que permite extrair conhecimento de informações 
armazenadas em grandes bases de dados especializadas, geralmente por assunto, como é 
o caso de Data Warehouses, Data Marts e Data Stores, por meio de uma ferramenta 
específica de KDD, auxiliando na busca da gestão do conhecimento estratégicoorganizacional. 
Ainda segundo Boente et. al (2007) a descoberta do conhecimento baseada em 
computador vem sendo realizada desde a década de 60. No entanto, as técnicas que se 
tornam possíveis foram ampliadas e aperfeiçoadas com o passar do tempo. 
Diante do processo de descoberta de conhecimento podemos dizer que ele deve 
obedecer a etapas para conseguir atingir seus objetivos, o que será observado ao 
decorrer deste trabalho. 
 
1. Dados, Informação e Conhecimento 
 
Para Carvalho e Dias (2008) dado é um elemento puro, quantificável sobre um 
determinado evento. Dados são fatos, números, texto ou qualquer mídia que possa ser 
processada pelo computador. 
É importante frisar que o dado sozinho, não oferece qualquer tipo de 
embasamento para a compreensão de uma determinada situação. 
Já para Carvalho e Dias (2008) a informação é o dado analisado e 
contextualizado. Envolve a interpretação de um conjunto de dados, ou seja, a 
informação é constituída por padrões, associações ou relações que todos aqueles dados 
acumulados podem proporcionar. 
Ainda segundo Carvalho e Dias (2008) o conhecimento refere-se à habilidade 
de criar um novo modelo mental que descreva o objeto e indique as ações e decisões a 
serem tomadas. 
De modo geral, o dado é um fato cru, sob nenhum contexto específico. A 
informação são dados organizados com a devida contextualização e conhecimento é a 
informação organizada. 
Com os esclarecimentos acima citados do que vem a ser dados, informação e 
conhecimento, já podemos falar um pouco sobre gestão do conhecimento. 
7 
 
Segundo Rossatto (2002) a gestão do conhecimento é um processo estratégico 
contínuo e dinâmico que visa gerir o capital intangível da empresa e todos os pontos 
estratégicos a ele relacionados e estimular a conversão do conhecimento. 
Organizações saudáveis geram e usam o conhecimento. À medida que 
interagem com seus ambientes, elas absorvem informações, transformam-nas em 
conhecimento e agem com base numa combinação desse conhecimento com suas 
experiências, valores e regras internas (DAVENPORT E PRUSAK, 2003). 
Esse processo de transformação de informação em conhecimento é agilizado 
através do emprego de tecnologia da informação. O uso de ferramentas de KDD permite 
esse tipo de integração de maneira mais fácil e ágil, principalmente pelo fato de que a 
análise de grandes quantidades de dados pelo homem é inviável sem o auxílio de uma 
ferramenta computacional apropriada (GOLDSCHMIDT E PASSO, 2005). 
 
2. Etapas da descoberta do conhecimento 
O KDD é um conjunto de funcionalidades contínuas que compartilham a descoberta do 
conhecimento a partir de bases de dados. É composta das seguintes etapas, como a seleção de dados, 
pré-processamento e limpeza, transformação, mineração de dados e interpretação. 
 
GSI - Grupo de Sistemas Inteligentes - Mineração de Dados 
 
Segundo GSI (1998), a descoberta de conhecimento em base de dados descreve 
as seguintes etapas para definição de problemas a serem resolvidos através do processo 
de KDD: 
1. Seleção - Seleção ou segmento de dados apropriados para a análise de 
acordo com algum critério. Por exemplo, todas as pessoas que possuem um 
carro – desta maneira subconjuntos dos dados podem ser determinados. 
8 
 
2. Pré-Processamento - Eliminação de ruídos e erros, estabelecimento de 
procedimentos para verificação da falta de dados; estabelecimento de 
convenções para nomeação e outros passos demorados para a construção de 
uma base de dados consistente. 
3. Transformação - Redução dos dados através da busca por atributos que 
representem várias características dos dados. 
4. Mineração de Dados - Aplicação dos algoritmos para descoberta de 
padrões nos dados; envolve a seleção de métodos/técnicas e modelos que 
melhor se enquadram no cumprimento das metas estabelecidas. 
5. Interpretação/Avaliação - Pode requerer a repetição de vários passos, mas 
normalmente é encarada como uma simples visualização dos dados. 
Os padrões identificados pelo sistema são interpretados em conhecimento, 
que pode então ser utilizado para suportar a tomada de decisão humana. 
 
3. O processo de KDD 
 
3.1 A Etapa de Pré-Processamento 
 
Segundo Boente et. al (2007) compreende as funções relacionadas à captação, 
à organização, ao tratamento e à preparação dos dados para a etapa de Mineração de 
Dados. É indispensável dizer que esta etapa representa fundamental importância no 
processo de descoberta de conhecimento em banco de dados. 
No pré-processamento podem ocorrer alguns métodos (seleção de dados, 
limpeza, codificação, enriquecimento, normalização de dados, construção de atributos e 
correção de prevalência). 
 
3.2 A Etapa de Mineração de Dados 
 
Para Boente et. al (2007) é considerada a principal etapa do processo de KDD. 
É aqui onde ocorre a busca efetiva por novos conhecimentos a partir de dados 
conhecidos. A execução dessa etapa compreende a aplicação de algoritmos sobre os 
dados procurando abstrair o tão esperado conhecimento. 
A mineração de dados pode ocorrer por meio de diferentes métodos e cada um 
deles requer diferentes necessidades de pré-processamento. Esses métodos podem ser 
baseados em redes neurais, algoritmos genéticos, instâncias, métodos estatísticos, 
9 
 
métodos específicos, indução de árvore de decisão e lógica nebulosa (BOENTE et. al, 
2007). 
 
3.3 A Etapa do Pós-Processamento 
 
Esta etapa envolve a visualização, a análise e a interpretação do modelo de 
conhecimento gerado pela etapa de mineração de dados. Será nesta etapa que o 
especialista em KDD e o especialista de domínio da aplicação avaliam os resultados 
obtidos e definem novas alternativas de investigação dos dados (BOENTE et. al, 2007). 
 
4. Aplicabilidade de Descoberta do Conhecimento em Banco de Dados 
 
Segundo Witten e Frank (2000 apud SILVA, 2004) visando uma 
exemplificação da aplicabilidade de KDD, são apresentados a seguir casos onde a 
descoberta de conhecimento em bancos de dados pode desempenhar tarefas relevantes: 
 Submissões a empréstimos demandam do proponente o fornecimento 
de dados pessoais e financeiros relevantes. Estas informações são 
utilizadas pelas instituições financeiras como base para a decisão de 
efetuar ou não o empréstimo. Tal decisão é comumente tomada em dois 
estágios. Primeiro, os métodos estatísticos são utilizados para 
determinar situações bem definidas em relação à aceitação ou rejeição 
do pedido. Os casos remanescentes, ou seja, aqueles que estão no limite 
necessitam de análise humana. KDD pode ser aplicado neste problema 
da seguinte forma: suponha-se a disponibilidade de um banco de dados 
histórico sobre clientes da instituição, com aproximadamente 5000 
cadastros contendo 20 diferentes atributos, tais como idade, tempo de 
serviço, vencimentos, bens, status atual de crédito etc. o tratamento 
dessas informações por métodos de KDD geraria automaticamente 
regras objetivas e claras sobre características fundamentais a bons e 
maus clientes, podendo estas regras serem aplicadas para aumentar a 
taxa de sucesso das operações de empréstimos. 
 Diagnóstico é uma das principais aplicações de sistemas especialistas. 
A manutenção preventiva de dispositivos eletromecânicos pode evitar 
falhas que interrompam processos industriais. Técnicos regularmente 
inspecionam cada dispositivo, medindo vibrações e outros fenômenos 
10 
 
que indicam necessidade de manutenção. Instalações de indústrias 
químicas chegam a utilizar mais de mil diferentes dispositivos, que vão 
de pequenas bombas a grandes turbo-alternadores. A medição de 
vibrações e demais fenômenos é muito ruidosa, devido às limitações 
dos procedimentosde medição e registro. Estes dados, uma vez 
estudados por um especialista, conduzem a um diagnóstico. As 
limitações dos procedimentos técnicos, aliadas à subjetividade humana, 
oferecem uma margem de erro preocupante. Por outro lado, um 
universo de 600 falhas, cada uma devidamente registrada com seus 
conjuntos de medições representando 20 anos de experiência, pode ser 
utilizado para determinar o tipo de falha através de procedimentos de 
KDD, aperfeiçoando assim o processo de busca e correção de 
problemas eletromecânicos. 
 
TAREFA E TÉCNICAS DE MINERAÇÃO DE DADOS 
Para melhor entendimento, temos que distinguir o que é tarefa e o que é uma 
técnica de mineração de dados. A tarefa sem dúvida consiste na especificação do que 
estamos querendo buscar nos dados. As principais tarefas são: classificação, estimativa, 
associação, segmentação e sumarização (COSTA, 2005). 
Na técnica de mineração de dados temos a especificação de métodos que 
consiste em garantir padrões que nos interessam. As principais técnicas utilizadas em 
mineração de dados, temos: memory based reasoning, algoritmo genético, regras de 
associação, árvores de decisão, redes neurais artificiais, modelo hibrido. 
 
 1 Tarefas de Mineração de dados 
As tarefas de mineração de dados, relacionadas abaixo estão resumidas para 
uma melhor compreensão. 
 
1.1 Classificação 
Segundo Costa (2005), a tarefa de classificação constrói um modelo de algum 
tipo que possa ser aplicado aos dados não classificados procurando classificá-los em 
classes. Os objetos são classificados e examinados de acordo com a classe definida. 
Podemos dar exemplos de classificação, tais como: classificar pedidos de 
créditos como de: baixo, médio e alto risco, esclarecer pedidos de seguros fraudulentos, 
11 
 
identificar a melhor forma de tratamento que o paciente pode responder, baseado em 
classes de pacientes que respondem a um determinado tratamento médico. 
 
1.2 Estimativa 
Para Costa (2005), a tarefa estimativa é usada para definir um valor para 
variável que continua desconhecida. A diferença da tarefa estimativa e da classificação 
é que a estimativa lida com resultados contínuos enquanto a classificação lida com 
resultados discretos. Assim, ela pode executar uma tarefa de classificação, com isso, 
todos os diferentes intervalos de valores contínuos correspondem a diferentes classes. 
Como exemplo de tarefa estimativa, temos: estimar o número de filhos em uma 
família, estimar o valor em tempo de vida de um cliente, estimar a probabilidade de que 
uma paciente morrerá com base nos resultados de um conjunto de diagnósticos médicos, 
prever a demanda de um consumidor para um determinado produto (COSTA, 2005). 
 
1.3 Associação 
Segundo Costa (2005), na tarefa associação é possível determinar quais itens 
podem ser adquirido com uma mesma transação. Sendo assim, podendo determinar 
quais produtos costumam ser colocados juntos em carrinho de compra. Com isso, as 
grandes redes de supermercados usam a associação para planejar a disposição dos 
produtos nas prateleiras, para que os itens adquiridos em uma mesma compra ficam 
próximos entre si. 
 
1.4 Segmentação ou Clustering 
Para Cortes (2002), nessa tarefa o conjunto de dados é subdividido em 
conjunto menor, sendo similar no comportamento dos atributos de segmentação. 
Através destes subconjuntos é possível determinar novos agrupamentos (clustering). 
Sendo assim, na segmentação não há classes predefinidas, ou seja, os registros são 
agrupados de acordo com a semelhança, o que diferencia da tarefa de classificação. 
Podemos dar exemplo de registros dos bilhetes aéreos de uma determinada 
companhia aérea por cidade, origem, sexo, classe e assento. Feito a segmentação 
podemos formar agrupamentos (clustering) por profissão, estado, frequência de viagens 
e faixa salarial para ter o perfil de seus passageiros (CORTES, 2002). 
 
 
12 
 
1.5 Sumarização 
Para Sferra (2003) a tarefa de sumarização é uma descrição compacta para um 
subconjunto. São exemplos as medidas de posição e variabilidade. As funções de 
sumarização são mais usadas análise exploratória de dados com geração automatizada 
de relatórios. 
 
2 Técnicas de mineração de dados 
As técnicas apresentadas logo abaixo são de forma resumida. 
2.1 Memory Based Reasoning (MRB) 
Segundo Cortes (2002), raciocínio baseado em memória (MRB) é a técnica que 
utiliza exemplos conhecidos como modelo previsões sobre exemplos não conhecidos, 
ou seja, o raciocínio baseados em casos tem base no método do vizinho mais próximo. 
Procurando vizinhos mais próximos nos exemplos conhecidos, ele procura combinar 
seus valores para atribuir valores de classificação e de previsão. 
Sua vantagem é a habilidade de aprender novas classificações introduzindo 
novos exemplos no banco de dados. Algumas das técnicas de raciocínio baseado em 
memória utilizam algoritmos como: Birch, Clarans. 
 
2.2 Algoritmo Genético 
Na década de 60 John Holland inventou o algoritmo genético para abstrair e 
explicar o processo adaptativo de sistemas neurais, contudo projetou sistemas artificiais 
de software contendo importantes mecanismos (CORTES, 2002). 
Os algoritmos genéticos possibilitam a busca e otimização simulando os 
processos naturais de evolução, como a seleção natural e a genética. Os algoritmos 
usam estratégias de busca massiva e estruturada, mas trabalha não com uma solução 
para o problema e sim testando e modificando várias soluções em paralelo. 
Estes algoritmos são aleatórios, ou seja, efetuam caminhadas aleatórias 
direcionadas, explorando informações anteriormente apreendidas buscando novos 
pontos de busca (CORTES, 2002). 
A mineração de dados é usada para formular hipóteses sobre dependências 
entre variáveis. Esta técnica é apropriada nas tarefas de classificação e segmentação. 
 
13 
 
2.3 Regras de Associação 
Segundo Sferra (2003), as regras de associação determinam relações entre 
campos do banco de dados, ou seja, uma correlação que permita uma tomada de 
decisão. Assim podemos dizer que também é conhecida como análise de carrinho de 
supermercado. Tendo como objetivo encontrar todos os conjuntos de itens que 
freqüentemente ocorrem de forma conjunta. 
Para Berry & Linoff (1997), existe três tipos de regras produzidas por esta 
análise são: as regras úteis, as triviais. 
As triviais são conhecidas por qualquer pessoa que conheça o negócio, assim 
produzem conhecimento comum sobre o negócio. Esta regra trivial mede ações prévias, 
tais como campanhas de marketing. 
As regras úteis são de alta qualidade e informação para ação uma vez que o 
padrão é encontrado não é difícil de justificá-lo. Exemplo é que um determinado 
produto B é comprado junto com o produto A por estar localizado próximo. Esta regra 
também pode utilizar colocando um produto C entre os produtos A e B para que ele 
também seja consumido (CORTES, 2002). 
Para Cortes (2002) existem vários métodos e algoritmos que possibilitam 
encontrar regras de Associação nas grandes bases de dados, são os algoritmos: 
PARTITION, DIC, AIS, SETM, DHP, DLG, mas o mais comum deles é o APRIORI e 
suas variações, como o APIORIO TID e o APRIORI HYBRID. 
 
2.4 Árvores de Decisão 
Segundo Cortes (2002) uma árvore de decisão é uma árvore onde cada nó não 
terminal representa uma decisão com o objetivo de separar as classes. A vantagem desta 
técnica é o modelo bem explicável. 
A partir de um numero de dados com várias colunas e linhas é possível com 
uma ferramenta de árvore de decisão escolher qual a coluna como objetivo de saída 
gerando o primeiro nó da árvore de decisão. 
 
CONCLUSÃO 
 
Com o avanço tecnológico, surgiuum grande volume de dados e tornou-se 
quase que impossível a sua manipulação. Então surgiu a necessidade de utilizar técnicas 
que possibilitassem esta manipulação. 
14 
 
A mineração de dados é uma grande ferramenta de apoio na gestão de 
informações dentro das empresas, pois ela torna menos complexa à manipulação 
grandes quantidades de dados e extrai de forma otimizada a informação contida nesses 
registros. 
Mesmo com todos os bons resultados da mineração de dados, ainda existem 
desafios a serem superados. E a todo o momento novos desafios surgem e é papel da 
mineração juntamente com o campo multidisciplinar e o processo KDD trazer soluções 
adequadas para esses problemas. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
15 
 
REFERÊNCIAS 
 
AMO, Sandra. Técnicas de Mineração de Dados. Disponível em: 
www.lsi.ufu.br/documentos/publicacoes/ano/2004/JAI-cap5.pdf Acessado em 24 de 
outubro de 2012. 
BERRY, Michael J. A.; LINOFF, Gordon. Data Mining techniques: for marketing, 
Sales and Customer Support. USA: Wiley Computer Publishing, 1997. Disponível 
em: http://ebookbrowse.com/wiley-data-mining-techniques-for-marketing-sales-and-
customer-support-2004-2ed-pdf-d74911770, Acessado em 10/11/2012. 
 
CARVALHO, Daniel Dias de; DIAS, Maxwel Macedo. Descoberta de Conhecimento 
em Ambientes Virtuais de Aprendizagem: Um Estudo de Caso no LabSQL. 2008. 
Disponível em: http://pt.scribd.com/doc/58807938/55/O-PROCESSO-DE-KDD. 
Acesso em 18 de setembro de 2012. 
CORTÊS, Sérgio da Costa; PORCARO, Rosa Maria; LIFSCHITZ, Sérgio. Mineração 
de Dados- Funcionalidades, Técnicas e Abordagens. 2002. Disponível em: 
ftp://ftp.inf.puc-rio.br/pub/docs/techreports/02_10_cortes.pdf Acessado em 24 de 
outubro de 2012. 
COSTA, Marcelo Senos. Mineração de Dados Utilizando Redes Neurais. Disponível 
em: http://www.cin.ufpe.br/~tg/2006-2/tmas.pdf. Acessado em 29/10/2012. 
ROSSATTO, M.A. Gestão do Conhecimento: A Busca da Humanização, 
Transparência, Socialização e Valorização do Intangível. Rio de Janeiro: 
Interciência, 2002. 
DAVENPORT, T.H.; PRUSAK, L. Conhecimento Empresarial: Como as 
Organizações Gerenciam o seu Capital Intelectual. Rio de Janeiro: Elsevier, 2003. 
GOLDSCHIMIDT, R.R.; PASSO, E. Data Mining: Um Guia Prático. Rio de Janeiro: 
Campus, 2005. 
BOENTE, Alfredo Nazareno Pereira. Et al. Utilização de Ferramentas de KDD para 
Integração de Aprendizagem e Tecnologia em Busca da Gestão Estratégica do 
Conhecimento na Empresa. 2007. Disponível em: 
http://www.aedb.br/seget/artigos07/1219_Artigo%20SEGET%202007.pdf. Acesso em 
20 de setembro de 2012. 
GSI, Grupo de Sistemas Inteligentes. O processo de mineração. 1998. Disponível em: 
http://www.din.uem.br/ia/mineracao/introducao/processo.html. Acesso em 18 de 
setembro de 2012. 
SILVA, Marcelino Pereira dos Santos. Mineração de Dados – Conceitos, Aplicações e 
Experimentos com Weka. 2004. Disponível em: 
www.lbd.dcc.ufmg.br:8080/colecoes/erirjes/2004/004.pdf.Acesso em 30 de setembro de 
2012. 
16 
 
SFERRA, Heloisa Helena; CORRÊA, Ângela M. C. Jorge, Conceitos e Aplicações de 
Data Mining. Disponível em: 
http://www.unimep.br/phpg/editora/revistaspdf/rct22art02.pdf Acessado em 09 de 
outubro de 2012.

Outros materiais