A maior rede de estudos do Brasil

Grátis
20 pág.
MT803-2012-Aula-01-Apres+Dicas+IntroDM

Pré-visualização | Página 4 de 4

à Mineração de Dados – Aula 1 71
Exemplo de Associação 
� Considere um cadastro de 500.000 clientes de uma 
loja de roupas.
� Através do uso de mineração foi descoberto:
� 7% dos clientes são casados;
� Esses clientes estão na faixa etária de 31 a 40 anos; e 
� Possuem pelo menos 2 filhos.
� Como essa descoberta seria útil para essa loja?
� Uma campanha de marketing poderia ser direcionada para 
esses clientes objetivando o aumento de consumo de 
produtos infantis.
� Importante: inicialmente não foi elaborada uma 
consulta para identificar clientes com esses perfis.
MT-803: Introdução à Mineração de Dados – Aula 1 72
Exercícios sobre Associação
� Considere o conjunto de transações, abaixo, para uma 
locadora de filmes:
1. Existem padrões de consumo? Quais?
2. Com base em um padrão de consumo, dê um exemplo 
de uma recomendação, isto é, uma oferta que a 
locadora poderia sugerir para os seus clientes.
B, C, H, I, JT4
A, D, R, JT5
C, P, QT3
A, C, D, P, QT2
A, B, C, D, F, H, I, J, R T1
Lista de FilmesTID
MT-803: Introdução à Mineração de Dados – Aula 1 73
� É também considerada uma tarefa descritiva.
� Clusterização
�Agrupamento de conjuntos de dados em clusters.
� Cluster: uma coleção de objetos
�Similares aos objetos do mesmo cluster.
�Dissimilares aos objetos de outros clusters.
� Clusterização é uma classificação não
supervisionada - sem classes predefinidas.
Clusterização ou Agrupamento
MT-803: Introdução à Mineração de Dados – Aula 1 74
Clusterização: Aplicações
�Marketing: Segmentação de mercado;
�Medicina: Agrupamento de pacientes com 
sintomas semelhantes;
� Bioinformática: Agrupamento de famílias de 
proteínas.
� Seguro: Identifica grupos de clientes que fazem 
comunicação de sinistro com alta freqüência.
�Web: Agrupamento de documentos.
MT-803: Introdução à Mineração de Dados – Aula 1 75
Exercícios sobre Clusterização
1. Como um analista de dados poderia 
transformar um problema de séries 
temporais curtas em um problema de 
clusterização?
2. Por que clusterização é considerada uma 
tarefa não-supervisionada?
MT-803: Introdução à Mineração de Dados – Aula 1 76
Principais softwares para Mineração
MT-803: Introdução à Mineração de Dados – Aula 1 77
Exercícios
1. Qual é a diferença básica entre classificação e
clusterização? 
2. Complete a tabela a seguir:
Perfil de compra de clientes
Layout de prateleiras 
Diagnósticos médicos
Avaliação de riscos de empréstimos
Segmentar clientes em um banco
Análise de sequências de DNA
Segmentação de mercado 
Detecção de fraudes 
Tarefa de MineraçãoAplicação
MT-803: Introdução à Mineração de Dados – Aula 1 78
Exercícios ...
3. Considere o conjunto de dados abaixo sobre eficiência de cana-
de-açúcar em São Paulo (em 2002). Dê exemplo de um tipo de 
informação e de conhecimento que pode ser extraído desses 
dados.

Crie agora seu perfil grátis para visualizar sem restrições.