MT803-2012-Aula-01-Apres+Dicas+IntroDM
20 pág.

MT803-2012-Aula-01-Apres+Dicas+IntroDM


DisciplinaIntrodução à Probabilidade e A Estatística II207 materiais1.658 seguidores
Pré-visualização4 páginas
à Mineração de Dados \u2013 Aula 1 71
Exemplo de Associação 
\ufffd Considere um cadastro de 500.000 clientes de uma 
loja de roupas.
\ufffd Através do uso de mineração foi descoberto:
\ufffd 7% dos clientes são casados;
\ufffd Esses clientes estão na faixa etária de 31 a 40 anos; e 
\ufffd Possuem pelo menos 2 filhos.
\ufffd Como essa descoberta seria útil para essa loja?
\ufffd Uma campanha de marketing poderia ser direcionada para 
esses clientes objetivando o aumento de consumo de 
produtos infantis.
\ufffd Importante: inicialmente não foi elaborada uma 
consulta para identificar clientes com esses perfis.
MT-803: Introdução à Mineração de Dados \u2013 Aula 1 72
Exercícios sobre Associação
\ufffd Considere o conjunto de transações, abaixo, para uma 
locadora de filmes:
1. Existem padrões de consumo? Quais?
2. Com base em um padrão de consumo, dê um exemplo 
de uma recomendação, isto é, uma oferta que a 
locadora poderia sugerir para os seus clientes.
B, C, H, I, JT4
A, D, R, JT5
C, P, QT3
A, C, D, P, QT2
A, B, C, D, F, H, I, J, R T1
Lista de FilmesTID
MT-803: Introdução à Mineração de Dados \u2013 Aula 1 73
\ufffd É também considerada uma tarefa descritiva.
\ufffd Clusterização
\ufffdAgrupamento de conjuntos de dados em clusters.
\ufffd Cluster: uma coleção de objetos
\ufffdSimilares aos objetos do mesmo cluster.
\ufffdDissimilares aos objetos de outros clusters.
\ufffd Clusterização é uma classificação não
supervisionada - sem classes predefinidas.
Clusterização ou Agrupamento
MT-803: Introdução à Mineração de Dados \u2013 Aula 1 74
Clusterização: Aplicações
\ufffdMarketing: Segmentação de mercado;
\ufffdMedicina: Agrupamento de pacientes com 
sintomas semelhantes;
\ufffd Bioinformática: Agrupamento de famílias de 
proteínas.
\ufffd Seguro: Identifica grupos de clientes que fazem 
comunicação de sinistro com alta freqüência.
\ufffdWeb: Agrupamento de documentos.
MT-803: Introdução à Mineração de Dados \u2013 Aula 1 75
Exercícios sobre Clusterização
1. Como um analista de dados poderia 
transformar um problema de séries 
temporais curtas em um problema de 
clusterização?
2. Por que clusterização é considerada uma 
tarefa não-supervisionada?
MT-803: Introdução à Mineração de Dados \u2013 Aula 1 76
Principais softwares para Mineração
MT-803: Introdução à Mineração de Dados \u2013 Aula 1 77
Exercícios
1. Qual é a diferença básica entre classificação e
clusterização? 
2. Complete a tabela a seguir:
Perfil de compra de clientes
Layout de prateleiras 
Diagnósticos médicos
Avaliação de riscos de empréstimos
Segmentar clientes em um banco
Análise de sequências de DNA
Segmentação de mercado 
Detecção de fraudes 
Tarefa de MineraçãoAplicação
MT-803: Introdução à Mineração de Dados \u2013 Aula 1 78
Exercícios ...
3. Considere o conjunto de dados abaixo sobre eficiência de cana-
de-açúcar em São Paulo (em 2002). Dê exemplo de um tipo de 
informação e de conhecimento que pode ser extraído desses 
dados.