A maior rede de estudos do Brasil

Grátis
20 pág.
MT803-2012-Aula-01-Apres+Dicas+IntroDM

Pré-visualização | Página 1 de 4

Introdução à
Mineração de Dados
(MT-803)
Stanley Robson de Medeiros Oliveira
Professor Colaborador
IMECC – 1o. Semestre de 2012
MT-803: Introdução à Mineração de Dados – Aula 1 2
Agenda
�� ApresentaApresentaçção dos ão dos AlunosAlunos + + DocenteDocente
�� FormaFormaçção + Situaão + Situaçção Atualão Atual
�� ExpectativasExpectativas
�� ApresentaApresentaçção da Disciplinaão da Disciplina
�Critérios de Avaliação
�Programa
�� Dicas sobre revisão de artigosDicas sobre revisão de artigos
�� Breve IntroduBreve Introduçção ão àà MineraMineraçção de Dadosão de Dados
MT-803: Introdução à Mineração de Dados – Aula 1 3
Informações Gerais
�Professor Responsável: Laecio Barros.
�Professor Credenciado: Stanley Robson de 
Medeiros Oliveira.
�Carga Horária Semestral: 60 horas
�Número de Créditos: 12
MT-803: Introdução à Mineração de Dados – Aula 1 4
Metodologia
�Aulas teóricas expositivas.
�Discussões em sala de aula.
�Atividades em sala de aula.
�Aulas práticas em laboratório.
�Apresentação de estudos de caso.
MT-803: Introdução à Mineração de Dados – Aula 1 5
Sobre o professor
� Formação
� Graduação – Ciência da Computação (UFCG – 1990).
� Mestrado – Ciência da Computação (UFCG – 1996). 
� Doutorado – Mineração de Dados (Universidade de 
Alberta, Canadá – 2004).
� Atuação Profissional
� Desenvolvedor (Embrapa).
� Analista de Sistemas (Embrapa).
� Pesquisador (Embrapa).
� Docência (ITI/EEP, IPEP, IBTA, Unicamp/Feagri).
MT-803: Introdução à Mineração de Dados – Aula 1 6
Critérios de Avaliação
� Frequência: Indispensável.
� Horário das aulas: Sextas das 17:00 às 20:00h.
� Exercícios (15%):
�Revisões de artigos – pelo menos 2 artigos p/ aluno.
� Listas de Exercícios (individual).
�Tarefa especial (15%).
� Avaliação:
�Prova em Sala de Aula (40%).
�Trabalho de Conclusão (45%).
MT-803: Introdução à Mineração de Dados – Aula 1 7
Planejamento das Aulas
�Aula 1 – 09/03/2012
� Informações gerais sobre o curso:
� Ementa, metodologia, avaliação dos alunos.
�Dicas sobre como revisar e apresentar artigos 
científicos.
�Exercício: Definição de um artigo para revisão.
�Breve revisão sobre tarefas de mineração de 
dados. 
MT-803: Introdução à Mineração de Dados – Aula 1 8
Planejamento das Aulas ...
�Aula 2
�Aspectos relevantes na fase de preparação de dados.
�Fatores críticos de sucesso para mineração de dados.
�Caracterização e representação de dados.
�Problemas relacionados à qualidade dos dados:
� Valores faltantes, ruídos e redundância.
� Integração de dados de múltiplas fontes.
�Transformação (normalização) de dados.
�Abordagens para redução de dados:
� Agregação, amostragem, sintetização de dados.
MT-803: Introdução à Mineração de Dados – Aula 1 9
Planejamento das Aulas ...
�Aula 3
�Redução de Dimensionalidade:
� Aspectos relevantes.
� Projeção Aleatória, PCA, outros métodos.
�Métodos para Seleção de Atributos:
� Força Bruta (Brute-Force);
� Métodos Embedded;
� Métodos Warppers;
� Método baseado no teste do Qui-quadrado;
� Método baseado na correlação de atributos (CFS).
�Estudo de caso – comparação dos métodos acima. 
MT-803: Introdução à Mineração de Dados – Aula 1 10
Planejamento das Aulas ...
�Aula 4
�Aula Prática – Laboratório –WEKA
�Aula em laboratório cobrindo os tópicos sobre 
preparação de dados já apresentados.
MT-803: Introdução à Mineração de Dados – Aula 1 11
Planejamento das Aulas ...
�Aula 5
�Geração de Regras de Associação:
� Conceitos básicos 
� Geração de regras de associação
� O Algoritmo Apriori.
� Efeitos da distribuição do suporte nos datasets.
� Problemas na seleção de regras.
� Medidas de interesse.
� Exercício em aula.
MT-803: Introdução à Mineração de Dados – Aula 1 12
Planejamento das Aulas ...
�Aula 6
�Clusterização ou Agrupamentos de Dados:
� Conceitos e aplicações
� Tipos de dados em clusterização
� Medidas de similaridade
� Análise da qualidade de clusters gerados
� Métodos de Clusterização:
� particionamento
� Métodos hierárquicos
� Métodos baseados em densidade
� Outros métodos.
MT-803: Introdução à Mineração de Dados – Aula 1 13
Planejamento das Aulas ...
�Aula 7
�Aula Prática – Laboratório –WEKA
�Aula em laboratório cobrindo os tópicos sobre 
regras de associação e clusterização.
MT-803: Introdução à Mineração de Dados – Aula 1 14
Planejamento das Aulas ...
�Aula 8
� Introdução à Aprendizagem de Máquina
� O processo de classificação de dados.
� Principais métodos de classificação.
� Árvores de decisão.
� Entropia e ganho de informação.
� Principais algoritmos existentes (ID3, C4.5, CART).
� Escolha do atributo “split”.
� Mecanismos de poda .
MT-803: Introdução à Mineração de Dados – Aula 1 15
Planejamento das Aulas ...
�Aula 9
� Introdução à Aprendizagem de Máquina (continua)
� O Algoritmo K-NN (vizinho mais próximo)
� O algoritmo Naïve Bayes.
� Introdução às redes neurais artificiais.
� Classificador SVM (Support Vector Machine).
MT-803: Introdução à Mineração de Dados – Aula 1 16
Planejamento das Aulas ...
�Aula 10
�Aula Prática – Laboratório –WEKA
�Aula em laboratório cobrindo os tópicos sobre:
� Árvores de decisão, 
� RNA, 
� SVM, 
� Naïve Bayes,
� K-NN.
MT-803: Introdução à Mineração de Dados – Aula 1 17
Planejamento das Aulas ...
�Aula 11
�Aprendizado com classes desbalanceadas:
�O algoritmo k-vizinhos mais próximos;
�Principais métodos;
�Precisão, taxa de erro e classes desbalanceadas;
�Como descartar ou duplicar exemplos;
�Tratamento para classes desbalanceadas.
MT-803: Introdução à Mineração de Dados – Aula 1 18
Planejamento das Aulas ...
�Aula 12
�Aula Prática – Laboratório –WEKA
�Aula em laboratório cobrindo os tópicos sobre 
aprendizado com classes desbalanceadas.
MT-803: Introdução à Mineração de Dados – Aula 1 19
Planejamento das Aulas ...
�Aula 13
�Prova em sala de aula
�Assunto: todo o conteúdo sobre preparação de 
dados apresentado.
�A prova é Individual e SEM Consulta.
�Não é permitido o empréstimo de qualquer 
material.
�Usar caneta azul ou preta.
MT-803: Introdução à Mineração de Dados – Aula 1 20
Planejamento das Aulas ...
�Aula 14
�Apresentação oral dos trabalhos finais;
�Entrega de relatórios com resultados (artigo).
�Aula 15
�Apresentação oral dos trabalhos finais;
�Entrega de relatórios com resultados (artigo).
MT-803: Introdução à Mineração de Dados – Aula 1 21
Disponibilização do Material Didático
http://www.teleduc.imecc.unicamp.br/~teleduchttp://www.teleduc.imecc.unicamp.br/~teleduc
MT-803: Introdução à Mineração de Dados – Aula 1 22
Bibliografia
FAYYAD, U., HAUSSLER, D. & STOLORZ, P., Mining Scientific Data, 
Communications of the ACM, Nov. 1996, Vol. 39, No. 11, 1996, Pages 51-57.
HAN, J. & KAMBER, M. Data Mining: Concepts and Techniques, 2nd edition, 
Morgan Kaufmann, 2006.
HAND, D. J.; MANNILA, H. & SMYTH, P. Principles of Data Mining, The MIT Press, 
2001.
LIU, H.; MOTODA, H. Computational Methods of Feature Selection, 
Chapman & Hall/CRC, 2008. 419p.
MARDIA, K.V.; KENT, J.T. & BIBBY, J.M. Multivariate Analysis, Academic Press, 
1979.
PIATETSKI-SHAPIRO, G. & FRAWLEY, W.J., Knowledge Discovery in Databases. 
AAAI Press, Menlo Park, California, 1991.
PYLE, D., Data Preparation for Data Mining, Morgan Kaufmann, 1999.
REZENDE, S. O., Sistemas Inteligentes, Manole, 2003.
TAN, Pang-Ning; STEINBACH, Michael; KUMAR, Vipin. Introduction to Data 
Mining. Addison Wesley, 2006. 769p.
WITTEN, I.H. & FRANK, E., Data Mining: Practical Machine Learning Tools and
Techniques with Java Implementations, Morgan Kaufmann, 2011.
Dicas sobre 
Revisão de Artigos
MT-803: Introdução à Mineração de Dados – Aula 1 24
Critérios para avaliar uma revisão
� Entendimento:
�Compreensão sobre o problema de pesquisa e sua 
solução;
� Identificação dos pontos fracos e fortes do artigo;
�Apresentação de críticas pessoais sobre os pontos 
analisados.
� Relevância: 
�Tente identificar algum relacionamento entre o artigo 
revisado com outros artigos relacionados (citados ou 
não no artigo revisado).

Crie agora seu perfil grátis para visualizar sem restrições.