MT803-2012-Aula-01-Apres+Dicas+IntroDM
20 pág.

MT803-2012-Aula-01-Apres+Dicas+IntroDM


DisciplinaIntrodução à Probabilidade e A Estatística II206 materiais1.653 seguidores
Pré-visualização4 páginas
Introdução à
Mineração de Dados
(MT-803)
Stanley Robson de Medeiros Oliveira
Professor Colaborador
IMECC \u2013 1o. Semestre de 2012
MT-803: Introdução à Mineração de Dados \u2013 Aula 1 2
Agenda
\ufffd\ufffd ApresentaApresentaçção dos ão dos AlunosAlunos + + DocenteDocente
\ufffd\ufffd FormaFormaçção + Situaão + Situaçção Atualão Atual
\ufffd\ufffd ExpectativasExpectativas
\ufffd\ufffd ApresentaApresentaçção da Disciplinaão da Disciplina
\ufffdCritérios de Avaliação
\ufffdPrograma
\ufffd\ufffd Dicas sobre revisão de artigosDicas sobre revisão de artigos
\ufffd\ufffd Breve IntroduBreve Introduçção ão àà MineraMineraçção de Dadosão de Dados
MT-803: Introdução à Mineração de Dados \u2013 Aula 1 3
Informações Gerais
\ufffdProfessor Responsável: Laecio Barros.
\ufffdProfessor Credenciado: Stanley Robson de 
Medeiros Oliveira.
\ufffdCarga Horária Semestral: 60 horas
\ufffdNúmero de Créditos: 12
MT-803: Introdução à Mineração de Dados \u2013 Aula 1 4
Metodologia
\ufffdAulas teóricas expositivas.
\ufffdDiscussões em sala de aula.
\ufffdAtividades em sala de aula.
\ufffdAulas práticas em laboratório.
\ufffdApresentação de estudos de caso.
MT-803: Introdução à Mineração de Dados \u2013 Aula 1 5
Sobre o professor
\ufffd Formação
\ufffd Graduação \u2013 Ciência da Computação (UFCG \u2013 1990).
\ufffd Mestrado \u2013 Ciência da Computação (UFCG \u2013 1996). 
\ufffd Doutorado \u2013 Mineração de Dados (Universidade de 
Alberta, Canadá \u2013 2004).
\ufffd Atuação Profissional
\ufffd Desenvolvedor (Embrapa).
\ufffd Analista de Sistemas (Embrapa).
\ufffd Pesquisador (Embrapa).
\ufffd Docência (ITI/EEP, IPEP, IBTA, Unicamp/Feagri).
MT-803: Introdução à Mineração de Dados \u2013 Aula 1 6
Critérios de Avaliação
\ufffd Frequência: Indispensável.
\ufffd Horário das aulas: Sextas das 17:00 às 20:00h.
\ufffd Exercícios (15%):
\ufffdRevisões de artigos \u2013 pelo menos 2 artigos p/ aluno.
\ufffd Listas de Exercícios (individual).
\ufffdTarefa especial (15%).
\ufffd Avaliação:
\ufffdProva em Sala de Aula (40%).
\ufffdTrabalho de Conclusão (45%).
MT-803: Introdução à Mineração de Dados \u2013 Aula 1 7
Planejamento das Aulas
\ufffdAula 1 \u2013 09/03/2012
\ufffd Informações gerais sobre o curso:
\ufffd Ementa, metodologia, avaliação dos alunos.
\ufffdDicas sobre como revisar e apresentar artigos 
científicos.
\ufffdExercício: Definição de um artigo para revisão.
\ufffdBreve revisão sobre tarefas de mineração de 
dados. 
MT-803: Introdução à Mineração de Dados \u2013 Aula 1 8
Planejamento das Aulas ...
\ufffdAula 2
\ufffdAspectos relevantes na fase de preparação de dados.
\ufffdFatores críticos de sucesso para mineração de dados.
\ufffdCaracterização e representação de dados.
\ufffdProblemas relacionados à qualidade dos dados:
\ufffd Valores faltantes, ruídos e redundância.
\ufffd Integração de dados de múltiplas fontes.
\ufffdTransformação (normalização) de dados.
\ufffdAbordagens para redução de dados:
\ufffd Agregação, amostragem, sintetização de dados.
MT-803: Introdução à Mineração de Dados \u2013 Aula 1 9
Planejamento das Aulas ...
\ufffdAula 3
\ufffdRedução de Dimensionalidade:
\ufffd Aspectos relevantes.
\ufffd Projeção Aleatória, PCA, outros métodos.
\ufffdMétodos para Seleção de Atributos:
\ufffd Força Bruta (Brute-Force);
\ufffd Métodos Embedded;
\ufffd Métodos Warppers;
\ufffd Método baseado no teste do Qui-quadrado;
\ufffd Método baseado na correlação de atributos (CFS).
\ufffdEstudo de caso \u2013 comparação dos métodos acima. 
MT-803: Introdução à Mineração de Dados \u2013 Aula 1 10
Planejamento das Aulas ...
\ufffdAula 4
\ufffdAula Prática \u2013 Laboratório \u2013WEKA
\ufffdAula em laboratório cobrindo os tópicos sobre 
preparação de dados já apresentados.
MT-803: Introdução à Mineração de Dados \u2013 Aula 1 11
Planejamento das Aulas ...
\ufffdAula 5
\ufffdGeração de Regras de Associação:
\ufffd Conceitos básicos 
\ufffd Geração de regras de associação
\ufffd O Algoritmo Apriori.
\ufffd Efeitos da distribuição do suporte nos datasets.
\ufffd Problemas na seleção de regras.
\ufffd Medidas de interesse.
\ufffd Exercício em aula.
MT-803: Introdução à Mineração de Dados \u2013 Aula 1 12
Planejamento das Aulas ...
\ufffdAula 6
\ufffdClusterização ou Agrupamentos de Dados:
\ufffd Conceitos e aplicações
\ufffd Tipos de dados em clusterização
\ufffd Medidas de similaridade
\ufffd Análise da qualidade de clusters gerados
\ufffd Métodos de Clusterização:
\ufffd particionamento
\ufffd Métodos hierárquicos
\ufffd Métodos baseados em densidade
\ufffd Outros métodos.
MT-803: Introdução à Mineração de Dados \u2013 Aula 1 13
Planejamento das Aulas ...
\ufffdAula 7
\ufffdAula Prática \u2013 Laboratório \u2013WEKA
\ufffdAula em laboratório cobrindo os tópicos sobre 
regras de associação e clusterização.
MT-803: Introdução à Mineração de Dados \u2013 Aula 1 14
Planejamento das Aulas ...
\ufffdAula 8
\ufffd Introdução à Aprendizagem de Máquina
\ufffd O processo de classificação de dados.
\ufffd Principais métodos de classificação.
\ufffd Árvores de decisão.
\ufffd Entropia e ganho de informação.
\ufffd Principais algoritmos existentes (ID3, C4.5, CART).
\ufffd Escolha do atributo \u201csplit\u201d.
\ufffd Mecanismos de poda .
MT-803: Introdução à Mineração de Dados \u2013 Aula 1 15
Planejamento das Aulas ...
\ufffdAula 9
\ufffd Introdução à Aprendizagem de Máquina (continua)
\ufffd O Algoritmo K-NN (vizinho mais próximo)
\ufffd O algoritmo Naïve Bayes.
\ufffd Introdução às redes neurais artificiais.
\ufffd Classificador SVM (Support Vector Machine).
MT-803: Introdução à Mineração de Dados \u2013 Aula 1 16
Planejamento das Aulas ...
\ufffdAula 10
\ufffdAula Prática \u2013 Laboratório \u2013WEKA
\ufffdAula em laboratório cobrindo os tópicos sobre:
\ufffd Árvores de decisão, 
\ufffd RNA, 
\ufffd SVM, 
\ufffd Naïve Bayes,
\ufffd K-NN.
MT-803: Introdução à Mineração de Dados \u2013 Aula 1 17
Planejamento das Aulas ...
\ufffdAula 11
\ufffdAprendizado com classes desbalanceadas:
\ufffdO algoritmo k-vizinhos mais próximos;
\ufffdPrincipais métodos;
\ufffdPrecisão, taxa de erro e classes desbalanceadas;
\ufffdComo descartar ou duplicar exemplos;
\ufffdTratamento para classes desbalanceadas.
MT-803: Introdução à Mineração de Dados \u2013 Aula 1 18
Planejamento das Aulas ...
\ufffdAula 12
\ufffdAula Prática \u2013 Laboratório \u2013WEKA
\ufffdAula em laboratório cobrindo os tópicos sobre 
aprendizado com classes desbalanceadas.
MT-803: Introdução à Mineração de Dados \u2013 Aula 1 19
Planejamento das Aulas ...
\ufffdAula 13
\ufffdProva em sala de aula
\ufffdAssunto: todo o conteúdo sobre preparação de 
dados apresentado.
\ufffdA prova é Individual e SEM Consulta.
\ufffdNão é permitido o empréstimo de qualquer 
material.
\ufffdUsar caneta azul ou preta.
MT-803: Introdução à Mineração de Dados \u2013 Aula 1 20
Planejamento das Aulas ...
\ufffdAula 14
\ufffdApresentação oral dos trabalhos finais;
\ufffdEntrega de relatórios com resultados (artigo).
\ufffdAula 15
\ufffdApresentação oral dos trabalhos finais;
\ufffdEntrega de relatórios com resultados (artigo).
MT-803: Introdução à Mineração de Dados \u2013 Aula 1 21
Disponibilização do Material Didático
http://www.teleduc.imecc.unicamp.br/~teleduchttp://www.teleduc.imecc.unicamp.br/~teleduc
MT-803: Introdução à Mineração de Dados \u2013 Aula 1 22
Bibliografia
FAYYAD, U., HAUSSLER, D. & STOLORZ, P., Mining Scientific Data, 
Communications of the ACM, Nov. 1996, Vol. 39, No. 11, 1996, Pages 51-57.
HAN, J. & KAMBER, M. Data Mining: Concepts and Techniques, 2nd edition, 
Morgan Kaufmann, 2006.
HAND, D. J.; MANNILA, H. & SMYTH, P. Principles of Data Mining, The MIT Press, 
2001.
LIU, H.; MOTODA, H. Computational Methods of Feature Selection, 
Chapman & Hall/CRC, 2008. 419p.
MARDIA, K.V.; KENT, J.T. & BIBBY, J.M. Multivariate Analysis, Academic Press, 
1979.
PIATETSKI-SHAPIRO, G. & FRAWLEY, W.J., Knowledge Discovery in Databases. 
AAAI Press, Menlo Park, California, 1991.
PYLE, D., Data Preparation for Data Mining, Morgan Kaufmann, 1999.
REZENDE, S. O., Sistemas Inteligentes, Manole, 2003.
TAN, Pang-Ning; STEINBACH, Michael; KUMAR, Vipin. Introduction to Data 
Mining. Addison Wesley, 2006. 769p.
WITTEN, I.H. & FRANK, E., Data Mining: Practical Machine Learning Tools and
Techniques with Java Implementations, Morgan Kaufmann, 2011.
Dicas sobre 
Revisão de Artigos
MT-803: Introdução à Mineração de Dados \u2013 Aula 1 24
Critérios para avaliar uma revisão
\ufffd Entendimento:
\ufffdCompreensão sobre o problema de pesquisa e sua 
solução;
\ufffd Identificação dos pontos fracos e fortes do artigo;
\ufffdApresentação de críticas pessoais sobre os pontos 
analisados.
\ufffd Relevância: 
\ufffdTente identificar algum relacionamento entre o artigo 
revisado com outros artigos relacionados (citados ou 
não no artigo revisado).