Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 WEKA Data Mining Edilberto M. Silva Tela Inicial Introdução ! O Weka é uma coleção de algoritmos de machine learning para resolver problemas de data mining do mundo real. Os algoritmos podem ser aplicados tanto a um conjunto de dados ou chamados do seu código Java. Além disso, o Weka apresenta facilidades para desenvolvimento de novos esquemas de machine learning. Esquemas implementados para classificação: • decision tree inducers • rule learners • naive Bayes • decision tables • locally weighted regression • support vector machines • instance-based learners • logistic regression • voted perceptrons • multi-layer perceptron Esquemas implementados para predição numérica: • linear regression • model tree generators • locally weighted regression • instance-based learners • decision tables • multi-layer perceptron "meta-schemes“ implementados: • bagging • stacking • boosting • regression via classification • classification via regression • cost sensitive classification 2 Arquivo ARFF Arquivo ARFF Arquivo ARFF Arquivo ARFF ! Valores faltantes são colocados no arquivo arff com o símbolo “?”. ! Qualquer atributo pode se tornar o atributo classe. Pré - processamento Clustering 3 Associação Avaliação de atributos Visualização de dados Classificação Exercícios ! Rodar arquivo weather-nominal.arff nos classificadores ZeroR,OneR,ID3 e J48, comparar resultados obtidos. ! Rodar o arquivo labor.arff no J48 uma vez com prunning e outra vez sem prunning e comparar resultados.
Compartilhar