Baixe o app para aproveitar ainda mais
Prévia do material em texto
Trabalho de Aprendizado de Máquina Modelos Descritivos 1. Objetivos: a) Comparar os resultados obtidos com os algoritmos k-means e hierárquicos para um dado problema de agrupamento (clustering). b) Objetivos Específicos: • Efetuar a análise de agrupamentos em conjuntos de dados. • Aprofundar os conhecimentos em aprendizado de máquina não-supervisionado. • Verificar o comportamento dos algoritmos de agrupamento quando os seus parâmetros são alterados. • Analisar qual a melhor forma de decidir qual o melhor número de grupos para um conjunto de dados. • Comparar diferentes metodologias para algoritmos de agrupamento em uma determinada tarefa. 2. Temas: a) Usar as bases de dados nativas do weka. As equipes são de, no máximo, três alunos. O número de problemas a ser abordado por cada equipe deverá ser igual ao número de componentes da equipe. b) Cada equipe, ao escolher seu(s) problema(s), deve enviar um e-mail para o Prof. Daniel (daniel@ufersa.edu.br), confirmando se o tema ainda pode ser escolhido. Caso, dentro de dois dias, não recebam um e-mail de confirmação, por favor, entrar em contato novamente. c) Os resultados obtidos em conjunto com as análises feitas devem compor o relatório final do projeto. 3. Análise: k-means a) Executar o algoritmo k-means usando 10 valores diferentes para k (de 1 a 10). b) Plotar os valores dos erros quadráticos médios em função do valor de k. c) Escolher o valor mais indicado de k para análise posterior, justificando a escolha. • O k-means deve ser executado, pelo menos, 3 vezes com diferentes inicializações de centróide e a solução com o menor erro quadrático médio deve ser usada para análise comparativa. • Observe a matriz de confusão da partição escolhida. d) Todas as execuções devem ser feitas usando a distância euclidiana. e) Execute, também, o k-means utilizando o número correto de grupos (valor já conhecido pelos rótulos das classes). f) Discuta o comportamento dos agrupamentos com relação a mudança de grupos e compare o valor apontado como número indicado de grupos e o valor real. g) Compare o resultados com os demais algoritmos. 4. Análise: Algoritmos hierárquicos a) Executar o algoritmos hierárquico usando a ligação simples e completa. b) Utilize o número de grupos real e o número indicado pelo estudo anterior. c) Observe a matriz de confusão gerada em cada partição. d) Discuta os resultados com relação ao número de grupos escolhido e compare-os com os demais algoritmos. 5. Organização geral do trabalho a) Preparar o relatório, dedicando bastante tempo à interpretação dos resultados obtidos. b) O relatório deve conter a descrição dos problemas, das bases de dados, análise dos resultados e referencias. 6. Prazo para entrega a) O relatório deve ser apresentado e entregue até o dia 25/02.
Compartilhar