Buscar

trabalho_am_descritivo

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Trabalho de Aprendizado de Máquina 
Modelos Descritivos 
 
 1. Objetivos: 
 a) Comparar os resultados obtidos com os algoritmos k-means e hierárquicos para um dado 
problema de agrupamento (clustering). 
 b) Objetivos Específicos: 
• Efetuar a análise de agrupamentos em conjuntos de dados. 
• Aprofundar os conhecimentos em aprendizado de máquina não-supervisionado. 
• Verificar o comportamento dos algoritmos de agrupamento quando os seus parâmetros são 
alterados. 
• Analisar qual a melhor forma de decidir qual o melhor número de grupos para um conjunto 
de dados. 
• Comparar diferentes metodologias para algoritmos de agrupamento em uma determinada 
tarefa. 
 
 2. Temas: 
 a) Usar as bases de dados nativas do weka. As equipes são de, no máximo, três alunos. O número 
de problemas a ser abordado por cada equipe deverá ser igual ao número de componentes da 
equipe. 
 b) Cada equipe, ao escolher seu(s) problema(s), deve enviar um e-mail para o Prof. Daniel 
(daniel@ufersa.edu.br), confirmando se o tema ainda pode ser escolhido. Caso, dentro de dois 
dias, não recebam um e-mail de confirmação, por favor, entrar em contato novamente. 
 c) Os resultados obtidos em conjunto com as análises feitas devem compor o relatório final do 
projeto. 
 
 3. Análise: k-means 
 a) Executar o algoritmo k-means usando 10 valores diferentes para k (de 1 a 10). 
 b) Plotar os valores dos erros quadráticos médios em função do valor de k. 
 c) Escolher o valor mais indicado de k para análise posterior, justificando a escolha. 
• O k-means deve ser executado, pelo menos, 3 vezes com diferentes inicializações de 
centróide e a solução com o menor erro quadrático médio deve ser usada para análise 
comparativa. 
• Observe a matriz de confusão da partição escolhida. 
 d) Todas as execuções devem ser feitas usando a distância euclidiana. 
 e) Execute, também, o k-means utilizando o número correto de grupos (valor já conhecido pelos 
rótulos das classes). 
 f) Discuta o comportamento dos agrupamentos com relação a mudança de grupos e compare o 
valor apontado como número indicado de grupos e o valor real. 
 g) Compare o resultados com os demais algoritmos. 
 
 4. Análise: Algoritmos hierárquicos 
 a) Executar o algoritmos hierárquico usando a ligação simples e completa. 
 b) Utilize o número de grupos real e o número indicado pelo estudo anterior. 
 c) Observe a matriz de confusão gerada em cada partição. 
 d) Discuta os resultados com relação ao número de grupos escolhido e compare-os com os demais 
algoritmos. 
 
 5. Organização geral do trabalho 
 a) Preparar o relatório, dedicando bastante tempo à interpretação dos resultados obtidos. 
 b) O relatório deve conter a descrição dos problemas, das bases de dados, análise dos resultados e 
referencias. 
 6. Prazo para entrega 
 a) O relatório deve ser apresentado e entregue até o dia 25/02.

Outros materiais