Prévia do material em texto
Roteiro Aula Prática MACHINE LEARNING II Público ROTEIRO DE AULA PRÁTICA NOME DA DISCIPLINA: Machine Learning II Unidade: 1 – Métodos de Amostragem e Modelos Preditivos Aula: 3 – Modelos Supervisionados Permitir que o aluno compreenda e implemente o algoritmo de agrupamento K-means, explorando sua aplicação em um conjunto de dados bidimensional. Definição dos objetivos da aula prática: OBJETIVOS PyCharm é um ambiente de desenvolvimento integrado usado para programação em Python. Ele fornece análise de código, um depurador gráfico, um testador de unidade integrado, integração com sistemas de controle de versão e suporta desenvolvimento web com Django, que pode ser acessado em https://www.jetbrains.com/pt-br/pycharm/ SOLUÇÃO DIGITAL: Pycharm Procedimento/Atividade nº 1 Desenvolvimento de um algoritmo em Python para analisar a função do K-means. Atividade proposta: Desenvolver um algoritmo k-means, utilizando linguagem de programação Python e suas bibliotecas sklearn, matplotlib e numpy. Procedimentos para a realização da atividade: Crie um algoritmo que utilize a função K-means da biblioteca sklearn.cluster. Para este exercício, siga os passos a seguir: Para a nossa base de dados, crie as seguintes matrizes: x = [4, 5, 10, 4, 3, 11, 14, 6, 10, 12] y = [21, 19, 24, 17, 16, 25, 24, 22, 21, 21] PROCEDIMENTOS PRÁTICOS E APLICAÇÕES Públic2o · Depois da criação da base de dados, transforme-a em um conjunto de pontos. · Para encontrar o melhor valor para K, precisamos executar K-means em nosso conjunto de pontos para uma variedade de valores possíveis. Temos apenas 10 pontos de dados, então o número máximo de clusters é 10. Portanto, para cada valor K no intervalo (1,11), treinamos um modelo K-means e plotamos o resultado. · Ajuste o seu K para 2 e plote os diferentes clusters atribuídos aos dados. Avaliando os resultados: O código desenvolvido implementa a análise de agrupamento em um conjunto de dados bidimensional utilizando o algoritmo K-Means. O código deve criar um conjunto de dados representado por duas listas de valores correspondentes às coordenadas x e y. A partir desses dados, deve-se calcular a inércia para diferentes quantidades de clusters, variando de 1 a 10, e construir um gráfico que permita identificar o número ideal de clusters através do método do cotovelo (Elbow Method). Esse gráfico será fundamental para determinar o ponto em que a adição de novos clusters deixa de trazer ganhos significativos em termos de redução de inércia. Após determinar o número ideal de clusters, aplique o algoritmo K-Means para agrupar os dados e visualize os resultados em um gráfico de dispersão. Nesse gráfico, os dados devem ser apresentados com cores diferentes para cada cluster, facilitando a interpretação visual dos agrupamentos formados. Certifique-se de utilizar as bibliotecas apropriadas para manipulação e visualização de dados, como `matplotlib` e `sklearn`, garantindo que os resultados sejam claros e bem estruturados. Checklist: · Desenvolver um algoritmo usando Python e K-means. · Gerar um conjunto de dados bidimensional representado por duas listas de valores. · Plotar gráficos com o resultado do treinamento de K-means. · Avaliar os resultados. RESULTADOS Públic3o Resultados do experimento: Ao final dessa aula prática, você deverá enviar um arquivo em pdf contendo o código desenvolvido e os gráfico gerados. O arquivo não pode exceder o tamanho de 2Mb. Resultados de Aprendizagem: Como resultados dessa prática será possível compreender os fundamentos do algoritmo K- Means e o uso do método do cotovelo para determinar o número ideal de clusters. Além disso, é desenvolvidas habilidades práticas em Python, manipulando dados bidimensionais e utilizando bibliotecas como sklearn e matplotlib para análise e visualização. Públic4o image6.png image7.png image8.png image9.png image10.png image11.png image12.png image1.png image2.png image3.png image4.png image5.png