Baixe o app para aproveitar ainda mais
Prévia do material em texto
2. Um dataset é um conjunto de dados em que podemos aplicar algoritmos de aprendizado de máquina para extrair novas informações relevantes. Um dataset muito famoso é o de flores íris. Nele, quando utilizamos algoritmos de agrupamento, idealmente queremos separar os dados em três clusters diferentes. Assinale a alternativa que contenha a razão correta para buscarmos esse número de clusters no dataset. Resposta incorreta. A. Porque é um dataset em que cada instância tem três atributos. O dataset original tem cinco atributos: tamanho e largura de sépala, tamanho e largura de pétala e tipo de flor. Você acertou! B. Porque existem três valores diferentes para o atributo tipo de flor. Queremos agrupar os dados em três grupos diferentes, um para cada tipo de flor. Resposta incorreta. C. Porque é o número de iterações necessárias para o algoritmo convergir. O algoritmo só irá convergir quando os clusters estiverem estabilizados.
Compartilhar