Clustering é um conjunto de técnicas que agrupa em subgrupos as observações contidas em um dataset. Quando pretende-se agrupar observações, estas pertencentes a um mesmo grupo e similares a observações de agrupamentos próximos. O K-means é um dos mais utilizados métodos utilizados para essa tarefa.
Qual das alternativas representa fluxo de execução da modelagem pelo K-means?
a.Pontos de baixa densidade são definidos com ruído e não agrupados; A densidade é baseada no raio especificado.
b.Protótipo é um centróide: média de grupo de pontos. Quase nunca é um ponto real de dados.
c.Protótipo baseado em medóide: ponto mais representativo. É um ponto real de dados.
d.Baseado em densidade; menos afetado por ruído; Número de grupos definido automaticamente.
A alternativa correta que representa o fluxo de execução da modelagem pelo K-means é a letra B: "Protótipo é um centróide: média de grupo de pontos. Quase nunca é um ponto real de dados." O K-means é um algoritmo de clustering que agrupa os dados em k grupos, onde k é um número pré-definido de clusters. O algoritmo começa selecionando aleatoriamente k pontos como centróides iniciais. Em seguida, cada ponto de dados é atribuído ao centróide mais próximo, formando assim os k clusters. Os centróides são recalculados como a média dos pontos em cada cluster e o processo é repetido até que a convergência seja alcançada. O protótipo é um centróide, que é a média do grupo de pontos e quase nunca é um ponto real de dados.
Para escrever sua resposta aqui, entre ou crie uma conta
Compartilhar