Mas se os valores são “Vermelho”, “Verde”, “Azul” (ou mais geralmente, algo que não tem ordem intrínseca), então simplesmente codificá-los como inteiros não funcionará. Uma possibilidade no caso é colocá-los igualmente espaçados ao redor de um círculo, desde então a distância entre qualquer par deles é a mesma.
Com N> 3valores, você pode querer colocá-los nos vértices de um simplex regular em Nespaço tridimensional. Em outras palavras, codifique-as como (1,0,…, 0), (0,1,0,…, 0),…, (0, 0, .., 0, 1). Então a distância entre qualquer par de valores é a mesma.
A principal coisa a se pensar é exatamente “qual é a definição apropriada de distância para meus dados?” Por definição, a KNN usa distâncias euclidianas. Dependendo da estrutura da sua combinação de dados numéricos e categóricos, isso pode ou não ser razoável.
Para escrever sua resposta aqui, entre ou crie uma conta.
Inteligência Artificial
•UniDBSCO
Compartilhar