Ed
anteontem
Vamos analisar cada uma das alternativas para determinar qual delas está correta em relação às medidas de distância: 1. O Rank pode ser utilizado para permitir a utilização de distância binárias em dados categóricos não ordinais. - O método de rank é mais associado a dados ordinais, então essa afirmação não é precisa. 2. Similaridade de cossenos é adequada para dados esparsos, com um elevado número de dimensões. - Esta afirmação é verdadeira. A similaridade de cossenos é frequentemente utilizada em contextos de dados esparsos, como em processamento de linguagem natural e análise de texto. 3. Distância euclidiana é adequada para dados com elevada dimensão que não estejam normalizados. - A distância euclidiana pode ser afetada por escalas diferentes de variáveis, então é recomendável normalizar os dados antes de usar essa medida, especialmente em alta dimensão. Portanto, essa afirmação não é correta. 4. Distância de Jaccard é utilizada para variáveis binárias simétricas. - A distância de Jaccard é mais comumente usada para variáveis binárias, mas não necessariamente simétricas. Ela é mais adequada para dados binários não simétricos, então essa afirmação também não é precisa. Diante da análise, a alternativa correta é: "Similaridade de cossenos é adequada para dados esparsos, com um elevado número de dimensões."