Na aula 5, sobre classificação e avaliação de documentos vimos as métricas de Jaro e Jaro-Winkler. A métrica de Jaro mede a distância de edição ent...
Na aula 5, sobre classificação e avaliação de documentos vimos as métricas de Jaro e Jaro-Winkler. A métrica de Jaro mede a distância de edição entre duas sequências ou termos. A métrica Jaro-Winkler é uma variante da métrica Jaro e é amplamente utilizada nas áreas de extração de informações, vinculação de registros, vinculação de entidades, uma vez que funciona bem na correspondência de nomes pessoais e de entidades. Qual das alternativas abaixo possui a declaração correta sobre os principais componentes do algoritmo de distância de Jaro? Cálculo dos comprimentos dos termos, identificação de caracteres comuns nos dois termos e contagem de transposições de caracteres. A Cálculo dos graus de similaridade, identificação de caracteres comuns nos dois termos e contagem da quantidade de aparições de um termo em um corpus. B Cálculo dos comprimentos dos termos, identificação de termos comuns no corpus e contagem da quantidade de aparições de um termo em um corpus. C Cálculo dos comprimentos dos termos, identificação de caracteres comuns nos dois termos e contagem de transposições de caracteres. D Cálculo dos graus de similaridade, identificação de caracteres comuns nos dois termos e contagem de transposições de caracteres. E Cálculo dos graus de caracteres, identificação de similaridades comuns nos termos e contagem de caracteres.
A alternativa correta é a letra D: "Cálculo dos comprimentos dos termos, identificação de caracteres comuns nos dois termos e contagem de transposições de caracteres." Isso descreve os principais componentes do algoritmo de distância de Jaro.
0
0
✏️ Responder
Para escrever sua resposta aqui, entre ou crie uma conta
Compartilhar