Buscar

Na atribuição de pesos para termos de indexação na RI, quando um termo aparece em todos os documentos de uma coleção acaba não sendo tão significat...

Na atribuição de pesos para termos de indexação na RI, quando um termo aparece em todos os documentos de uma coleção acaba não sendo tão significativo quanto um termo que aparece em poucos documentos. Para obter esse efeito, é necessário fazer a atribuição de pesos aos termos de indexação. Sobre este tema, marque a alternativa que contenha a afirmativa CORRETA.

a) Os pesos de termos de indexação não possuem correlação nenhuma com a importância de um termo descrevendo um documento ou os documentos de uma coleção.
b) É possível concluir que diferentes termos podem ter importâncias iguais e, portanto, podem ser ponderados de forma igual.
c) A frequência de termos (TF) de indexação é a primeira forma de atribuição de pesos e o peso de um termo é proporcional à frequência deste termo em um documento.
d) A noção por trás da frequência inversa de documentos (IDF) relaciona-se ao fato de que a indexação dos termos em um documento é obtida de uma forma mais efetiva considerando-se a especificidade de cada documento.
e) O TF leva em conta a frequência de aparecimento de um termo em todo o conjunto de documentos, ao passo que o IDF leva em consideração a frequência de um termo apenas em um documento e gera um peso diferente do mesmo termo para cada documento.

Essa pergunta também está no material:

NATURAL LANGUAGE PROCESSING - Apol 1 - Nota 90
10 pág.

Processamento de Linguagem Natural Centro Universitário UNINTERCentro Universitário UNINTER

💡 1 Resposta

User badge image

Ed Verified user icon

A alternativa correta é a letra d) A noção por trás da frequência inversa de documentos (IDF) relaciona-se ao fato de que a indexação dos termos em um documento é obtida de uma forma mais efetiva considerando-se a especificidade de cada documento. A IDF é uma técnica de atribuição de pesos que leva em consideração a frequência de um termo em toda a coleção de documentos, e não apenas em um documento específico. Ela é usada para identificar termos que são raros em uma coleção de documentos, mas que podem ser importantes para a recuperação de informações relevantes.

0
Dislike0

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

✏️ Responder

SetasNegritoItálicoSublinhadoTachadoCitaçãoCódigoLista numeradaLista com marcadoresSubscritoSobrescritoDiminuir recuoAumentar recuoCor da fonteCor de fundoAlinhamentoLimparInserir linkImagemFórmula

Para escrever sua resposta aqui, entre ou crie uma conta

User badge image

Outros materiais