Buscar

Ao juntarmos a indexação por frequência dos termos (TF) com a indexação por frequência inversa de documentos (IDF), obtemos o mais popular esquema ...

Ao juntarmos a indexação por frequência dos termos (TF) com a indexação por frequência inversa de documentos (IDF), obtemos o mais popular esquema de atribuição de pesos para indexação de documentos, o TF-IDF.

A Para indexarmos palavras em documentos é preferível utilizarmos apenas o TF, que leva em conta a distribuição estatística de cada termo em cada documento e se mostra mais efetivo para coleções de documentos de forma geral.
B O uso de combinações distintas dos cálculos de TF e IDF resultam em conjuntos de pesos TF-IDF diferentes e cada uma pode resultar em uma busca com maior ou menor precisão de resultados, mas sempre serão melhores do que a utilização apenas de TF ou de IDF separadamente.
C Para a criação dos pesos TF, o uso do esquema de pesos binário é o mais usado e é este esquema que foi usado em nossas demonstrações de aula.
D Ao unirmos o esquema de pesos de normalização logarítmica para TF com o esquema de pesos unitário de IDF, obtemos o principal esquema de pesos recomendados para o uso do TF-IDF.
E Durante a aplicação de TF-IDF em uma coleção de documentos, em primeiro lugar devemos calcular os pesos TF-IDF de todos os elementos, para então obtermos a matriz de frequências.

Essa pergunta também está no material:

NATURAL LANGUAGE PROCESSING - Apol 1 - Nota 90
10 pág.

Processamento de Linguagem Natural Centro Universitário UNINTERCentro Universitário UNINTER

💡 1 Resposta

User badge image

Ed Verified user icon

A alternativa correta é a letra D: Ao unirmos o esquema de pesos de normalização logarítmica para TF com o esquema de pesos unitário de IDF, obtemos o principal esquema de pesos recomendados para o uso do TF-IDF. O esquema de atribuição de pesos TF-IDF é amplamente utilizado em sistemas de recuperação de informação e é considerado um dos mais eficazes para indexação de documentos. Ele combina a frequência de um termo em um documento (TF) com a frequência inversa do termo em toda a coleção de documentos (IDF), atribuindo pesos mais altos para termos que aparecem com frequência em um documento específico, mas raramente em outros documentos da coleção.

0
Dislike0

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

✏️ Responder

SetasNegritoItálicoSublinhadoTachadoCitaçãoCódigoLista numeradaLista com marcadoresSubscritoSobrescritoDiminuir recuoAumentar recuoCor da fonteCor de fundoAlinhamentoLimparInserir linkImagemFórmula

Para escrever sua resposta aqui, entre ou crie uma conta

User badge image

Outros materiais