Buscar

How is IDF calculated? A term tj that appears in few documents discriminates better than one that appears in many. N is the total number of docume...

How is IDF calculated?

A term tj that appears in few documents discriminates better than one that appears in many.
N is the total number of documents and nj is the number of documents that contain the term tj.

Essa pergunta também está no material:

Representación de documentos mediante TF-IDF
7 pág.

Processamento Digital de Sinais Instituto Politécnico NacionalInstituto Politécnico Nacional

Respostas

User badge image

Ed Verified user icon

IDF (Inverse Document Frequency) é calculado usando a fórmula: IDF(tj) = log(N/nj) Onde: - tj é o termo que você deseja calcular o IDF - N é o número total de documentos no corpus - nj é o número de documentos que contêm o termo tj O IDF é usado para medir a raridade de um termo em um corpus. Quanto menor o IDF, mais comum é o termo e menos importante ele é para a pesquisa. Quanto maior o IDF, mais raro é o termo e mais importante ele é para a pesquisa.

0
Dislike0

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Responda

SetasNegritoItálicoSublinhadoTachadoCitaçãoCódigoLista numeradaLista com marcadoresSubscritoSobrescritoDiminuir recuoAumentar recuoCor da fonteCor de fundoAlinhamentoLimparInserir linkImagemFórmula

Para escrever sua resposta aqui, entre ou crie uma conta

User badge image