Buscar

. Este processo faz parte do pré-processamento de dados realizado nas etapas iniciais de um pipeline de PLN. Ao se montar um bag-of-words, por exe...

. Este processo faz parte do pré-processamento de dados realizado nas etapas iniciais de um pipeline de PLN. Ao se montar um bag-of-words, por exemplo, a maior frequência de palavras será de stopwords, pois são utilizadas o tempo todo para dar sentido ao texto. Portanto, remover stopwords reduz o ruído dos dados analisados. Durante o pré-processamento de uma base de dados textual, uma das etapas normalmente é a remoção de stopwords. Qual é a sua definição?

💡 2 Respostas

User badge image

Ed Verified user icon

Durante o pré-processamento de uma base de dados textual, a remoção de stopwords refere-se à eliminação de palavras comuns que geralmente não contribuem significativamente para a análise de texto, como artigos, preposições e conjunções. Essas palavras são removidas para reduzir o ruído nos dados e focar nas palavras mais relevantes para a análise de processamento de linguagem natural (PLN).

0
Dislike0
User badge image

Eu

C. 

Palavras irrelevantes para o conjunto de dados.


0
Dislike0

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

✏️ Responder

SetasNegritoItálicoSublinhadoTachadoCitaçãoCódigoLista numeradaLista com marcadoresSubscritoSobrescritoDiminuir recuoAumentar recuoCor da fonteCor de fundoAlinhamentoLimparInserir linkImagemFórmula

Para escrever sua resposta aqui, entre ou crie uma conta

User badge image

Outros materiais