Buscar

O tratamento de dados exige o conhecimento de diversas técnicas para tratá-los, por exemplo, Bag of Words, frequency-inverse document frequency, ag...

O tratamento de dados exige o conhecimento de diversas técnicas para tratá-los, por exemplo, Bag of Words, frequency-inverse document frequency, agrupamento, classificação, muitas vezes como uma preparação de dados, antes de serem utilizados em rotinas de aprendizado de máquina. Considerando essas técnicas, analise as afirmativas a seguir e selecione a opção correta.
I – A representação espacial de documentos textuais pode ser aplicada via modelagem Bag of Words, verificando a frequência com que as palavras são detectadas no texto, aplica-se também a análise de sentimentos.
II – O método Bag of Words tem como base a frequência com que aparecem as palavras no texto, entretanto termos relevantes com frequência menor podem comprometer os resultados.
III – A utilização da técnica TF–IDF (frequency-inverse document frequency) propõe a penalização de palavras frequentes contabilizadas em uma determinada página.
IV – O agrupamento tem como característica a separação dos dados em cluster organizados por similaridade de acordo com sua frequência.
II e IV corretas.
I e II corretas.
I e IV corretas.
III e IV corretas.
I e III corretas.

Essa pergunta também está no material:

ENGENHARIA, PREPARAÇÃO E VISUALIZAÇÃO DE DADOS - unidade 3
4 pág.

Análise e Desenvolvimento de Sistemas Faculdade de Desenvolvimento do Rio Grande do SulFaculdade de Desenvolvimento do Rio Grande do Sul

💡 1 Resposta

User badge image

Ed Verified user icon

A alternativa correta é "I e III corretas". A afirmativa I está correta, pois a representação espacial de documentos textuais pode ser aplicada via modelagem Bag of Words, verificando a frequência com que as palavras são detectadas no texto, aplicando-se também a análise de sentimentos. A afirmativa II está incorreta, pois o método Bag of Words tem como base a frequência com que aparecem as palavras no texto, mas termos relevantes com frequência menor não comprometem necessariamente os resultados. A afirmativa III está correta, pois a utilização da técnica TF-IDF (frequency-inverse document frequency) propõe a penalização de palavras frequentes contabilizadas em uma determinada página. A afirmativa IV está incorreta, pois o agrupamento tem como característica a separação dos dados em cluster organizados por similaridade, mas não necessariamente de acordo com sua frequência.

0
Dislike0

✏️ Responder

SetasNegritoItálicoSublinhadoTachadoCitaçãoCódigoLista numeradaLista com marcadoresSubscritoSobrescritoDiminuir recuoAumentar recuoCor da fonteCor de fundoAlinhamentoLimparInserir linkImagemFórmula

Para escrever sua resposta aqui, entre ou crie uma conta

User badge image

Outros materiais