A alternativa correta é "I e III corretas". A afirmativa I está correta, pois a representação espacial de documentos textuais pode ser aplicada via modelagem Bag of Words, verificando a frequência com que as palavras são detectadas no texto, aplicando-se também a análise de sentimentos. A afirmativa II está incorreta, pois o método Bag of Words tem como base a frequência com que aparecem as palavras no texto, mas termos relevantes com frequência menor não comprometem necessariamente os resultados. A afirmativa III está correta, pois a utilização da técnica TF-IDF (frequency-inverse document frequency) propõe a penalização de palavras frequentes contabilizadas em uma determinada página. A afirmativa IV está incorreta, pois o agrupamento tem como característica a separação dos dados em cluster organizados por similaridade, mas não necessariamente de acordo com sua frequência.
Para escrever sua resposta aqui, entre ou crie uma conta
Liderança e Desenvolvimento de Equipes
•UniCesumar
Compartilhar