Dados do tipo texto requerem extensos procedimentos de pré-processamento antes de serem aplicados à modelagem de dados.
Sobre a preparação de dados...
Dados do tipo texto requerem extensos procedimentos de pré-processamento antes de serem aplicados à modelagem de dados. Sobre a preparação de dados textuais, podemos afirmar que: I. A geração de tokens promove a remoção de sinais como pontos, vírgulas, hífens e outros diacríticos durante a análise lexical. II. Na etapa de representação é realizado o mapeamento entre termos, documentos e corpus para dados numéricos, formando um conjunto de dados que será utilizado pelos algoritmos de aprendizagem de máquina. III. O processo de redução do termo ao radical tem como objetivo encontrar os sufixos de palavras semelhantes a fim de identificá-las como únicas. IV. Na eliminação de termos irrelevantes são removidas as palavras que não fazem parte do domínio da aplicação. São verdadeiras:
A geração de tokens promove a remoção de sinais como pontos, vírgulas, hífens e outros diacríticos durante a análise lexical. Na etapa de representação é realizado o mapeamento entre termos, documentos e corpus para dados numéricos, formando um conjunto de dados que será utilizado pelos algoritmos de aprendizagem de máquina. O processo de redução do termo ao radical tem como objetivo encontrar os sufixos de palavras semelhantes a fim de identificá-las como únicas. Na eliminação de termos irrelevantes são removidas as palavras que não fazem parte do domínio da aplicação. II, III e IV, apenas. I e II, apenas. II e IV, apenas. I, apenas. I, III e IV, apenas.
Compartilhar