Logo Passei Direto
Buscar

Introdução à Ciência de Dados - Descoberta de Tópicos em Texto Exercício Avaliativo - Módulo de Encerramento_ Revisão da tentativa

User badge image
Viviane P

em

Ferramentas de estudo

Questões resolvidas

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Prévia do material em texto

Iniciado em terça-feira, 17 set. 2024, 17:38
Estado Finalizada
Concluída em terça-feira, 17 set. 2024, 17:42
Tempo
empregado
3 minutos 50 segundos
Notas 4,00/4,00
Avaliar 100,00 de um máximo de 100,00
Questão 1
Completo
Atingiu 1,00 de 1,00
Questão 2
Completo
Atingiu 1,00 de 1,00
Qual a importância do processo de transliteração para ASCII no exercício?
Escolha uma opção:
a. Evitar as codi�cações de caracteres UTF-8 e ISO-8859-1, que são reconhecidamente piores que as demais.
b. Evitar as codi�cações UTF-8 e ISO-8859-1, pois elas são padrões de sistemas operacionais diferentes (Linux e Windows,
respectivamente).
c. Uniformizar a codi�cação de caracteres e simpli�car o conjunto de caracteres, eliminando, por exemplo, acentuação das
palavras e outros caracteres não ASCII.
d. O KNIME só consegue trabalhar com codi�cação ASCII.
e. Nenhuma das alternativas.
Sobre os processos de transformação para letras minúsculas e remoção de caracteres especiais, marque a alternativa correta: 
a. A transformação para letras minúsculas é mais econômica em termos de memória, pois a representação dos caracteres exige
menos bytes.
b. As palavras originalmente podem ser escritas com letras maiúsculas ou minúsculas, então o processo de transformação para
minúsculas acaba sempre sendo prejudicial para as tarefas seguintes de processamento de linguagem natural por máquina. 
c. Transformar para letras minúsculas é mera convenção, podendo o processo alternativamente converter todas as letras para
maiúsculas. O importante é a padronização da escrita. 
d. Os caracteres especiais não têm nenhum valor semântico, por isso é importante retirá-los.
e. A remoção de caracteres especiais pode ser feita na fase de transliteração para ASCII, já que esta codi�cação não aceita esses
caracteres.
17/09/2024, 17:42 Exercício Avaliativo - Módulo de Encerramento: Revisão da tentativa
https://mooc41.escolavirtual.gov.br/mod/quiz/review.php?attempt=6604517&cmid=123539 1/2
Questão 3
Completo
Atingiu 1,00 de 1,00
Questão 4
Completo
Atingiu 1,00 de 1,00
A remoção de palavras pequenas permite:
Escolha uma opção:
a. Eliminar palavras que, por serem muito curtas, representam erros de escrita.
b. Diminuir o tamanho do texto, exigindo assim menos memória do computador.
c. Eliminar palavras que usualmente têm pouco valor semântico para o texto, além de erros de escrita.
d. Eliminar os caracteres especiais que não foram retidos no passo anterior.
e. Nenhuma das alternativas. 
Sobre os processos de remoção de stopwords e stemização, marque a alternativa correta: 
a. Exemplos de stopwords incluem artigos, preposições e a maioria dos substantivos. 
b. Não é possível adicionar novas stopwords à lista padrão da linguagem, por exemplo, palavras especí�cas de domínio muito
usadas nos textos que não ajudam a discriminá-los uns dos outros.
c. A stemização reduz as palavras à sua raiz, permitindo uniformizar escrita de palavras que guardam valor semântico
aproximado. 
d. A stemização, apesar de facilitar a leitura humana, di�culta o processamento por máquina. 
e. Stopwords são palavras raras em uma linguagem que, por estarem pouco presentes na maioria dos textos, não têm alto valor
discriminativo. 
17/09/2024, 17:42 Exercício Avaliativo - Módulo de Encerramento: Revisão da tentativa
https://mooc41.escolavirtual.gov.br/mod/quiz/review.php?attempt=6604517&cmid=123539 2/2

Mais conteúdos dessa disciplina