Baixe o app para aproveitar ainda mais
Prévia do material em texto
Exercício - Mineração de textos (Text mining) 1. A mineração de texto é realizada para obter informações importantes de um texto por meio da elaboração de padrões e tendências por meio de padrões estatísticos. Quais são os benefícios da mineração de texto? A. Busca de informações implícitas em documentos, análise gradativa de grandes volumes de textos e uma melhor compreensão dos conteúdos que estão indisponíveis em documentos textuais. Por que esta resposta não é correta? Você acertou! B. Busca de informações específicas em documentos, análise qualitativa e quantitativa de grandes volumes de textos e uma melhor compreensão dos conteúdos disponíveis em documentos textuais. Por que esta resposta é a correta? Os benefícios da mineração de textos podem estar presentes em qualquer domínio que utilize textos, sendo que suas principais contribuições estão relacionadas à busca de informações específicas em documentos, à análise qualitativa e quantitativa de grandes volumes de textos e à melhor compreensão do conteúdo disponível em documentos textuais. C. Busca de informações explícitas em documentos, análise qualitativa de textos e compreensão de conteúdos que estão disponíveis em documentos na web. Por que esta resposta não é correta? D. Busca de informações específicas em documentos, análise gradual de grandes volumes de textos e uma melhor compreensão dos conteúdos disponíveis em documentos textuais. Por que esta resposta não é correta? E. Busca de informações explícitas em documentos, análise qualitativa e quantitativa de pequenos textos e uma baixa compreensão dos conteúdos disponíveis em documentos textuais. Por que esta resposta não é correta? 2. Recuperação de informação, KDT e mineração de textos têm alto grau de dependência no que diz respeito ao processamento de linguagem natural, especialmente utilizando processos de linguística computacional. Assinale a alternativa que corresponde ao processamento de linguagem natural. Você acertou! A. Faz uso de computador para interpretar e manipular palavras como parte da linguagem. Por que esta resposta é a correta? Recuperação de informação, KDT e mineração de textos têm alto grau de dependência no que diz respeito ao processamento de linguagem natural, especialmente utilizando processos de linguística computacional. O processamento de linguagem natural corresponde à utilização de computador para interpretar e manipular palavras como parte da linguagem. Na linguística são desenvolvidas ferramentas necessárias para investigar textos e extrair informação sintática e gramaticalmente classificadas destes. B. Realizar uma combinação das palavras que são variantes morfológicas em várias formas de representação. Por que esta resposta não é correta? C. Idealiza um tratamento no texto, impedindo a definição de uma estrutura compatível com as entradas dos algoritmos de mineração. Por que esta resposta não é correta? D. Impede que documentos relevantes sejam escolhidos e processados. Por que esta resposta não é correta? E. Transforma o texto em documentos para análise, sem um processamento de linguagem natural e de métodos analíticos. Por que esta resposta não é correta? 3. Qual o é objetivo principal da indexação e normalização dos textos? Você acertou! A. Facilitar a identificação de similaridade de significado entre suas palavras, considerando as variações morfológicas e problemas de sinonímia. Por que esta resposta é a correta? Nessa fase, as características dos documentos são identificadas e adicionadas. Esse processo tem como resultado a geração de um índice, tendo por objetivo ajudar a identificar a similaridade de significado entre as palavras, a partir de considerações de variedades morfológicas e problemas em relação aos sinônimos. B. Facilitar a identificação de diferentes significados entre suas palavras, considerando as variações morfológicas e problemas de processamento. Por que esta resposta não é correta? C. Facilitar, selecionar e identificar diferentes significados entre suas palavras, sem considerar as variações morfológicas e problemas de processamento. Por que esta resposta não é correta? D. Minerar, selecionar e identificar semelhantes significados entre suas palavras, sem considerar as variações morfológicas e problemas de processamento. Por que esta resposta não é correta? E. Minerar, selecionar e assimilar semelhantes significados entre suas palavras, sem considerar as variações morfológicas e problemas de processamento Por que esta resposta não é correta? 4. Qual é a finalidade da utilização da técnica de mineração de texto (Knowledge Discovery in Texts — KDT)? Você acertou! A. Identificar os padrões e conhecimentos necessários para auxiliar em tomadas de decisões. Por que esta resposta é a correta? O processo de KDT é centrado no processo de mineração de textos. É um campo multidisciplinar, envolvendo recuperação de informação, análises textuais, extração de informação, clusterização, categorização, visualização, tecnologias de base de dados e mineração de dados. B. Identifica o processo de descoberta de conhecimento, potencialmente inútil e previamente conhecido, em bases de dados desestruturadas. Por que esta resposta não é correta? C. Gerar conhecimento irrelevante para a área de negócios, o que facilita a tomada de decisões. Por que esta resposta não é correta? D. Padronizar conhecimentos não tão explícitos e menos relevantes em bases de dados estruturadas. Por que esta resposta não é correta? E. Potencializar padrões e conhecimentos, dificultando a tomada de decisões. Por que esta resposta não é correta? 5. Assinale a alternativa que representa corretamente uma das principais ferramentas de mineração de texto. A. TagCrowd, pode ser executada em computadores com sistemas operacionais como, por exemplo: Windows, Linux ou Mac OS. Se diferencia das demais por apresentar os principais conceitos no texto e o relacionamento entre eles, utilizando grafos; porém, não está disponível on-line. Por que esta resposta não é correta? B. TextAlyser, pode ser executada em computadores com sistemas operacionais como, por exemplo: Windows, Linux ou Mac OS. Se diferencia das demais por apresentar os principais conceitos no texto e o relacionamento entre eles, utilizando grafos; on-line e gratuita. Por que esta resposta não é correta? Você não acertou! C. WordCounter, uma ferramenta gratuita on-line para analisar textos destacando grupos de palavras, permitindo que o usuário descubra, de forma rápida, o assunto principal do texto que está sendo analisado, verificando as palavras e expressões utilizadas. Por que esta resposta não é correta? D. Sobek, ferramenta criada por Steven Morgan Friedman, também on-line e gratuita, que apresenta uma relação de palavras mais utilizadas em um texto, ou seja, mostra as palavras redundantes em uma lista e, tem por objetivo encontrar estatísticas de uso de palavras e termos no texto. Por que esta resposta não é correta? Resposta correta E. TextAlyser, uma ferramenta gratuita on-line que destaca grupos de palavras, permitindo ao usuário que descubra de forma ágil o principal assunto do texto que está em análise, verificando as palavras e expressões utilizadas. Por que esta resposta é a correta? Trata-se de uma ferramenta de análise de texto on-line, a qual apresenta as estatísticas detalhadas do seu texto.
Compartilhar