Prévia do material em texto
• Pergunta 1 0 em 1 pontos Leia o excerto a seguir: “O TM é conhecido pela descoberta de conhecimento em bases de dados textuais […]. Este refere-se ao processo de extração de padrões interessantes ou a extração de conhecimento de documentos de texto não estruturados, logo é possível identificar padrões até então não visualizados ou intuitivos nas bases de dados textuais”. SILVA, A. J. O. Text mining e processamento de linguagem natural para interpretação de notas clínicas . 2016. Dissertação (Mestrado em Engenharia e Gestão de Sistemas de Informação) – Escola de Engenharia, Universidade do Minho, Braga, 2016. p. 16. Disponível em: http://repositorium.sdum.uminho.pt/handle/1822/54544. Acesso em: 22 abr. 2021. Considerando o excerto apresentado, no que tange às etapas do text mining , analise as afirmativas a seguir. I. O text mining é composto basicamente de quatro etapas, sendo elas, respectivamente: coleta de documentos; pré-processamento; extração de conhecimento; e avaliação e interpretação dos resultados. II. Uma das etapas do text mining é a avaliação e interpretação dos resultados, em que pode ser necessário executar novamente as etapas anteriores caso os resultados não sejam satisfatórios. III. O text mining é composto apenas de três etapas, sendo elas, respectivamente: coleta de documentos, pré-processamento e avaliação e interpretação dos resultados. IV. Uma das etapas do text mining é a extração de pré-processamento, que gera os dados durante a extração de informação. Está correto o que se afirma em: Resposta Selecionada: I, II e IV, apenas. Resposta Correta: I e II, apenas. Comentário da resposta: Sua resposta está incorreta. A alternativa está incorreta, pois a execução do text mining pode ser composta de várias etapas. As quatro etapas básicas em todos os processos são: coleta de documentos; pré-processamento; extração de conhecimento; e avaliação e interpretação dos resultados. Nesta última, se não for obtido o resultado esperado, será necessário retomar as outras etapas, a fim de produzir resultados satisfatórios. • Pergunta 2 1 em 1 pontos Leia o excerto a seguir: “Existem alguns fatores que exercem influência direta no processo decisório. Antes de existir o problema, já existem estes fatores e, quando o problema surge, o mesmo é inserido em um cenário onde estes fatores estão embutidos. Normalmente, estes fatores não fazem parte das variáveis que compõem o problema, ou mesmo das alternativas propostas para a solução do mesmo, porém, estes fatores estão sempre presentes e exercem influência na solução do problema”. BISPO, C. A. F. Uma análise da nova geração de sistemas de apoio à decisão . 1998. Dissertação (Mestrado em Engenharia da Produção) – Escola de Engenharia de São Carlos, Universidade de São Paulo, São Carlos, 1998. p. 45. Disponível em: teses.usp.br/teses/disponiveis/18/18140/tde-04042004- 152849/publico/dissertacao_carlos.pdf. Acesso em: 14 abr. 2021. Considerando os conhecimentos estudados e o texto apresentado sobre a tomada de decisão e sua abrangência quanto às informações gerenciais, assinale a alternativa correta. Resposta Selecionada: A informação é o melhor insumo para tomada de decisão. Resposta Correta: A informação é o melhor insumo para tomada de decisão. Comentário da resposta: Resposta correta. A alternativa está correta, uma vez que a informação é a fonte das melhores decisões, pois considera fatos e problemas de forma analítica. Logo, a partir da informação, é possível se ter um maior domínio do meio para, assim, chegar à tomada de decisão mais eficiente. • Pergunta 3 1 em 1 pontos Leia o excerto a seguir. “A sigla ETL significa Extração, Transformação e Carga (em inglês Extract, Transform and Load ) e visa trabalhar com toda a parte de extração de dados de fontes externas, transformação para atender às necessidades de negócios e carga dos dados dentro do Data Warehouse . ETL é uma das etapas mais importantes do projeto, sendo necessária bastante atenção na integridade dos dados a serem carregados em um Data Warehouse ”. LYRA, A. L. B. Uso de um processo ETL em um modelo data warehouse para a geração de dashboards de indicadores de redes de telefonia celular . 2016. Projeto (Graduação em Engenharia Eletrônica e de Computação) – Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2016. p. 19. Disponível em: http://monografias.poli.ufrj.br/monografias/monopoli10018211.pdf. Acesso em: 22 abr. 2021. A partir do texto apresentado e do conteúdo estudado, analise as afirmativas a seguir: I. Extração é a etapa de coleta de dados apenas de sistemas que tenham base de dados, extraindo-os e transferindo-os para a etapa seguinte. II. Na etapa de extração, são realizados os devidos ajustes dos dados, aplicando-se uma série de regras ou funções para, assim, melhorar a qualidade dos dados e consolidar dados de duas ou mais fontes. III. O processo de carga consiste em carregar periodicamente os dados, após sua extração e transformação, em um repositório. IV. O processo de extração recupera e armazena os dados em uma staging area em que o processo de ETL pode operar. Está correto o que se afirma em: Resposta Selecionada: III e IV, apenas. Resposta Correta: III e IV, apenas. Comentário da resposta: Resposta correta. A alternativa está correta, pois o processo de extração recupera todos os dados em uma staging area; depois, esses dados são transformados e a carga ocorre periodicamente, levando os dados para um determinado repositório, geralmente um data warehouse. • Pergunta 4 1 em 1 pontos Leia o excerto a seguir: Análise de sentimentos ou mineração de opinião é um tópico e pesquisa relativamente novo no processo de linguagem natural, que vem ganhando muita atenção dado o crescimento das redes sociais. Uma tarefa comum na análise de sentimentos é a classificação dos textos. Nessa tarefa, um texto, uma sentença ou uma opinião pode ser classificada como positiva, negativa ou neutra. BALAGE FILHO, P.; PARDO, T. A. S.; ALUÍSIO, S. An Evaluation of the Brazilian Portuguese LIWC Dictionary for Sentiment Analysis. In : BRAZILIAN SYMPOSIUM IN INFORMATION AND HUMAN LANGUAGE TECHNOLOGY, 9., 2013, Fortaleza. Proceedings [...]. Fortaleza: SBC, 2013. Disponível em: https://www.aclweb.org/anthology/W13- 4829.pdf. Acesso em: 22 abr. 2021. Tendo em vista o respectivo texto, assinale a alternativa correta. Resposta Selecionada: A classificação de textos em polaridades é uma tarefa comum na análise de sentimentos. Resposta Correta: A classificação de textos em polaridades é uma tarefa comum na análise de sentimentos. Comentário da resposta: Resposta correta. A alternativa está correta, pois, para gerar predições em textos, é necessário agrupá-los em classificações que os tornem passíveis de aplicação de algoritmos. Os algoritmos, por sua vez, analisam as predições em textos, fazendo o agrupamento para identificar padrões. • Pergunta 5 1 em 1 pontos Leia o excerto a seguir: “O TM pode ser aplicado aos mais diversos tipos de documentos, com extensões diferentes. Podem ser documentos HTML, PDF, XML, .doc ou um simples .txt. Para extrair informação de uma grande quantidade de documentos é necessário processá-los previamente. Existem diversas técnicas que são utilizadas na etapa de pré-processamento”. RODRIGUES, H. J. F. Ferramenta para text mining em textos completos . 2016. Dissertação (Mestrado em Engenharia Informática e Computação) – Faculdade de Engenharia, Universidade do Porto, Porto, 2016. p. 45. Disponível em: https://repositorio- aberto.up.pt/handle/10216/85394. Acesso em: 22 abr. 2021. A respeito das técnicas para diminuir a quantidade de dados em um processo e text mining , analise as afirmativas a seguir e assinaleV para a(s) verdadeira(s) e F para a(s) falsa(s). I. ( ) Duas das técnicas são a stopwords removal , que retira palavras sem significado, que não oferecem informação adicional, e stemming , que é o processo de reduzir as palavras à sua origem. II. ( ) Duas das técnicas são a stopwords removal , que retira palavras com significado, que oferecem informação adicional, e stemming , que é o processo de reduzir as palavras à sua origem. III. ( ) Uma das técnicas é a stopwords removal, que retira palavras como artigos, preposições e conjunções. IV. ( ) Uma das técnicas é a stemming , que tem por desvantagem a retirada de palavras que têm a mesma raiz, mas significados diferentes. Assinale a alternativa que apresenta a sequência correta. Resposta Selecionada: V, F, V, V. Resposta Correta: V, F, V, V. Comentário da resposta: Resposta correta. A alternativa está correta, pois a técnica stopwords retira palavras sem significado, como artigos, preposições, etc., e a técnica stemming reduz as palavras à sua origem, tendo a desvantagem de existirem palavras que tenham a mesma origem com significados diferentes, como os termos ingleses desert e dessert, palavras cuja raiz é “des”, mas os significados são completamente distintos. • Pergunta 6 1 em 1 pontos Leia o excerto a seguir. “[…] os primeiros Sistemas de Apoio à Decisão (SAD) surgiram nos anos 60 e 70, para dar suporte aos gerentes na solução de problemas gerenciais não estruturados. Estes SADs pioneiros eram muitos caros, de uso muito específico e difíceis de se operar; talvez por isso não tenha havido maiores investimentos neste setor”. BISPO, C. A. F. Uma análise da nova geração de sistemas de apoio à decisão . 1998. Dissertação (Mestrado em Engenharia da Produção) – Escola de Engenharia de São Carlos, Universidade de São Paulo, São Carlos, 1998. p. 47. Disponível em: teses.usp.br/teses/disponiveis/18/18140/tde-04042004- 152849/publico/dissertacao_carlos.pdf. Acesso em: 14 abr. 2021. Quanto ao texto apresentado, analise as afirmativas a seguir, em relação aos sistemas de tomada de decisão. I. Os sistemas de apoio à decisão (SAD) fornecem aos executivos diversas ferramentas de modelagem e análise sobre informações obtidas de diversas fontes de dados na empresa. II. Os sistemas de apoio à decisão (SAD) fornecem aos executivos diversas ferramentas com informações não estruturadas obtidas de diversas fontes de dados na empresa. III. As informações do SAD têm o objetivo de capacitar os usuários a solucionar problemas de forma integral. IV. As informações do SAD têm o objetivo de capacitar os usuários a solucionar problemas estruturados de forma parcial. Está correto o que se afirma em: Resposta Selecionada: I e III, apenas. Resposta Correta: I e III, apenas. Comentário da resposta: Resposta correta. A alternativa está correta, pois o SAD contém informações de diversas fontes, permitindo o trabalho com esses dados de forma a capacitar os usuários na solução de problemas, o que colabora para a orquestração de informações de diversas fontes de forma mais eficiente. • Pergunta 7 1 em 1 pontos Leia o excerto a seguir: “O modelo formal de um sistema de recomendação consiste em três itens, um conjunto C com os usuários, um conjunto S com os itens passíveis de recomendação […] e uma função de utilidade u. […] A parte fundamental do modelo formal é a função de utilidade, que mede a utilidade de um item c para um usuário s . SOUZA, B. F. M. Modelos de fatoração matricial para recomendação de vídeos . 2012. Tese (Mestrado em Informática) – Pontifícia Universidade Católica do Rio de Janeiro, Rio de Janeiro, 2012. p. 77. Considerando o excerto apresentado e os conceitos sobre sistemas de recomendação, assinale a alternativa correta. Resposta Selecionada: A função de utilidade do modelo formal de recomendação é . Resposta Correta: A função de utilidade do modelo formal de recomendação é . Comentário da resposta: Resposta correta. A alternativa está correta, pois a função de utilidade u consiste na multiplicação do conjunto de usuários pelo conjunto de itens passíveis de recomendação, determinando o conjunto R de recomendações, que, por sua vez, vai embasar o sistema de recomendação. • Pergunta 8 1 em 1 pontos O Human Data Science pode ser definido como o campo de pesquisa que estuda mecanismos e abordagens necessários para se gerar valor e descobertas a partir dos dados gerados por humanos, o que tem contribuído bastante, nos últimos anos, para os estudos de análises comportamentais. Considerando o excerto apresentado sobre dados comportamentais, analise as afirmativas a seguir: I. Uma técnica a ser utilizada na análise de dados comportamentais é a text mining . II. Dados gerados por humanos são ausentes de propriedade intelectual. III. Dados gerados por humanos podem se originar de meios digitais. IV. A técnica text mining não se aplica à análise comportamental por tratar apenas de textos gerados por máquinas. Está correto o que se afirma em: Resposta Selecionada: I e III, apenas. Resposta Correta: I e III, apenas. Comentário da resposta: Resposta correta. A alternativa está correta, pois a técnica que pode ser utilizada é a text mining, em que são gerados valores a partir de textos, e esses textos, advindos de dados humanos, podem ser originários de meios digitais, como fóruns de internet, listas de discussão, redes sociais, entre outros, isto é, meios de comunicação digital nos quais trafegam textos. • Pergunta 9 0 em 1 pontos Leia o excerto a seguir: “Para realizar predições do que cada usuário irá gostar no futuro, um algoritmo user-based identifica correlações entre diferentes usuários com base em preferências do passado que são similares, ou seja, primeiro observa-se as séries históricas para tentar analisar as preferências presentes e futuras”. SANTOS, E. S. Recomendação de conteúdo em um contexto de big data . 2015. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Departamento Acadêmico de Computação, Universidade Tecnológica Federal do Paraná, Medianeira, 2015. p. 67. Disponível em: http://repositorio.roca.utfpr.edu.br/jspui/bitstream/1/5514/1/MD_COCIC_2015_1_01.pdf. Acesso em: 22 abr. 2021. Tendo em vista o texto acima e os conhecimentos estudados sobre as técnicas de recomendação para mineração, analise as afirmativas a seguir e assinale V para a(s) alternativa(s) verdadeira(s) e F para a(s) falsa(s). I. ( ) Um algoritmo user-based faz parte da abordagem de recomendação de conteúdo. II. ( ) Um algoritmo user-based faz parte da abordagem de filtragem colaborativa. III. ( ) O algoritmo de Pearson não é um exemplo de algoritmo user-based . IV. ( ) O algoritmo de Pearson é um exemplo de algoritmo user-based . Assinale a alternativa que apresenta a sequência correta. Resposta Selecionada: V, V, F, V. Resposta Correta: F, V, F, V. Comentário da resposta: Sua resposta está incorreta. A alternativa está incorreta, pois o algoritmo de Pearson está contido entre os algoritmos user-based, bem como compõe a abordagem de filtragem colaborativa; logo, é errado afirmar que o algoritmo user- based faz parte da abordagem de recomendação de conteúdo e que o algoritmo de Pearson não é um exemplo de algoritmo user-based. • Pergunta 10 1 em 1 pontos Leia o excerto a seguir. “A Filtragem Colaborativa constitui-se em uma das mais populares técnicas de recomendação, sendo utilizada em muitos sistemas existentes na Internet […]. A técnica se baseia na análise de preferências comuns em um grupo de pessoas. A essência desta técnica está na troca de experiências entre as pessoas que possuem interesses comuns e possuem “gostos” semelhantes por itens”. CAZELLA, C. S. et al . Recomendação de objetosde aprendizagem empregando filtragem colaborativa e competências. In : SIMPÓSIO BRASILEIRO DE INFORMÁTICA NA EDUCAÇÃO, 20., 2009, São Leopoldo. Anais […]. São Leopoldo: UNISINOS, 2009. Disponível em: https://www.br-ie.org/pub/index.php/sbie/article/view/1158/1061. Acesso em: 22 abr. 2021. Considerando o excerto apresentado e os sistemas de recomendação, analise as afirmativas a seguir. I. Os métodos de filtragem colaborativa são divididos em: baseados em modelos, que costumam dividir-se em abordagens baseadas em usuários ou itens, e os baseados em vizinhança. II. Métodos baseados em modelos utilizam o algoritmo de fatorização de matrizes para criação de modelos preditivos. III. Métodos baseados em modelos utilizam o cálculo de similaridade a partir das técnicas para se medir o coeficiente de correlação ou alguma medida de distância, como: Pearson, Cosseno, Jaccard e Spearman. IV. Os métodos de filtragem colaborativa são divididos em: vizinhança, que costumam se dividir em abordagens baseadas em usuários ou itens, e os baseados em modelos. Está correto o que se afirma em: Resposta Selecionada: II e IV, apenas. Resposta Correta: II e IV, apenas. Comentário da resposta: Resposta correta. A alternativa está correta, pois o método de filtragem colaborativa pode ser baseado em vizinhança e baseado em modelos, e o algoritmo utilizado para essa última técnica é o de fatorização de matrizes, logo as alternativas II e IV estão corretas.