HUMAN DATA SCIENCE N2

•

Humanas / Sociais

Ligya

28/05/2021

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

• Pergunta 1 
0 em 1 pontos 
 
Leia o excerto a seguir: 
“O TM é conhecido pela descoberta de conhecimento em bases de dados 
textuais […]. Este refere-se ao processo de extração de padrões 
interessantes ou a extração de conhecimento de documentos de texto não 
estruturados, logo é possível identificar padrões até então não visualizados 
ou intuitivos nas bases de dados textuais”. 
 
SILVA, A. J. O. Text mining e processamento de linguagem natural para 
interpretação de notas clínicas . 2016. Dissertação (Mestrado em 
Engenharia e Gestão de Sistemas de 
Informação) – Escola de Engenharia, Universidade do Minho, Braga, 2016. 
p. 16. Disponível 
em: http://repositorium.sdum.uminho.pt/handle/1822/54544. Acesso em: 22 
abr. 2021. 
 
Considerando o excerto apresentado, no que tange às etapas do text 
mining , analise as afirmativas a seguir. 
 
I. O text mining é composto basicamente de quatro etapas, sendo elas, 
respectivamente: coleta de documentos; pré-processamento; extração de 
conhecimento; e avaliação e interpretação dos resultados. 
II. Uma das etapas do text mining é a avaliação e interpretação dos 
resultados, em que pode ser necessário executar novamente as etapas 
anteriores caso os resultados não sejam satisfatórios. 
III. O text mining é composto apenas de três etapas, sendo elas, 
respectivamente: coleta de documentos, pré-processamento e avaliação e 
interpretação dos resultados. 
IV. Uma das etapas do text mining é a extração de pré-processamento, que 
gera os dados durante a extração de informação. 
 
Está correto o que se afirma em: 
 
Resposta Selecionada: 
I, II e IV, apenas. 
 
Resposta Correta: 
I e II, apenas. 
Comentário 
da resposta: 
Sua resposta está incorreta. A alternativa está incorreta, 
pois a execução do text mining pode ser composta de várias 
etapas. As quatro etapas básicas em todos os processos 
são: coleta de documentos; pré-processamento; extração de 
conhecimento; e avaliação e interpretação dos resultados. 
Nesta última, se não for obtido o resultado esperado, será 
necessário retomar as outras etapas, a fim de produzir 
resultados satisfatórios. 
 
 
• Pergunta 2 
1 em 1 pontos 
 
Leia o excerto a seguir: 
“Existem alguns fatores que exercem influência direta no processo decisório. 
Antes de existir o problema, já existem estes fatores e, quando o problema 
surge, o mesmo é inserido em um cenário onde estes fatores estão 
embutidos. Normalmente, estes fatores não fazem parte das variáveis que 
compõem o problema, ou mesmo das alternativas propostas para a solução 
do mesmo, porém, estes fatores estão sempre presentes e exercem 
influência na solução do problema”. 
 
BISPO, C. A. F. Uma análise da nova geração de sistemas de apoio à 
decisão . 1998. Dissertação (Mestrado em Engenharia da Produção) – 
Escola de Engenharia de São Carlos, Universidade de São Paulo, São 
Carlos, 1998. p. 45. Disponível 
em: teses.usp.br/teses/disponiveis/18/18140/tde-04042004-
152849/publico/dissertacao_carlos.pdf. Acesso em: 14 abr. 2021. 
 
Considerando os conhecimentos estudados e o texto apresentado sobre a 
tomada de decisão e sua abrangência quanto às informações gerenciais, 
assinale a alternativa correta. 
 
Resposta 
Selecionada: 
 
A informação é o melhor insumo para tomada de 
decisão. 
Resposta Correta: 
A informação é o melhor insumo para tomada de 
decisão. 
Comentário 
da resposta: 
Resposta correta. A alternativa está correta, uma vez que a 
informação é a fonte das melhores decisões, pois considera 
fatos e problemas de forma analítica. Logo, a partir da 
informação, é possível se ter um maior domínio do meio 
para, assim, chegar à tomada de decisão mais eficiente. 
 
 
• Pergunta 3 
1 em 1 pontos 
 
Leia o excerto a seguir. 
“A sigla ETL significa Extração, Transformação e Carga (em inglês Extract, 
Transform and Load ) e visa trabalhar com toda a parte de extração de dados 
de fontes externas, transformação para atender às necessidades de negócios 
e carga dos dados dentro do Data Warehouse . ETL é uma das etapas mais 
importantes do projeto, sendo necessária bastante atenção na integridade 
dos dados a serem carregados em um Data Warehouse ”. 
 
LYRA, A. L. B. 
Uso de um processo ETL em um modelo data warehouse para a geração 
de dashboards de indicadores de redes de telefonia celular . 2016. 
Projeto (Graduação em Engenharia Eletrônica e de Computação) – 
Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2016. p. 19. 
Disponível 
em: http://monografias.poli.ufrj.br/monografias/monopoli10018211.pdf. Acesso 
em: 22 abr. 2021. 
 
 
A partir do texto apresentado e do conteúdo estudado, analise as afirmativas 
a seguir: 
 
I. Extração é a etapa de coleta de dados apenas de sistemas que tenham 
base de dados, extraindo-os e transferindo-os para a etapa seguinte. 
II. Na etapa de extração, são realizados os devidos ajustes dos dados, 
aplicando-se uma série de regras ou funções para, assim, melhorar a 
qualidade dos dados e consolidar dados de duas ou mais fontes. 
III. O processo de carga consiste em carregar periodicamente os dados, após 
sua extração e transformação, em um repositório. 
IV. O processo de extração recupera e armazena os dados em uma staging 
area 
em que o processo de ETL pode operar. 
 
Está correto o que se afirma em: 
Resposta Selecionada: 
III e IV, apenas. 
 
Resposta Correta: 
III e IV, apenas. 
 
Comentário 
da resposta: 
Resposta correta. A alternativa está correta, pois o processo 
de extração recupera todos os dados em uma staging area; 
depois, esses dados são transformados e a carga ocorre 
periodicamente, levando os dados para um determinado 
repositório, geralmente um data warehouse. 
 
 
• Pergunta 4 
1 em 1 pontos 
 
Leia o excerto a seguir: 
Análise de sentimentos ou mineração de opinião é um tópico e pesquisa 
relativamente novo no processo de linguagem natural, que vem ganhando 
muita atenção dado o crescimento das redes sociais. Uma tarefa comum na 
análise de sentimentos é a classificação dos textos. Nessa tarefa, um texto, 
uma sentença ou uma opinião pode ser classificada como positiva, negativa 
ou neutra. 
 
BALAGE FILHO, P.; PARDO, T. A. S.; ALUÍSIO, S. An Evaluation of the 
Brazilian Portuguese LIWC Dictionary for Sentiment Analysis. In : 
BRAZILIAN SYMPOSIUM IN INFORMATION AND HUMAN LANGUAGE 
TECHNOLOGY, 9., 2013, Fortaleza. Proceedings [...]. Fortaleza: SBC, 
2013. Disponível em: https://www.aclweb.org/anthology/W13-
4829.pdf. Acesso em: 22 abr. 2021. 
 
Tendo em vista o respectivo texto, assinale a alternativa correta. 
 
Resposta 
Selecionada: 
 
A classificação de textos em polaridades é uma tarefa 
comum na análise de sentimentos. 
Resposta Correta: 
A classificação de textos em polaridades é uma tarefa 
comum na análise de sentimentos. 
Comentário 
da resposta: 
Resposta correta. A alternativa está correta, pois, para gerar 
predições em textos, é necessário agrupá-los em 
classificações que os tornem passíveis de aplicação de 
algoritmos. Os algoritmos, por sua vez, analisam as 
predições em textos, fazendo o agrupamento para 
identificar padrões. 
 
• Pergunta 5 
1 em 1 pontos 
 
Leia o excerto a seguir: 
“O TM pode ser aplicado aos mais diversos tipos de documentos, com 
extensões diferentes. Podem ser documentos HTML, PDF, XML, .doc ou um 
simples .txt. Para extrair informação de uma grande quantidade de 
documentos é necessário processá-los previamente. Existem diversas 
técnicas que são utilizadas na etapa de pré-processamento”. 
 
RODRIGUES, H. J. F. Ferramenta para text mining em textos 
completos . 2016. Dissertação (Mestrado em Engenharia Informática e 
Computação) – Faculdade de Engenharia, Universidade do Porto, Porto, 
2016. p. 45. Disponível em: https://repositorio-
aberto.up.pt/handle/10216/85394. Acesso em: 22 abr. 2021. 
 
A respeito das técnicas para diminuir a quantidade de dados em um 
processo e text mining , analise as afirmativas a seguir e assinaleV para 
a(s) verdadeira(s) e F para a(s) falsa(s). 
 
I. ( ) Duas das técnicas são a stopwords removal , que retira palavras sem 
significado, que não oferecem informação adicional, e stemming , 
que é o processo de reduzir as palavras à sua origem. 
II. ( ) Duas das técnicas são a stopwords removal , que retira palavras com 
significado, que oferecem informação adicional, e stemming , que é o 
processo de reduzir as palavras à sua origem. 
III. ( ) Uma das técnicas é a stopwords removal, que retira palavras como 
artigos, preposições e conjunções. 
IV. ( ) Uma das técnicas é a stemming , que tem por desvantagem a retirada 
de palavras que têm a mesma raiz, mas significados diferentes. 
 
Assinale a alternativa que apresenta a sequência correta. 
 
Resposta Selecionada: 
V, F, V, V. 
Resposta Correta: 
V, F, V, V. 
 
Comentário 
da resposta: 
Resposta correta. A alternativa está correta, pois a 
técnica stopwords retira palavras sem significado, como 
artigos, preposições, etc., e a técnica stemming reduz as 
palavras à sua origem, tendo a desvantagem de existirem 
palavras que tenham a mesma origem com significados 
diferentes, como os termos 
ingleses desert e dessert, palavras cuja raiz é “des”, mas os 
significados são completamente distintos. 
 
• Pergunta 6 
1 em 1 pontos 
 
Leia o excerto a seguir. 
“[…] os primeiros Sistemas de Apoio à Decisão (SAD) surgiram nos anos 60 
e 70, para dar suporte aos gerentes na solução de problemas gerenciais 
não estruturados. Estes SADs pioneiros eram muitos caros, de uso muito 
específico e difíceis de se operar; talvez por isso não tenha havido maiores 
investimentos neste setor”. 
 
BISPO, C. A. F. Uma análise da nova geração de sistemas de apoio à 
decisão . 1998. Dissertação (Mestrado em Engenharia da Produção) – 
Escola de Engenharia de São Carlos, Universidade de São Paulo, São 
Carlos, 1998. p. 47. Disponível 
em: teses.usp.br/teses/disponiveis/18/18140/tde-04042004-
152849/publico/dissertacao_carlos.pdf. Acesso em: 14 abr. 2021. 
 
Quanto ao texto apresentado, analise as afirmativas a seguir, em relação 
aos sistemas de tomada de decisão. 
 
I. Os sistemas de apoio à decisão (SAD) fornecem aos executivos diversas 
ferramentas de modelagem e análise sobre informações obtidas de diversas 
fontes de dados na empresa. 
II. Os sistemas de apoio à decisão (SAD) fornecem aos executivos diversas 
ferramentas com informações não estruturadas obtidas de diversas fontes 
de dados na empresa. 
III. As informações do SAD têm o objetivo de capacitar os usuários a 
solucionar problemas de forma integral. 
IV. As informações do SAD têm o objetivo de capacitar os usuários a 
solucionar problemas estruturados de forma parcial. 
 
Está correto o que se afirma em: 
 
Resposta Selecionada: 
I e III, apenas. 
Resposta Correta: 
I e III, apenas. 
Comentário 
da resposta: 
Resposta correta. A alternativa está correta, pois o SAD 
contém informações de diversas fontes, permitindo o 
trabalho com esses dados de forma a capacitar os usuários 
na solução de problemas, o que colabora para a 
 
orquestração de informações de diversas fontes de forma 
mais eficiente. 
 
• Pergunta 7 
1 em 1 pontos 
 
Leia o excerto a seguir: 
“O modelo formal de um sistema de recomendação consiste em três itens, 
um conjunto C com os usuários, um conjunto S com os itens passíveis de 
recomendação […] e uma função de utilidade u. […] A parte fundamental do 
modelo formal é a função de utilidade, que mede a utilidade de um 
item c para um usuário s . 
 
SOUZA, B. F. M. Modelos de fatoração matricial para recomendação de 
vídeos . 2012. Tese (Mestrado em Informática) – Pontifícia Universidade 
Católica do Rio de Janeiro, Rio de Janeiro, 2012. p. 77. 
 
Considerando o excerto apresentado e os conceitos sobre sistemas de 
recomendação, assinale a alternativa correta. 
 
Resposta 
Selecionada: 
 
A função de utilidade do modelo formal de 
recomendação é . 
Resposta Correta: 
A função de utilidade do modelo formal de 
recomendação é . 
Comentário 
da resposta: 
Resposta correta. A alternativa está correta, pois a função 
de utilidade u consiste na multiplicação do conjunto de 
usuários pelo conjunto de itens passíveis de recomendação, 
determinando o conjunto R de recomendações, que, por sua 
vez, vai embasar o sistema de recomendação. 
 
 
• Pergunta 8 
1 em 1 pontos 
 
O Human Data Science pode ser definido como o campo de pesquisa que 
estuda mecanismos e abordagens necessários para se gerar valor e 
descobertas a partir dos dados gerados por humanos, o que tem contribuído 
bastante, nos últimos anos, para os estudos de análises comportamentais. 
 
Considerando o excerto apresentado sobre dados comportamentais, analise 
as afirmativas a seguir: 
 
I. Uma técnica a ser utilizada na análise de dados comportamentais é a text 
mining . 
II. Dados gerados por humanos são ausentes de propriedade intelectual. 
III. Dados gerados por humanos podem se originar de meios digitais. 
IV. A técnica text mining não se aplica à análise comportamental por tratar 
apenas de textos gerados por máquinas. 
 
 
Está correto o que se afirma em: 
Resposta Selecionada: 
I e III, apenas. 
Resposta Correta: 
I e III, apenas. 
Comentário 
da resposta: 
Resposta correta. A alternativa está correta, pois a técnica 
que pode ser utilizada é a text mining, em que são gerados 
valores a partir de textos, e esses textos, advindos de dados 
humanos, podem ser originários de meios digitais, como 
fóruns de internet, listas de discussão, redes sociais, entre 
outros, isto é, meios de comunicação digital nos quais 
trafegam textos. 
 
 
• Pergunta 9 
0 em 1 pontos 
 
Leia o excerto a seguir: 
“Para realizar predições do que cada usuário irá gostar no futuro, um algoritmo user-based 
identifica correlações entre diferentes usuários com base em preferências do passado que são 
similares, ou seja, primeiro observa-se as séries históricas para tentar analisar as preferências 
presentes e futuras”. 
 
SANTOS, E. S. 
Recomendação de conteúdo em um contexto de big data . 2015. Trabalho de Conclusão de 
Curso (Bacharelado em Ciência da Computação) – Departamento Acadêmico de Computação, 
Universidade Tecnológica Federal do Paraná, Medianeira, 2015. p. 67. Disponível 
em: http://repositorio.roca.utfpr.edu.br/jspui/bitstream/1/5514/1/MD_COCIC_2015_1_01.pdf. Acesso 
em: 22 abr. 2021. 
 
Tendo em vista o texto acima e os conhecimentos estudados sobre as técnicas de recomendação 
para mineração, analise as afirmativas a seguir e assinale V para a(s) alternativa(s) verdadeira(s) e 
F para a(s) falsa(s). 
 
I. ( ) Um algoritmo user-based faz parte da abordagem de recomendação de conteúdo. 
II. ( ) Um algoritmo user-based faz parte da abordagem de filtragem colaborativa. 
III. ( ) O algoritmo de Pearson não é um exemplo de algoritmo user-based . 
IV. ( ) O algoritmo de Pearson é um exemplo de algoritmo user-based . 
 
Assinale a alternativa que apresenta a sequência correta. 
Resposta Selecionada: 
V, V, F, V. 
Resposta Correta: 
F, V, F, V. 
Comentário da 
resposta: 
Sua resposta está incorreta. A alternativa está incorreta, pois o algoritmo de 
Pearson está contido entre os algoritmos user-based, bem como compõe a 
abordagem de filtragem colaborativa; logo, é errado afirmar que o algoritmo user-
based faz parte da abordagem de recomendação de conteúdo e que o algoritmo 
de Pearson não é um exemplo de algoritmo user-based. 
 
• Pergunta 10 
1 em 1 pontos 
 
Leia o excerto a seguir. 
“A Filtragem Colaborativa constitui-se em uma das mais populares técnicas 
de recomendação, sendo utilizada em muitos sistemas existentes na 
Internet […]. A técnica se baseia na análise de preferências comuns em um 
grupo de pessoas. A essência desta técnica está na troca de experiências 
entre as pessoas que possuem interesses comuns e possuem “gostos” 
semelhantes por itens”. 
 
CAZELLA, C. S. et al . Recomendação de objetosde aprendizagem 
empregando filtragem colaborativa e competências. In : SIMPÓSIO 
BRASILEIRO DE INFORMÁTICA NA EDUCAÇÃO, 20., 2009, São 
Leopoldo. Anais […]. São Leopoldo: UNISINOS, 2009. Disponível 
em: https://www.br-ie.org/pub/index.php/sbie/article/view/1158/1061. Acesso 
em: 22 abr. 2021. 
 
Considerando o excerto apresentado e os sistemas de recomendação, 
analise as afirmativas a seguir. 
 
I. Os métodos de filtragem colaborativa são divididos em: baseados em 
modelos, que costumam dividir-se em abordagens baseadas em usuários 
ou itens, e os baseados em vizinhança. 
II. Métodos baseados em modelos utilizam o algoritmo de fatorização de 
matrizes para criação de modelos preditivos. 
III. Métodos baseados em modelos utilizam o cálculo de similaridade a partir 
das técnicas para se medir o coeficiente de correlação ou alguma medida de 
distância, como: Pearson, Cosseno, Jaccard e Spearman. 
IV. Os métodos de filtragem colaborativa são divididos em: vizinhança, que 
costumam se dividir em abordagens baseadas em usuários ou itens, e os 
baseados em modelos. 
 
Está correto o que se afirma em: 
 
Resposta Selecionada: 
II e IV, apenas. 
Resposta Correta: 
II e IV, apenas. 
Comentário 
da resposta: 
Resposta correta. A alternativa está correta, pois o método 
de filtragem colaborativa pode ser baseado em vizinhança e 
baseado em modelos, e o algoritmo utilizado para essa 
última técnica é o de fatorização de matrizes, logo as 
alternativas II e IV estão corretas.