Buscar

GABARITO BIG DATA ANALYTIC E A TOMADA DE DECISÕES

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

31/08/2021 AVA
https://ava.uniasselvi.com.br/academico/notas_e_avaliacaoes/gabarito/645387 1/7
Avaliação
Acadêmico / Notas e Avaliações / Gabarito
Avaliação da Disciplina 
Disciplina: Big Data Analytic e a Tomada de Decisões (17324) 
Nota: 8 
Prova: 36096712
Uma das principais vantagens da clusterização baseada em MapReduce é, sem dúvida, a transparência de toda complexidade de implementação envolvida
com a distribuição dos dados entre os clusters ou mesmo a capacidade para detectar e corrigir falhas que eventualmente possam ocorrer durante o processo.
 
Relacione as técnicas com os algoritmos que as compõem, associando os itens, conforme o código abaixo:
 
I – Clusterização Paralela.
 
II – Clusterização baseada em MapReduce.
 
( ) GPMR.
 
( ) PBIRCH.
 
( ) MR-DBSCAN.
 
( ) G-DBSCAN.
 
A partir das alternativas abaixo, assinale a CORRETA: 
A) I – II – II – I.
B)   I – II – I – II. 
C)  II – I – I – II. 
D)   II – I – II – I. 
A transição da Web representou um importante mecanismo para a revolução dos dados e expôs um novo cenário de explosão e novos formatos para análise
de dados nos meios digitais.
Nesse sentido, dentre as três fases da web, qual destas representou a gênese para explosão dos dados?
 
A partir das alternativas abaixo, assinale a CORRETA:
A)  Na Web 1.0 que representou o primeiro contato dos usuários em relação à web. 
B)  Na Web 3.0 a partir da geração de conteúdo por parte do usuário e a compreensão semântica de suas atividades na rede.
C)  Na Web 2.0 onde os usuários passaram a gerar conteúdo a partir de sistemas dinâmicos. 
D)  Entre a Web 1.0 e Web 2.0 com o surgimento das primeiras redes sociais. 
A de�nição de uma arquitetura que atenda às necessidades é algo central em projetos de Big Data e pode ajudar diretamente gestores de negócio em suas
tomadas de decisão.
 
Dessa forma, em termos de projetos: que requisitos e componentes principais uma arquitetura tradicional deve ter? A partir das alternativas abaixo, assinale a
CORRETA:  
A)  Forte mecanismo de integração de dados para entregar ao gestor de negócios informações de forma transparente e única. É necessário alto
investimento em máquinas que possam suportar o armazenamento e processamento paralelo a �m de que seja possível analisar os dados e entregá-los à
camada de apresentação
Alterar modo de visualização
1
2
3
https://ava.uniasselvi.com.br/academico/notas_e_avaliacaoes
31/08/2021 AVA
https://ava.uniasselvi.com.br/academico/notas_e_avaliacaoes/gabarito/645387 2/7
camada de apresentação.

B)  Capacidade para armazenar e processar grandes volumes de dados entregando a informação certa no tempo certo. Para isso é necessário de�nir uma
camada de extração e ingestão de dados e�ciente, política de armazenamento, de�nição do tipo de análise e uma camada para apresentação de
resultados. 
C)  Alto investimento em infraestrutura para suportar as demandas de Big Data. Implementação de um sólido mecanismo de coleta e armazenamento de
dados no Hadoop para processar grandes volumes de dados em tempo real e uma camada de visualização que será útil para gestores de negócio extrair
insights.
D)   Lidar com dados de quaisquer naturezas obtidos a partir de diversas fontes (internas e externas). Implementação de estrutura que suporte
armazenamento e processamento em larga escala tanto para dados em lote quanto em �uxo contínuo. 
Para inovar, é preciso pensar fora da caixa, ser ousado, buscar por conhecimento, pesquisar, estabelecer parcerias e ter comprometimento. Isso posto, assinale
V para verdadeiro e F para falso nas a�rmações que seguem:
 
(  ) O Manual de Oslo, editado pela Organização para a Cooperação e o Desenvolvimento Econômico (OCDE, 2005), responsável pela de�nição de inovação
adotada mundialmente, fez uma alteração que expandiu o conceito de inovação, abrangendo o setor �nanceiro e acrescentando as mensurações estatísticas
da de�nição.
(  ) O Manual de Oslo fez uma alteração que expandiu o conceito de inovação, abrangendo o setor de serviços e removendo a palavra “tecnológica” da
de�nição, estabelecendo como possível, a inovação em produtos, em processos, em serviços, em marketing e em sistemas organizacionais.
(  ) “A Lei do Bem”, de�ne inovação tecnológica como a concepção de novo produto ou processo de fabricação, bem como agrega novas funcionalidades ou
características ao produto ou processo, implicando melhorias incrementais e efetivo ganho de qualidade ou produtividade.
 
Assinale a alternativa que apresenta a sequência correta de respostas:  
 A) V – V – V.
B) V – V – F.
C) F – V – V.
D) F – V – F.
Em métodos hierárquicos tradicionais a complexidade no espaço O(n²) e no tempo O(n³) é algo que limita o poder de ação dos algoritmos. E, em muitos casos,
algumas circunstâncias tornam o processo de análise extremamente oneroso ou mesmo inviável. Essa limitação tem sido evidenciada por alguns fatores,
quais destes é possível destacar?
 
A partir das alternativas abaixo, assinale a CORRETA:
A)  A exigência cada vez mais recorrente de aplicações voltadas para detecção de eventos anômalos.
B)  O volume intenso e variado de dados que estão sendo gerados e requeridos para análise. 
C)  O modelo de gestão de dados que impôs o uso de algoritmos distribuídos para ganhos de performance.
D)  O crescente número de ferramentas voltadas para Big Data que substituem as formas de análise tradicionais.
A inovação que permeia toda a organização, que se alimenta de aprendizado (ao longo da vida), que se desenvolve por meio de ferramentas e metodologias
especí�cas, que utiliza racionalmente tecnologias, que se valida por indicadores próprios, que persegue novos valores e é potencializada por meio dos novos
processos gerenciais, deve ser vista como a principal alavanca do crescimento sustentável de uma organização.
 
STAREC, Claudio (Org.). Gestão da informação, inovação e inteligência competitiva: como transformar a informação em vantagem competitiva nas
organizações. São Paulo: Saraiva, 2012.
 
Sobre inovação, analise as sentenças que seguem:
 
I - A gestão para inovação se preocupa em respeitar a cultura organizacional, utilizando o modelo mais indicado à organização.
II - Para inovar, é necessário repensar padrões e conceitos, romper barreiras e agregar valor.
III - Para que as organizações consigam efetivamente implantar a inovação, é preciso, necessariamente, que desenvolvam novas tecnologias.
 
Assinale a alternativa que apresenta a resposta correta: 
A) As sentenças II e III estão corretas.
B) As sentenças I, II e III estão corretas.
C) As sentenças I e II estão corretas.
4
5
6
31/08/2021 AVA
https://ava.uniasselvi.com.br/academico/notas_e_avaliacaoes/gabarito/645387 3/7
D) As sentenças I e III estão corretas.
As fontes de dados podem ser externas - quando se referem a fontes em que a organização não tem total controle – ou internas, quando a organização possui
total controle. Ambas são úteis para análise em Big Data, visto que podem fornecer uma visão mais ampla de como o negócio está posicionado no mercado.
Sobre a estrutura dos dados contidos nas fontes, é possível classi�car em: dados estruturados, semiestruturados e não estruturados.
 
Com base nisso, associe os itens I,II e III com as descrições correspondentes abaixo:
I – Dados estruturados.
II – Dados semiestruturados.
III – Dados não estruturados.
( ) São dados que apresentam uma estrutura �exível e autodescritiva.
( ) São dados que apresentam uma estrutura bem de�nida com tamanho �xo.
( ) São dados que não apresentam uma estrutura e são descritos em linguagem natural.
 
Assinale a alternativa que apresenta a sequência CORRETA dos itens:
A)  II – III – I.
B)  I – III – II. 
C)  I – II – III. 
D)  II – I – III. 
As técnicas de Multi Machine Clustering surgiram para otimizar e melhorar a escalabilidade e o desempenho das análises em cluster para atender às
demandas do Big Data. Em relação às técnicas de Multi Machine Clustering, o que é possível a�rmar?
 
A partir das alternativasabaixo, assinale a CORRETA:

A)  É composta pela clusterização paralela e pela clusterização baseada em MapReduce. A segunda, inclusive, torna o processo de paralelização mais
transparente para o desenvolvedor. 
B)  São mais velozes que as abordagens tradicionais de agrupamento, no entanto, a alta complexidade de implementação inviabiliza projetos de análises
mais amplos. 
C)  Apresentam como grande característica o alto poder de processamento com implementação de baixa complexidade e algoritmos como PAM, DBSCAN e
PIRBICH. 
D)  É constituída pelas técnicas de clusterização paralela e baseada em MapReduce que tornam o processo de paralelização menos complexo para o
desenvolvedor.
No dia a dia as decisões para análise de Big Data precisam ser assertivas, ou seja, é necessário saber qual o objetivo da análise para que as soluções
realmente possam atender ao real desejo da organização.
 
Nesse sentido, imagine um pequeno cenário: - Um gestor de uma grande empresa alimentícia possui diversos sistemas com grandes volumes de dados de TI
(CRM, ERP, Bases relacionais e diversos formatos de arquivos). Ele gostaria de monitorar os clientes que são mais aderentes (ou mais �éis) à empresa, com
informações mais atualizadas possíveis. O objetivo é, além de manter aqueles clientes com maior aderência, aproximar aqueles que porventura estejam um
pouco mais distantes da empresa e com real possibilidade de deixarem de ser clientes �xos.
 
Qual seria a solução mais viável para auxiliar esse gestor? A partir das alternativas abaixo, assinale a CORRETA:
A)  Aplicação de processos tradicionais de ETL e armazenamento de dados no Data Lake ou Data Warehouse. Posteriormente esses dados podem ser
processados via Hadoop MapReduce. Além disso, modelos de Machine Learning podem ser aplicados para prever se um cliente sairá ou não da empresa.

B)  Monitoramento das atividades dos clientes nas redes sociais através da coleta de dados via Spark Streaming, armazenar todos os dados (externos e
internos) no HDFS para manter uma base histórica e realizar análises preditivas atribuindo scores para mensurar a aderência do cliente à organização.

C)  Coleta dos dados estruturados utilizando o HiveQL e armazenamento em batch (lote) utilizando o HDFS do Hadoop e análise tradicional em cluster para
agrupar clientes com mais �delidade em um mesmo grupo, enquanto que outros formam um segundo grupo. 
D)  Construção de uma arquitetura de BI híbrida (lote e dados em tempo real). A coleta de dados poderia �car a cargo do Sqoop e o armazenamento de
dados a cargo do Spark. Os dados podem ser analisados por algoritmos de mineração de dados para mapear as atividades dos clientes. 
7
8
9
10
31/08/2021 AVA
https://ava.uniasselvi.com.br/academico/notas_e_avaliacaoes/gabarito/645387 4/7
A etapa de pré-processamento de dados é uma das etapas mais custosas do processo, especialmente em dados não estruturados, que são carregados de
erros advindos da linguagem humana.
 
Com base nisso, classi�que V para as sentenças verdadeiras e F para as falsas:
 
( ) O processo de Stemming visa extrair um conjunto de palavras-chave em uma sentença.
 
( ) A remoção de stopwords é necessária para eliminar termos que apenas fazem o elo de ligação entre os elementos do texto.
 
( ) Erros ortográ�cos precisam ser corrigidos para melhorar a qualidade dos dados e não penalizar a análise desses dados, é possível realizar essa correção
manualmente.
 
( ) A remoção de números e espaços em branco ou caracteres especiais, muitas vezes, não é necessária, pois não comprometem a análise.
 
( ) A ‘tokenização’ é o processo de quebrar o texto em tokens e assim extrair termos que podem ser utilizados, por exemplo, para análise de frequência.
 
A partir das alternativas abaixo, assinale a CORRETA: 
A)  F – V – V – F – V. 
B)  F – F – F – V – V.
C)   V – F – V – V – F. 
D)  F – V – V – V – V.
As métricas de segmentação representam outra classe de medidas para análise de redes sociais.
 
Em relação a essas métricas, associe os itens, conforme o código abaixo:
 
I – Coe�ciente de agrupamento.
 
II – Coesão.
 
III – Clique.
 
( ) É uma medida que representa o grau de ligação existente entre dois vértices.
 
( ) É uma medida que indica a probabilidade de formação de clusters entre os vértices.
 
( ) Quando um determinado vértice está diretamente conectado a todos os outros vértices.
 
A partir das alternativas abaixo, assinale a CORRETA: 
A)  II – I – III. 
B)  III – II – I.
C)  II – III – I. 
D)   I – II – III. 
Existem diversos métodos tradicionais que podem ser empregados para análise em cluster e são potencialmente interessantes em cenários de baixa
complexidade - com quantidade de dados reduzida.
 
Em relação aos métodos hierárquicos é CORRETO a�rmar que:
) ( )
10
11
12
31/08/2021 AVA
https://ava.uniasselvi.com.br/academico/notas_e_avaliacaoes/gabarito/645387 5/7
A)  Agrupa um conjunto de pontos de dados em uma estrutura de árvore (dendograma) e fornece boa capacidade para comunicação dos resultados. 
B)  Apresenta como vantagem a simplicidade e o fato de ser e�ciente, mesmo em situações onde o conjunto de dados é signi�cativo.
C)  De�ne aleatoriamente um ponto de partida para o parâmetro K e assim tenta otimizar o resultado ao longo das iterações.
 D)  Divide o cluster através de níveis, onde os objetos alocados nos níveis superiores da árvore são mais próximos entre si. 
“O processo de Big Data Analytics é utilizado nos negócios para descobrir padrões. Encontrar as tendências de mercado e acompanhar o comportamento do
consumidor ajuda os negócios em suas decisões estratégicas e de marketing”.
Disponível em: < https://marketingconteudo.com/big-data-analytics/ >
 
Em relação ao processo de Big Data, o que é possível a�rmar?
A partir das alternativas abaixo, assinale a CORRETA:
 A)  É interativa e constituída de etapas similares à análise tradicional, com a diferença de que pode manipular grandes conjuntos de dados em nuvem.
B)  É interativo devido às etapas de todo o processo serem independentes umas das outras, além de apresentar escopo bem reduzido, simpli�cando a
análise. 
C)  É interativo e constituído pelas etapas de extração, ingestão, transformação, limpeza, análise de dados e visualização de dados. 
D)  É considerado iterativo de baixa complexidade se comparado à análise de dados tradicional, com etapas bem de�nidas e dependentes entre si.
Em épocas passadas as empresas conviviam com certas limitações, em termos de tecnologia, para que pudessem analisar seus dados.
Por outro lado, nos dias atuais, as tecnologias possibilitaram e estimularam a produção de conteúdo.
Tendo isso em mente, classi�que V para as sentenças verdadeiras e F para as falsas:
 
( ) As empresas precisam lidar com o alto volume e variedade de dados digitais propondo soluções automáticas de análise a �m de se manterem competitivas.
( ) As empresas orientadas a dados têm à disposição uma massiva quantidade de dados, porém, em muitos casos não sabem como gerenciá-los.
( ) A elevada produção de conteúdo implica em um problema de sobrecarga de informação, evidenciando as limitações da ação humana para lidar com isso.
 
Assinale a alternativa correta:
A)   V – V – V.
B)   F – V – V.
C)   V – F – F.
D)   V – F – V.
Um processo de análise de dados pode ser representado em quatro etapas. Cada uma dessas etapas possui particularidades que vão desde a base para
implementação de análise de dados nas empresas até profundos e so�sticados mecanismos de análise dentro das organizações.
 
Em se tratando dos tipos de análises existentes, qual a opção que descreve a análise prescritiva? A partir das alternativas abaixo, assinale a CORRETA:
A)  É um tipo de análise voltado para responder apenas perguntas de situações que ainda não ocorreram, mas que provavelmente venham a ocorrer. Isso é
obtido através da criação de modelos de aprendizagem de máquina avançados.
B)  Análise prescritiva refere-se ao tipo de análise que é responsável por tomaras decisões com independência. Procura responder perguntas como: “Por
que esse evento aconteceu?” e obtém respostas através de algoritmos de classi�cação.

C)  Etapa mais avançada da análise de dados que fornece apoio à tomada de decisão de forma automatizada com mínima intervenção humana. Isso é
possível graças às experiências desenvolvidas que são aperfeiçoadas ao longo do tempo.
D)  É um processo voltado para responder perguntas do passado para inferir situações que venham a ocorrer. Por isso, a participação humana é importante
para fornecer suporte e aprimorar as decisões obtidas pelos algoritmos implementados.
Ferramentas para inovação são metodologias de apoio ao processo de criação de novas concepções. Diante disso, analise e associe os itens que seguem:
 
I – Estratégia do oceano azul
II – Brainstorming
III – Business Model Canvas
IV – Design Thinking
13
14
15
16
31/08/2021 AVA
https://ava.uniasselvi.com.br/academico/notas_e_avaliacaoes/gabarito/645387 6/7
 
(  ) Metodologia de geração de ideias sobre novos produtos, serviços e campanhas publicitárias. Foca, prioritariamente, a quantidade de ideias geradas,
desprezando a qualidade, em um primeiro momento.
(  ) Metodologia baseada em ação criativa. É um processo interativo que exige experimentação e cujo foco principal se volta para o consumidor.
(  ) Consiste em um mapa dividido em nove blocos que de�nirão, de maneira rápida e prática, o modelo de negócios de uma organização.
(  ) Apresenta uma nova maneira de pensar sobre estratégia, resultando na criação de novos espaços e na separação da concorrência.
 
Assinale a alternativa que apresenta a sequência correta de respostas: 
A) II – IV – III – I.
B) I – II – IV – III.
C) II – I – III – IV.
D) I – II – III – IV.
A demanda por pro�ssionais de análise de dados ampliou o escopo de exigências destes pro�ssionais. As empresas estão interessadas em pro�ssionais
capacitados e que tenham habilidades em trabalhar com dados. Tendo isso em mente, quais são as principais habilidades requeridas para um pro�ssional de
dados?
A partir das alternativas abaixo, assinale a CORRETA:
A)  Raciocínio lógico apurado, capacidade para extrair insights de dados não estruturados, experiência prévia em aprendizagem de máquina e pouco
conhecimento do conceito de Big Data.
B)  Domínio de técnicas de aprendizagem de máquina, amplo conhecimento em matemática, experiência com todos os tipos de dados ou banco de dados
(extração e manipulação) e amplo conhecimento do negócio.
C)  Forte capacidade analítica, amplo conhecimento em ferramentas de visualização de dados e frameworks de Big Data como Apache Spark e PowerBI e
domínio de bancos de dados não relacionais.

D)  Capacidade para manipulação de dados, conhecimentos em estatística e aprendizado de máquina, habilidades com ferramentas e/ou linguagens de
programação e capacidade para transmitir resultados.
O gerenciamento da inovação é o processo de aquisição de capacidades relevantes para melhorar o desempenho da organização.
Nesse sentido, assinale a alternativa que apresenta as cinco principais áreas de atuação do gerenciamento da inovação: 
A) Imagem, sustentabilidade, processos, serviços e oferta.
B) Oferta, processos, marca, clientes, produto.
C) Organização, estratégias, processo, recursos e aprendizado.
D) Design, projeto, produto e estratégia.
Empresas de muitos ramos têm investido em tecnologias e análise de dados para expandirem seus negócios. Em geral, que circunstâncias-chave tem
incentivado empresas a investirem parte de seus recursos em análise de dados?
 
A partir das alternativas abaixo, assinale a CORRETA:
 
A)  Melhoria dos processos de negócio, aumento de competitividade e o valor que pode ser obtido. 
B)  Automatização de processos, incentivos �scais e mão de obra barata. 
C)  Mensurar retorno de investimentos, incentivos governamentais e garantia de lucro.
D)  Algoritmos cada vez mais inteligentes, redução de mão de obra e incremento tecnológico.
Os métodos tradicionais de agrupamento (clustering) podem ser implementados por uma diversidade de algoritmos.
 
Relacione a classe de algoritmos com os métodos, associando os itens, conforme o código abaixo:
 
I – Algoritmos DIANA, ROCK.
II – Algoritmos DBSCAN, OPTICS.
III – Algoritmos Expectation-Maximization (EM), Self-Organization Map (SOM)
17
18
19
20
31/08/2021 AVA
https://ava.uniasselvi.com.br/academico/notas_e_avaliacaoes/gabarito/645387 7/7
Uniasselvi © 2021
IV – Algoritmos K-Means, CLARANS.
V – Algoritmos STING, WAVECLUSTER.
 
( ) Métodos hierárquicos.
( ) Métodos baseados em grid.
( ) Métodos de particionamento.
( ) Métodos baseados em modelos.
( ) Métodos baseados em densidade.
 
Assinale a alternativa que apresenta a sequência CORRETA:  
A)  I – V – IV – III – II. 
B)  II – V – III – IV – I.
C)  III – IV – II – I – V.
D)  I – IV – V – II – III.
Voltar

Continue navegando