quiz web Big Data Analytic e a Tomada de Decisões

•

Uniasselvi

2

0

2

0

arnaldo cesar

26/05/2021

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 3 páginas

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Big Data

5.766 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Big Data Analytic e a Tomada de Decisões
1 Os Bancos de Dados Não Relacionais (NoSQL) surgiram com o intuito de preencher
algumas lacunas advindas dos modelos relacionais. O crescente uso do Big Data nas
organizações favoreceu a difusão de bancos NoSQL.Nesse sentido, quais fatores
contribuíram para que bancos NoSQL ganhassem destaque nos últimos anos?

A partir das alternativas abaixo, assinale a CORRETA:
Resposta certa: A escalabilidade, flexibilidade para lidar com diferentes estruturas e rapidez
nas consultas.
2 Os Bancos de Dados Não Relacionais podem ser classificados em quatro grandes
grupos - aqueles que são orientados a documentos, chave-valor, colunar e orientado a
grafos.

Com base nisso, associe os itens, conforme o código abaixo:

I – Bancos NoSQL do tipo chave-valor.
II – Bancos NoSQL orientados a documentos.
III – Bancos NoSQL orientados a colunas.
IV – Bancos NoSQL orientados a grafos.

( IV ) Armazenam em nós e os relacionamentos entre nós são representados por arestas.
(III ) Armazenam os dados em formato tabular que pode conter uma família de colunas com
tamanho variável.
(I ) Armazenam os dados em um formato simples com baixíssima complexidade de
implementação.
(II ) Armazenam dados em coleções altamente escaláveis. Cada coleção pode conter dados de
diversos tipos.
3 Ao implementar soluções para Big Data é necessário pensar em uma arquitetura que
suporte a demanda do negócio. Uma das características fundamentais é saber distinguir
entre algumas opções possíveis em termos de processamento.

Com base nisso, classifique V para as sentenças verdadeiras e F para as falsas:

( V ) O processamento em batch ou em lote é um tipo de processamento útil para processar
grandes conjuntos de dados de forma eficiente.
( F ) O processamento em streaming ou em tempo real também é útil para processar grandes
conjuntos de dados e exige um servidor para armazenar as informações.
( V ) A arquitetura lambda adota tanto a forma de processamento em lote como em tempo real.

A partir das alternativas abaixo, assinale a CORRETA:

4 A análise de redes sociais envolve um conjunto de métricas para entender o
comportamento e a posição dos indivíduos dentro da rede.
Em relação às métricas de conexão, associe os itens, conforme o código abaixo:

I – Hemofilia.
II – Propinquidade.
III – Multiplexidade.
IV – Mutualidade.

(III ) Está relacionada a identificar a força do relacionamento entre dois atores, através das
múltiplas formas de interação entre estes em diferentes contextos.
(IV ) Uma métrica útil em situações nas quais seja necessário identificar a relação entre os
atores na rede, verificando, sobretudo, a presença de relações bidirecionais entre os vértices.
(II ) É uma métrica necessária para tentar extrair a tendência de um dado ator adquirir uma
nova relação com outros atores na rede através de uma aproximação geográfica.
(I ) Adequado para casos onde desejamos verificar a semelhança entre os atores da rede
através de parâmetros (ou variáveis) definidas previamente, ou seja, antes da aplicação da
análise . A partir das alternativas abaixo, assinale a CORRETA:

5 As métricas de distribuição representam um outro conjunto de métricas para análise
de redes sociais.
Em relação a essas métricas, associe os itens, conforme o código abaixo:

I – Densidade.
II – Centralidade.
III – Força de conexão.
IV – Distância.

(II ) É uma das métricas mais conhecidas para análise de redes e visa identificar os atores mais
importantes dentro de uma rede.
( III ) Avalia circunstâncias sociais ou emocionais para mensurar a conexão entre atores, por
meio de pesos inseridos nos relacionamentos.
(IV ) Basicamente é uma medida que realiza a contagem do número de arestas para sair de um
determinado ator A até um ator destino B.
( I ) O resultado dessa medida é obtido por meio da taxa entre o número total de relações que
uma rede tem em relação ao total de relações possíveis.

A partir das alternativas abaixo, assinale a CORRETA:

6 A centralidade é uma métrica de distribuição que, por conta do seu raio de atuação,
pode ser classificada a partir de várias métricas. Considerando isso, associe os itens,
conforme o código abaixo.

I – Grau de centralidade.
II – Centralidade de proximidade.
III – Centralidade de autovalor.
IV – Centralidade betweeness.

(III ) É possível medir a influência de um ator na rede, por meio de um score, que é atribuído
por outros atores influentes (scores elevados) na rede.
( I ) O foco é identificar atores (vértices) que possuem relacionamento direto entre si. O
relacionamento pode ser medido pelo grau de entrada e saída desses vértices.
( IV ) Verifica para cada vértice o total de caminhos mais curtos que passam através deste, e,
em seguida, realiza a contagem. Os que possuem maior frequência possuem um elevado grau
de influência na rede.
( II ) Determina a distância entre os vértices de uma rede considerando o tamanho dos
caminhos mais rápidos para alcançar o destino final.
A partir das alternativas abaixo, assinale a CORRETA:

7 Uma das ferramentas mais poderosas para processamento e análise de fluxo contínuo
(streaming) de dados é o Apache Spark. A motivação para o surgimento do Spark está
relacionada a algumas limitações apresentadas na forma de processamento do Hadoop
MapReduce.
Face ao exposto, que características tornam o Apache Spark tão atrativo?
Resposta correta: Processa grandes volumes de dados de forma iterativa e em memória, o que
torna o processamento muito mais veloz se comparado ao Hadoop MapReduce, que processa
dados em disco e apresenta altas taxas de latência para processamento iterativo.

8 Sistemas IR possuem várias métricas para avaliar sua performance, dentre elas a
Precision (precisão) e a Recall (revocação). Avalie as situações abaixo:

SITUAÇÃO 1: Suponha que um usuário digitou em um mecanismo de busca a sentença: “Big
Data Analytics”. Sabe-se que existe um total de 500 documentos com potencial relevância na
base, ou seja, D = {1,2, ... ,500}. No entanto, na pesquisa foram recuperados apenas 100
documentos destes documentos relevantes.

SITUAÇÃO 2: Para o usuário dos 100 documentos que o sistema de IR julgou importantes,
apenas 10 são relevantes.

Com base nas situações expostas, o que podemos afirmar a respeito destas?
Resposta correta: A situação 1 diz respeito à medida Recall que vale 20%, enquanto que a
situação 2 refere-se à precisão que foi apenas de 10%.
9 O pré-processamento de textos consiste em um passo importante e uma das primeiras
etapas, inclusive para melhoria da qualidade dos dados que serão utilizados nas etapas
subsequentes. Considere a frase a seguir: ““Ontem ressebi 20 ligações de clientes
reclamando do produto”.
Que tipo de tarefas podem ser aplicadas para que o gestor verifique a aceitação do seu
produto no mercado, a partir dessa frase?

A partir das alternativas abaixo, assinale a CORRETA:
Extração de termos (‘tokenização’), remoção de Stopwords, e correção ortográfica do termo
‘ressebi’ e avaliação de sentimento da frase. A extração do número pode ser útil dependendo
da análise que será realizada.
10 A Internet das Coisas representa um marco importante na era atual além de ser uma
forte tendência para os próximos anos. Inúmeros dispositivos conectados à rede
representaram um ativo de informação nas empresas.
Com base nisso, o que podemos concluir sobre a Internet das Coisas?
A partir das alternativas abaixo, assinale a CORRETA:
Refere-se a uma imensidão de novos dispositivos ou “coisas” que serão conectadas entre si e
produzirão ainda mais dados, impondo novos desafios no que se refere a infraestrutura,
técnicas e análises, privacidade, dentre outras questões.