Banco de Dados para Big Data - Avaliação II - Individual

•

UNIASSELVI IERGS

7

0

7

0

enio ricardo de farias

27/04/2021

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 3 páginas

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Banco de Dados II

2.856 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Acadêmico:
Disciplina: Banco de Dados para Big Data ()
Avaliação: Avaliação II - Individual ( Cod.:) ( peso.:1,50)
Prova:
Nota da Prova: 7,00
Legenda: Resposta Certa   Sua Resposta Errada  
1. Big data é uma expressão relativamente nova. Com o avanço da Tecnologia da Informação e Comunicação (TIC), lidar com quantidades enormes d
tem se tornado algo comum em empresas e instituições públicas. Sobre os 3 Vs do conceito de big data, assinale a alternativa CORRETA:
 a) Volume, vaidade, variedade.
 b) Volume, velocidade, visibilidade.
 c) Veromicidade, velocidade, variedade.
 d) Volume, velocidade, variedade.
2. Ao desenvolver o processo de dados, alguns fatores devem ser levados em consideração, como necessidades especiais de posicionamento ou ace
dados e índices de domínio, além de suportar tabelas com particionamento único ou composto. Sobre o particionamento, distribuição de dados e o
de uso, associe os itens, utilizando o código a seguir:
 
I- Intervalos consecutivos de valores.
 II- Listas não ordenadas de valores.
 III- Algoritmo de hash interno.
 
(    ) Intervalo de uma tabela particionada por data.
 (    ) Uma lista de pedidos ordenadas por país.
 (    ) Hash de tabela de pedidos particionado pelo id do cliente.
 
Assinale a alternativa que apresenta a sequência CORRETA:
 a) III - II - I.
 b) I - III - I.
 c) I - II - III.
 d) II - III - I.
3. O particionamento de dados pode acontecer de maneira horizontal, vertical ou funcional. Cada um dos tipos de particionamento apresenta caracte
que irão variar em benefícios, de acordo com a estratégia a ser adotada por uma instituição. Existe um tipo de particionamento chamado de fragm
sharding. Nesse modelo, os dados são fragmentados em partes menores, chamadas de shard ou fragmento, com todos os dados do mesmo tipo j
Assinale a alternativa CORRETA que apresenta esse tipo de particionamento:
 a) Particionamento vertical.
 b) Particionamento funcional.
 c) Particionamento orbital.
 d) Particionamento horizontal.
4. O Spark é baseado no processamento distribuído de dados em memória, por meio de uma abstração chamada RDD (do inglês Resilient Distributed
Os RDDs são coleções distribuídas de elementos de dados imutáveis. Sobre esse tema, classifique V para as sentenças verdadeiras e F para as fal
(     ) O Apache PostgreSQL é considerado um framework de Big Data.
 (     ) O Apache Storm é considerado um framework de Big Data.
 (     ) O Apache Flink é considerado um framework de Big Data. 
 (     ) O Apache Hadoop é considerado um framework de Big Data.
Assinale a alternativa que apresenta a sequência CORRETA:
 
FONTE: GUEDES, Thaylon et al. Análise Online de Dados de Proveniência e de Domínio de Aplicações Spark com SAMbA. In: SBBD Companion, 201
 a) V - F - F - V.
 b) F - V - V - V.
 c) F - V - F - V.
 d) V - F - V - F.
5. O termo streaming é utilizado em diversos contextos em tecnologia, como serviços de streaming de música e vídeo, que têm como objetivo fornec
recursos em tempo real. No contexto de Big Data e dados, streaming de dados representa coleta e armazenamento em tempo real. Considerando a
ferramentas que são frameworks de streamming de dados, classifique V para as opções verdadeiras e F para as falsas:
 
(    ) MongoDB.
 (    ) Neo4J.
 (    ) Spark.
 (    ) PostgreSQL.
 
Assinale a alternativa que apresenta a sequência CORRETA:

 a) F - V - F - V.
 b) F - V - V - F.
 c) V - F - F - V.
 d) F - F - V - F.
6. Ao particionar tabelas e índices em unidades menores e mais gerenciáveis, os administradores de bancos de dados podem usar uma abordagem d
para conquistar no gerenciamento de dados. Bancos de dados distribuídos fornecem um conjunto abrangente de comandos SQL para gerenciar ta
particionamento. Sobre o tema, associe os itens, utilizando o código a seguir:
 
I- Particionamento vertical.
 II- Particionamento funcional.
 III- Particionamento horizontal.
 
(    ) Chamado de fragmentação ou sharding. Nesse modelo, os dados são fragmentados em partes menores, chamadas de shard ou fragmento, co
os dados do mesmo tipo juntos. Um exemplo seria uma enorme tabela de clientes cadastrados sendo dividida com um número X de registros de c
cada fragmento, formando um conjunto de shards.
 (    ) É uma forma diferente de particionar os dados, que seria como criar subtabelas derivadas de uma tabela central. É um uso comum na separaç
dados que sejam apenas para leitura ou consulta de outros que servem para escrita e leitura.
 (    ) Esse tipo de particionamento, diferentemente do horizontal, divide os dados de modo a deixar apenas campos ou colunas mais acessados em
partição, deixando os demais em outra partição. 
 
Assinale a alternativa que apresenta a sequência CORRETA:
 a) III - II - I.
 b) I - II - III.
 c) I - III - II.
 d) II - III - I.
7. Em seu ambiente, apesar de serem necessários apenas dois componentes para compor uma aplicação para se planejar um ambiente distribuído d
eficiência, são necessários os demais componentes utilizando o Apache Hadoop. Assinale a alternativa CORRETA que apresenta o componente qu
sistema gerenciador de dados distribuídos do Hadoop, este gerencia o armazenamento dos dados e a distribuição:
 a) PostgreSQL.
 b) Hive.
 c) Hue.
 d) HDFS.
8. A computação em nuvem é a ideia de utilizarmos, em qualquer lugar e independente de plataforma, os mais variados tipos de aplicações através d
com a mesma facilidade de tê-las instaladas em nossos próprios computadores. Sobre o particionamento de dados em nuvem, classifique V para a
sentenças verdadeiras e F para as falsas:
 
(    ) O AWS Lake é um serviço que facilita a configuração de um data lake.
 (    ) O Azure é um serviço de armazenamento em nuvem Open Source e gratuito.
 (    ) O Azure pode ter redes virtuais e também pode ser conectado à rede corporativa.
 (    ) Amazon EMR é uma plataforma de big data que oferece suporte a 19 projetos de código aberto, como Apache Spark, Hive, HBase, entre outros
Assinale a alternativa que apresenta a sequência CORRETA:
 
FONTE: RUSCHEL, Henrique; ZANOTTO, Mariana Susan; MOTA, WC da. Computação em nuvem. Curitiba, Pontifícia Universidade Católica do Paraná
 a) F - V - V - F.
 b) V - F - F - V.
 c) V - F - V - V.
 d) F - V - F - V.
9. Big Data é um termo utilizado para descrever conjuntos de dados cuja captura, armazenamento, distribuição e análise requerem métodos e tecnolo
avançadas devido a qualquer combinação de seu tamanho (volume), frequência de atualização (velocidade) e diversidade (heterogeneidade). Sobr
algoritmo MapReduce, classifique V para as sentenças verdadeiras e F para as falsas:
 
(    ) MapReduce é um modelo de programação e implementação associada a esse modelo.
 (    ) MapReduce é implementado apenas em Java.
 (    ) O Spark implementa o MapReduce.
 (    ) O Hadoop implementa o MapReduce.
 
Assinale a alternativa que apresenta a sequência CORRETA:
 
FONTE: SILVA, Fabricio Alves Barbosa da. Big data e nuvens computacionais: aplicações em saúde pública e genômica. Journal of health Informati
2, 2016.
 a) V - F - V - F.
 b) F - F - F - V.
 c) V - F - V - V.
 d) F - V - V - F.
10.O HDFS é um sistema de arquivos distribuído altamente escalável e flexível, projetado para ser tolerante a falhas mesmo quando executa em clust
hardware comum. Dentro do HDFS, segue-se uma arquitetura mestre-escravo formada por dois tipos de nós: NameNode (NN) e DataNode (DN). So
relação entre HDFS on premise e dados em nuvem, classifique V para as sentenças verdadeiras e F para as falsas:
 
(    ) O HDFS on premise atua sob demanda e só é pago quando consome.
 (    ) Para utilizar HDFS em nuvem é preciso ter equipe de suporte e espaço físico local.
 (    ) O HDFS on premise está limitado à capacidade física do hardware local.
 (    ) O HDFS on em nuvem pode ter o hardware expandido a qualquer momento.
 
Assinale a alternativa que apresenta a sequência CORRETA:
 a) F - F - F - F.
 b) F - F - V - V.
 c) F - V - V - F.
 d) V - V - F - V.
Prova finalizada com 7 acertos e 3 questões erradas.