Buscar

Avaliação II - Individual

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

18/03/2024, 10:51 Avaliação II - Individual
about:blank 1/5
Prova Impressa
GABARITO | Avaliação II - Individual (Cod.:742994)
Peso da Avaliação 1,50
Prova 45424319
Qtd. de Questões 10
Acertos/Erros 10/0
Nota 10,00
O MapReduce é um modelo que foi proposto para o processamento de grandes conjuntos de dados, 
através da aplicação de tarefas independentes entre si. Programas em MapReduce são baseados em estilos de 
programação funcional, capazes de realizar processamento de grandes volumes de dados de forma paralela. 
Sobre o fluxo do MapReduce, ordene os itens a seguir:
I- Entrada.
II- Separação.
III- Mapeamento.
IV- Redução.
V- Combinação.
Assinale a alternativa CORRETA com a sequência do algoritmo MapReduce:
A I - II - III - IV - V.
B V - III - IV - I - II.
C I - II - III - V - IV.
D I - II - IV - V - III.
O HDFS é um sistema de arquivos distribuído altamente escalável e flexível, projetado para ser 
tolerante a falhas mesmo quando executa em clusters com hardware comum. Dentro do HDFS, segue-se uma 
arquitetura mestre-escravo formada por dois tipos de nós: NameNode (NN) e DataNode (DN). Sobre a 
relação entre HDFS on premise e dados em nuvem, classifique V para as sentenças verdadeiras e F para as 
falsas:
( ) O HDFS on premise atua sob demanda e só é pago quando consome.
( ) Para utilizar HDFS em nuvem é preciso ter equipe de suporte e espaço físico local.
( ) O HDFS on premise está limitado à capacidade física do hardware local.
( ) O HDFS on em nuvem pode ter o hardware expandido a qualquer momento.
Assinale a alternativa que apresenta a sequência CORRETA:
A F - F - V - V.
B V - V - F - V.
C F - F - F - F.
D F - V - V - F.
 VOLTAR
A+ Alterar modo de visualização
1
2
18/03/2024, 10:51 Avaliação II - Individual
about:blank 2/5
Os frameworks de Big Data baseados em lote são caracterizados pelo armazenamento prévio da massa 
de dados para o processamento da demanda computacional. Por outro lado, os frameworks baseados em 
tempo real não realizam o armazenamento prévio dos dados, pois nesse caso existe uma fonte responsável 
pela geração contínua de dados para o processamento. Sobre os frameworks de Big Data, classifique V para 
as sentenças verdadeiras e F para as falsas:
( ) No Hadoop, geralmente os dados de entrada e as saídas são armazenados em um sistema de arquivos.
( ) No Spark, os dados podem ser mantidos em memória para os casos de processamento iterativo.
( ) Em todos os cenários, o Hadoop tem um melhor desempenho que o Spark.
( ) O Spark e o Hadoop não podem ser integrados.
Assinale a alternativa que apresenta a sequência CORRETA:
A V - F - V - F.
B V - V - F - F.
C F - V - V - F.
D F - F - V - V.
O particionamento de dados pode acontecer de maneira horizontal, vertical ou funcional. Cada um dos 
tipos de particionamento apresenta características que irão variar em benefícios, de acordo com a estratégia a 
ser adotada por uma instituição. Existe um tipo de particionamento chamado de fragmentação ou sharding. 
Nesse modelo, os dados são fragmentados em partes menores, chamadas de shard ou fragmento, com todos 
os dados do mesmo tipo juntos. Assinale a alternativa CORRETA que apresenta esse tipo de 
particionamento:
A Particionamento vertical.
B Particionamento funcional.
C Particionamento horizontal.
D Particionamento orbital.
Ao particionar tabelas e índices em unidades menores e mais gerenciáveis, os administradores de 
bancos de dados podem usar uma abordagem de dividir para conquistar no gerenciamento de dados. Bancos 
de dados distribuídos fornecem um conjunto abrangente de comandos SQL para gerenciar tabelas de 
particionamento. Sobre o tema, associe os itens, utilizando o código a seguir:
I- Particionamento vertical.
II- Particionamento funcional.
III- Particionamento horizontal.
( ) Chamado de fragmentação ou sharding. Nesse modelo, os dados são fragmentados em partes menores, 
chamadas de shard ou fragmento, com todos os dados do mesmo tipo juntos. Um exemplo seria uma enorme 
tabela de clientes cadastrados sendo dividida com um número X de registros de clientes em cada fragmento, 
formando um conjunto de shards.
( ) É uma forma diferente de particionar os dados, que seria como criar subtabelas derivadas de uma tabela 
central. É um uso comum na separação de dados que sejam apenas para leitura ou consulta de outros que 
servem para escrita e leitura.
( ) Esse tipo de particionamento, diferentemente do horizontal, divide os dados de modo a deixar apenas 
3
4
5
18/03/2024, 10:51 Avaliação II - Individual
about:blank 3/5
campos ou colunas mais acessados em uma partição, deixando os demais em outra partição. 
Assinale a alternativa que apresenta a sequência CORRETA:
A I - III - II.
B II - III - I.
C III - II - I.
D I - II - III.
Big data é uma expressão relativamente nova. Com o avanço da Tecnologia da Informação e 
Comunicação (TIC), lidar com quantidades enormes de dados tem se tornado algo comum em empresas e 
instituições públicas. Sobre os 3 Vs do conceito de big data, assinale a alternativa CORRETA:
A Volume, velocidade, variedade.
B Volume, velocidade, visibilidade.
C Volume, vaidade, variedade.
D Veromicidade, velocidade, variedade.
O Spark é baseado no processamento distribuído de dados em memória, por meio de uma abstração 
chamada RDD (do inglês Resilient Distributed Dataset). Os RDDs são coleções distribuídas de elementos de 
dados imutáveis. Sobre esse tema, classifique V para as sentenças verdadeiras e F para as falsas:
( ) O Apache PostgreSQL é considerado um framework de Big Data.
( ) O Apache Storm é considerado um framework de Big Data.
( ) O Apache Flink é considerado um framework de Big Data. 
( ) O Apache Hadoop é considerado um framework de Big Data.
Assinale a alternativa que apresenta a sequência CORRETA:
FONTE: GUEDES, Thaylon et al. Análise Online de Dados de Proveniência e de Domínio de Aplicações 
Spark com SAMbA. In: SBBD Companion, 2018, p. 17-22.
A V - F - F - V.
B V - F - V - F.
C F - V - F - V.
D F - V - V - V.
Ao desenvolver o processo de dados, alguns fatores devem ser levados em consideração, como 
necessidades especiais de posicionamento ou acesso a dados e índices de domínio, além de suportar tabelas 
com particionamento único ou composto. Sobre o particionamento, distribuição de dados e os casos de uso, 
associe os itens, utilizando o código a seguir:
6
7
8
18/03/2024, 10:51 Avaliação II - Individual
about:blank 4/5
I- Intervalos consecutivos de valores.
II- Listas não ordenadas de valores.
III- Algoritmo de hash interno.
( ) Intervalo de uma tabela particionada por data.
( ) Uma lista de pedidos ordenadas por país.
( ) Hash de tabela de pedidos particionado pelo id do cliente.
Assinale a alternativa que apresenta a sequência CORRETA:
A I - III - I.
B I - II - III.
C III - II - I.
D II - III - I.
A computação em nuvem é a ideia de utilizarmos, em qualquer lugar e independente de plataforma, os 
mais variados tipos de aplicações através da internet com a mesma facilidade de tê-las instaladas em nossos 
próprios computadores. Sobre o particionamento de dados em nuvem, classifique V para as sentenças 
verdadeiras e F para as falsas:
( ) O AWS Lake é um serviço que facilita a configuração de um data lake.
( ) O Azure é um serviço de armazenamento em nuvem Open Source e gratuito.
( ) O Azure pode ter redes virtuais e também pode ser conectado à rede corporativa.
( ) Amazon EMR é uma plataforma de big data que oferece suporte a 19 projetos de código aberto, como 
Apache Spark, Hive, HBase, entre outros. 
Assinale a alternativa que apresenta a sequência CORRETA:
FONTE: RUSCHEL, Henrique; ZANOTTO, Mariana Susan; MOTA, WC da. Computação em nuvem. 
Curitiba, Pontifícia Universidade Católica do Paraná, 2010.
A F - V - F - V.
B V - F - F - V.
C V - F - V - V.
D F - V - V - F.
Em seu ambiente, apesar de serem necessários apenas dois componentes para compor uma aplicação 
para se planejar um ambientedistribuído de maior eficiência, são necessários os demais componentes 
utilizando o Apache Hadoop. Assinale a alternativa CORRETA que apresenta o componente que é o sistema 
gerenciador de dados distribuídos do Hadoop, este gerencia o armazenamento dos dados e a distribuição:
A HDFS.
B Hive.
C Hue.
D PostgreSQL.
9
10
18/03/2024, 10:51 Avaliação II - Individual
about:blank 5/5
Imprimir

Outros materiais