Buscar

Introdução ao Hadoop e Big Data

Prévia do material em texto

04/11/2019 EPS
simulado.estacio.br/alunos/?user_cod=1416696&matr_integracao=201602238146 1/3
 
 
 
 BANCO DE DADOS AVANÇADO 2a aula
 Lupa 
PPT
 
MP3
 
 
Exercício: CCT0395_EX_A2_201602238146_V2 04/11/2019
Aluno(a): KAIO CESAR VIEIRA DA COSTA 2019.2
Disciplina: CCT0395 - BANCO DE DADOS AVANÇADO 201602238146
 
 1a Questão
Marque a opção que apresenta 2 vantagens do Hadoop:
Rápido acesso aos dados / Aumento linear da escalabilidade
É usado mesmo quando o processamento não é paralelo / Facilita operações ETL em larga escala
Permite o trabalho com uma variedade de tipos de dados / É bom mesmo com lotes de dados pequenos
 Processa grandes volumes de dados em ambiente paralelo / Facilita a execução de agregação de grandes bancos de dados
por meio do Reduce
Permite o processamento de grandes datasets em paralelo / É bom para o processamento transacional
Respondido em 04/11/2019 17:37:39
 
 
Explicação:
Duas das prinicipais vantagens do Hadoo são o processamento massivo de grandes volumes de dados e a agregação de grandes
bancos de dados com o uso da função Reduce
 
 
 2a Questão
Marque a opção que apresenta a composição inicial do Hadoop:
HDFS e HBase
MapReduce e YARN
HDFS e Hive
 MapReduce e HDFS
YARN e HDFS
Respondido em 04/11/2019 17:37:47
 
 
Explicação:
O Hadoop tem em sua composição inicial o MapReduce e o HDFS, porém necessita de mais ferramentas para atender as
necessidades do trabalho com Big Data
 
 
 3a Questão
Sobre o MapReduce podemos afirmar que:
04/11/2019 EPS
simulado.estacio.br/alunos/?user_cod=1416696&matr_integracao=201602238146 2/3
Permite a distribuição do processamento, mas não a junção dos resultados
 É um modelo genérico de programação
Usou recursos das linguagens funcionais: Map, Reduce e C
Combina recursos existentes nas linguagens procedurais das quais se originou
A função Reduce é a responsável pelo processamento a partir das buscas em paralelo
Respondido em 04/11/2019 17:37:59
 
 
Explicação:
 
O MapReduce é um modelo genérico de programação. Ele recebeu esse nome por conta da combinação entre os recursos
existentes das linguagens funcionais que foram usadas, sendo eles o Map e o Reduce.
 
 
 
 4a Questão
São justificativas para o uso do Big Data em ambinete de computação distribuída, exceto: 
 Facilidade no gerenciamento dos recursos computacionais
 Processamento de grandes massas de dados
Flexibilidade quanto ao uso do processamento das aplicações de acordo com a real necessidade
Eliminação do ponto único de falha
Uso do paralelismo no processamento de consultas
Respondido em 04/11/2019 17:38:11
 
 
Explicação:
Há um aumento da complexidade no gerenciamento dos recursos computacionais, mas a desvantagem é superada em muito pelas
vantagens obtidas pelo uso da computação distribuída
 
 
 5a Questão
O Hadoop é?
É um projeto administrado atualmente pelo Google
 Engloba um conjunto de produtos que permite o processamento de aplicações Big Data
É um banco de dados NOSQL amplamente usado em Big Data
O projeto está apoiado em dois componentes principais: o Map e o Reduce
Um banco de dados orientado a objetos
Respondido em 04/11/2019 17:38:21
 
 
Explicação:
O Hadoop engloba um conjunto de produtos que permite processar o Big Data, por meio de um processamento de dados paralelo
nos nós de computação, com uma aceleração no processamento, com diminuição da latência e altamente escalável.
 
 
 
 6a Questão
Assinale a alternativa que NÃO apresenta 2 ferramentas ou componentes usados no framework Hadoop: 
ZooKeeper e Chukwa
MapReduce e HDFS
Ambari e Mahout
 Hive e Neo4J
Pig e Hive
Respondido em 04/11/2019 17:38:33
 
 
04/11/2019 EPS
simulado.estacio.br/alunos/?user_cod=1416696&matr_integracao=201602238146 3/3
Explicação:
O Neo4J é um banco de dados NOSQL baseado em grafos

Continue navegando