Baixe o app para aproveitar ainda mais
Prévia do material em texto
1a Questão Marque a opção que apresenta 2 vantagens do Hadoop: Processa grandes volumes de dados em ambiente paralelo / Facilita a execução de agregação de grandes bancos de dados por meio do Reduce Rápido acesso aos dados / Aumento linear da escalabilidade É usado mesmo quando o processamento não é paralelo / Facilita operações ETL em larga escala Permite o trabalho com uma variedade de tipos de dados / É bom mesmo com lotes de dados pequenos Permite o processamento de grandes datasets em paralelo / É bom para o processamento transacional Explicação: Duas das prinicipais vantagens do Hadoo são o processamento massivo de grandes volumes de dados e a agregação de grandes bancos de dados com o uso da função Reduce 2a Questão Marque a opção que apresenta a composição inicial do Hadoop: HDFS e Hive MapReduce e YARN HDFS e HBase YARN e HDFS MapReduce e HDFS Explicação: O Hadoop tem em sua composição inicial o MapReduce e o HDFS, porém necessita de mais ferramentas para atender as necessidades do trabalho com Big Data 3a Questão Sobre o MapReduce podemos afirmar que: Usou recursos das linguagens funcionais: Map, Reduce e C Permite a distribuição do processamento, mas não a junção dos resultados A função Reduce é a responsável pelo processamento a partir das buscas em paralelo É um modelo genérico de programação Combina recursos existentes nas linguagens procedurais das quais se originou Explicação: O MapReduce é um modelo genérico de programação. Ele recebeu esse nome por conta da combinação entre os recursos existentes das linguagens funcionais que foram usadas, sendo eles o Map e o Reduce. 4a Questão São justificativas para o uso do Big Data em ambinete de computação distribuída, exceto: Uso do paralelismo no processamento de consultas Flexibilidade quanto ao uso do processamento das aplicações de acordo com a real necessidade Eliminação do ponto único de falha Processamento de grandes massas de dados Facilidade no gerenciamento dos recursos computacionais Explicação: Há um aumento da complexidade no gerenciamento dos recursos computacionais, mas a desvantagem é superada em muito pelas vantagens obtidas pelo uso da computação distribuída 5a Questão O Hadoop é? Um banco de dados orientado a objetos É um projeto administrado atualmente pelo Google É um banco de dados NOSQL amplamente usado em Big Data O projeto está apoiado em dois componentes principais: o Map e o Reduce Engloba um conjunto de produtos que permite o processamento de aplicações Big Data Explicação: O Hadoop engloba um conjunto de produtos que permite processar o Big Data, por meio de um processamento de dados paralelo nos nós de computação, com uma aceleração no processamento, com diminuição da latência e altamente escalável. 6a Questão Assinale a alternativa que NÃO apresenta 2 ferramentas ou componentes usados no framework Hadoop: MapReduce e HDFS ZooKeeper e Chukwa Ambari e Mahout Hive e Neo4J Pig e Hive Explicação: O Neo4J é um banco de dados NOSQL baseado em grafos
Compartilhar