Prévia do material em texto
1. Em um contexto geral, o Data Lake representa um repositório para grandes quantidades de dados. Portanto, pode-se afirmar que o Data Lake é: Você acertou! A. uma tecnologia para Big Data. 2. O Apache Hadoop apresenta um ecossistema de tecnologias que auxiliam no gerenciamento de dados. Quais dos nomes a seguir fazem parte desse ecossistema? Você acertou! C. Apache Spark e Apache Sqoop. 3 Uma das ferramentas que ganhou mais notoriedade nos últimos anos é o Apache Spark. Qual é o seu diferencial? Você acertou! A. O Apache Spark tem como diferencial o uso da escrita em memória, em vez de fazer várias chamadas ao disco rígido, aumentando sua velocidade no processamento dos dados. 4. As camadas do ecossistema de Big Data são responsáveis por cuidar de todo o processo que um dado percorre. Quais são essas camadas? Você acertou! D. Camada ingestão, camada armazenamento, camada processamento, camada apresentação e camada segurança. 5. Data Lake e Data Warehouse apresentam diferenças significativas em seus conceitos. Qual é a única coisa que ambos têm em comum? Você acertou! E. Ambos funcionam como repositórios para grandes quantidades de dados.