Alexandro Carvalho
mês passado
A alternativa correta é a a. V-F-V-V-F.
As avaliações das afirmações são as seguintes:
(V) O Hadoop é um framework de código aberto desenvolvido pela Apache Software Foundation, que permite o processamento distribuído de grandes volumes de dados usando o modelo MapReduce.
Verdadeiro. O Hadoop é um projeto da Apache Software Foundation e seu módulo central (Hadoop MapReduce) implementa esse modelo de programação para processamento paralelo de dados [1].
(F) O Spark é uma plataforma de processamento de dados exclusivamente para armazenamento em disco, sem suporte para processamento em memória.
Falso. O Spark foi projetado para processamento em memória, o que o torna significativamente mais rápido que o Hadoop MapReduce para muitas cargas de trabalho [2, 3].
(V) O Hadoop Distributed File System (HDFS) é um componente essencial do Hadoop, que permite o armazenamento distribuído de dados em clusters de computadores.
Verdadeiro. O HDFS é o sistema de arquivos principal do ecossistema Hadoop, projetado para armazenar dados em larga escala de forma confiável e distribuída [1].
(V) O Spark oferece suporte a uma variedade de tipos de cargas de trabalho, incluindo processamento em tempo real, análise de gráficos e aprendizado de máquina, através de seu mecanismo de processamento em memória.
Verdadeiro. O Spark possui bibliotecas integradas como Spark SQL, Spark Streaming, MLlib (Machine Learning) e GraphX, que operam sobre o mesmo mecanismo de execução em memória [2, 3].
(F) O Hadoop é mais rápido que o Spark em todas as operações de processamento de dados devido à sua arquitetura baseada em disco.
Falso. O Spark é geralmente mais rápido que o Hadoop MapReduce, especialmente para tarefas iterativas e processamento em memória, pois evita escritas e leituras frequentes em disco [3].