Logo Passei Direto
Buscar
MT Tópicos De Big Data Em Python 9 Marcar para revisão Organizações que lidam com grandes volumes de dados, como redes sociais e plataformas de streaming, frequentemente adotam soluções específicas para garantir desempenho, escalabilidade e tolerância a falhas. Uma dessas soluções é o Hadoop, cuja arquitetura é composta por diversos componentes que trabalham em conjunto. Considerando a função desses componentes, qual deles é responsável por armazenar os dados efetivos dentro do cluster Hadoop? A YARN, por ser o componente responsável pelo agendamento e gerenciamento de tarefas distribuidas B NameNode, por conter os metadados que descrevem a localização dos arquivos armazenados C MapReduce, por possibilitar a divisão das tarefas em pares chave-valor para processamento paralelo D DataNode, por ser o responsável direto pelo armazenamento fisico dos dados no cluster E Hadoop Common, por fornecer bibliotecas e scripts necessários à execução dos demais componentes
User badge image
Josué Alves lima

há 3 meses

Respostas

User badge image

Ed Verified user icon

há 3 meses

Vamos analisar cada uma das alternativas para identificar qual componente do Hadoop é responsável pelo armazenamento físico dos dados no cluster: A) YARN, por ser o componente responsável pelo agendamento e gerenciamento de tarefas distribuídas - Correto, mas não é responsável pelo armazenamento de dados. B) NameNode, por conter os metadados que descrevem a localização dos arquivos armazenados - O NameNode gerencia os metadados, mas não armazena os dados efetivos. C) MapReduce, por possibilitar a divisão das tarefas em pares chave-valor para processamento paralelo - MapReduce é um modelo de programação para processamento de dados, não armazena dados. D) DataNode, por ser o responsável direto pelo armazenamento físico dos dados no cluster - Correto! O DataNode é o componente que armazena os dados efetivos. E) Hadoop Common, por fornecer bibliotecas e scripts necessários à execução dos demais componentes - Hadoop Common fornece suporte, mas não armazena dados. Portanto, a alternativa correta é: D) DataNode, por ser o responsável direto pelo armazenamento físico dos dados no cluster.

Essa resposta te ajudou?

0
Dislike0

Ainda com dúvidas?

Envie uma pergunta e tenha sua dúvida de estudo respondida!

Mais conteúdos dessa disciplina