Prévia do material em texto
A B C D E A B C 1 Marcar para revisão A respeito do HDFS, selecione a opção correta cujo componente lógico mantém os dados do usuário na forma de blocos de dados. YARN NameNode Bloco de dados Replicação DataNode 2 Marcar para revisão A respeito do Hadoop, selecione a opção correta com o componente que faz o rastreamento de tarefas. MapReduce HDFS Task manager Questão 1 de 10 Em branco (10) 1 2 3 4 5 6 7 8 9 10 Finalizar exercícios Lista de exercícios Hadoop e… Sair e finalizar depois 10/11/2025, 11:20 estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/ https://estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/ 1/8 D E A B C D E Camada de ingestão Mrjob 3 Marcar para revisão Em relação ao Data Lake, selecione a opção correta que contenha o(s) formato(s) de dados que pode(m) ser armazenado(s) nele. Apenas estruturado Estruturado e semiestruturado Estruturado, não estruturado e semiestruturado Apenas não estruturado Apenas tabelas relacionais 4 Marcar para revisão Reconhecer os conceitos de Data Lake é fundamental para o profissional de Tecnologia da Informação. Selecione a opção correta que define resumidamente o que é o Data Lake. 10/11/2025, 11:20 estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/ https://estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/ 2/8 A B C D E A B C É um repositório para tratamento dos dados. É uma tecnologia de armazenamento e processamento de dados. É um repositório centralizado para armazenamento de dados. É um ambiente para tratamento e armazenamento apenas de dados relacionais. Trata-se de um componente do HDFS responsável pela implementação do mecanismo MapReduce para fazer o gerenciamento dos dados. 5 Marcar para revisão Reconhecer os conceitos de Data Lake é fundamental para o profissional de Tecnologia da Informação. Selecione a opção correta a respeito do Data Lake. Possui alta latência para acesso dos dados. Aplica processos de tratamento nos dados. Armazena os dados de modo eficiente. 10/11/2025, 11:20 estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/ https://estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/ 3/8 D E A B C Demanda por equipamentos especiais. São exclusivos da distribuição Hadoop Apache. 6 Marcar para revisão Organizações que lidam com grandes volumes de dados, como redes sociais e plataformas de streaming, frequentemente adotam soluções específicas para garantir desempenho, escalabilidade e tolerância a falhas. Uma dessas soluções é o Hadoop, cuja arquitetura é composta por diversos componentes que trabalham em conjunto. Considerando a função desses componentes, qual deles é responsável por armazenar os dados efetivos dentro do cluster Hadoop? YARN, por ser o componente responsável pelo agendamento e gerenciamento de tarefas distribuídas NameNode, por conter os metadados que descrevem a localização dos arquivos armazenados MapReduce, por possibilitar a divisão das tarefas em pares chave-valor para processamento paralelo 10/11/2025, 11:20 estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/ https://estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/ 4/8 D E A B C DataNode, por ser o responsável direto pelo armazenamento físico dos dados no cluster Hadoop Common, por fornecer bibliotecas e scripts necessários à execução dos demais componentes 7 Marcar para revisão Durante a execução de aplicações com Hadoop, a fase de redução desempenha papel fundamental no processamento final dos dados. Essa etapa é precedida por um processo que organiza e redistribui os pares chave-valor gerados pelas tarefas de mapeamento, otimizando a carga de trabalho entre os nós. Qual é o nome desse processo e qual é sua principal contribuição? Combinação – reduz a quantidade de tarefas no redutor ao eliminar duplicatas Classificação – organiza os dados em ordem alfabética antes da gravação final Embaralhamento – redistribui os dados intermediários para os redutores corretos 10/11/2025, 11:20 estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/ https://estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/ 5/8 D E A B C D E Particionamento – divide os dados em grupos com base em similaridade semântica Agendamento – determina quais tarefas devem ser executadas com prioridade 8 Marcar para revisão O Hadoop é uma tecnologia especializada em atender as demandas de Big Data. Selecione a opção correta que contenha a linguagem de programação utilizada para o desenvolvimento e implementação do Hadoop. Python Java Lua JavaScript Perl 9 Marcar para revisão O Hadoop é um framework de código aberto voltado para aplicações de Big Data. Neste sentido, selecione a alternativa 10/11/2025, 11:20 estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/ https://estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/ 6/8 A B C D E correta que apresenta um grande desafio no processo de configuração e gerenciamento do Hadoop. Processos de extração, transformação e carregamento dos dados. Mecanismo para melhorar o processamento dos dados. Aplicar políticas de segurança. Gerenciamento do armazenamento de dados. Tratar dados não- estruturados. 10 Marcar para revisão A arquitetura do Hadoop é projetada para garantir alto desempenho na manipulação de grandes volumes de dados distribuídos. Um de seus principais diferenciais é a capacidade de dividir tarefas entre diversos nós do cluster. Qual componente da arquitetura Hadoop é responsável por gerenciar os recursos computacionais disponíveis e monitorar o uso de CPU, memória e disco em cada máquina do cluster? 10/11/2025, 11:20 estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/ https://estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/ 7/8 A B C D E NameNode NodeManager DataNode TaskTracker Mapper 10/11/2025, 11:20 estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/ https://estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/ 8/8