Prévia do material em texto
Você acertou 2 de 10 questões Verifique o seu desempenho e continue treinando! Você pode refazer o exercício quantas vezes quiser. Verificar Desempenho A B 1 Marcar para revisão Organizações que lidam com grandes volumes de dados, como redes sociais e plataformas de streaming, frequentemente adotam soluções específicas para garantir desempenho, escalabilidade e tolerância a falhas. Uma dessas soluções é o Hadoop, cuja arquitetura é composta por diversos componentes que trabalham em conjunto. Considerando a função desses componentes, qual deles é responsável por armazenar os dados efetivos dentro do cluster Hadoop? YARN, por ser o componente responsável pelo agendamento e gerenciamento de tarefas distribuídas NameNode, por conter os metadados que descrevem a localização dos arquivos armazenados Questão 1 de 10 Corretas (2) Incorretas (8) Em branco (0) 1 2 3 4 5 6 7 8 9 10 Lista de exercícios Hadoop e… Sair 06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 1/13 C D E MapReduce, por possibilitar a divisão das tarefas em pares chave-valor para processamento paralelo DataNode, por ser o responsável direto pelo armazenamento físico dos dados no cluster Hadoop Common, por fornecer bibliotecas e scripts necessários à execução dos demais componentes Resposta incorreta Opa! A alternativa correta é a letra D. Confira o gabarito comentado! Gabarito Comentado O DataNode é o componente da arquitetura Hadoop responsável por armazenar os dados reais em cada nó do cluster. Ele atua como "escravo" na estrutura mestre- escravo, sendo coordenado pelo NameNode, que apenas gerencia metadados. Enquanto outros componentes como YARN e MapReduce se concentram em processamento e gerenciamento, o DataNode se encarrega do armazenamento em si. 2 Marcar para revisão A respeito do Hadoop, selecione a opção correta com o componente que faz o rastreamento de tarefas. 06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 2/13 A B C D E MapReduce HDFS Task manager Camada de ingestão Mrjob Resposta incorreta Opa! A alternativa correta é a letra A. Confira o gabarito comentado! Gabarito Comentado O MapReduce é o componente do Hadoop responsável pelo rastreamento de tarefas. Ele opera por meio de dois tipos de rastreadores: os Task Trackers, que rastreiam tarefas individuais, e os Job Trackers, que rastreiam trabalhos completos. Este mecanismo permite a distribuição eficiente de tarefas em um cluster. As demais alternativas, HDFS, Task manager, Camada de ingestão e Mrjob, embora estejam relacionadas ao Hadoop, não possuem a funcionalidade específica de rastreamento de tarefas. 3 Marcar para revisão 06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 3/13 A B C D E A arquitetura do Hadoop é projetada para garantir alto desempenho na manipulação de grandes volumes de dados distribuídos. Um de seus principais diferenciais é a capacidade de dividir tarefas entre diversos nós do cluster. Qual componente da arquitetura Hadoop é responsável por gerenciar os recursos computacionais disponíveis e monitorar o uso de CPU, memória e disco em cada máquina do cluster? NameNode NodeManager DataNode TaskTracker Mapper Resposta correta Parabéns, você selecionou a alternativa correta. Confira o gabarito comentado! Gabarito Comentado O NodeManager atua como o agente em cada máquina (nó) do cluster, sendo responsável por monitorar os recursos locais e repassar essas informações ao ResourceManager, parte integrante do YARN. Ele assegura que os containers sejam gerenciados com base na 06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 4/13 A B C D E capacidade da máquina, otimizando a alocação de tarefas. 4 Marcar para revisão Durante a execução de aplicações com Hadoop, a fase de redução desempenha papel fundamental no processamento final dos dados. Essa etapa é precedida por um processo que organiza e redistribui os pares chave-valor gerados pelas tarefas de mapeamento, otimizando a carga de trabalho entre os nós. Qual é o nome desse processo e qual é sua principal contribuição? Combinação – reduz a quantidade de tarefas no redutor ao eliminar duplicatas Classificação – organiza os dados em ordem alfabética antes da gravação final Embaralhamento – redistribui os dados intermediários para os redutores corretos Particionamento – divide os dados em grupos com base em similaridade semântica Agendamento – determina quais tarefas devem ser executadas com prioridade 06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 5/13 A B C Resposta incorreta Opa! A alternativa correta é a letra C. Confira o gabarito comentado! Gabarito Comentado O embaralhamento (ou shuffle) é o processo em que os pares chave-valor intermediários, gerados pelos mapeadores, são redistribuídos entre os redutores conforme a chave. Essa etapa garante que todos os valores de uma mesma chave sejam processados juntos, permitindo uma redução eficaz e consistente dos dados. 5 Marcar para revisão Reconhecer os conceitos de Data Lake é fundamental para o profissional de Tecnologia da Informação. Selecione a opção correta a respeito do Data Lake. Possui alta latência para acesso dos dados. Aplica processos de tratamento nos dados. Armazena os dados de modo eficiente. 06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 6/13 D E Demanda por equipamentos especiais. São exclusivos da distribuição Hadoop Apache. Resposta incorreta Opa! A alternativa correta é a letra C. Confira o gabarito comentado! Gabarito Comentado O conceito de Data Lake se refere a um sistema de armazenamento que é capaz de guardar uma grande quantidade de dados brutos, em seu formato original. A alternativa correta é a letra C, que afirma que o Data Lake armazena os dados de modo eficiente. Isso ocorre porque o Data Lake é projetado para armazenar grandes volumes de dados de maneira eficaz, permitindo que os usuários acessem e analisem esses dados rapidamente. Além disso, é importante ressaltar que o Data Lake não demanda por equipamentos especiais e não é de uso exclusivo da distribuição Hadoop Apache, contrariando as afirmações das alternativas D e E, respectivamente. 6 Marcar para revisão Selecione a opção correta a respeito do nível do Data Lake responsável por fornecer dados para a análise de negócios. 06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 7/13 A B C D E Nível de governança Nível de Metadados Nível de admissão Nível de gerenciamento Nível de consumo Resposta incorreta Opa! A alternativa correta é a letra E. Confira o gabarito comentado! Gabarito Comentado O Data Lake é estruturado em três níveis principais: admissão, gerenciamento e consumo. O nível de admissão é responsável pelos serviços de aquisição de dados. O nível de gerenciamento cuida da identificação e localização dos dados. Por fim, o nível de consumo é o que fornece dados para serem utilizados por aplicações que auxiliam na tomada de decisões de negócios. Portanto, a alternativa correta é o "Nível de consumo", poisé este nível que disponibiliza os dados para análise de negócios. 7 Marcar para revisão 06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 8/13 A B C D E Em relação ao Data Lake, selecione a opção correta que contenha o(s) formato(s) de dados que pode(m) ser armazenado(s) nele. Apenas estruturado Estruturado e semiestruturado Estruturado, não estruturado e semiestruturado Apenas não estruturado Apenas tabelas relacionais Resposta incorreta Opa! A alternativa correta é a letra C. Confira o gabarito comentado! Gabarito Comentado O Data Lake é uma solução de armazenamento de dados que permite a inclusão de diferentes formatos de dados, sejam eles estruturados, semiestruturados ou não estruturados. Essa característica de variedade dos dados é uma das principais vantagens do Data Lake, especialmente em aplicações de Big Data, onde a diversidade de formatos de dados é uma constante. Portanto, a alternativa correta é a C, que afirma que o Data Lake pode armazenar dados estruturados, semiestruturados e não estruturados. 06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 9/13 A B C D E 8 Marcar para revisão Em relação às fases do Hadoop, selecione a opção correta que apresenta o componente responsável pela geração de pares intermediários de valor e chave. Embaralhamento Combinação Agrupamento Redução Gravação da saída Resposta incorreta Opa! A alternativa correta é a letra A. Confira o gabarito comentado! Gabarito Comentado O processo de embaralhamento, também conhecido pelo termo em inglês "shuffling", é o componente do Hadoop responsável pela geração de pares intermediários de valor e chave. Esses pares são transferidos para a fase de redução. Este processo ocorre em paralelo com outras tarefas da fase de mapeamento, otimizando o uso dos recursos e aumentando a eficiência do processamento de dados. Portanto, a 06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 10/13 A B C D E alternativa correta é a "A: Embaralhamento". 9 Marcar para revisão O Hadoop é uma tecnologia especializada em atender as demandas de Big Data. Selecione a opção correta que contenha a linguagem de programação utilizada para o desenvolvimento e implementação do Hadoop. Python Java Lua JavaScript Perl Resposta incorreta Opa! A alternativa correta é a letra B. Confira o gabarito comentado! Gabarito Comentado O Hadoop foi originalmente desenvolvido utilizando a linguagem de programação Java, pela Apache Foundation. Com o passar do tempo, diferentes versões do framework foram implementadas em várias 06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 11/13 A B C D E linguagens, incluindo Python. No entanto, a linguagem de programação principal e mais utilizada para o desenvolvimento e implementação do Hadoop continua sendo Java, tornando a alternativa B a resposta correta para esta questão. 10 Marcar para revisão O Hadoop é um framework de código aberto voltado para aplicações de Big Data. Neste sentido, selecione a alternativa correta que apresenta um grande desafio no processo de configuração e gerenciamento do Hadoop. Processos de extração, transformação e carregamento dos dados. Mecanismo para melhorar o processamento dos dados. Aplicar políticas de segurança. Gerenciamento do armazenamento de dados. Tratar dados não-estruturados. Resposta correta Parabéns, você selecionou a alternativa correta. Confira o gabarito comentado! 06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 12/13 Gabarito Comentado O desafio de aplicar políticas de segurança no Hadoop é significativo, pois envolve a configuração de um sistema que lida com problemas complexos de Big Data. A segurança da informação é um aspecto crítico em qualquer sistema de dados, e no caso do Hadoop, isso se torna ainda mais desafiador devido à sua natureza de lidar com grandes volumes de dados, muitas vezes não estruturados. Portanto, o profissional responsável por essa etapa precisa ter um alto nível de conhecimento e habilidade para garantir a segurança adequada dos dados. 06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 13/13