3 Hadoop e Armazenamento de Dados

UNINASSAU CARUARU

José Nilson Vieira

em 18/06/2025

Conteúdos escolhidos para você

65 pág.

Sistemas de Informacao Distribuidos - Blockchain

ESTÁCIO

4 pág.

Tópicos de bigData com python - EX 2

ESTÁCIO

14 pág.

BIG DATA PYTHON - TEMA 03 ex04

ESTÁCIO

5 pág.

Exercício - Hadoop e Armazenamento de Dados

ESTÁCIO

31 pág.

Exercicios 2025 - Ferramentas de Tomada de Decisao

ESTÁCIO EAD

Perguntas dessa disciplina

DESAFIO PROFISSIONAL DE BANCO DE DADOS Esta é a descrição do seu Desafio Profissional. Para que você possa desenvolver sua atividade e chegar à con...

UniCesumar

Voce toi contratado(a) como Desenvolvedor(a) Android Senior por uma startup de logistica que esta revolucionando o gerenciamento de armazéns. Seu p...

Uniasselvi

ETAPA 1 - Apresentação do Desafio Profissional. Você foi contratado recentemente como Analista de Banco de Dados pela "MedLife Clínicas", uma rede ...

UniCesumar

DESAFIO PROFISSIONAL DE BANCO DE DADOS Esta é a descrição do seu Desafio Profissional. Para que você possa desenvolver sua atividade e chegar à con...

UniCesumar

ENADE – BANCO DE DADOS II 5 Considere um banco de dados relacional formado por três tabelas, conforme é apresentado na figura a seguir. As chaves prim

Material

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Libere esse material sem enrolação!

Cadastre-se ou realize login

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Conteúdos escolhidos para você

65 pág.

Sistemas de Informacao Distribuidos - Blockchain

ESTÁCIO

4 pág.

Tópicos de bigData com python - EX 2

ESTÁCIO

14 pág.

BIG DATA PYTHON - TEMA 03 ex04

ESTÁCIO

5 pág.

Exercício - Hadoop e Armazenamento de Dados

ESTÁCIO

31 pág.

Exercicios 2025 - Ferramentas de Tomada de Decisao

ESTÁCIO EAD

Perguntas dessa disciplina

DESAFIO PROFISSIONAL DE BANCO DE DADOS Esta é a descrição do seu Desafio Profissional. Para que você possa desenvolver sua atividade e chegar à con...

UniCesumar

Voce toi contratado(a) como Desenvolvedor(a) Android Senior por uma startup de logistica que esta revolucionando o gerenciamento de armazéns. Seu p...

Uniasselvi

ETAPA 1 - Apresentação do Desafio Profissional. Você foi contratado recentemente como Analista de Banco de Dados pela "MedLife Clínicas", uma rede ...

UniCesumar

DESAFIO PROFISSIONAL DE BANCO DE DADOS Esta é a descrição do seu Desafio Profissional. Para que você possa desenvolver sua atividade e chegar à con...

UniCesumar

ENADE – BANCO DE DADOS II 5 Considere um banco de dados relacional formado por três tabelas, conforme é apresentado na figura a seguir. As chaves prim

Prévia do material em texto

Você acertou 2 de 10
questões
Verifique o seu desempenho e continue
treinando! Você pode refazer o exercício
quantas vezes quiser.
Verificar Desempenho
A
B
1 Marcar para revisão
Organizações que lidam com grandes volumes
de dados, como redes sociais e plataformas de
streaming, frequentemente adotam soluções
específicas para garantir desempenho,
escalabilidade e tolerância a falhas. Uma
dessas soluções é o Hadoop, cuja arquitetura é
composta por diversos componentes que
trabalham em conjunto. Considerando a função
desses componentes, qual deles é responsável
por armazenar os dados efetivos dentro do
cluster Hadoop?
YARN, por ser o componente
responsável pelo agendamento e
gerenciamento de tarefas distribuídas
NameNode, por conter os metadados
que descrevem a localização dos
arquivos armazenados
Questão 1 de 10
Corretas (2)
Incorretas (8)
Em branco (0)
1 2 3 4 5
6 7 8 9 10
Lista de exercícios Hadoop e… Sair
06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/
https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 1/13
C
D
E
MapReduce, por possibilitar a divisão
das tarefas em pares chave-valor para
processamento paralelo
DataNode, por ser o responsável
direto pelo armazenamento físico dos
dados no cluster
Hadoop Common, por fornecer
bibliotecas e scripts necessários à
execução dos demais componentes
Resposta incorreta
Opa! A alternativa correta é a letra
D. Confira o gabarito comentado!
Gabarito Comentado
O DataNode é o componente da arquitetura
Hadoop responsável por armazenar os
dados reais em cada nó do cluster. Ele atua
como "escravo" na estrutura mestre-
escravo, sendo coordenado pelo
NameNode, que apenas gerencia
metadados. Enquanto outros componentes
como YARN e MapReduce se concentram
em processamento e gerenciamento, o
DataNode se encarrega do armazenamento
em si.
2 Marcar para revisão
A respeito do Hadoop, selecione a opção
correta com o componente que faz o
rastreamento de tarefas.
06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/
https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 2/13
A
B
C
D
E
MapReduce
HDFS
Task manager
Camada de ingestão
Mrjob
Resposta incorreta
Opa! A alternativa correta é a letra
A. Confira o gabarito comentado!
Gabarito Comentado
O MapReduce é o componente do Hadoop
responsável pelo rastreamento de tarefas.
Ele opera por meio de dois tipos de
rastreadores: os Task Trackers, que
rastreiam tarefas individuais, e os Job
Trackers, que rastreiam trabalhos
completos. Este mecanismo permite a
distribuição eficiente de tarefas em um
cluster. As demais alternativas, HDFS, Task
manager, Camada de ingestão e Mrjob,
embora estejam relacionadas ao Hadoop,
não possuem a funcionalidade específica
de rastreamento de tarefas.
3 Marcar para revisão
06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/
https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 3/13
A
B
C
D
E
A arquitetura do Hadoop é projetada para
garantir alto desempenho na manipulação de
grandes volumes de dados distribuídos. Um de
seus principais diferenciais é a capacidade de
dividir tarefas entre diversos nós do cluster.
Qual componente da arquitetura Hadoop é
responsável por gerenciar os recursos
computacionais disponíveis e monitorar o uso
de CPU, memória e disco em cada máquina do
cluster?
NameNode
NodeManager
DataNode
TaskTracker
Mapper
Resposta correta
Parabéns, você selecionou a
alternativa correta. Confira o
gabarito comentado!
Gabarito Comentado
O NodeManager atua como o agente em
cada máquina (nó) do cluster, sendo
responsável por monitorar os recursos
locais e repassar essas informações ao
ResourceManager, parte integrante do
YARN. Ele assegura que os containers
sejam gerenciados com base na
06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/
https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 4/13
A
B
C
D
E
capacidade da máquina, otimizando a
alocação de tarefas.
4 Marcar para revisão
Durante a execução de aplicações com
Hadoop, a fase de redução desempenha papel
fundamental no processamento final dos dados.
Essa etapa é precedida por um processo que
organiza e redistribui os pares chave-valor
gerados pelas tarefas de mapeamento,
otimizando a carga de trabalho entre os nós.
Qual é o nome desse processo e qual é sua
principal contribuição?
Combinação – reduz a quantidade de
tarefas no redutor ao eliminar
duplicatas
Classificação – organiza os dados em
ordem alfabética antes da gravação
final
Embaralhamento – redistribui os dados
intermediários para os redutores
corretos
Particionamento – divide os dados em
grupos com base em similaridade
semântica
Agendamento – determina quais
tarefas devem ser executadas com
prioridade
06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/
https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 5/13
A
B
C
Resposta incorreta
Opa! A alternativa correta é a letra
C. Confira o gabarito comentado!
Gabarito Comentado
O embaralhamento (ou shuffle) é o
processo em que os pares chave-valor
intermediários, gerados pelos mapeadores,
são redistribuídos entre os redutores
conforme a chave. Essa etapa garante que
todos os valores de uma mesma chave
sejam processados juntos, permitindo uma
redução eficaz e consistente dos dados.
5 Marcar para revisão
Reconhecer os conceitos de Data Lake é
fundamental para o profissional de Tecnologia
da Informação. Selecione a opção correta a
respeito do Data Lake.
Possui alta latência para acesso dos
dados.
Aplica processos de tratamento nos
dados.
Armazena os dados de modo
eficiente.
06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/
https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 6/13
D
E
Demanda por equipamentos especiais.
São exclusivos da distribuição Hadoop
Apache.
Resposta incorreta
Opa! A alternativa correta é a letra
C. Confira o gabarito comentado!
Gabarito Comentado
O conceito de Data Lake se refere a um
sistema de armazenamento que é capaz de
guardar uma grande quantidade de dados
brutos, em seu formato original. A
alternativa correta é a letra C, que afirma
que o Data Lake armazena os dados de
modo eficiente. Isso ocorre porque o Data
Lake é projetado para armazenar grandes
volumes de dados de maneira eficaz,
permitindo que os usuários acessem e
analisem esses dados rapidamente. Além
disso, é importante ressaltar que o Data
Lake não demanda por equipamentos
especiais e não é de uso exclusivo da
distribuição Hadoop Apache, contrariando
as afirmações das alternativas D e E,
respectivamente.
6 Marcar para revisão
Selecione a opção correta a respeito do nível do
Data Lake responsável por fornecer dados para
a análise de negócios.
06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/
https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 7/13
A
B
C
D
E
Nível de governança
Nível de Metadados
Nível de admissão
Nível de gerenciamento
Nível de consumo
Resposta incorreta
Opa! A alternativa correta é a letra
E. Confira o gabarito comentado!
Gabarito Comentado
O Data Lake é estruturado em três níveis
principais: admissão, gerenciamento e
consumo. O nível de admissão é
responsável pelos serviços de aquisição de
dados. O nível de gerenciamento cuida da
identificação e localização dos dados. Por
fim, o nível de consumo é o que fornece
dados para serem utilizados por aplicações
que auxiliam na tomada de decisões de
negócios. Portanto, a alternativa correta é
o "Nível de consumo", poisé este nível que
disponibiliza os dados para análise de
negócios.
7 Marcar para revisão
06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/
https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 8/13
A
B
C
D
E
Em relação ao Data Lake, selecione a opção
correta que contenha o(s) formato(s) de dados
que pode(m) ser armazenado(s) nele.
Apenas estruturado
Estruturado e semiestruturado
Estruturado, não estruturado e
semiestruturado
Apenas não estruturado
Apenas tabelas relacionais
Resposta incorreta
Opa! A alternativa correta é a letra
C. Confira o gabarito comentado!
Gabarito Comentado
O Data Lake é uma solução de
armazenamento de dados que permite a
inclusão de diferentes formatos de dados,
sejam eles estruturados, semiestruturados
ou não estruturados. Essa característica de
variedade dos dados é uma das principais
vantagens do Data Lake, especialmente em
aplicações de Big Data, onde a diversidade
de formatos de dados é uma constante.
Portanto, a alternativa correta é a C, que
afirma que o Data Lake pode armazenar
dados estruturados, semiestruturados e
não estruturados.
06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/
https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 9/13
A
B
C
D
E
8 Marcar para revisão
Em relação às fases do Hadoop, selecione a
opção correta que apresenta o componente
responsável pela geração de pares
intermediários de valor e chave.
Embaralhamento
Combinação
Agrupamento
Redução
Gravação da saída
Resposta incorreta
Opa! A alternativa correta é a letra
A. Confira o gabarito comentado!
Gabarito Comentado
O processo de embaralhamento, também
conhecido pelo termo em inglês "shuffling",
é o componente do Hadoop responsável
pela geração de pares intermediários de
valor e chave. Esses pares são transferidos
para a fase de redução. Este processo
ocorre em paralelo com outras tarefas da
fase de mapeamento, otimizando o uso dos
recursos e aumentando a eficiência do
processamento de dados. Portanto, a
06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/
https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 10/13
A
B
C
D
E
alternativa correta é a "A:
Embaralhamento".
9 Marcar para revisão
O Hadoop é uma tecnologia especializada
em atender as demandas de Big Data.
Selecione a opção correta que contenha a
linguagem de programação utilizada para o
desenvolvimento e implementação do
Hadoop.
Python
Java
Lua
JavaScript
Perl
Resposta incorreta
Opa! A alternativa correta é a letra
B. Confira o gabarito comentado!
Gabarito Comentado
O Hadoop foi originalmente desenvolvido
utilizando a linguagem de programação
Java, pela Apache Foundation. Com o
passar do tempo, diferentes versões do
framework foram implementadas em várias
06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/
https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 11/13
A
B
C
D
E
linguagens, incluindo Python. No entanto, a
linguagem de programação principal e mais
utilizada para o desenvolvimento e
implementação do Hadoop continua sendo
Java, tornando a alternativa B a resposta
correta para esta questão.
10 Marcar para revisão
O Hadoop é um framework de código aberto
voltado para aplicações de Big Data. Neste
sentido, selecione a alternativa correta que
apresenta um grande desafio no processo
de configuração e gerenciamento do
Hadoop.
Processos de extração, transformação
e carregamento dos dados.
Mecanismo para melhorar o
processamento dos dados.
Aplicar políticas de segurança.
Gerenciamento do armazenamento de
dados.
Tratar dados não-estruturados.
Resposta correta
Parabéns, você selecionou a
alternativa correta. Confira o
gabarito comentado!
06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/
https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 12/13
Gabarito Comentado
O desafio de aplicar políticas de segurança
no Hadoop é significativo, pois envolve a
configuração de um sistema que lida com
problemas complexos de Big Data. A
segurança da informação é um aspecto
crítico em qualquer sistema de dados, e no
caso do Hadoop, isso se torna ainda mais
desafiador devido à sua natureza de lidar
com grandes volumes de dados, muitas
vezes não estruturados. Portanto, o
profissional responsável por essa etapa
precisa ter um alto nível de conhecimento e
habilidade para garantir a segurança
adequada dos dados.
06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/
https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 13/13

3 Hadoop e Armazenamento de Dados

UNINASSAU CARUARU

Ferramentas de estudo

Conteúdos escolhidos para você

Sistemas de Informacao Distribuidos - Blockchain

Tópicos de bigData com python - EX 2

BIG DATA PYTHON - TEMA 03 ex04

Exercício - Hadoop e Armazenamento de Dados

Exercicios 2025 - Ferramentas de Tomada de Decisao

Perguntas dessa disciplina

DESAFIO PROFISSIONAL DE BANCO DE DADOS Esta é a descrição do seu Desafio Profissional. Para que você possa desenvolver sua atividade e chegar à con...

Voce toi contratado(a) como Desenvolvedor(a) Android Senior por uma startup de logistica que esta revolucionando o gerenciamento de armazéns. Seu p...

ETAPA 1 - Apresentação do Desafio Profissional. Você foi contratado recentemente como Analista de Banco de Dados pela "MedLife Clínicas", uma rede ...

DESAFIO PROFISSIONAL DE BANCO DE DADOS Esta é a descrição do seu Desafio Profissional. Para que você possa desenvolver sua atividade e chegar à con...

ENADE – BANCO DE DADOS II 5 Considere um banco de dados relacional formado por três tabelas, conforme é apresentado na figura a seguir. As chaves prim

Libere esse material sem enrolação!

Libere esse material sem enrolação!

Libere esse material sem enrolação!

Libere esse material sem enrolação!

Libere esse material sem enrolação!

Libere esse material sem enrolação!

Libere esse material sem enrolação!

Libere esse material sem enrolação!

Libere esse material sem enrolação!

Libere esse material sem enrolação!

Conteúdos escolhidos para você

Sistemas de Informacao Distribuidos - Blockchain

Tópicos de bigData com python - EX 2

BIG DATA PYTHON - TEMA 03 ex04

Exercício - Hadoop e Armazenamento de Dados

Exercicios 2025 - Ferramentas de Tomada de Decisao

Perguntas dessa disciplina

DESAFIO PROFISSIONAL DE BANCO DE DADOS Esta é a descrição do seu Desafio Profissional. Para que você possa desenvolver sua atividade e chegar à con...

Voce toi contratado(a) como Desenvolvedor(a) Android Senior por uma startup de logistica que esta revolucionando o gerenciamento de armazéns. Seu p...

ETAPA 1 - Apresentação do Desafio Profissional. Você foi contratado recentemente como Analista de Banco de Dados pela "MedLife Clínicas", uma rede ...

DESAFIO PROFISSIONAL DE BANCO DE DADOS Esta é a descrição do seu Desafio Profissional. Para que você possa desenvolver sua atividade e chegar à con...

ENADE – BANCO DE DADOS II 5 Considere um banco de dados relacional formado por três tabelas, conforme é apresentado na figura a seguir. As chaves prim

Mais conteúdos dessa disciplina