Logo Passei Direto
Buscar
Material
páginas com resultados encontrados.
páginas com resultados encontrados.
details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

details

Libere esse material sem enrolação!

Craque NetoCraque Neto

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Prévia do material em texto

Você acertou 2 de 10
questões
Verifique o seu desempenho e continue
treinando! Você pode refazer o exercício
quantas vezes quiser.
Verificar Desempenho
A
B
1 Marcar para revisão
Organizações que lidam com grandes volumes
de dados, como redes sociais e plataformas de
streaming, frequentemente adotam soluções
específicas para garantir desempenho,
escalabilidade e tolerância a falhas. Uma
dessas soluções é o Hadoop, cuja arquitetura é
composta por diversos componentes que
trabalham em conjunto. Considerando a função
desses componentes, qual deles é responsável
por armazenar os dados efetivos dentro do
cluster Hadoop?
YARN, por ser o componente
responsável pelo agendamento e
gerenciamento de tarefas distribuídas
NameNode, por conter os metadados
que descrevem a localização dos
arquivos armazenados
Questão 1 de 10
Corretas (2)
Incorretas (8)
Em branco (0)
1 2 3 4 5
6 7 8 9 10
Lista de exercícios Hadoop e… Sair
06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/
https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 1/13
C
D
E
MapReduce, por possibilitar a divisão
das tarefas em pares chave-valor para
processamento paralelo
DataNode, por ser o responsável
direto pelo armazenamento físico dos
dados no cluster
Hadoop Common, por fornecer
bibliotecas e scripts necessários à
execução dos demais componentes
Resposta incorreta
Opa! A alternativa correta é a letra
D. Confira o gabarito comentado!
Gabarito Comentado
O DataNode é o componente da arquitetura
Hadoop responsável por armazenar os
dados reais em cada nó do cluster. Ele atua
como "escravo" na estrutura mestre-
escravo, sendo coordenado pelo
NameNode, que apenas gerencia
metadados. Enquanto outros componentes
como YARN e MapReduce se concentram
em processamento e gerenciamento, o
DataNode se encarrega do armazenamento
em si.
2 Marcar para revisão
A respeito do Hadoop, selecione a opção
correta com o componente que faz o
rastreamento de tarefas.
06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/
https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 2/13
A
B
C
D
E
MapReduce
HDFS
Task manager
Camada de ingestão
Mrjob
Resposta incorreta
Opa! A alternativa correta é a letra
A. Confira o gabarito comentado!
Gabarito Comentado
O MapReduce é o componente do Hadoop
responsável pelo rastreamento de tarefas.
Ele opera por meio de dois tipos de
rastreadores: os Task Trackers, que
rastreiam tarefas individuais, e os Job
Trackers, que rastreiam trabalhos
completos. Este mecanismo permite a
distribuição eficiente de tarefas em um
cluster. As demais alternativas, HDFS, Task
manager, Camada de ingestão e Mrjob,
embora estejam relacionadas ao Hadoop,
não possuem a funcionalidade específica
de rastreamento de tarefas.
3 Marcar para revisão
06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/
https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 3/13
A
B
C
D
E
A arquitetura do Hadoop é projetada para
garantir alto desempenho na manipulação de
grandes volumes de dados distribuídos. Um de
seus principais diferenciais é a capacidade de
dividir tarefas entre diversos nós do cluster.
Qual componente da arquitetura Hadoop é
responsável por gerenciar os recursos
computacionais disponíveis e monitorar o uso
de CPU, memória e disco em cada máquina do
cluster?
NameNode
NodeManager
DataNode
TaskTracker
Mapper
Resposta correta
Parabéns, você selecionou a
alternativa correta. Confira o
gabarito comentado!
Gabarito Comentado
O NodeManager atua como o agente em
cada máquina (nó) do cluster, sendo
responsável por monitorar os recursos
locais e repassar essas informações ao
ResourceManager, parte integrante do
YARN. Ele assegura que os containers
sejam gerenciados com base na
06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/
https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 4/13
A
B
C
D
E
capacidade da máquina, otimizando a
alocação de tarefas.
4 Marcar para revisão
Durante a execução de aplicações com
Hadoop, a fase de redução desempenha papel
fundamental no processamento final dos dados.
Essa etapa é precedida por um processo que
organiza e redistribui os pares chave-valor
gerados pelas tarefas de mapeamento,
otimizando a carga de trabalho entre os nós.
Qual é o nome desse processo e qual é sua
principal contribuição?
Combinação – reduz a quantidade de
tarefas no redutor ao eliminar
duplicatas
Classificação – organiza os dados em
ordem alfabética antes da gravação
final
Embaralhamento – redistribui os dados
intermediários para os redutores
corretos
Particionamento – divide os dados em
grupos com base em similaridade
semântica
Agendamento – determina quais
tarefas devem ser executadas com
prioridade
06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/
https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 5/13
A
B
C
Resposta incorreta
Opa! A alternativa correta é a letra
C. Confira o gabarito comentado!
Gabarito Comentado
O embaralhamento (ou shuffle) é o
processo em que os pares chave-valor
intermediários, gerados pelos mapeadores,
são redistribuídos entre os redutores
conforme a chave. Essa etapa garante que
todos os valores de uma mesma chave
sejam processados juntos, permitindo uma
redução eficaz e consistente dos dados.
5 Marcar para revisão
Reconhecer os conceitos de Data Lake é
fundamental para o profissional de Tecnologia
da Informação. Selecione a opção correta a
respeito do Data Lake.
Possui alta latência para acesso dos
dados.
Aplica processos de tratamento nos
dados.
Armazena os dados de modo
eficiente.
06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/
https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 6/13
D
E
Demanda por equipamentos especiais.
São exclusivos da distribuição Hadoop
Apache.
Resposta incorreta
Opa! A alternativa correta é a letra
C. Confira o gabarito comentado!
Gabarito Comentado
O conceito de Data Lake se refere a um
sistema de armazenamento que é capaz de
guardar uma grande quantidade de dados
brutos, em seu formato original. A
alternativa correta é a letra C, que afirma
que o Data Lake armazena os dados de
modo eficiente. Isso ocorre porque o Data
Lake é projetado para armazenar grandes
volumes de dados de maneira eficaz,
permitindo que os usuários acessem e
analisem esses dados rapidamente. Além
disso, é importante ressaltar que o Data
Lake não demanda por equipamentos
especiais e não é de uso exclusivo da
distribuição Hadoop Apache, contrariando
as afirmações das alternativas D e E,
respectivamente.
6 Marcar para revisão
Selecione a opção correta a respeito do nível do
Data Lake responsável por fornecer dados para
a análise de negócios.
06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/
https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 7/13
A
B
C
D
E
Nível de governança
Nível de Metadados
Nível de admissão
Nível de gerenciamento
Nível de consumo
Resposta incorreta
Opa! A alternativa correta é a letra
E. Confira o gabarito comentado!
Gabarito Comentado
O Data Lake é estruturado em três níveis
principais: admissão, gerenciamento e
consumo. O nível de admissão é
responsável pelos serviços de aquisição de
dados. O nível de gerenciamento cuida da
identificação e localização dos dados. Por
fim, o nível de consumo é o que fornece
dados para serem utilizados por aplicações
que auxiliam na tomada de decisões de
negócios. Portanto, a alternativa correta é
o "Nível de consumo", poisé este nível que
disponibiliza os dados para análise de
negócios.
7 Marcar para revisão
06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/
https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 8/13
A
B
C
D
E
Em relação ao Data Lake, selecione a opção
correta que contenha o(s) formato(s) de dados
que pode(m) ser armazenado(s) nele.
Apenas estruturado
Estruturado e semiestruturado
Estruturado, não estruturado e
semiestruturado
Apenas não estruturado
Apenas tabelas relacionais
Resposta incorreta
Opa! A alternativa correta é a letra
C. Confira o gabarito comentado!
Gabarito Comentado
O Data Lake é uma solução de
armazenamento de dados que permite a
inclusão de diferentes formatos de dados,
sejam eles estruturados, semiestruturados
ou não estruturados. Essa característica de
variedade dos dados é uma das principais
vantagens do Data Lake, especialmente em
aplicações de Big Data, onde a diversidade
de formatos de dados é uma constante.
Portanto, a alternativa correta é a C, que
afirma que o Data Lake pode armazenar
dados estruturados, semiestruturados e
não estruturados.
06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/
https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 9/13
A
B
C
D
E
8 Marcar para revisão
Em relação às fases do Hadoop, selecione a
opção correta que apresenta o componente
responsável pela geração de pares
intermediários de valor e chave.
Embaralhamento
Combinação
Agrupamento
Redução
Gravação da saída
Resposta incorreta
Opa! A alternativa correta é a letra
A. Confira o gabarito comentado!
Gabarito Comentado
O processo de embaralhamento, também
conhecido pelo termo em inglês "shuffling",
é o componente do Hadoop responsável
pela geração de pares intermediários de
valor e chave. Esses pares são transferidos
para a fase de redução. Este processo
ocorre em paralelo com outras tarefas da
fase de mapeamento, otimizando o uso dos
recursos e aumentando a eficiência do
processamento de dados. Portanto, a
06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/
https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 10/13
A
B
C
D
E
alternativa correta é a "A:
Embaralhamento".
9 Marcar para revisão
O Hadoop é uma tecnologia especializada
em atender as demandas de Big Data.
Selecione a opção correta que contenha a
linguagem de programação utilizada para o
desenvolvimento e implementação do
Hadoop.
Python
Java
Lua
JavaScript
Perl
Resposta incorreta
Opa! A alternativa correta é a letra
B. Confira o gabarito comentado!
Gabarito Comentado
O Hadoop foi originalmente desenvolvido
utilizando a linguagem de programação
Java, pela Apache Foundation. Com o
passar do tempo, diferentes versões do
framework foram implementadas em várias
06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/
https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 11/13
A
B
C
D
E
linguagens, incluindo Python. No entanto, a
linguagem de programação principal e mais
utilizada para o desenvolvimento e
implementação do Hadoop continua sendo
Java, tornando a alternativa B a resposta
correta para esta questão.
10 Marcar para revisão
O Hadoop é um framework de código aberto
voltado para aplicações de Big Data. Neste
sentido, selecione a alternativa correta que
apresenta um grande desafio no processo
de configuração e gerenciamento do
Hadoop.
Processos de extração, transformação
e carregamento dos dados.
Mecanismo para melhorar o
processamento dos dados.
Aplicar políticas de segurança.
Gerenciamento do armazenamento de
dados.
Tratar dados não-estruturados.
Resposta correta
Parabéns, você selecionou a
alternativa correta. Confira o
gabarito comentado!
06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/
https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 12/13
Gabarito Comentado
O desafio de aplicar políticas de segurança
no Hadoop é significativo, pois envolve a
configuração de um sistema que lida com
problemas complexos de Big Data. A
segurança da informação é um aspecto
crítico em qualquer sistema de dados, e no
caso do Hadoop, isso se torna ainda mais
desafiador devido à sua natureza de lidar
com grandes volumes de dados, muitas
vezes não estruturados. Portanto, o
profissional responsável por essa etapa
precisa ter um alto nível de conhecimento e
habilidade para garantir a segurança
adequada dos dados.
06/06/2025, 15:00 estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/
https://estacio.saladeavaliacoes.com.br/exercicio/68432cbbe9ec021803284e1f/gabarito/ 13/13

Mais conteúdos dessa disciplina