Logo Passei Direto
Buscar

Big Data em Python 2

User badge image
Isakinhooo

em

Ferramentas de estudo

Questões resolvidas

Material
páginas com resultados encontrados.
páginas com resultados encontrados.
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Prévia do material em texto

A
B
C
D
E
A
B
C
1 Marcar para revisão
A respeito do HDFS, selecione a opção
correta cujo componente lógico
mantém os dados do usuário na forma
de blocos de dados.
YARN
NameNode
Bloco de dados
Replicação
DataNode
2 Marcar para revisão
A respeito do Hadoop, selecione a
opção correta com o componente
que faz o rastreamento de tarefas.
MapReduce
HDFS
Task manager
Questão 1 de 10
Em branco (10)
1 2 3 4 5
6 7 8 9 10
Finalizar exercícios
Lista de exercícios Hadoop e… Sair e finalizar depois
10/11/2025, 11:20 estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/
https://estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/ 1/8
D
E
A
B
C
D
E
Camada de ingestão
Mrjob
3 Marcar para revisão
Em relação ao Data Lake, selecione a
opção correta que contenha o(s)
formato(s) de dados que pode(m) ser
armazenado(s) nele.
Apenas estruturado
Estruturado e
semiestruturado
Estruturado, não estruturado
e semiestruturado
Apenas não estruturado
Apenas tabelas relacionais
4 Marcar para revisão
Reconhecer os conceitos de Data Lake
é fundamental para o profissional de
Tecnologia da Informação. Selecione a
opção correta que define
resumidamente o que é o Data Lake.
10/11/2025, 11:20 estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/
https://estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/ 2/8
A
B
C
D
E
A
B
C
É um repositório para
tratamento dos dados.
É uma tecnologia de
armazenamento e
processamento de dados.
É um repositório centralizado
para armazenamento de
dados.
É um ambiente para
tratamento e armazenamento
apenas de dados relacionais.
Trata-se de um componente
do HDFS responsável pela
implementação do
mecanismo MapReduce para
fazer o gerenciamento dos
dados.
5 Marcar para revisão
Reconhecer os conceitos de Data Lake
é fundamental para o profissional de
Tecnologia da Informação. Selecione a
opção correta a respeito do Data Lake.
Possui alta latência para
acesso dos dados.
Aplica processos de
tratamento nos dados.
Armazena os dados de modo
eficiente.
10/11/2025, 11:20 estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/
https://estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/ 3/8
D
E
A
B
C
Demanda por equipamentos
especiais.
São exclusivos da
distribuição Hadoop Apache.
6 Marcar para revisão
Organizações que lidam com grandes
volumes de dados, como redes sociais
e plataformas de streaming,
frequentemente adotam soluções
específicas para garantir desempenho,
escalabilidade e tolerância a falhas.
Uma dessas soluções é o Hadoop,
cuja arquitetura é composta por
diversos componentes que trabalham
em conjunto. Considerando a função
desses componentes, qual deles é
responsável por armazenar os dados
efetivos dentro do cluster Hadoop?
YARN, por ser o componente
responsável pelo
agendamento e
gerenciamento de tarefas
distribuídas
NameNode, por conter os
metadados que descrevem a
localização dos arquivos
armazenados
MapReduce, por possibilitar a
divisão das tarefas em pares
chave-valor para
processamento paralelo
10/11/2025, 11:20 estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/
https://estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/ 4/8
D
E
A
B
C
DataNode, por ser o
responsável direto pelo
armazenamento físico dos
dados no cluster
Hadoop Common, por
fornecer bibliotecas e scripts
necessários à execução dos
demais componentes
7 Marcar para revisão
Durante a execução de aplicações
com Hadoop, a fase de redução
desempenha papel fundamental no
processamento final dos dados. Essa
etapa é precedida por um processo
que organiza e redistribui os pares
chave-valor gerados pelas tarefas de
mapeamento, otimizando a carga de
trabalho entre os nós. Qual é o nome
desse processo e qual é sua principal
contribuição?
Combinação – reduz a
quantidade de tarefas no
redutor ao eliminar duplicatas
Classificação – organiza os
dados em ordem alfabética
antes da gravação final
Embaralhamento – redistribui
os dados intermediários para
os redutores corretos
10/11/2025, 11:20 estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/
https://estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/ 5/8
D
E
A
B
C
D
E
Particionamento – divide os
dados em grupos com base
em similaridade semântica
Agendamento – determina
quais tarefas devem ser
executadas com prioridade
8 Marcar para revisão
O Hadoop é uma tecnologia
especializada em atender as
demandas de Big Data. Selecione a
opção correta que contenha a
linguagem de programação
utilizada para o desenvolvimento e
implementação do Hadoop.
Python
Java
Lua
JavaScript
Perl
9 Marcar para revisão
O Hadoop é um framework de
código aberto voltado para
aplicações de Big Data. Neste
sentido, selecione a alternativa
10/11/2025, 11:20 estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/
https://estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/ 6/8
A
B
C
D
E
correta que apresenta um grande
desafio no processo de
configuração e gerenciamento do
Hadoop.
Processos de extração,
transformação e
carregamento dos dados.
Mecanismo para melhorar o
processamento dos dados.
Aplicar políticas de
segurança.
Gerenciamento do
armazenamento de dados.
Tratar dados não-
estruturados.
10 Marcar para revisão
A arquitetura do Hadoop é projetada
para garantir alto desempenho na
manipulação de grandes volumes de
dados distribuídos. Um de seus
principais diferenciais é a capacidade
de dividir tarefas entre diversos nós do
cluster. Qual componente da
arquitetura Hadoop é responsável por
gerenciar os recursos
computacionais disponíveis e
monitorar o uso de CPU, memória e
disco em cada máquina do cluster?
10/11/2025, 11:20 estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/
https://estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/ 7/8
A
B
C
D
E
NameNode
NodeManager
DataNode
TaskTracker
Mapper
10/11/2025, 11:20 estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/
https://estacio.saladeavaliacoes.com.br/exercicio/6911f4995cb9efb59786b45a/ 8/8

Mais conteúdos dessa disciplina