Exercício - Hadoop e Armazenamento de Dados

Bases de Dados

ESTÁCIO

nata viana

em 11/09/2023

Questões resolvidas

Em relação ao Data Lake, selecione a opção correta que contenha o(s) formato(s) de dados que pode(m) ser armazenado(s) nele. A Apenas não estruturado B Estruturado, não estruturado e semiestruturado C Estruturado e semiestruturado D Apenas estruturado E Apenas tabelas relacionais

O Hadoop é um framework de código aberto voltado para aplicações de Big Data.
Neste sentido, selecione a alternativa correta que apresenta um grande desafio no processo de configuração e gerenciamento do Hadoop.
A – Processos de extração, transformação e carregamento dos dados.
B – Mecanismo para melhorar o processamento dos dados.
C – Gerenciamento do armazenamento de dados.
D – Gerenciamento do armazenamento de dados.
E – Tratar dados não-estruturados.

Em relação aos arquivos de configuração do Hadoop, selecione a opção correta que contém o arquivo que trata das configurações do HDFS.
A – mapred-site.xml
B – core-site.xml
C – hdfs-site.xml
D – yarn-site.xml
E – hadoop-env.cmd

Reconhecer os conceitos de Data Lake é fundamental para o profissional de Tecnologia da Informação. Selecione a opção correta que define resumidamente o que é o Data Lake.
A É um repositório para tratamento dos dados.
B É uma tecnologia de armazenamento e processamento de dados.
C É um repositório centralizado para armazenamento de dados.
D É um ambiente para tratamento e armazenamento apenas de dados relacionais.
E Trata-se de um componente do HDFS responsável pela implementação do mecanismo MapReduce para fazer o gerenciamento dos dados.

A respeito do HDFS, selecione a opção correta cujo componente lógico mantém os dados do usuário na forma de blocos de dados.
A YARN
B NameNode
C Bloco de dados
D Replicação
E DataNode

O data lake é composto por camadas e níveis.
Selecione a opção correta a respeito da camada responsável por fazer a marcação dos dados do Data Lake.
A – Camada de governança
B – Camada de Metadados
C – Camada de segurança
D – Camada de gerenciamento de dados
E – Camada de gerenciamento do ciclo de vida da informação

Selecione a opção correta a respeito do nível do Data Lake responsável por fornecer dados para a análise de negócios. a) Nível de gerenciamento b) Nível de governança c) Nível de Metadados d) Nível de consumo e) Nível de admissão

A respeito do Hadoop, selecione a opção correta com o componente que faz o rastreamento de tarefas.
A) MapReduce
B) HDFS
C) Task manager
D) Camada de ingestão
E) Mrjob

Em relacáo ao Hadoop, selecione a opcáo correta que trata da otimizacáo da relacáo custo e benefício a respeito da expansao de uma infraestrutura.
A - Escalabilidade
B - Tempo de resposta
C - Volume de dados
D - Flexibilidade
E - Variedade dos dados

Em relação às fases do Hadoop, selecione a opção correta que apresenta o componente responsável pela geração de pares intermediários de valor e chave.
A Embaralhamento
B Combinação
C Agrupamento
D Redução
E Gravação da saída

Conteúdos escolhidos para você

12 pág.

Simulado 1_Tópicos de Big Data em Python

ESTÁCIO

4 pág.

Tópicos de bigData com python - EX 2

ESTÁCIO

14 pág.

BIG DATA PYTHON - TEMA 03 ex04

ESTÁCIO

3 pág.

TÓPICOS DE BIG DATA EM PYTHON

ESTÁCIO

53 pág.

hadoop-e-armazenamento-de-dados

ESTÁCIO EAD

Perguntas dessa disciplina

Princípio de Big Data Desafio 1 Você foi recentemente contratado por uma empresa de análise de dados como analista de Big Data. Durante uma reunião co

ESTÁCIO

A utilização de estatística e métodos de aprendizado de máquina em aplicações de Big Data é cada vez mais comum. Um dos fatores que influencia para...

Questão 5 | MINERACAO DE DADOS Código da questão: 249031 Leia o trecho abaixo: “É importante destacar que o processo de KDD não requer que os dado...

Unifael

Questão 8/10 - Big Data Ler em voz alta Leia com atenção o texto a seguir, que trata da variedade dos dados encontrados na rede, um dos dez “Vs” do Bi

Uma das tarefas mais importantes do Big Data é o processo de ingestão de dados. A realização dessa tarefa depende de três características a respeito d

ESTÁCIO

Material

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Crie sua conta grátis para liberar esse material. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Questões resolvidas

Em relação ao Data Lake, selecione a opção correta que contenha o(s) formato(s) de dados que pode(m) ser armazenado(s) nele. A Apenas não estruturado B Estruturado, não estruturado e semiestruturado C Estruturado e semiestruturado D Apenas estruturado E Apenas tabelas relacionais

O Hadoop é um framework de código aberto voltado para aplicações de Big Data.
Neste sentido, selecione a alternativa correta que apresenta um grande desafio no processo de configuração e gerenciamento do Hadoop.
A – Processos de extração, transformação e carregamento dos dados.
B – Mecanismo para melhorar o processamento dos dados.
C – Gerenciamento do armazenamento de dados.
D – Gerenciamento do armazenamento de dados.
E – Tratar dados não-estruturados.

Em relação aos arquivos de configuração do Hadoop, selecione a opção correta que contém o arquivo que trata das configurações do HDFS.
A – mapred-site.xml
B – core-site.xml
C – hdfs-site.xml
D – yarn-site.xml
E – hadoop-env.cmd

Reconhecer os conceitos de Data Lake é fundamental para o profissional de Tecnologia da Informação. Selecione a opção correta que define resumidamente o que é o Data Lake.
A É um repositório para tratamento dos dados.
B É uma tecnologia de armazenamento e processamento de dados.
C É um repositório centralizado para armazenamento de dados.
D É um ambiente para tratamento e armazenamento apenas de dados relacionais.
E Trata-se de um componente do HDFS responsável pela implementação do mecanismo MapReduce para fazer o gerenciamento dos dados.

A respeito do HDFS, selecione a opção correta cujo componente lógico mantém os dados do usuário na forma de blocos de dados.
A YARN
B NameNode
C Bloco de dados
D Replicação
E DataNode

O data lake é composto por camadas e níveis.
Selecione a opção correta a respeito da camada responsável por fazer a marcação dos dados do Data Lake.
A – Camada de governança
B – Camada de Metadados
C – Camada de segurança
D – Camada de gerenciamento de dados
E – Camada de gerenciamento do ciclo de vida da informação

Selecione a opção correta a respeito do nível do Data Lake responsável por fornecer dados para a análise de negócios. a) Nível de gerenciamento b) Nível de governança c) Nível de Metadados d) Nível de consumo e) Nível de admissão

A respeito do Hadoop, selecione a opção correta com o componente que faz o rastreamento de tarefas.
A) MapReduce
B) HDFS
C) Task manager
D) Camada de ingestão
E) Mrjob

Em relacáo ao Hadoop, selecione a opcáo correta que trata da otimizacáo da relacáo custo e benefício a respeito da expansao de uma infraestrutura.
A - Escalabilidade
B - Tempo de resposta
C - Volume de dados
D - Flexibilidade
E - Variedade dos dados

Em relação às fases do Hadoop, selecione a opção correta que apresenta o componente responsável pela geração de pares intermediários de valor e chave.
A Embaralhamento
B Combinação
C Agrupamento
D Redução
E Gravação da saída