Buscar

Tópicos de bigData com python - EX 2

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Exercício por
Temas
 avalie sua aprendizagem
Selecione a opção correta a respeito do nível do Data Lake responsável por fornecer dados para a análise de
negócios.
Reconhecer os conceitos de Data Lake é fundamental para o pro�ssional de Tecnologia da Informação. Selecione a
opção correta que de�ne resumidamente o que é o Data Lake.
TÓPICOS DE BIG DATA EM PYTHON  
NATÃ VIANA ALVES 202002695986
TÓPICOS DE BIG DAT  2023.3 EAD (GT) / EX
Prezado (a) Aluno(a),
Você fará agora seu EXERCÍCIO! Lembre-se que este exercício é opcional, mas não valerá ponto para sua avaliação. O
mesmo será composto de questões de múltipla escolha.
Após responde cada questão, você terá acesso ao gabarito comentado e/ou à explicação da mesma. Aproveite para se
familiarizar com este modelo de questões que será usado na sua AV e AVS.
02508 - HADOOP E ARMAZENAMENTO DE DADOS
 
1.
Nível de admissão
Nível de consumo
Nível de governança
Nível de gerenciamento
Nível de Metadados
Data Resp.: 10/10/2023 18:18:09
Explicação:
O Data Lake possui três níveis: o de admissão, o de gerenciamento e o de consumo que tratam, respectivamente,
dos serviços de aquisição de dados, da identi�cação e localização dos dados e que fornecem dados para ser
consumidos por aplicações de apoio à tomada de decisão.
 
2.
É um repositório para tratamento dos dados.
É um repositório centralizado para armazenamento de dados.
É uma tecnologia de armazenamento e processamento de dados.
javascript:voltar();
javascript:voltar();
javascript:voltar();
javascript:voltar();
Em relação ao Data Lake, selecione a opção correta que contenha o(s) formato(s) de dados que pode(m) ser
armazenado(s) nele.
A respeito do HDFS, selecione a opção correta cujo componente lógico mantém os dados do usuário na forma de
blocos de dados.
O Hadoop é uma tecnologia especializada em atender as demandas de Big Data. Selecione a opção correta que
contenha a linguagem de programação utilizada para o desenvolvimento e implementação do Hadoop.
Trata-se de um componente do HDFS responsável pela implementação do mecanismo MapReduce para fazer
o gerenciamento dos dados.
É um ambiente para tratamento e armazenamento apenas de dados relacionais.
Data Resp.: 10/10/2023 18:18:18
Explicação:
O Data Lake é um repositório centralizado capaz de armazenar dados nos diversos formatos: estruturados, não
estruturados e semiestruturados sem a necessidade de aplicar nenhum tratamento.
 
3.
apenas tabelas relacionais
apenas estruturado
estruturado e semiestruturado
estruturado, não estruturado e semiestruturado
apenas não estruturado
Data Resp.: 10/10/2023 18:18:36
Explicação:
O Data Lake pode armazenar dados estruturados, semiestruturados e não estruturados que correspondem a
característica de variedade dos dados que é bem típica de aplicações de Big Data.
 
4.
Bloco de dados
Replicação
NameNode
DataNode
YARN
Data Resp.: 10/10/2023 18:18:54
Explicação:
O DataNode é componente da arquitetura do HDFS responsável pelo armazenamento dos dados na forma de
blocos de dados.
 
5.
Lua
Perl
Java
Python
Java Script
Data Resp.: 10/10/2023 18:19:15
A respeito do Hadoop, selecione a opção correta com o componente que faz o rastreamento de tarefas.
Reconhecer os conceitos de Data Lake é fundamental para o pro�ssional de Tecnologia da Informação. Selecione a
opção correta a respeito do Data Lake.
A respeito dos arquivos de con�guração do Hadoop, selecione a opção correta com as tags que fornecem acesso
aos parâmetros de con�guração.
Explicação:
O Hadoop foi desenvolvido usando, originalmente, a linguagem de programação Java na distribuição livre da
Apache Foundation. Atualmente, diferentes distribuições do framework estão implementadas em diversas
linguagens, entre as quais o Python.
 
6.
Camada de ingestão
MapReduce
Task manager
HDFS
Mrjob
Data Resp.: 10/10/2023 18:19:34
Explicação:
O mecanismo MapReduce é responsável pela distribuição de tarefas em um cluster, através de rastreamento de
tarefas (Task Trackers) e de trabalhos (Job Trackers). As demais alternativas, embora tenham relação com o
Hadoop, não possuem a funcionalidade de rastreamento de tarefas.
 
7.
Demandam por equipamentos especiais.
Possui alta latência para acesso dos dados.
Aplicam processos de tratamento nos dados.
Armazenam os dados de modo e�ciente.
São exclusivos da distribuição Hadoop Apache.
Data Resp.: 10/10/2023 18:20:06
Explicação:
O Data Lake utiliza um método muito e�ciente para fazer o armazenamento dos dados. Dessa forma ele possui
baixa latência para acessar os dados. Além disso, o Data Lake não demanda por equipamentos especiais e não é
de uso exclusivo da distribuição Hadoop Apache.
 
8.
Data Resp.: 10/10/2023 18:20:10
Em relação as fases do Hadoop, selecione a opção correta que apresenta o componente responsável pela geração
de pares intermediários de valor e chave.
O Hadoop é um framework de código aberto voltado para aplicações de Big Data. Neste sentido, selecione a
alternativa correta que apresenta um grande desa�o no processo de con�guração e gerenciamento do
Hadoop.
Explicação:
As con�gurações dos arquivos do Hadoop são especi�cadas entre as tags con�gurations. As demais opções não
representam tags corretas para parâmetros de con�gurações do Hadoop.
 
9.
Combinação
Embaralhamento
Agrupamento
Gravação da saída
Redução
Data Resp.: 10/10/2023 18:20:34
Explicação:
Através do processo de embaralhamento, também conhecido pelo termo em inglês "shuf�ing", o mecanismo
MapReduce faz a geração de pares intermediários de valor e chave que são transferidos para a fase de redução,
o que é realizado em paralelo com outras tarefas da fase de mapeamento.
 
10.
Mecanismo para melhorar o processamento dos dados.
Processos de extração, transformação e carregamento dos dados.
Gerenciamento do armazenamento de dados.
Tratar dados não-estruturados.
Aplicar políticas de segurança.
Data Resp.: 10/10/2023 18:23:15
Explicação:
O tratamento da segurança da informação é um grande desa�o para o Hadoop, pois o pro�ssional responsável
por essa etapa terá que con�gurar o sistema que, pela natureza dos problemas de Big Data, é uma tarefa
complexa.
    Não Respondida      Não Gravada     Gravada
Exercício por Temas inciado em 10/10/2023 18:17:59.

Outros materiais