Baixe o app para aproveitar ainda mais
Prévia do material em texto
Exercício por Temas avalie sua aprendizagem Selecione a opção correta a respeito do nível do Data Lake responsável por fornecer dados para a análise de negócios. Reconhecer os conceitos de Data Lake é fundamental para o pro�ssional de Tecnologia da Informação. Selecione a opção correta que de�ne resumidamente o que é o Data Lake. TÓPICOS DE BIG DATA EM PYTHON NATÃ VIANA ALVES 202002695986 TÓPICOS DE BIG DAT 2023.3 EAD (GT) / EX Prezado (a) Aluno(a), Você fará agora seu EXERCÍCIO! Lembre-se que este exercício é opcional, mas não valerá ponto para sua avaliação. O mesmo será composto de questões de múltipla escolha. Após responde cada questão, você terá acesso ao gabarito comentado e/ou à explicação da mesma. Aproveite para se familiarizar com este modelo de questões que será usado na sua AV e AVS. 02508 - HADOOP E ARMAZENAMENTO DE DADOS 1. Nível de admissão Nível de consumo Nível de governança Nível de gerenciamento Nível de Metadados Data Resp.: 10/10/2023 18:18:09 Explicação: O Data Lake possui três níveis: o de admissão, o de gerenciamento e o de consumo que tratam, respectivamente, dos serviços de aquisição de dados, da identi�cação e localização dos dados e que fornecem dados para ser consumidos por aplicações de apoio à tomada de decisão. 2. É um repositório para tratamento dos dados. É um repositório centralizado para armazenamento de dados. É uma tecnologia de armazenamento e processamento de dados. javascript:voltar(); javascript:voltar(); javascript:voltar(); javascript:voltar(); Em relação ao Data Lake, selecione a opção correta que contenha o(s) formato(s) de dados que pode(m) ser armazenado(s) nele. A respeito do HDFS, selecione a opção correta cujo componente lógico mantém os dados do usuário na forma de blocos de dados. O Hadoop é uma tecnologia especializada em atender as demandas de Big Data. Selecione a opção correta que contenha a linguagem de programação utilizada para o desenvolvimento e implementação do Hadoop. Trata-se de um componente do HDFS responsável pela implementação do mecanismo MapReduce para fazer o gerenciamento dos dados. É um ambiente para tratamento e armazenamento apenas de dados relacionais. Data Resp.: 10/10/2023 18:18:18 Explicação: O Data Lake é um repositório centralizado capaz de armazenar dados nos diversos formatos: estruturados, não estruturados e semiestruturados sem a necessidade de aplicar nenhum tratamento. 3. apenas tabelas relacionais apenas estruturado estruturado e semiestruturado estruturado, não estruturado e semiestruturado apenas não estruturado Data Resp.: 10/10/2023 18:18:36 Explicação: O Data Lake pode armazenar dados estruturados, semiestruturados e não estruturados que correspondem a característica de variedade dos dados que é bem típica de aplicações de Big Data. 4. Bloco de dados Replicação NameNode DataNode YARN Data Resp.: 10/10/2023 18:18:54 Explicação: O DataNode é componente da arquitetura do HDFS responsável pelo armazenamento dos dados na forma de blocos de dados. 5. Lua Perl Java Python Java Script Data Resp.: 10/10/2023 18:19:15 A respeito do Hadoop, selecione a opção correta com o componente que faz o rastreamento de tarefas. Reconhecer os conceitos de Data Lake é fundamental para o pro�ssional de Tecnologia da Informação. Selecione a opção correta a respeito do Data Lake. A respeito dos arquivos de con�guração do Hadoop, selecione a opção correta com as tags que fornecem acesso aos parâmetros de con�guração. Explicação: O Hadoop foi desenvolvido usando, originalmente, a linguagem de programação Java na distribuição livre da Apache Foundation. Atualmente, diferentes distribuições do framework estão implementadas em diversas linguagens, entre as quais o Python. 6. Camada de ingestão MapReduce Task manager HDFS Mrjob Data Resp.: 10/10/2023 18:19:34 Explicação: O mecanismo MapReduce é responsável pela distribuição de tarefas em um cluster, através de rastreamento de tarefas (Task Trackers) e de trabalhos (Job Trackers). As demais alternativas, embora tenham relação com o Hadoop, não possuem a funcionalidade de rastreamento de tarefas. 7. Demandam por equipamentos especiais. Possui alta latência para acesso dos dados. Aplicam processos de tratamento nos dados. Armazenam os dados de modo e�ciente. São exclusivos da distribuição Hadoop Apache. Data Resp.: 10/10/2023 18:20:06 Explicação: O Data Lake utiliza um método muito e�ciente para fazer o armazenamento dos dados. Dessa forma ele possui baixa latência para acessar os dados. Além disso, o Data Lake não demanda por equipamentos especiais e não é de uso exclusivo da distribuição Hadoop Apache. 8. Data Resp.: 10/10/2023 18:20:10 Em relação as fases do Hadoop, selecione a opção correta que apresenta o componente responsável pela geração de pares intermediários de valor e chave. O Hadoop é um framework de código aberto voltado para aplicações de Big Data. Neste sentido, selecione a alternativa correta que apresenta um grande desa�o no processo de con�guração e gerenciamento do Hadoop. Explicação: As con�gurações dos arquivos do Hadoop são especi�cadas entre as tags con�gurations. As demais opções não representam tags corretas para parâmetros de con�gurações do Hadoop. 9. Combinação Embaralhamento Agrupamento Gravação da saída Redução Data Resp.: 10/10/2023 18:20:34 Explicação: Através do processo de embaralhamento, também conhecido pelo termo em inglês "shuf�ing", o mecanismo MapReduce faz a geração de pares intermediários de valor e chave que são transferidos para a fase de redução, o que é realizado em paralelo com outras tarefas da fase de mapeamento. 10. Mecanismo para melhorar o processamento dos dados. Processos de extração, transformação e carregamento dos dados. Gerenciamento do armazenamento de dados. Tratar dados não-estruturados. Aplicar políticas de segurança. Data Resp.: 10/10/2023 18:23:15 Explicação: O tratamento da segurança da informação é um grande desa�o para o Hadoop, pois o pro�ssional responsável por essa etapa terá que con�gurar o sistema que, pela natureza dos problemas de Big Data, é uma tarefa complexa. Não Respondida Não Gravada Gravada Exercício por Temas inciado em 10/10/2023 18:17:59.
Compartilhar