Prévia do material em texto
Fazer teste: Semana 5 - Atividade Avaliativa Informações do teste Descrição Instruções Várias tentativas Este teste permite 3 tentativas. Esta é a tentativa número 1. Forçar conclusão Este teste pode ser salvo e retomado posteriormente. Suas respostas foram salvas automaticamente. a. b. c. d. e. PERGUNTA 1 O framework Kafka, para processamento em larga escala, é uma plataforma de streaming distribuído que possui alta escalabilidade, tolerância a falhas, permite alto nível de paralelismo e desacoplamento entre produtores de dados e consumidores de dados. Analise estas duas definições: as mensagens são persistidas em uma fila, mas uma mensagem específica pode ser consumida por, no máximo, um consumidor; as mensagens são persistidas em um tópico, e os consumidores podem se inscrever em um ou mais tópicos e consumir todas as mensagens desse tópico. Assinale a alternativa correta que define os tipos de sistemas de mensagens para a definição dos trechos acima, respectivamente. Buffer e queue. Ponto a ponto e publicar-assinar. Ponto a ponto e queue. Queue e buffer. Publicar-assinar e ponto a ponto. 1,6 pontos Salva PERGUNTA 2 O conjunto de soluções do framework Apache Spark é denominado “ecossistema Apache Spark”. Esse ecossistema é constituído pelos seguintes elementos: Spark Core, Spark SQL, Spark Streaming, MLLib e Graphx, cada qual com as suas funções específicas no framework. Com relação às funcionalidades dos elementos que compõem o ecossistema do framework Apache Spark, avalie as afirmações a seguir que explicam essas vantagens. I. Spark Core: refere-se ao motor de execução da plataforma e 1,4 pontos Salva Estado de Conclusão da Pergunta: 1 2 3 4 5 6 7 Clique em Salvar e Enviar para salvar e enviar. Clique em Salvar todas as respostas para salvar todas as resp a. b. c. d. e. p ç p representa um mecanismo de processamento de dados distribuído. II. Spark SQL: é um mecanismo para o Hadoop Hive que permite que consultas não modificadas sejam executadas de forma mais rápida. III. Spark Streaming: é um mecanismo que permite aplicativos interativos e analíticos poderosos no streaming de dados. IV. GraphX: é o mais novo componente do Spark e representa uma biblioteca de aprendizado de máquina escalável. V. MLLib: é um mecanismo de computação gráfica que fornece vários utilitários úteis para tarefas de aprendizado de máquina. É correto o que se afirma em: I, II e III, apenas. II, III e IV, apenas. III e IV, apenas. I, II, III e IV, apenas. I, II, III, IV e V. a. b. c. d. e. PERGUNTA 3 O Spark representa outro framework para processamento de dados em larga escala, que foi motivado, por exemplo, pelo aumento dos datasets na web e pela Internet das Coisas (IoT). O Apache Spark, uma alternativa ao MapReduce para algumas aplicações, é um sistema de computação em cluster com baixa latência e usado para grandes conjuntos de dados. Assinale a alternativa que descreve um dos principais benefícios do Apache Spark. Trabalha com nós de processamento, denominados “hosts”, e consegue acelerar o processamento dos dados. Separa os processos em grids e ranks, o que facilita a administração dos processos pelo sistema central. Em vez de carregar os dados do disco para cada consulta, os dados são compartilhados diretamente na memória. Utiliza sub-partições de disco para facilitar o processamento dos dados dos diferentes usuários do sistema. Trabalha com o conceito de paginação de dados, separando as camadas de processamento por prioridades. 1,4 pontos Salva PERGUNTA 4 A arquitetura do framework Apache Hadoop utiliza a maior parte do seu poder computacional e de armazenamento de dados do sistema nos nós principais do cluster Além disso utiliza elementos para balancear 1,4 pontos Salva Clique em Salvar e Enviar para salvar e enviar. Clique em Salvar todas as respostas para salvar todas as resp a. b. c. d. e. nós principais do cluster. Além disso, utiliza elementos para balancear a carga de processamento, como Sistema de Arquivos Distribuídos Hadoop (HDFS), NameNode, DataNode e MapReduce Engine. Relacione adequadamente os elementos do Apache Hadoop com as características a seguir. 1. NameNode. 2. DataNode. I. O servidor que contém a instância é bastante crucial, pois existe apenas um. II. Pode ser executado em qualquer sistema de arquivos subjacente (ext3/4, NTFS etc.) III. Log de transações para exclusões/inclusões de arquivos etc. Assinale a alternativa que correlaciona adequadamente os dois grupos de informações. 1-I; 2-II; 2-III. 1-II; 2-I; 2-III. 1-I; 1-II; 2-III. 1-I; 1-III; 2-II. 1-I; 2-II; 1-III. a. b. c. d. e. PERGUNTA 5 O Spark representa outro framework para processamento de dados em larga escala, que foi motivado, por exemplo, pelo aumento dos datasets na web e pela Internet das Coisas (IoT). O Apache Spark é um sistema de computação em cluster com baixa latência e usado para grandes conjuntos de dados. Baseado no texto acima, identifique se são verdadeiras (V) ou falsas (F) as afirmativas a seguir, que demonstram os benefícios da utilização do Apache Spark. I. ( ) Generaliza o MapReduce. II. ( ) Modelo de programação. III. ( ) Domínio de sistemas. IV. ( ) Gerenciamento de memória. V. ( ) Movimentação de dados. Assinale a alternativa que apresenta a sequência correta. V - V - V - V - V. F - F - F - F - F. V - F - F - V - F. V - V - F - V - V. F - V - V - V - F. 1,4 pontos Salva Clique em Salvar e Enviar para salvar e enviar. Clique em Salvar todas as respostas para salvar todas as resp Xande Riscado a. b. c. d. e. PERGUNTA 6 O framework Apache Hadoop pode ser encontrado em aplicações de vários segmentos do mercado devido ao seu grande poder de processamento de dados em larga escala, aliado às suas características, como capacidade de processamento, flexibilidade, disponibilidade e custo baixo. Leia as afirmações a seguir de exemplos de áreas que aplicam o Apache Hadoop. I. Aplicações na publicidade. II. Aplicações em segurança. III. Aplicações em machine learning. É correto que se afirma em: II, apenas. I e II, apenas. I e III, apenas. II e III, apenas. I, II e III. 1,4 pontos Salva a. b. c. d. e. PERGUNTA 7 O Apache Hadoop é um exemplo de framework utilizado, sendo uma implementação de código aberto de estruturas para armazenamento de dados e computação confiável, escalável e distribuído. O Hadoop é uma arquitetura flexível e altamente disponível para computação em larga escala e processamento de dados em uma rede de hardware comum. Assinale a alternativa correta que descreve duas características/requisitos do Apache Hadoop. É escrito na linguagem C# e trabalha apenas com dados não estruturados. É escrito na linguagem Java e trabalha apenas com dados estruturados. É escrito na linguagem C# e trabalha apenas com dados estruturados. É escrito na linguagem C# e trabalha com dados estruturados e não estruturados. É escrito na linguagem Java e trabalha com dados estruturados e não estruturados. 1,4 pontos Salva Clique em Salvar e Enviar para salvar e enviar. Clique em Salvar todas as respostas para salvar todas as resp Clique em Salvar e Enviar para salvar e enviar. Clique em Salvar todas as respostas para salvar todas as resp