Baixe o app para aproveitar ainda mais
Prévia do material em texto
PERGUNTA 1 1. Analise as afirmativas: I. O Mahout é uma ferramenta desenvolvida em linguagem de programação Java dentro do projeto de computação distribuída Hadoop; II. O projeto Mahout possui implementações de diversos algoritmos em sua execução direta no Hadoop com o Mapreduce; III. O projeto Mahout não permite integração e implementações de algoritmo usando o Spark; Selecione a correta alternativa quanto às afirmativas: a. I – correta, II – correta e III - correta. b. I – incorreta, II – correta e III - correta. c. I – correta, II – incorreta e III - correta. d. I – correta, II – correta e III - incorreta. e. I – incorreta, II – incorreta e III - incorreta. 0,2 pontos PERGUNTA 2 1. Analise as afirmativas: I. O Resilient Distributed Datasets (RDD) é o conceito central da plataforma Spark. Foi desenvolvido para suportar o armazenamento de dados na memória e distribuído ou em um cluster, que implementa sua tolerância a falhas, devido, em parte, ao seu rastreamento de dados brutos ou processamentos.; II. O RDD é uma funcionalidade permite que usuários da plataforma ou software R utilizem funções ou funcionalidades Spark de maneira mais usual.; III. Spark Streaming aproveita a capacidade de processamento rápido da Spark Core para executar os processamentos. Permite a execução e transformações RDD (Solids Distributed Datasets) nesses pedações menores de dados e lotes de processamento.; Selecione a correta alternativa quanto às afirmativas: a. I – correta, II – correta e III - correta. b. I – incorreta, II – correta e III - correta. c. I – correta, II – incorreta e III - correta. d. I – correta, II – correta e III - incorreta. e. I – incorreta, II – incorreta e III - incorreta. 0,2 pontos PERGUNTA 3 1. Analise as afirmativas: I. O Spark Core é a plataforma principal de execução que possibilita é base para todas as outras funcionalidades. Ela fornece a execução em memória e faz referência a conjuntos de dados em sistemas de armazenamento externos e distribuídos; II. O framework Spark necessita, para sua execução básica, da linguagem Java, a linguagem Scala e a linguagem Python instaladas no sistema operacional; III. MLlib é uma biblioteca de aprendizagem por máquina distribuída que roda sobre a arquitetura de Spark baseada em memória distribuída; Selecione a correta alternativa quanto às afirmativas: a. I – correta, II – correta e III - correta. b. I – incorreta, II – correta e III - correta. c. I – correta, II – incorreta e III - correta. d. I – correta, II – correta e III - incorreta. e. I – incorreta, II – incorreta e III - incorreta. 0,2 pontos PERGUNTA 4 1. Analise as afirmativas: I. O MapReduce com Hadoop tradicional é em torno de 100 vezes mais rápido do que o processamento com o Spark; II. O Spark permite um desempenho em torno de 100 vezes mais rápido que o MapReduce com Hadoop tradicional.; III. Como característica principal o Spark otimiza os processos executados através do Hadoop MapReduce em memória; Selecione a correta alternativa quanto às afirmativas: a. I – correta, II – correta e III - correta. b. I – incorreta, II – correta e III - correta. c. I – correta, II – incorreta e III - correta. d. I – correta, II – correta e III - incorreta. e. I – incorreta, II – incorreta e III - incorreta.
Compartilhar