Baixe o app para aproveitar ainda mais
Prévia do material em texto
Fazer teste: AS V PERGUNTA 1 1. Analise as afirmativas: I. O Resilient Distributed Datasets (RDD) é o conceito central da plataforma Spark. Foi desenvolvido para suportar o armazenamento de dados na memória e distribuído ou em um cluster, que implementa sua tolerância a falhas, devido, em parte, ao seu rastreamento de dados brutos ou processamentos.; II. O RDD é uma funcionalidade permite que usuários da plataforma ou software R utilizem funções ou funcionalidades Spark de maneira mais usual.; III. Spark Streaming aproveita a capacidade de processamento rápido da Spark Core para executar os processamentos. Permite a execução e transformações RDD (Solids Distributed Datasets) nesses pedações menores de dados e lotes de processamento.; Selecione a correta alternativa quanto às afirmativas: a. I – correta, II – correta e III - correta. b. I – incorreta, II – correta e III - correta. c. I – correta, II – incorreta e III - correta. d. I – correta, II – correta e III - incorreta. e. I – incorreta, II – incorreta e III - incorreta. PERGUNTA 2 (ERRADA) 1. Analise as afirmativas: I. O Spark Core é a plataforma principal de execução que possibilita é base para todas as outras funcionalidades. Ela fornece a execução em memória e faz referência a conjuntos de dados em sistemas de armazenamento externos e distribuídos; II. O framework Spark necessita, para sua execução básica, da linguagem Java, a linguagem Scala e a linguagem Python instaladas no sistema operacional; III. MLlib é uma biblioteca de aprendizagem por máquina distribuída que roda sobre a arquitetura de Spark baseada em memória distribuída; Selecione a correta alternativa quanto às afirmativas: a. I – correta, II – correta e III - correta. b. I – incorreta, II – correta e III - correta. c. I – correta, II – incorreta e III - correta. d. I – correta, II – correta e III - incorreta. e. I – incorreta, II – incorreta e III - incorreta. PERGUNTA 3 1. Analise a definição: é um projeto de código livre da fundação Apache que possui uma biblioteca de implementação de algoritmos para aprendizagem de máquina. Selecione a alternativa que traz o nome da ferramenta ou projeto a qual a definição se refere: a. Hadoop. b. Spark. c. Mahout. d. RDD. e. HDFS. PERGUNTA 4 1. Analise as afirmativas: I. O Mahout é uma ferramenta desenvolvida em linguagem de programação Java dentro do projeto de computação distribuída Hadoop; II. O projeto Mahout possui implementações de diversos algoritmos em sua execução direta no Hadoop com o Mapreduce; III. O projeto Mahout não permite integração e implementações de algoritmo usando o Spark; Selecione a correta alternativa quanto às afirmativas: a. I – correta, II – correta e III - correta. b. I – incorreta, II – correta e III - correta. c. I – correta, II – incorreta e III - correta. d. I – correta, II – correta e III - incorreta. e. I – incorreta, II – incorreta e III - incorreta. TENTATIVA 2 Fazer teste: AS V PERGUNTA 1 1. Analise as afirmativas: I. O Mahout é uma ferramenta desenvolvida em linguagem de programação Java dentro do projeto de computação distribuída Hadoop; II. O projeto Mahout possui implementações de diversos algoritmos em sua execução direta no Hadoop com o Mapreduce; III. O projeto Mahout não permite integração e implementações de algoritmo usando o Spark; Selecione a correta alternativa quanto às afirmativas: a. I – correta, II – correta e III - correta. b. I – incorreta, II – correta e III - correta. c. I – correta, II – incorreta e III - correta. d. I – correta, II – correta e III - incorreta. e. I – incorreta, II – incorreta e III - incorreta. PERGUNTA 2 1. Analise o comando: hadoopfs - copyFromLocal C50 / Analise as afirmativas quanto ao comando: I. -copyFromLocal serve para copiar algo para o HDFS; II. C50 é a pasta ou arquivo de origem a ser copiado; III. / serve para formatar a pasta de destino; Selecione a correta alternativa quanto às afirmativas: a. I – correta, II – correta e III - correta. b. I – incorreta, II – correta e III - correta. c. I – correta, II – incorreta e III - correta. d. I – correta, II – correta e III - incorreta. e. I – incorreta, II – incorreta e III - incorreta. PERGUNTA 3 1. Analise a definição: é um projeto de código livre da fundação Apache que possui uma biblioteca de implementação de algoritmos para aprendizagem de máquina. Selecione a alternativa que traz o nome da ferramenta ou projeto a qual a definição se refere: a. Hadoop. b. Spark. c. Mahout. d. RDD. e. HDFS. PERGUNTA 4 1. Analise as afirmativas: I. O Resilient Distributed Datasets (RDD) é o conceito central da plataforma Spark. Foi desenvolvido para suportar o armazenamento de dados na memória e distribuído ou em um cluster, que implementa sua tolerância a falhas, devido, em parte, ao seu rastreamento de dados brutos ou processamentos.; II. O RDD é uma funcionalidade permite que usuários da plataforma ou software R utilizem funções ou funcionalidades Spark de maneira mais usual.; III. Spark Streaming aproveita a capacidade de processamento rápido da Spark Core para executar os processamentos. Permite a execução e transformações RDD (Solids Distributed Datasets) nesses pedações menores de dados e lotes de processamento.; Selecione a correta alternativa quanto às afirmativas: a. I – correta, II – correta e III - correta. b. I – incorreta, II – correta e III - correta. c. I – correta, II – incorreta e III - correta. d. I – correta, II – correta e III - incorreta. e. I – incorreta, II – incorreta e III - incorreta.
Compartilhar