Baixe o app para aproveitar ainda mais
Prévia do material em texto
Fazer teste: AS V Parte superior do formulário Informações do teste Descrição Instruções Várias tentativas Este teste permite 2 tentativas. Esta é a tentativa número 1. Forçar conclusão Este teste pode ser salvo e retomado posteriormente. Suas respostas foram salvas automaticamente. Estado de Conclusão da Pergunta: PERGUNTA 1 1. Analise o comando: hadoop fs -copyFromLocal C50 / Analise as afirmativas quanto ao comando: I. -copyFromLocal serve para copiar algo para o HDFS; II. C50 é a pasta ou arquivo de origem a ser copiado; III. / serve para formatar a pasta de destino; Selecione a correta alternativa quanto às afirmativas: a. I – correta, II – correta e III - correta. b. I – incorreta, II – correta e III - correta. c. I – correta, II – incorreta e III - correta. d. I – correta, II – correta e III - incorreta. e. I – incorreta, II – incorreta e III - incorreta. 0,2 pontos PERGUNTA 2 1. Analise as afirmativas: I. O MapReduce com Hadoop tradicional é em torno de 100 vezes mais rápido do que o processamento com o Spark; II. O Spark permite um desempenho em torno de 100 vezes mais rápido que o MapReduce com Hadoop tradicional.; III. Como característica principal o Spark otimiza os processos executados através do Hadoop MapReduce em memória; Selecione a correta alternativa quanto às afirmativas: a. I – correta, II – correta e III - correta. b. I – incorreta, II – correta e III - correta. c. I – correta, II – incorreta e III - correta. d. I – correta, II – correta e III - incorreta. e. I – incorreta, II – incorreta e III - incorreta. 0,2 pontos PERGUNTA 3 1. Analise a definição: é um projeto de código livre da fundação Apache que possui uma biblioteca de implementação de algoritmos para aprendizagem de máquina. Selecione a alternativa que traz o nome da ferramenta ou projeto a qual a definição se refere: a. Hadoop. b. Spark. c. Mahout. d. RDD. e. HDFS. 0,2 pontos PERGUNTA 4(ERRADA) 1. Analise as afirmativas: I. O Resilient Distributed Datasets (RDD) é o conceito central da plataforma Spark. Foi desenvolvido para suportar o armazenamento de dados na memória e distribuído ou em um cluster, que implementa sua tolerância a falhas, devido, em parte, ao seu rastreamento de dados brutos ou processamentos.; II. O RDD é uma funcionalidade permite que usuários da plataforma ou software R utilizem funções ou funcionalidades Spark de maneira mais usual.; III. Spark Streaming aproveita a capacidade de processamento rápido da Spark Core para executar os processamentos. Permite a execução e transformações RDD (Solids Distributed Datasets) nesses pedações menores de dados e lotes de processamento.; Selecione a correta alternativa quanto às afirmativas: a. I – correta, II – correta e III - correta. b. I – incorreta, II – correta e III - correta. c. I – correta, II – incorreta e III - correta. -> Resposta certa d. I – correta, II – correta e III - incorreta. e. I – incorreta, II – incorreta e III - incorreta. Parte inferior do formulário
Compartilhar