Buscar

AS-V - BIG DATA

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Fazer teste: AS V 
 
PERGUNTA 1 
1. Analise as afirmativas: 
I. O Resilient Distributed Datasets (RDD) é o conceito central da plataforma 
Spark. Foi desenvolvido para suportar o armazenamento de dados na memória 
e distribuído ou em um cluster, que implementa sua tolerância a falhas, devido, 
em parte, ao seu rastreamento de dados brutos ou processamentos.; 
II. O RDD é uma funcionalidade permite que usuários da plataforma ou software 
R utilizem funções ou funcionalidades Spark de maneira mais usual.; 
III. Spark Streaming aproveita a capacidade de processamento rápido da Spark 
Core para executar os processamentos. Permite a execução e transformações 
RDD (Solids Distributed Datasets) nesses pedações menores de dados e lotes 
de processamento.; 
Selecione a correta alternativa quanto às afirmativas: 
 
a. I – correta, II – correta e III - correta. 
 
b. I – incorreta, II – correta e III - correta. 
 
c. I – correta, II – incorreta e III - correta. 
 
d. I – correta, II – correta e III - incorreta. 
 
e. I – incorreta, II – incorreta e III - incorreta. 
 
PERGUNTA 2 (ERRADA) 
1. Analise as afirmativas: 
I. O Spark Core é a plataforma principal de execução que possibilita é base para 
todas as outras funcionalidades. Ela fornece a execução em memória e faz 
referência a conjuntos de dados em sistemas de armazenamento externos e 
distribuídos; 
II. O framework Spark necessita, para sua execução básica, da linguagem Java, 
a linguagem Scala e a linguagem Python instaladas no sistema operacional; 
III. MLlib é uma biblioteca de aprendizagem por máquina distribuída que roda 
sobre a arquitetura de Spark baseada em memória distribuída; 
Selecione a correta alternativa quanto às afirmativas: 
 
a. I – correta, II – correta e III - correta. 
 
b. I – incorreta, II – correta e III - correta. 
 
c. I – correta, II – incorreta e III - correta. 
 
d. I – correta, II – correta e III - incorreta. 
 
e. I – incorreta, II – incorreta e III - incorreta. 
 
 
PERGUNTA 3 
1. Analise a definição: é um projeto de código livre da fundação Apache que possui 
uma biblioteca de implementação de algoritmos para aprendizagem de máquina. 
Selecione a alternativa que traz o nome da ferramenta ou projeto a qual a 
definição se refere: 
 
a. Hadoop. 
 
b. Spark. 
 
c. Mahout. 
 
d. RDD. 
 
e. HDFS. 
 
 
 
 
PERGUNTA 4 
1. Analise as afirmativas: 
I. O Mahout é uma ferramenta desenvolvida em linguagem de programação 
Java dentro do projeto de computação distribuída Hadoop; 
II. O projeto Mahout possui implementações de diversos algoritmos em sua 
execução direta no Hadoop com o Mapreduce; 
III. O projeto Mahout não permite integração e implementações de algoritmo 
usando o Spark; 
Selecione a correta alternativa quanto às afirmativas: 
 
a. I – correta, II – correta e III - correta. 
 
b. I – incorreta, II – correta e III - correta. 
 
c. I – correta, II – incorreta e III - correta. 
 
d. I – correta, II – correta e III - incorreta. 
 
e. I – incorreta, II – incorreta e III - incorreta. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
TENTATIVA 2 
 
 
Fazer teste: AS V 
 
PERGUNTA 1 
1. Analise as afirmativas: 
I. O Mahout é uma ferramenta desenvolvida em linguagem de programação Java 
dentro do projeto de computação distribuída Hadoop; 
II. O projeto Mahout possui implementações de diversos algoritmos em sua execução 
direta no Hadoop com o Mapreduce; 
III. O projeto Mahout não permite integração e implementações de algoritmo usando o 
Spark; 
Selecione a correta alternativa quanto às afirmativas: 
 
a. I – correta, II – correta e III - correta. 
 
b. I – incorreta, II – correta e III - correta. 
 
c. I – correta, II – incorreta e III - correta. 
 
d. I – correta, II – correta e III - incorreta. 
 
e. I – incorreta, II – incorreta e III - incorreta. 
 
PERGUNTA 2 
1. Analise o comando: hadoopfs - copyFromLocal C50 / 
Analise as afirmativas quanto ao comando: 
I. -copyFromLocal serve para copiar algo para o HDFS; 
II. C50 é a pasta ou arquivo de origem a ser copiado; 
III. / serve para formatar a pasta de destino; 
Selecione a correta alternativa quanto às afirmativas: 
 
a. I – correta, II – correta e III - correta. 
 
b. I – incorreta, II – correta e III - correta. 
 
c. I – correta, II – incorreta e III - correta. 
 
d. I – correta, II – correta e III - incorreta. 
 
e. I – incorreta, II – incorreta e III - incorreta. 
 
 
 
 
 
 
 
 
 
 
 
 
PERGUNTA 3 
1. Analise a definição: é um projeto de código livre da fundação Apache que possui uma 
biblioteca de implementação de algoritmos para aprendizagem de máquina. Selecione 
a alternativa que traz o nome da ferramenta ou projeto a qual a definição se refere: 
 
a. Hadoop. 
 
b. Spark. 
 
c. Mahout. 
 
d. RDD. 
 
e. HDFS. 
PERGUNTA 4 
1. Analise as afirmativas: 
I. O Resilient Distributed Datasets (RDD) é o conceito central da plataforma Spark. Foi 
desenvolvido para suportar o armazenamento de dados na memória e distribuído ou 
em um cluster, que implementa sua tolerância a falhas, devido, em parte, ao seu 
rastreamento de dados brutos ou processamentos.; 
II. O RDD é uma funcionalidade permite que usuários da plataforma ou software R 
utilizem funções ou funcionalidades Spark de maneira mais usual.; 
III. Spark Streaming aproveita a capacidade de processamento rápido da Spark Core 
para executar os processamentos. Permite a execução e transformações RDD (Solids 
Distributed Datasets) nesses pedações menores de dados e lotes de processamento.; 
Selecione a correta alternativa quanto às afirmativas: 
 
a. I – correta, II – correta e III - correta. 
 
b. I – incorreta, II – correta e III - correta. 
 
c. I – correta, II – incorreta e III - correta. 
 
d. I – correta, II – correta e III - incorreta. 
 
e. I – incorreta, II – incorreta e III - incorreta.

Outros materiais