Buscar

RDDs suportam basicamente dois tipos de operações: transformações e ações. Avalie as seguintes afirmações a respeito das operações suportadas pel...

RDDs suportam basicamente dois tipos de operações: transformações e ações.

Avalie as seguintes afirmações a respeito das operações suportadas pelo Spark:

I – map é uma ação que passa cada elemento de um conjunto de dados por uma função e retorna um novo RDD representando os resultados.
II – reduce é uma ação que agrega todos os elementos de um RDD utilizando alguma função e retorna o resultado final ao DriverProgram.
III – Todas as transformações em Spark são preguiçosas, ou seja, são computadas apenas quando uma ação requisita um resultado para ser retornado para o Driver Program.
IV – É possível garantir a ordenação entre as execuções de cada tarefa utilizando a ação sort.
V – O método persist é utilizado para tornar-se um RDD persistente, esse método é importante para otimizar acessos futuros.
Dentre essas afirmações estão INCORRETAS:

I – map é uma ação que passa cada elemento de um conjunto de dados por uma função e retorna um novo RDD representando os resultados.
II – reduce é uma ação que agrega todos os elementos de um RDD utilizando alguma função e retorna o resultado final ao DriverProgram.
III – Todas as transformações em Spark são preguiçosas, ou seja, são computadas apenas quando uma ação requisita um resultado para ser retornado para o Driver Program.
IV – É possível garantir a ordenação entre as execuções de cada tarefa utilizando a ação sort.
V – O método persist é utilizado para tornar-se um RDD persistente, esse método é importante para otimizar acessos futuros.
A) II e IV
B) Nenhuma
C) Todas, exceto II
D) I, III e V
E) I e IV

Essa pergunta também está no material:

Apol2 - Big Data
6 pág.

Big Data Universidade Federal do ParanáUniversidade Federal do Paraná

Respostas

User badge image

Ed Verified user icon

A resposta correta é a alternativa D) I, III e V. A afirmação II está incorreta, pois a operação reduce não retorna o resultado final ao Driver Program, mas sim um valor agregado dos elementos do RDD. As afirmações I, III e V estão corretas. A operação map é uma transformação que passa cada elemento de um conjunto de dados por uma função e retorna um novo RDD representando os resultados. Todas as transformações em Spark são preguiçosas, ou seja, são computadas apenas quando uma ação requisita um resultado para ser retornado para o Driver Program. O método persist é utilizado para tornar um RDD persistente, o que é importante para otimizar acessos futuros.

0
Dislike0

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Responda

SetasNegritoItálicoSublinhadoTachadoCitaçãoCódigoLista numeradaLista com marcadoresSubscritoSobrescritoDiminuir recuoAumentar recuoCor da fonteCor de fundoAlinhamentoLimparInserir linkImagemFórmula

Para escrever sua resposta aqui, entre ou crie uma conta

User badge image

Mais conteúdos dessa disciplina