A descrição apresentada na pergunta está incompleta, mas posso afirmar que a definição apresentada sobre RDDs está correta. RDDs (Resilient Distributed Datasets) são uma coleção de dados somente para leitura, particionada em um conjunto de máquinas que são acessados por meio de operações paralelas que podem ser de dois tipos: transformação e ação. As transformações criam um novo RDD a partir de um RDD existente, enquanto as ações retornam um valor para o programa ou gravam dados em um sistema externo.
Para escrever sua resposta aqui, entre ou crie uma conta
Compartilhar