RDD significa Resilient Distributed Datasets, que em português pode ser traduzido como Conjunto de Dados Distribuídos e Resilientes. É uma estrutura de dados fundamental do Apache Spark, que permite o processamento distribuído de grandes conjuntos de dados em um cluster de computadores. A definição correta é "Uma coleção distribuída imutável de dados".
Para escrever sua resposta aqui, entre ou crie uma conta
Compartilhar