Ed
ano passado
Vamos analisar cada uma das afirmações sobre o RDD (Resilient Distributed Dataset) do Apache Spark: ( ) É uma estrutura física do Spark que guarda informações dos objetos do Spark. Sua única limitação é não possuir um mecanismo para tratamento de falhas. É falsa. O RDD é uma abstração que permite o processamento de dados em paralelo, e possui mecanismos para tratamento de falhas, como a recuperação de dados. ( ) Possui uma estrutura similar a uma tabela, conhecida como dataset que pode armazenar dados de diferentes tipos. É falsa. O RDD não é uma estrutura similar a uma tabela; essa descrição se aplica mais ao DataFrame ou Dataset no Spark. ( ) Fornece suporte a dois tipos de operações: transformação e ação. Quando se aplica uma transformação, um novo RDD é criado, mas o conjunto de dados só é alterado se for aplicada uma etapa de ação. É verdadeira. Essa é uma característica fundamental do RDD, onde as transformações são operações que criam novos RDDs e as ações são operações que computam resultados. ( ) Algumas operações de transformação são: SortByKey, FlatMap e GroupByKey enquanto que collect, count e CountByKey são operações de ação. É verdadeira. As operações mencionadas estão corretamente classificadas como transformações e ações. Portanto, a sequência correta é: F – F – V – V. A alternativa que apresenta essa sequência é: D) F – F – V – V.
Já tem uma conta?
Ao continuar, você aceita os Termos de Uso e Política de Privacidade
Mais perguntas desse material