Logo Passei Direto
Buscar
Grande parte do sucesso do Spark está relacionado à sua estrutura, que é composta por alguns componentes. O principal deles é o RDD. Sobre este componente, classifique V para as sentenças verdadeiras e F para as falsas: ( ) É uma estrutura física do Spark que guarda informações dos objetos do Spark. Sua única limitação é não possuir um mecanismo para tratamento de falhas. ( ) Possui uma estrutura similar a uma tabela, conhecida como dataset que pode armazenar dados de diferentes tipos. ( ) Fornece suporte a dois tipos de operações: transformação e ação. Quando se aplica uma transformação um novo RDD é criado, mas o conjunto de dados só é alterado se for aplicada uma etapa de ação. ( ) Algumas operações de transformação são: SortByKey, FlatMap e GroupByKey enquanto que collect, count e CountByKey são operações de ação. A partir das alternativas abaixo, assinale a CORRETA:

A F – V – V – F.
B F – V – V – V.
C V – V – V – F.
D F – F – V – V.
User badge image
ServicoSocializando

ano passado

Respostas

User badge image

Ed Verified user icon

ano passado

Vamos analisar cada uma das afirmações sobre o RDD (Resilient Distributed Dataset) do Apache Spark: ( ) É uma estrutura física do Spark que guarda informações dos objetos do Spark. Sua única limitação é não possuir um mecanismo para tratamento de falhas. É falsa. O RDD é uma abstração que permite o processamento de dados em paralelo, e possui mecanismos para tratamento de falhas, como a recuperação de dados. ( ) Possui uma estrutura similar a uma tabela, conhecida como dataset que pode armazenar dados de diferentes tipos. É falsa. O RDD não é uma estrutura similar a uma tabela; essa descrição se aplica mais ao DataFrame ou Dataset no Spark. ( ) Fornece suporte a dois tipos de operações: transformação e ação. Quando se aplica uma transformação, um novo RDD é criado, mas o conjunto de dados só é alterado se for aplicada uma etapa de ação. É verdadeira. Essa é uma característica fundamental do RDD, onde as transformações são operações que criam novos RDDs e as ações são operações que computam resultados. ( ) Algumas operações de transformação são: SortByKey, FlatMap e GroupByKey enquanto que collect, count e CountByKey são operações de ação. É verdadeira. As operações mencionadas estão corretamente classificadas como transformações e ações. Portanto, a sequência correta é: F – F – V – V. A alternativa que apresenta essa sequência é: D) F – F – V – V.

Essa resposta te ajudou?

0
Dislike0
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar essa resposta. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Ainda com dúvidas?

Envie uma pergunta e tenha sua dúvida de estudo respondida!

Essa pergunta também está no material:

Mais perguntas desse material

Mais conteúdos dessa disciplina