Logo Passei Direto
Buscar
Atualmente, o Apache Spark é o mais bem-sucedido framework para Big Data. Selecione a opção correta que contenha apenas funções que podem ser categorizadas como transformações no Spark.
A count, collect e take.
B map, sample e collect.
C map, filter e union.
D reduce, first e map.
E map, take e reduce.
User badge image
Desafios para Aprender

há 10 meses

Respostas

User badge image

Ed Verified user icon

há 10 meses

Para identificar quais funções podem ser categorizadas como transformações no Apache Spark, é importante entender a diferença entre transformações e ações. Transformações são operações que produzem um novo RDD (Resilient Distributed Dataset) a partir de um RDD existente, enquanto ações são operações que retornam um resultado ao driver ou gravam dados em um sistema de armazenamento. Vamos analisar as opções: A) count, collect e take - Essas são ações, não transformações. B) map, sample e collect - "map" e "sample" são transformações, mas "collect" é uma ação. C) map, filter e union - Todas essas são transformações. D) reduce, first e map - "map" é uma transformação, mas "reduce" e "first" são ações. E) map, take e reduce - "map" é uma transformação, mas "take" e "reduce" são ações. A única opção que contém apenas funções que podem ser categorizadas como transformações no Spark é: C) map, filter e union.

Essa resposta te ajudou?

0
Dislike0
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar essa resposta. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Ainda com dúvidas?

Envie uma pergunta e tenha sua dúvida de estudo respondida!

Essa pergunta também está no material:

Mais perguntas desse material

Dado que Felipe quer fazer a junção entre dois conjuntos de dados e escreveu o seguinte código: import pandas as pd df1 = pd.DataFrame({'lkey': ['foo', 'bar', 'baz', 'foo'], 'value': [1, 2, 3, 5]}) df2 = pd.DataFrame({'rkey': ['foo', 'bar', 'baz', 'foo'], 'value': [5, 6, 7, 8]}) df1.merge(df2, left_on='lkey', right_on='rkey')
Qual destas alternativas descreve as saídas do código?
I ¿ O conjunto resultante terá colunas lkey, value_x, rkey, value_y
II ¿ O código não executará, pois Filipe não definiu os sufixos de coluna
III ¿ O resultado do código em questão retornará um pd.Series juntando os conjuntos pela lkey e rkey.
Apenas as opções II e III estão corretas.
Apenas a opção I está correta.
Apenas as opções I e III estão corretas.
Apenas a opção II está correta.
Apenas a opção III está correta.

Mais conteúdos dessa disciplina