Logo Passei Direto
Buscar
Observe o trecho de código abaixo

```
import numpy as np
from pyspark import SparkContext
spark_contexto = SparkContext()
# = np.array([1, 2, 3, 4, 5, 6, 7, 8])
teste = spark_contexto.parallelize(a)
```
Selecione a opção correta a respeito dele.
A A utilização do SparkContext é opcional.
B A linha "spark_contexto.parallelize(a)" aplica a técnica MapReduce para processar o vetor "a".
C A variável "teste" corresponde a um RDD.
D A execução do trecho de código vai gerar um erro.
E O objetivo do trecho de código é contar a quantidade de ocorrências dos valores do vetor "a".
User badge image
Desenvolvendo com Questões

há 5 meses

Respostas

User badge image

Ed Verified user icon

há 5 meses

Vamos analisar cada uma das alternativas em relação ao trecho de código apresentado: A) A utilização do SparkContext é opcional. - Incorreto. O SparkContext é essencial para criar um contexto de execução no Apache Spark. B) A linha "spark_contexto.parallelize(a)" aplica a técnica MapReduce para processar o vetor "a". - Incorreto. A função `parallelize` cria um RDD a partir de uma coleção, mas não aplica diretamente a técnica MapReduce. MapReduce é um conceito mais amplo que envolve operações de mapeamento e redução. C) A variável "teste" corresponde a um RDD. - Correto. A linha `teste = spark_contexto.parallelize(a)` cria um RDD a partir do vetor "a". D) A execução do trecho de código vai gerar um erro. - Incorreto. O código não deve gerar um erro, desde que "a" seja definido corretamente como um vetor. E) O objetivo do trecho de código é contar a quantidade de ocorrências dos valores do vetor "a". - Incorreto. O trecho de código apenas cria um RDD a partir do vetor "a", não conta ocorrências. Portanto, a alternativa correta é: C) A variável "teste" corresponde a um RDD.

Essa resposta te ajudou?

0
Dislike0
left-side-bubbles-backgroundright-side-bubbles-background

Crie sua conta grátis para liberar essa resposta. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Ainda com dúvidas?

Envie uma pergunta e tenha sua dúvida de estudo respondida!

Essa pergunta também está no material:

Mais perguntas desse material

Em relação ao Data Lake, selecione a opção correta que contenha o(s) formato(s) de dados que pode(m) ser armazenado(s) nele. A Apenas não estruturado B Estruturado, não estruturado e semiestruturado C Estruturado e semiestruturado D Apenas estruturado E Apenas tabelas relacionais

Mais conteúdos dessa disciplina