Grátis: Observe o trecho de código abaixo ``` import numpy as np from pyspark import SparkContext spark_contexto = SparkContext() # = np.array([1, 2, 3, 4...

Bases de Dados

Outros

Observe o trecho de código abaixo

```
import numpy as np
from pyspark import SparkContext
spark_contexto = SparkContext()
# = np.array([1, 2, 3, 4, 5, 6, 7, 8])
teste = spark_contexto.parallelize(a)
```
Selecione a opção correta a respeito dele.
A A utilização do SparkContext é opcional.
B A linha "spark_contexto.parallelize(a)" aplica a técnica MapReduce para processar o vetor "a".
C A variável "teste" corresponde a um RDD.
D A execução do trecho de código vai gerar um erro.
E O objetivo do trecho de código é contar a quantidade de ocorrências dos valores do vetor "a".

Desenvolvendo com Questões

há 5 meses

Desenvolvendo com Questões

há 5 meses

35 pág.

Topico Big Data Python 3

ESTÁCIO EAD

Respostas

há 5 meses

Vamos analisar cada uma das alternativas em relação ao trecho de código apresentado: A) A utilização do SparkContext é opcional. - Incorreto. O SparkContext é essencial para criar um contexto de execução no Apache Spark. B) A linha "spark_contexto.parallelize(a)" aplica a técnica MapReduce para processar o vetor "a". - Incorreto. A função `parallelize` cria um RDD a partir de uma coleção, mas não aplica diretamente a técnica MapReduce. MapReduce é um conceito mais amplo que envolve operações de mapeamento e redução. C) A variável "teste" corresponde a um RDD. - Correto. A linha `teste = spark_contexto.parallelize(a)` cria um RDD a partir do vetor "a". D) A execução do trecho de código vai gerar um erro. - Incorreto. O código não deve gerar um erro, desde que "a" seja definido corretamente como um vetor. E) O objetivo do trecho de código é contar a quantidade de ocorrências dos valores do vetor "a". - Incorreto. O trecho de código apenas cria um RDD a partir do vetor "a", não conta ocorrências. Portanto, a alternativa correta é: C) A variável "teste" corresponde a um RDD.

Essa resposta te ajudou?

Crie sua conta grátis para liberar essa resposta. 🤩

Já tem uma conta?

Ao continuar, você aceita os Termos de Uso e Política de Privacidade

Ainda com dúvidas?

Envie uma pergunta e tenha sua dúvida de estudo respondida!

Essa pergunta também está no material:

35 pág.

Topico Big Data Python 3

ESTÁCIO EAD

Mais perguntas desse material

Em relação ao protocolo de transporte para transmissão de aplicações de streaming, selecione a opção correta. A CoAP B UDP C TCP D HTTP E MQTT

Em relação ao formato dos dados, selecione a opção correta que corresponde ao formato dos dados de transações bancárias. A Dados estruturados B Dados semiestruturados C Dados de Internet das Coisas D Dados de Big Data E Dados não estruturados

Sobre a IoT (Internet das coisas) e seus blocos básicos de construção, identifique como verdadeiras (V) ou falsas (F) as seguintes afirmativas:
() Na IoT, os objetos podem prover comunicação entre usuários e dispositivos, viabilizando diversas aplicações, tais como coleta de dados de pacientes e monitoramento de idosos e sensoriamento de ambientes de difícil acesso.
() A tecnologia de IoT consiste na coexistência colaborativa de dois componentes: As "coisas" e os protocolos de rede que permitem a sua comunicação.
() Protocolos de comunicação: Viabilizam a troca de dados via Internet entre os objetos físicos e outros sistemas.
Assinale a alternativa que apresenta a sequência correta, de cima para baixo.
A) V F V
B F V F
C V V F
D F F F
E F V V

Selecione a opção correta que contém a principal plataforma de tecnologia de nuvem que é usada como referência para as outras plataformas. A Google Cloud B IBM Cloud C Oracle Cloud D Amazon AWS E Microsoft Azure

Selecione a opção em que a computação se refere à execução de aplicações e serviços em uma rede distribuída usando recursos virtualizados.
A Computação centralizada
B Computação Paralela
C Computação de banco de dados
D Computação de Big Data
E Computação em Nuvem

Em relação ao Data Lake, selecione a opção correta que contenha o(s) formato(s) de dados que pode(m) ser armazenado(s) nele. A Apenas não estruturado B Estruturado, não estruturado e semiestruturado C Estruturado e semiestruturado D Apenas estruturado E Apenas tabelas relacionais

A respeito do HDFS, selecione a opção correta cujo componente lógico mantém os dados do usuário na forma de blocos de dados.
A YARN
B NameNode
C Bloco de dados
D Replicação
E DataNode

Reconhecer os conceitos de Data Lake é fundamental para o profissional de Tecnologia da Informação.
Selecione a opção correta a respeito do Data Lake.
A- Possui alta latência para acesso dos dados.
B- Aplica processos de tratamento nos dados.
C- Armazena os dados de modo eficiente.
D- Demanda por equipamentos especiais.
E- São exclusivos da distribuição Hadoop Apache.

O Hadoop é um framework de código aberto voltado para aplicações de Big Data.
Neste sentido, selecione a alternativa correta que apresenta um grande desafio no processo de configuração e gerenciamento do Hadoop.
A- Processos de extração, transformação e carregamento dos dados.
B- Mecanismo para melhorar o processamento dos dados.
C- Aplicar políticas de segurança.
D- Gerenciamento do armazenamento de dados.
E- Tratar dados não-estruturados.

Reconhecer os conceitos de Data Lake é fundamental para o profissional de Tecnologia da Informação.
Selecione a opção correta que define resumidamente o que é o Data Lake.
A- É um repositório para tratamento dos dados.
B- É uma tecnologia de armazenamento e processamento de dados.
C- É um repositório centralizado para armazenamento de dados.
D- É um ambiente para tratamento e armazenamento apenas de dados relacionais.

Bases de Dados

Topico Big Data Python 3

Respostas

Crie sua conta grátis para liberar essa resposta. 🤩

Ainda com dúvidas?

Essa pergunta também está no material:

Topico Big Data Python 3

Em relação ao protocolo de transporte para transmissão de aplicações de streaming, selecione a opção correta. A CoAP B UDP C TCP D HTTP E MQTT

Em relação ao formato dos dados, selecione a opção correta que corresponde ao formato dos dados de transações bancárias. A Dados estruturados B Dados semiestruturados C Dados de Internet das Coisas D Dados de Big Data E Dados não estruturados

Selecione a opção correta que contém a principal plataforma de tecnologia de nuvem que é usada como referência para as outras plataformas. A Google Cloud B IBM Cloud C Oracle Cloud D Amazon AWS E Microsoft Azure

Selecione a opção em que a computação se refere à execução de aplicações e serviços em uma rede distribuída usando recursos virtualizados.A Computação centralizadaB Computação ParalelaC Computação de banco de dadosD Computação de Big DataE Computação em Nuvem

Em relação ao Data Lake, selecione a opção correta que contenha o(s) formato(s) de dados que pode(m) ser armazenado(s) nele. A Apenas não estruturado B Estruturado, não estruturado e semiestruturado C Estruturado e semiestruturado D Apenas estruturado E Apenas tabelas relacionais

A respeito do HDFS, selecione a opção correta cujo componente lógico mantém os dados do usuário na forma de blocos de dados.A YARNB NameNodeC Bloco de dadosD ReplicaçãoE DataNode

Mais conteúdos dessa disciplina

Selecione a opção em que a computação se refere à execução de aplicações e serviços em uma rede distribuída usando recursos virtualizados.
A Computação centralizada
B Computação Paralela
C Computação de banco de dados
D Computação de Big Data
E Computação em Nuvem

A respeito do HDFS, selecione a opção correta cujo componente lógico mantém os dados do usuário na forma de blocos de dados.
A YARN
B NameNode
C Bloco de dados
D Replicação
E DataNode