Buscar

TÓPICOS DE BIG DATA EM PYTHON - SIMULADO AV

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

24/03/2022 14:17 Estácio: Alunos
https://simulado.estacio.br/alunos/ 1/5
 
Simulado AV
Teste seu conhecimento acumulado
 
Disc.: TÓPICOS DE BIG DATA EM PYTHON 
Aluno(a): FABIO JUNIOR DE LIMA 202001058737
Acertos: 10,0 de 10,0 24/03/2022
 
 
Acerto: 1,0 / 1,0
A respeito das aplicações de fluxos de dados, selecione a opção correta.
Reapresentação de programas de televisão.
Serviço de correio eletrônico
Serviços de compras online
 Serviços sob demanda, como serviços de filme online.
Transações bancárias, como o serviço de PIX.
Respondido em 24/03/2022 11:01:40
 
 
Explicação:
Os serviços de fluxo de dado de aplicações de mídia de streaming são arquivos enviados em partes por serviço
e reproduzidos por um cliente conforme a entrega continua. As demais opções estão erradas, pois são exemplos
de serviços em que os dados já foram gerados, ou que são usados apenas esporadicamente.
 
 
Acerto: 1,0 / 1,0
Selecione a opção correta que contém a principal plataforma de tecnologia de nuvem que é usada como
referência para as outras plataformas.
Google Cloud
IBM Cloud
 Amazon AWS
Microsft Azure
Oracle Cloud
Respondido em 24/03/2022 11:02:15
 
 
Explicação:
A plataforma Amazon AWS foi a primeira plataforma Cloud e até hoje é considerada como principal referência
do mercado. As outras plataformas também são muito importantes e, junto com a Amazon, detém boa fatia do
mercado.
 
 Questão1
a
 Questão2
a
https://simulado.estacio.br/alunos/inicio.asp
javascript:voltar();
24/03/2022 14:17 Estácio: Alunos
https://simulado.estacio.br/alunos/ 2/5
 
Acerto: 1,0 / 1,0
A respeito do HDFS, selecione a opção correta cujo componente lógico mantém os dados do usuário na forma
de blocos de dados.
 DataNode
Replicação
NameNode
YARN
Bloco de dados
Respondido em 24/03/2022 11:07:29
 
 
Explicação:
O DataNode é componente da arquitetura do HDFS responsável pelo armazenamento dos dados na forma de
blocos de dados.
 
 
Acerto: 1,0 / 1,0
Em relação ao Data Lake, selecione a opção correta que contenha o(s) formato(s) de dados que pode(m) ser
armazenado(s) nele.
apenas tabelas relacionais
estruturado e semiestruturado
 estruturado, não estruturado e semiestruturado
apenas estruturado
apenas não estruturado
Respondido em 24/03/2022 11:08:01
 
 
Explicação:
O Data Lake pode armazenar dados estruturados, semiestruturados e não estruturados que correspondem a
característica de variedade dos dados que é bem típica de aplicações de Big Data.
 
 
Acerto: 1,0 / 1,0
Observe o trecho de código abaixo
import numpy as np 
from pyspark import SparkContext
spark_contexto = SparkContext() 
a = np.array([1, 5, 1, 6, 4, 7, 7]) 
teste = spark_contexto.parallelize(a)
Selecione a opção correta a respeito dele.
A utilização do SparkContext é opcional.
A execução do trecho de código vai gerar um erro.
A linha "spark_contexto.parallelize(a)" aplica a técnica MapReduce para processar o vetor "a".
O objetivo do trecho de código é contar a quantidade de ocorrências dos valores do vetor "a".
 A variável "teste" corresponde a um RDD.
Respondido em 24/03/2022 11:03:15
 
 
Explicação:
 Questão3
a
 Questão4
a
 Questão5
a
24/03/2022 14:17 Estácio: Alunos
https://simulado.estacio.br/alunos/ 3/5
Gabarito: A variável "teste" corresponde a um RDD.
Justificativa: O trecho de código está sintaticamente correto. O objetivo é criar um RDD que, no caso, é
representado pela variável "teste" para isso é obrigatório utilizar o "SparkContext". O pacote "numpy" foi
utilizado por causa da variável vetor "a".
 
 
Acerto: 1,0 / 1,0
O paradigma MapReduce é uma estratégia de computação com capacidade de processar grandes conjuntos de
dados de maneira distribuída em várias máquinas. Em relação à técnica MapReduce, selecione a opção que é
responsável por consolidar os resultados produzidos ao longo do processamento.
Processamento
Mapeamento
Agregação
 Redução
Separação
Respondido em 24/03/2022 11:09:28
 
 
Explicação:
Gabarito: Redução
Justificativa: A função de redução agrupa os pares após a fase de embaralhamento concluindo o
processamento dos dados. O MapReduce é uma técnica clássica de programação distribuída e é bastante
utilizada por diversos frameworks como o Spark, por exemplo.
 
 
Acerto: 1,0 / 1,0
Para a regularização dos dados obtidos, qual técnica podemos utilizar objetivando fazer com que os dados
fiquem na mesma escala?
Map & Reduce
 MinMax
Shuffle
Splice
Divide
Respondido em 24/03/2022 13:44:29
 
 
Explicação:
Extraímos do dado observado sua proporção em relação ao valor mínimo possível até o valor máximo e
enquadramos o mesmo nesta régua, assim realizando a regularização, que consiste em colocar os dados na
mesma escala.
 
 
Acerto: 1,0 / 1,0
No mundo de Big Data, temos dados os mais variados possíveis, e sua classificação é fundamental para um
cientista de dados. As notas que compõem o histórico escolar de um aluno são classificadas como que tipo de
dados?
Numéricos
Temporais
Semi-Estruturados
 Categóricos
 Questão6
a
 Questão7
a
 Questão8
a
24/03/2022 14:17 Estácio: Alunos
https://simulado.estacio.br/alunos/ 4/5
Atemporais
Respondido em 24/03/2022 11:12:44
 
 
Explicação:
O correto é classificar como dados categóricos, pois a nota de um aluno mesmo que possa ser operada por
funções de soma, média etc., representa um conceito ou extrato/proporção de aprendizado de um aluno, um 8
muitas das vezes significa que o aluno aprendeu 80% da matéria por exemplo, ou implica na condição de apto,
ou reprovado. O tipo numérico seria correto se não tivesse o contexto implícito de categoria, por isso devemos
ter cuidado ao modelarmos nossos dados.
 
 
Acerto: 1,0 / 1,0
As redes neurais são modelos poderosos cujo principal componente onde estão armazenados seus
conhecimentos é(são) 
Pesos
Vieses
 Camadas Escondidas
Função de Ativação
Camada de Saída
Respondido em 24/03/2022 13:46:55
 
 
Explicação:
O conhecimento dos modelos conexionistas é localizado em suas camadas internas ocultas ou escondidas
(hidden), pois é lá que se encontram as matrizes de pesos, vieses e funções de ativação que, ao trabalharem
juntas, produzem o conhecimento necessário para discriminar novas observações com base em registros
passados.
 
 
Acerto: 1,0 / 1,0
O enquadramento de aprendizado não supervisionado contempla qual(is) técnicas?
I - Agrupamento
II - Classificação
III - Regressão
Apenas as opções II e III estão corretas
Apenas a opção III está correta
 Apenas a opção I está correta
Apenas a opção II está correta
Apenas as opções I e III estão corretas
Respondido em 24/03/2022 13:45:05
 
 
Explicação:
O aprendizado supervisionado se caracteriza pelo aprendizado autodidata que é caracterizado pelo
agrupamento. Já a classificação e a regressão são técnicas oriundas do aprendizado supervisionado.
 
 
 
 Questão9
a
 Questão10
a
javascript:abre_colabore('38403','278724082','5154997927');
24/03/2022 14:17 Estácio: Alunos
https://simulado.estacio.br/alunos/ 5/5
 
 
 
 
 
 
 
 
javascript:abre_colabore('38403','278724082','5154997927');

Continue navegando