Buscar

TÓPICOS DE BIG DATA EM PYTHON ESTACIO - simulado 1

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

26/03/2022 13:32 Estácio: Alunos
https://simulado.estacio.br/alunos/ 1/5
 
Simulado AV
Teste seu conhecimento acumulado
 
Disc.: TÓPICOS DE BIG DATA EM PYTHON 
Aluno(a): JOÃO PEDRO TEIXEIRA MATOS 202002497157
Acertos: 5,0 de 10,0 26/03/2022
 
 
Acerto: 1,0 / 1,0
A respeito das aplicações de fluxos de dados, selecione a opção correta.
Transações bancárias, como o serviço de PIX.
Serviço de correio eletrônico
Serviços de compras online
Reapresentação de programas de televisão.
 Serviços sob demanda, como serviços de filme online.
Respondido em 26/03/2022 13:30:15
 
 
Explicação:
Os serviços de fluxo de dado de aplicações de mídia de streaming são arquivos enviados em partes por serviço
e reproduzidos por um cliente conforme a entrega continua. As demais opções estão erradas, pois são exemplos
de serviços em que os dados já foram gerados, ou que são usados apenas esporadicamente.
 
 
Acerto: 1,0 / 1,0
Selecione a opção correta que contém a principal plataforma de tecnologia de nuvem que é usada como
referência para as outras plataformas.
Oracle Cloud
Google Cloud
Microsft Azure
 Amazon AWS
IBM Cloud
Respondido em 26/03/2022 13:09:31
 
 
Explicação:
A plataforma Amazon AWS foi a primeira plataforma Cloud e até hoje é considerada como principal referência
do mercado. As outras plataformas também são muito importantes e, junto com a Amazon, detém boa fatia do
mercado.
 
 Questão1
a
 Questão2
a
https://simulado.estacio.br/alunos/inicio.asp
javascript:voltar();
26/03/2022 13:32 Estácio: Alunos
https://simulado.estacio.br/alunos/ 2/5
 
Acerto: 1,0 / 1,0
Selecione a opção que indica o processo responsável por executar uma tarefa atribuída a ele pelo Job Tracker.
 Task Tracker
Job Tracker Slave
MapReduce
MapTracker
MapJob
Respondido em 26/03/2022 13:17:23
 
 
Explicação:
O JobTracker envia as informações necessárias para a execução de uma tarefa para o TaskTracker que, por sua
vez, executa a tarefa e envia os resultados de volta para JobTracker, além de fazer o seu rastreamento.
 
 
Acerto: 0,0 / 1,0
Em relação as fases do Hadoop, selecione a opção correta que apresenta o componente responsável pela
geração de pares intermediários de valor e chave.
 Redução
 Embaralhamento
Agrupamento
Gravação da saída
Combinação
Respondido em 26/03/2022 13:16:52
 
 
Explicação:
Através do processo de embaralhamento, também conhecido pelo termo em inglês "shuffling", o mecanismo
MapReduce faz a geração de pares intermediários de valor e chave que são transferidos para a fase de redução,
o que é realizado em paralelo com outras tarefas da fase de mapeamento.
 
 
Acerto: 0,0 / 1,0
Observe o trecho de código abaixo
import numpy as np 
from pyspark import SparkContext
spark_contexto = SparkContext() 
a = np.array([1, 5, 1, 6, 4, 7, 7]) 
teste = spark_contexto.parallelize(a)
Selecione a opção correta a respeito dele.
O objetivo do trecho de código é contar a quantidade de ocorrências dos valores do vetor "a".
A execução do trecho de código vai gerar um erro.
 A variável "teste" corresponde a um RDD.
A linha "spark_contexto.parallelize(a)" aplica a técnica MapReduce para processar o vetor "a".
 A utilização do SparkContext é opcional.
Respondido em 26/03/2022 13:20:30
 
 
Explicação:
 Questão3
a
 Questão4
a
 Questão5
a
26/03/2022 13:32 Estácio: Alunos
https://simulado.estacio.br/alunos/ 3/5
Gabarito: A variável "teste" corresponde a um RDD.
Justificativa: O trecho de código está sintaticamente correto. O objetivo é criar um RDD que, no caso, é
representado pela variável "teste" para isso é obrigatório utilizar o "SparkContext". O pacote "numpy" foi
utilizado por causa da variável vetor "a".
 
 
Acerto: 1,0 / 1,0
O paradigma MapReduce é uma estratégia de computação com capacidade de processar grandes conjuntos de
dados de maneira distribuída em várias máquinas. Em relação à técnica MapReduce, selecione a opção que é
responsável por consolidar os resultados produzidos ao longo do processamento.
Separação
Processamento
Mapeamento
Agregação
 Redução
Respondido em 26/03/2022 13:21:15
 
 
Explicação:
Gabarito: Redução
Justificativa: A função de redução agrupa os pares após a fase de embaralhamento concluindo o
processamento dos dados. O MapReduce é uma técnica clássica de programação distribuída e é bastante
utilizada por diversos frameworks como o Spark, por exemplo.
 
 
Acerto: 1,0 / 1,0
A linguagem Python fornece para o cientista de dados uma grande variedade de funções e bibliotecas. Qual o
método que faz a projeção do Dataframe orientado pelos rótulos das colunas do conjunto?
sum
 loc
reset_index
shuffle
iloc
Respondido em 26/03/2022 13:23:15
 
 
Explicação:
Através do método loc, passando o nome da coluna ou colunas desejadas entre colchetes, é aplicada a operação
de projeção do DataFrame, de acordo com o objetivo desejado. As demais alternativas não dizem respeito à
projeção do DataFrame.
 
 
Acerto: 0,0 / 1,0
Dados categóricos são aqueles normalmente expressos por texto, que representam rótulos, nomes e símbolos.
Qual tipo de visualização de dados abaixo é recomendado para dados categóricos?
Gráficos de Linha.
 Gráfico de Matriz de Dispersão.
Gráfico de Faces de Chernoff.
 Gráficos de Barra.
 Questão6
a
 Questão7
a
 Questão8
a
26/03/2022 13:32 Estácio: Alunos
https://simulado.estacio.br/alunos/ 4/5
Gráfico de Estrela.
Respondido em 26/03/2022 13:26:08
 
 
Explicação:
O gráfico de barras mostra as proporções dos dados categóricos assim evidenciando os extratos da amostra.
Lembrando que os dados categóricos não se encaixam nos gráficos de dados numéricos, como o de dispersão
causando confusão na função de visualização ou quebrando a mesma dependendo da biblioteca escolhida.
 
 
Acerto: 0,0 / 1,0
Como podemos checar as métricas de classificação do modelo neural da biblioteca Scikit-Learn?
Plotly
Gráfico de Matriz de Dispersão
 Gráfico de Histograma
 Classification Report
Regressão Linear
Respondido em 26/03/2022 13:28:58
 
 
Explicação:
O classification report é um dos métodos oferecidos pelo scikit-learn que nos permite usar um conjunto ground
truth para comparar contra as predições de um modelo e este calculará as métricas de acurácia, precisão e
medida F de cada classe possível e também as mesmas métricas em um nível macro.
 
 
Acerto: 0,0 / 1,0
A qual técnica de Aprendizado de Máquina o Algoritmo de Árvore de Decisão Classificadora pertence?
 Classificação
Agrupamento
Q-Learning
Modelos Generativos
 Regressão
Respondido em 26/03/2022 13:29:56
 
 
Explicação:
O algoritmo de árvore de decisão é um dos mais simples e poderosos algoritmos de aprendizado de máquina
que pode ser utilizado tanto para regressão quanto para classificação, mas muda sua terminação dependendo
da técnica em questão, por exemplo, para classificação é a Árvore de Decisão Classificadora, enquanto para
regressão se chama Árvore Regressora, ou Árvore de Decisão Regressora.
 
 
 
 
 
 
 Questão9
a
 Questão10
a
javascript:abre_colabore('38403','278915670','5160707274');
26/03/2022 13:32 Estácio: Alunos
https://simulado.estacio.br/alunos/ 5/5

Continue navegando