Baixe o app para aproveitar ainda mais
Prévia do material em texto
26/03/2022 13:32 Estácio: Alunos https://simulado.estacio.br/alunos/ 1/5 Simulado AV Teste seu conhecimento acumulado Disc.: TÓPICOS DE BIG DATA EM PYTHON Aluno(a): JOÃO PEDRO TEIXEIRA MATOS 202002497157 Acertos: 5,0 de 10,0 26/03/2022 Acerto: 1,0 / 1,0 A respeito das aplicações de fluxos de dados, selecione a opção correta. Transações bancárias, como o serviço de PIX. Serviço de correio eletrônico Serviços de compras online Reapresentação de programas de televisão. Serviços sob demanda, como serviços de filme online. Respondido em 26/03/2022 13:30:15 Explicação: Os serviços de fluxo de dado de aplicações de mídia de streaming são arquivos enviados em partes por serviço e reproduzidos por um cliente conforme a entrega continua. As demais opções estão erradas, pois são exemplos de serviços em que os dados já foram gerados, ou que são usados apenas esporadicamente. Acerto: 1,0 / 1,0 Selecione a opção correta que contém a principal plataforma de tecnologia de nuvem que é usada como referência para as outras plataformas. Oracle Cloud Google Cloud Microsft Azure Amazon AWS IBM Cloud Respondido em 26/03/2022 13:09:31 Explicação: A plataforma Amazon AWS foi a primeira plataforma Cloud e até hoje é considerada como principal referência do mercado. As outras plataformas também são muito importantes e, junto com a Amazon, detém boa fatia do mercado. Questão1 a Questão2 a https://simulado.estacio.br/alunos/inicio.asp javascript:voltar(); 26/03/2022 13:32 Estácio: Alunos https://simulado.estacio.br/alunos/ 2/5 Acerto: 1,0 / 1,0 Selecione a opção que indica o processo responsável por executar uma tarefa atribuída a ele pelo Job Tracker. Task Tracker Job Tracker Slave MapReduce MapTracker MapJob Respondido em 26/03/2022 13:17:23 Explicação: O JobTracker envia as informações necessárias para a execução de uma tarefa para o TaskTracker que, por sua vez, executa a tarefa e envia os resultados de volta para JobTracker, além de fazer o seu rastreamento. Acerto: 0,0 / 1,0 Em relação as fases do Hadoop, selecione a opção correta que apresenta o componente responsável pela geração de pares intermediários de valor e chave. Redução Embaralhamento Agrupamento Gravação da saída Combinação Respondido em 26/03/2022 13:16:52 Explicação: Através do processo de embaralhamento, também conhecido pelo termo em inglês "shuffling", o mecanismo MapReduce faz a geração de pares intermediários de valor e chave que são transferidos para a fase de redução, o que é realizado em paralelo com outras tarefas da fase de mapeamento. Acerto: 0,0 / 1,0 Observe o trecho de código abaixo import numpy as np from pyspark import SparkContext spark_contexto = SparkContext() a = np.array([1, 5, 1, 6, 4, 7, 7]) teste = spark_contexto.parallelize(a) Selecione a opção correta a respeito dele. O objetivo do trecho de código é contar a quantidade de ocorrências dos valores do vetor "a". A execução do trecho de código vai gerar um erro. A variável "teste" corresponde a um RDD. A linha "spark_contexto.parallelize(a)" aplica a técnica MapReduce para processar o vetor "a". A utilização do SparkContext é opcional. Respondido em 26/03/2022 13:20:30 Explicação: Questão3 a Questão4 a Questão5 a 26/03/2022 13:32 Estácio: Alunos https://simulado.estacio.br/alunos/ 3/5 Gabarito: A variável "teste" corresponde a um RDD. Justificativa: O trecho de código está sintaticamente correto. O objetivo é criar um RDD que, no caso, é representado pela variável "teste" para isso é obrigatório utilizar o "SparkContext". O pacote "numpy" foi utilizado por causa da variável vetor "a". Acerto: 1,0 / 1,0 O paradigma MapReduce é uma estratégia de computação com capacidade de processar grandes conjuntos de dados de maneira distribuída em várias máquinas. Em relação à técnica MapReduce, selecione a opção que é responsável por consolidar os resultados produzidos ao longo do processamento. Separação Processamento Mapeamento Agregação Redução Respondido em 26/03/2022 13:21:15 Explicação: Gabarito: Redução Justificativa: A função de redução agrupa os pares após a fase de embaralhamento concluindo o processamento dos dados. O MapReduce é uma técnica clássica de programação distribuída e é bastante utilizada por diversos frameworks como o Spark, por exemplo. Acerto: 1,0 / 1,0 A linguagem Python fornece para o cientista de dados uma grande variedade de funções e bibliotecas. Qual o método que faz a projeção do Dataframe orientado pelos rótulos das colunas do conjunto? sum loc reset_index shuffle iloc Respondido em 26/03/2022 13:23:15 Explicação: Através do método loc, passando o nome da coluna ou colunas desejadas entre colchetes, é aplicada a operação de projeção do DataFrame, de acordo com o objetivo desejado. As demais alternativas não dizem respeito à projeção do DataFrame. Acerto: 0,0 / 1,0 Dados categóricos são aqueles normalmente expressos por texto, que representam rótulos, nomes e símbolos. Qual tipo de visualização de dados abaixo é recomendado para dados categóricos? Gráficos de Linha. Gráfico de Matriz de Dispersão. Gráfico de Faces de Chernoff. Gráficos de Barra. Questão6 a Questão7 a Questão8 a 26/03/2022 13:32 Estácio: Alunos https://simulado.estacio.br/alunos/ 4/5 Gráfico de Estrela. Respondido em 26/03/2022 13:26:08 Explicação: O gráfico de barras mostra as proporções dos dados categóricos assim evidenciando os extratos da amostra. Lembrando que os dados categóricos não se encaixam nos gráficos de dados numéricos, como o de dispersão causando confusão na função de visualização ou quebrando a mesma dependendo da biblioteca escolhida. Acerto: 0,0 / 1,0 Como podemos checar as métricas de classificação do modelo neural da biblioteca Scikit-Learn? Plotly Gráfico de Matriz de Dispersão Gráfico de Histograma Classification Report Regressão Linear Respondido em 26/03/2022 13:28:58 Explicação: O classification report é um dos métodos oferecidos pelo scikit-learn que nos permite usar um conjunto ground truth para comparar contra as predições de um modelo e este calculará as métricas de acurácia, precisão e medida F de cada classe possível e também as mesmas métricas em um nível macro. Acerto: 0,0 / 1,0 A qual técnica de Aprendizado de Máquina o Algoritmo de Árvore de Decisão Classificadora pertence? Classificação Agrupamento Q-Learning Modelos Generativos Regressão Respondido em 26/03/2022 13:29:56 Explicação: O algoritmo de árvore de decisão é um dos mais simples e poderosos algoritmos de aprendizado de máquina que pode ser utilizado tanto para regressão quanto para classificação, mas muda sua terminação dependendo da técnica em questão, por exemplo, para classificação é a Árvore de Decisão Classificadora, enquanto para regressão se chama Árvore Regressora, ou Árvore de Decisão Regressora. Questão9 a Questão10 a javascript:abre_colabore('38403','278915670','5160707274'); 26/03/2022 13:32 Estácio: Alunos https://simulado.estacio.br/alunos/ 5/5
Compartilhar