Prévia do material em texto
Parte superior do formulário Simulado AV avalie seus conhecimentos Avaliação: EEX0174_SM_202004242491 V.1 Disciplina: TÓPICOS DE BIG DATA EM PYTHON Aluno: WESLEY ALVES DE OLIVEIRA (202004242491 ) Autenticação da Avaliação Parcial 1. Veja abaixo, todas as suas respostas gravadas no nosso banco de dados. 2. Caso você queira voltar à prova clique no botão "Voltar". 3. Caso queira FINALIZAR a avaliação, digite o código de 4 carateres impresso abaixo. ATENÇÃO: Caso finalize esta avaliação você não poderá mais modificar as suas respostas. RVRV Cód.: Obs.: Os caracteres da imagem ajudam a Instituição a evitar fraudes, que dificultam a gravação das respostas. Quest.: 1 1. Selecione a opção correta que contém a principal plataforma de tecnologia de nuvem que é usada como referência para as outras plataformas. Amazon AWS IBM Cloud Microsft Azure Oracle Cloud Google Cloud Respondido em 28/03/2022 23:34:39 Quest.: 2 2. A respeito das aplicações de fluxos de dados, selecione a opção correta. Serviços sob demanda, como serviços de filme online. Transações bancárias, como o serviço de PIX. Reapresentação de programas de televisão. Serviço de correio eletrônico Serviços de compras online Respondido em 28/03/2022 23:34:15 Quest.: 3 3. O data lake é composto por camadas e níveis. Selecione a opção correta a respeito da camada responsável por fazer a marcação dos dados do Data Lake. Camada de gerenciamento do ciclo de vida da informação Camada de Metadados Camada de governança Camada de gerenciamento de dados Camada de segurança Respondido em 29/03/2022 00:03:04 Quest.: 4 4. Selecione a opção correta a respeito do nível do Data Lake responsável por fornecer dados para a análise de negócios. Nível de gerenciamento Nível de governança Nível de consumo Nível de Metadados Nível de admissão Respondido em 28/03/2022 23:55:20 Quest.: 5 5. Observe o trecho de código abaixo import numpy as np from pyspark import SparkContext spark_contexto = SparkContext() a = np.array([1, 5, 1, 6, 4, 7, 7]) teste = spark_contexto.parallelize(a) Selecione a opção correta a respeito dele. A execução do trecho de código vai gerar um erro. A linha "spark_contexto.parallelize(a)" aplica a técnica MapReduce para processar o vetor "a". A utilização do SparkContext é opcional. A variável "teste" corresponde a um RDD. O objetivo do trecho de código é contar a quantidade de ocorrências dos valores do vetor "a". Respondido em 28/03/2022 23:35:22 Quest.: 6 6. O paradigma MapReduce é uma estratégia de computação com capacidade de processar grandes conjuntos de dados de maneira distribuída em várias máquinas. Em relação à técnica MapReduce, selecione a opção que é responsável por consolidar os resultados produzidos ao longo do processamento. Processamento Agregação Separação Redução Mapeamento Respondido em 28/03/2022 23:35:31 Quest.: 7 7. Eduardo quer mostrar aos gestores da empresa como as ações da carteira de investimentos recomendada que ele e o time dele propuseram estão valorizando e gerando muitos dividendos aos clientes. Para isso, Eduardo construiu um gráfico de ______, pois está lidando com dados ________ e quer mostrar o quão bem as recomendações geradas por seu time estão evoluindo. Respectivamente a resposta que completa as duas lacunas é: Linha; Categóricos Linha; Numéricos Pizza; Numéricos Linha; Temporais Pizza; Categóricos Respondido em 29/03/2022 00:04:03 Quest.: 8 8. A linguagem Python fornece para o cientista de dados uma grande variedade de funções e bibliotecas. Qual o método que faz a projeção do Dataframe orientado pelos rótulos das colunas do conjunto? loc shuffle iloc reset_index sum Respondido em 28/03/2022 23:42:03 Quest.: 9 9. Qual destes modelos é adequado para um problema de classificação? I - SVM II - Árvore de Decisão III - K-Médias Apenas as opções I e III Apenas a opção III Apenas as opções II e III Apenas as opções I e II Todas as opções I, II e III Respondido em 28/03/2022 23:40:22 Quest.: 10 10. Leonardo começou seu trabalho de conclusão de curso. Nesse trabalho, Leonardo quer elaborar um classificador de imagem, mas, não sabe se decidir com relação à configuração das camadas de sua rede neural. É muito comum utilizarmos o conjunto ________ para fazermos o benchmark de modelos de ______________: MNIST; Processamento de Linguagem Natural IRIS; Processamento da Linguagem Natural IRIS; Processamento de Imagens MNIST; Processamento de Imagens Pizzas; Categorias Respondido em 28/03/2022 23:59:37 Parte inferior do formulário