Baixe o app para aproveitar ainda mais
Prévia do material em texto
24/03/2022 14:17 Estácio: Alunos https://simulado.estacio.br/alunos/ 1/5 Simulado AV Teste seu conhecimento acumulado Disc.: TÓPICOS DE BIG DATA EM PYTHON Aluno(a): FABIO JUNIOR DE LIMA 202001058737 Acertos: 10,0 de 10,0 24/03/2022 Acerto: 1,0 / 1,0 A respeito das aplicações de fluxos de dados, selecione a opção correta. Reapresentação de programas de televisão. Serviço de correio eletrônico Serviços de compras online Serviços sob demanda, como serviços de filme online. Transações bancárias, como o serviço de PIX. Respondido em 24/03/2022 11:01:40 Explicação: Os serviços de fluxo de dado de aplicações de mídia de streaming são arquivos enviados em partes por serviço e reproduzidos por um cliente conforme a entrega continua. As demais opções estão erradas, pois são exemplos de serviços em que os dados já foram gerados, ou que são usados apenas esporadicamente. Acerto: 1,0 / 1,0 Selecione a opção correta que contém a principal plataforma de tecnologia de nuvem que é usada como referência para as outras plataformas. Google Cloud IBM Cloud Amazon AWS Microsft Azure Oracle Cloud Respondido em 24/03/2022 11:02:15 Explicação: A plataforma Amazon AWS foi a primeira plataforma Cloud e até hoje é considerada como principal referência do mercado. As outras plataformas também são muito importantes e, junto com a Amazon, detém boa fatia do mercado. Questão1 a Questão2 a https://simulado.estacio.br/alunos/inicio.asp javascript:voltar(); 24/03/2022 14:17 Estácio: Alunos https://simulado.estacio.br/alunos/ 2/5 Acerto: 1,0 / 1,0 A respeito do HDFS, selecione a opção correta cujo componente lógico mantém os dados do usuário na forma de blocos de dados. DataNode Replicação NameNode YARN Bloco de dados Respondido em 24/03/2022 11:07:29 Explicação: O DataNode é componente da arquitetura do HDFS responsável pelo armazenamento dos dados na forma de blocos de dados. Acerto: 1,0 / 1,0 Em relação ao Data Lake, selecione a opção correta que contenha o(s) formato(s) de dados que pode(m) ser armazenado(s) nele. apenas tabelas relacionais estruturado e semiestruturado estruturado, não estruturado e semiestruturado apenas estruturado apenas não estruturado Respondido em 24/03/2022 11:08:01 Explicação: O Data Lake pode armazenar dados estruturados, semiestruturados e não estruturados que correspondem a característica de variedade dos dados que é bem típica de aplicações de Big Data. Acerto: 1,0 / 1,0 Observe o trecho de código abaixo import numpy as np from pyspark import SparkContext spark_contexto = SparkContext() a = np.array([1, 5, 1, 6, 4, 7, 7]) teste = spark_contexto.parallelize(a) Selecione a opção correta a respeito dele. A utilização do SparkContext é opcional. A execução do trecho de código vai gerar um erro. A linha "spark_contexto.parallelize(a)" aplica a técnica MapReduce para processar o vetor "a". O objetivo do trecho de código é contar a quantidade de ocorrências dos valores do vetor "a". A variável "teste" corresponde a um RDD. Respondido em 24/03/2022 11:03:15 Explicação: Questão3 a Questão4 a Questão5 a 24/03/2022 14:17 Estácio: Alunos https://simulado.estacio.br/alunos/ 3/5 Gabarito: A variável "teste" corresponde a um RDD. Justificativa: O trecho de código está sintaticamente correto. O objetivo é criar um RDD que, no caso, é representado pela variável "teste" para isso é obrigatório utilizar o "SparkContext". O pacote "numpy" foi utilizado por causa da variável vetor "a". Acerto: 1,0 / 1,0 O paradigma MapReduce é uma estratégia de computação com capacidade de processar grandes conjuntos de dados de maneira distribuída em várias máquinas. Em relação à técnica MapReduce, selecione a opção que é responsável por consolidar os resultados produzidos ao longo do processamento. Processamento Mapeamento Agregação Redução Separação Respondido em 24/03/2022 11:09:28 Explicação: Gabarito: Redução Justificativa: A função de redução agrupa os pares após a fase de embaralhamento concluindo o processamento dos dados. O MapReduce é uma técnica clássica de programação distribuída e é bastante utilizada por diversos frameworks como o Spark, por exemplo. Acerto: 1,0 / 1,0 Para a regularização dos dados obtidos, qual técnica podemos utilizar objetivando fazer com que os dados fiquem na mesma escala? Map & Reduce MinMax Shuffle Splice Divide Respondido em 24/03/2022 13:44:29 Explicação: Extraímos do dado observado sua proporção em relação ao valor mínimo possível até o valor máximo e enquadramos o mesmo nesta régua, assim realizando a regularização, que consiste em colocar os dados na mesma escala. Acerto: 1,0 / 1,0 No mundo de Big Data, temos dados os mais variados possíveis, e sua classificação é fundamental para um cientista de dados. As notas que compõem o histórico escolar de um aluno são classificadas como que tipo de dados? Numéricos Temporais Semi-Estruturados Categóricos Questão6 a Questão7 a Questão8 a 24/03/2022 14:17 Estácio: Alunos https://simulado.estacio.br/alunos/ 4/5 Atemporais Respondido em 24/03/2022 11:12:44 Explicação: O correto é classificar como dados categóricos, pois a nota de um aluno mesmo que possa ser operada por funções de soma, média etc., representa um conceito ou extrato/proporção de aprendizado de um aluno, um 8 muitas das vezes significa que o aluno aprendeu 80% da matéria por exemplo, ou implica na condição de apto, ou reprovado. O tipo numérico seria correto se não tivesse o contexto implícito de categoria, por isso devemos ter cuidado ao modelarmos nossos dados. Acerto: 1,0 / 1,0 As redes neurais são modelos poderosos cujo principal componente onde estão armazenados seus conhecimentos é(são) Pesos Vieses Camadas Escondidas Função de Ativação Camada de Saída Respondido em 24/03/2022 13:46:55 Explicação: O conhecimento dos modelos conexionistas é localizado em suas camadas internas ocultas ou escondidas (hidden), pois é lá que se encontram as matrizes de pesos, vieses e funções de ativação que, ao trabalharem juntas, produzem o conhecimento necessário para discriminar novas observações com base em registros passados. Acerto: 1,0 / 1,0 O enquadramento de aprendizado não supervisionado contempla qual(is) técnicas? I - Agrupamento II - Classificação III - Regressão Apenas as opções II e III estão corretas Apenas a opção III está correta Apenas a opção I está correta Apenas a opção II está correta Apenas as opções I e III estão corretas Respondido em 24/03/2022 13:45:05 Explicação: O aprendizado supervisionado se caracteriza pelo aprendizado autodidata que é caracterizado pelo agrupamento. Já a classificação e a regressão são técnicas oriundas do aprendizado supervisionado. Questão9 a Questão10 a javascript:abre_colabore('38403','278724082','5154997927'); 24/03/2022 14:17 Estácio: Alunos https://simulado.estacio.br/alunos/ 5/5 javascript:abre_colabore('38403','278724082','5154997927');
Compartilhar