Baixe o app para aproveitar ainda mais
Prévia do material em texto
Disciplina: EEX0174 - TÓPICOS DE BIG DATA EM PYTHON Período: 2022.1 EAD (GT) / AVS Matrícula: Data: 17/06/2022 15:34:32 Turma: 9001 ATENÇÃO 1. Veja abaixo, todas as suas respostas gravadas no nosso banco de dados. 2. Caso você queira voltar à prova clique no botão "Retornar à Avaliação". 1a Questão (Ref.: 202010092427) Selecione a opção a respeito da computação em nuvem. é a definição para aplicações de Big Data que utilizam os protocolos de internet é uma forma de abstrair serviços da internet das coisas em redes locais distribuídas é um conjunto de tecnologias que disponibilizam sistemas e recursos na internet é uma outra forma de denominar a internet das coisas trata-se da utilização de aplicações com finalidades específicas 2a Questão (Ref.: 202010092336) Selecione a opção correta sobre o uso de Big Data. Grandes volumes de dados são úteis para testar a capacidade dos servidores de gerenciamento de dados. Projetos de big de Big Data são uma forma de organizar tabelas normalizadas com grande volume de dados. O volume e diversidade dos dados podem dar uma visão realística do que está sendo observado. Com projetos de Big Data é sempre possível detectar fraudes em operações financeiras. É impossível não utilizar aplicações de Big Data para gerenciar projetos de internet das coisas. 3a Questão (Ref.: 202010101273) Em relação à fase de mapeamento do Hadoop, selecione a opção correta que apresenta o responsável pela geração de fragmento para os componentes da fase de redução. Combinador. Particionador. Redutor. Leitor de registros. Mapeador. 4a Questão (Ref.: 202010101271) Em relação aos RDBMS, selecione a opção que apresenta a característica que trata as transações em um banco de dados como uma unidade indivisível. Durabilidade. Indivisibilidade. Atomicidade. Isolamento. Consistência. 5a Questão (Ref.: 202010101138) As bibliotecas são coleções de subprogramas utilizados no desenvolvimento de softwares. Selecione a opção correta que contém o componente do ecossistema do Spark responsável por realizar operações paralelas em grafos. MLlib Spark Streaming RDDs Spark Core GraphX 6a Questão (Ref.: 202010101142) A biblioteca Pandas é amplamente utilizada para manipular dados heterogêneos, situação recorrente para aplicações de Big Data. Nesse sentido, selecione a opção que contém a estrutura de dados que possibilita o Cientista de dados atribuir nome para as colunas. SQL PySpark DataFrame RDD numpy.array 7a Questão (Ref.: 202010101763) No contexto de Coleta de Dados, o que podemos afirmar sobre Dados Primários: I - São dados obtidos em primeira mão pelo cientista de dados ou pelo analista de dados II - São dados que precisam ser pré-processados para análise, e serão feitos exclusivamente no primeiro momento pelo dono dos dados, o analista em questão III - São obtidos através de softwares de monitoramento de logs, surveys, e bancos de dados Analise as frases listadas e assinale a alternativa correta. Apenas as opções I e III. Apenas a opção I. Apenas as opções II e III. Apenas a opção II. As opções I, II, e III estão corretas. 8a Questão (Ref.: 202010101979) Os dados que, por alguma razão, normalmente interferência humana, não chegam com todos os atributos esperados durante a coleta de dados, são conhecidos como: Embaralhados. Nulos. Corrompidos. Enviesados. Faltantes. 9a Questão (Ref.: 202010100967) As redes neurais são implementadas em Python através de uma biblioteca de processamento de cálculos em paralelo baseada em grafos. Qual o nome desta biblioteca? Numpy Plotly Pandas Tensorflow Scipy 10a Questão (Ref.: 202010100963) O boom da IA se deve ao surgimento de novas tecnologias e dispositivos que por estarem sempre conectados produzem uma quantidade enorme de dados. Estes dados que alimentam os modelos de aprendizado de máquina também são conhecidos como: Conhecimento. Observações. Big Data. Dados Faltantes. Informações. Autenticação para a Prova On-line
Compartilhar