Prévia do material em texto
Disc.: DGT0134 - TÓPICOS DE BIG DATA EM PYTHON Período: 2023.1 EAD (G) / AV Aluno: Matrícula: Data: 28/05/2023 18:34:16 Turma: 9001 1a Questão (Ref.: 202008551732) Em relação às redes de Internet das coisas, selecione a opção correta que relaciona os dispositivos entre si. São um relacionamento máquina a máquina São redes locais São um conjunto de sinais São interconectados entre si É uma conexão rede a rede 2a Questão (Ref.: 202008551483) A respeito das aplicações de fluxos de dados, selecione a opção correta. Reapresentação de programas de televisão. Serviço de correio eletrônico Serviços de compras online Serviços sob demanda, como serviços de filme online. Transações bancárias, como o serviço de PIX. 3a Questão (Ref.: 202008560474) A respeito dos componentes do ecossistema do Hadoop, selecione a opção correta que apresenta o componente responsável pelo gerenciamento dos clusters. Flume HBase Spark HCluster Zookeeper 4a Questão (Ref.: 202008560417) Em relação à fase de mapeamento do Hadoop, selecione a opção correta que apresenta o responsável pela geração de fragmento para os componentes da fase de redução. Particionador. Mapeador. Leitor de registros. Combinador. Redutor. 5a Questão (Ref.: 202008560282) As bibliotecas são coleções de subprogramas utilizados no desenvolvimento de softwares. Selecione a opção correta que contém o componente do ecossistema do Spark responsável por realizar operações paralelas em grafos. RDDs GraphX MLlib Spark Streaming Spark Core 6a Questão (Ref.: 202008566647) Selecione a opção correta que contenha as categorias em que transformações podem ser classificadas. Separação e finalização Embaralhamento e redução Estreitas e amplas Mapeamento e redução Mapeamento e partição 7a Questão (Ref.: 202008560907) No contexto de Coleta de Dados, o que podemos afirmar sobre Dados Primários: I - São dados obtidos em primeira mão pelo cientista de dados ou pelo analista de dados II - São dados que precisam ser pré-processados para análise, e serão feitos exclusivamente no primeiro momento pelo dono dos dados, o analista em questão III - São obtidos através de softwares de monitoramento de logs, surveys, e bancos de dados Analise as frases listadas e assinale a alternativa correta. Apenas as opções II e III. Apenas as opções I e III. Apenas a opção II. Apenas a opção I. As opções I, II, e III estão corretas. 8a Questão (Ref.: 202008561123) Os dados que, por alguma razão, normalmente interferência humana, não chegam com todos os atributos esperados durante a coleta de dados, são conhecidos como: Embaralhados. Faltantes. Nulos. Corrompidos. Enviesados. 9a Questão (Ref.: 202008560108) Qual o processo irmão do KDD que é utilizado comumente no âmbito industrial? SIGKDD. KDD-DM. CRISP-DM. KDM. SIGM. 10a Questão (Ref.: 202008560104) Quais os métodos de aprendizado de máquina que existem? Aprendizado Supervisionado, Escondido, Por Reforço, e Semisupervisionado Aprendizado Supervisionado, Não-Supervisionado, Por Reforço, e Aleatório Aprendizado Supervisionado, Não-Supervisionado, Por Reforço, e Semisupervisionado Aprendizado Supersticioso, Não-Supervisionado, Por Reforço, e Semisupervisionado Aprendizado Supervisionado, Não-Supervisionado, Por Força Bruta, e Semisupervisionado