Baixe o app para aproveitar ainda mais
Prévia do material em texto
Disciplina: EEX0174 - TÓPICOS DE BIG DATA EM PYTHON Período: 2022.1 EAD (GT) / AVS Aluno: Matrícula: Data: 17/06/2022 21:13:59 Turma: 9001 ATENÇÃO 1. Veja abaixo, todas as suas respostas gravadas no nosso banco de dados. 2. Caso você queira voltar à prova clique no botão "Retornar à Avaliação". 1a Questão (Ref.: 202010349708) Em relação à Internet das coisas, selecione a opção correta que relaciona os dispositivos com aos servidores de aplicação. Servidores de banco de dados Tecnologia proprietária Redes locais Nuvem Dispositivos de recepção 2a Questão (Ref.: 202010349802) Em relação aos formatos que os dados de Big Data, selecione a opção que corresponde a quantidade de formas que podem ser encontrados. 3 4 5 2 6 3a Questão (Ref.: 202010358613) A respeito dos componentes do ecossistema do Hadoop, selecione a opção correta que apresenta o componente responsável pelo gerenciamento dos clusters. HBase Zookeeper Spark Flume HCluster 4a Questão (Ref.: 202010358554) Em relação aos RDBMS, selecione a opção que apresenta a característica que trata as transações em um banco de dados como uma unidade indivisível. Indivisibilidade. Isolamento. Durabilidade. Atomicidade. Consistência. 5a Questão (Ref.: 202010358427) A escolha adequada de uma linguagem de programação é fundamental para a maximização dos resultados almejados. Nesse sentido, selecione a opção que contém a linguagem de programação mais adequada para desenvolver aplicações para o Spark. Python Scala Java Script R Java 6a Questão (Ref.: 202010358419) Compreender os conceitos e princípios do framework Apache Spark é fundamental para o cientista de dados. Selecione a opção correta que contém o componente do ecossistema Spark responsável por dar suporte para tratar fluxo de dados típicos de aplicações de tempo real. Spark Streaming Spark Core RDDs Spark SQL Spark Hadoop 7a Questão (Ref.: 202010359046) No contexto de Coleta de Dados, o que podemos afirmar sobre Dados Primários: I - São dados obtidos em primeira mão pelo cientista de dados ou pelo analista de dados II - São dados que precisam ser pré-processados para análise, e serão feitos exclusivamente no primeiro momento pelo dono dos dados, o analista em questão III - São obtidos através de softwares de monitoramento de logs, surveys, e bancos de dados Analise as frases listadas e assinale a alternativa correta. Apenas a opção I. As opções I, II, e III estão corretas. Apenas as opções I e III. Apenas as opções II e III. Apenas a opção II. 8a Questão (Ref.: 202010359180) A biblioteca pandas é poderosa e de grande valia para a vida de um cientista de dados. Sobre ela podemos afirmar que: I - O nome Pandas se refere a dados em painel ou panel data II - O DataFrame é o coletivo de listas (lists) III - É possível criarmos DataFrames a partir de praticamente qualquer estrutura de dados, principalmente CSVs, Excels, e JSONsAnalise as frases listadas e assinale a alternativa correta. Apenas I. Apenas I e II. Apenas II. Apenas I e III. Apenas II e III. 9a Questão (Ref.: 202010358248) Luís foi contratado recentemente para trabalhar em uma empresa de consultoria de análise de dados. O projeto no qual foi alocado já havia começado, e os colegas de Luís lhe disseram que estavam preparando o conjunto de dados para poder passar os mesmos por um modelo de árvore de decisão. Já que especificamente os colegas de Luís estão removendo dados faltantes, em qual etapa do processo de KDD, Luís se encontra: Avaliação. Coleta de Dados. Descoberta de Padrões. Pré-Processamento . Transformação de Dados. 10a Questão (Ref.: 202010358244) Os modelos simbólicos são aqueles que: São aqueles que só lidam com problemas categóricos Se baseiam em lógica e regras de inferência para aprender e raciocinar São aqueles que lidam apenas com problemas numéricos Se baseiam estritamente em dados e inferências estatísticas em cima deles Se baseiam em táticas de agrupamento por similaridade
Compartilhar