Prévia do material em texto
<p>12/09/2024, 09:18 estacio.saladeavaliacoes.com.br/prova/66e2d407b34285d4d59ba46a/ SM2 Tópicos De Big Data Em Python T 1 Marcar para revisão 00 : 16 07 Ocultar hora min seg Atualmente, o Apache Spark é o mais bem-sucedido framework para Big Data. Questão 1 de 10 Selecione a opção correta que contenha apenas funções que 1 2 3 4 5 podem ser categorizadas como transformações no Spark. 6 7 8 9 10 A reduce, first e map. Respondidas (10) Em branco (0) Finalizar prova B map, sample e collect. C map, take e reduce. D count, collect e take. E map, filter e union. 2 Marcar para revisão Selecione a opção correta que contenha a operação responsável por retornar um subconjunto aleatório dos dados de entrada. Feedback 1/12</p><p>12/09/2024, 09:18 A filter B random C mapRandom D distinct E sample 3 Marcar para revisão PySpark caracteriza-se como uma biblioteca Spark responsável por executar programas usando recursos do Apache Spark. Selecione a opção correta que contenha itens que são pré-requisitos de instalação para utilização do PySpark. A Hadoop e Spark B Casandra e Spark C Java e Python 2/12</p><p>12/09/2024, 09:18 estacio.saladeavaliacoes.com.br/prova/66e2d407b34285d4d59ba46a/ D Python e Escala E Java e R 4 Marcar para revisão A visualização dos dados é fundamental no processo de análise, interpretação e obtenção de conhecimento. Dentre as visualizações mais adequadas para dados numéricos estão: I - Histograma - Gráfico de Dispersão III - Gráfico de Pizza Analisem as alternativas listadas e assinalem a correta. A Apenas e III B Apenas e III C Apenas e D Apenas III E As alternativas I, II e III 3/12</p><p>12/09/2024, 09:18 5 Marcar para revisão Luís planeja começar um projeto particular visando construir um módulo de análise de dados. Primeiramente, ele deseja começar por um módulo de coleta de dados. Para que ele possa obter um padrão organizado de criação de projeto, qual é a sequência desejável de passos que esperamos que Luís siga? 4/12</p><p>12/09/2024, 09:18 Criar uma pasta para acomodar seu projeto; Levantar um virtualenv através do venv; Instalar as dependências com as quais ele quer trabalhar através do A pip install; congelar as mesmas no requirements.txt através do pip freeze; criar uma pasta para o módulo de coleta e dentro dela criar um para a lógica do módulo. Criar uma pasta para acomodar seu projeto; Instalar as dependências com as quais ele quer trabalhar através do B pip install; criar uma pasta para o módulo de coleta e dentro dela criar um arquivo __init_.py em branco e outro para a lógica do módulo. 5/12</p><p>12/09/2024, 09:18 estacio.saladeavaliacoes.com.br/prova/66e2d407b34285d4d59ba46a/ Criar uma pasta para acomodar seu projeto; Instalar as dependências com as quais ele quer trabalhar através do pip install; congelar as mesmas no C requirements.txt através do pip freeze; criar uma pasta para o módulo de coleta e dentro dela criar um arquivo __init_.py em branco e outro para a lógica do módulo. Criar uma pasta para acomodar seu projeto; Levantar um virtualenv através do venv; Instalar as dependências com as quais ele quer trabalhar através do pip install; congelar as D mesmas no requirements.txt através do pip freeze; criar uma pasta para o módulo de coleta e dentro dela criar um arquivo __init_.py em branco e outro para a lógica do módulo. 6/12</p><p>12/09/2024, 09:18 Criar uma pasta para acomodar seu projeto; Levantar um virtualenv através do Instalar as dependências com as quais ele quer trabalhar através do pip install; congelar as E mesmas no requirements.txt através do pip freeze; criar uma pasta para o módulo de coleta e dentro dela criar um arquivo - _init_.py com a lógica do módulo. 6 Marcar para revisão Gabriel entrou recentemente em uma empresa de gestão de fundos de investimento. No seu primeiro dia de trabalho, lhe é conferida a tarefa de buscar os relatórios do pessoal da contabilidade para fazer suas análises exploratórias. O departamento de contabilidade extrai os dados de seus relatórios de um SAP que retorna valores brutos de compras, quantidades de produtos etc. Então os contadores organizam, por agregação, informação relevante no 7/12</p><p>12/09/2024, 09:18 relatório em planilhas por eles desenvolvidos. Por questões de acesso e segurança, Gabriel só pode lidar com essas planilhas. Este tipo de coleta feita por Gabriel e pelos Contadores é respectivamente dos tipos: A Secundária; Primária. B Primária; Primária. C Secundária; Terciária. D Primária; Secundária. Secundária; E Secundária. 7 Marcar para revisão Qual o objetivo da inteligência artificial ao simular comportamentos humanos na máquina? 8/12</p><p>12/09/2024, 09:18 Fazer com que computadores A acessem a internet mais rápido. Incrementar o uso da B memória de longa duração do sistema. Otimizar algoritmos para que eles se C adaptem a contextos não previamente codificados. Melhorar a capacidade de D processamento de dados do sistema. Viabilizar a E computação paralela. 8 Marcar para revisão Dentre as inúmeras bibliotecas da linguagem Python, qual destas é a que abstrai conceitos de engenharia de aprendizado de máquina e implementa modelos de ML? 9/12</p><p>12/09/2024, 09:18 estacio.saladeavaliacoes.com.br/prova/66e2d407b34285d4d59ba46a/ A BeautifulSoup B Scikit-Learn C Numpy D Pandas E 9 Marcar para revisão Os componentes do Spark têm como objetivo facilitar o desenvolvimento de projetos com finalidades específicas. Nesse sentido, selecione a opção que contém o componente responsável por estabelecer uma conexão com o Cluster. A SparkSession B DataFrame C RDD 10/12</p><p>12/09/2024, 09:18 D SparkContext E Spark.Catalog 10 Marcar para revisão Sobre o Pandas DataFrame, o que podemos afirmar? - É o coletivo de séries temporais pandas.Series a estrutura de dados que representa os dados em painel - uma matriz conjunto de vetores - bloco fundamental da análise de dados moderna, principalmente para aprendizado de máquina. Analise as frases listadas e assinale a alternativa correta. Apenas as opções I, II, A III. Apenas as opções II, B III. Apenas as opções I, C II, IV. 11/12</p><p>12/09/2024, 09:18 estacio.saladeavaliacoes.com.br/prova/66e2d407b34285d4d59ba46a/ D Apenas a opção III. Todas as opções I, II, E III, IV. 12/12</p>