Prévia do material em texto
1 Marcar para revisão PySpark caracteriza-se como uma biblioteca Spark responsável por executar programas usando recursos do Apache Spark. Selecione a opção correta que contenha itens que são pré-requisitos de instalação para utilização do PySpark. A Hadoop e Spark B Casandra e Spark C Java e Python D Python e Escala E Java e R 2 Marcar para revisão Atualmente, o Apache Spark é o mais bem-sucedido framework para Big Data. Selecione a opção correta que contenha apenas funções quepodem ser categorizadas como transformações no Spark. A count, collect e take. B map, sample e collect. C map, filter e union. D reduce, first e map. E map, take e reduce. 3 Marcar para revisão paradigma MapReduce é uma estratégia de computação com capacidade de processar grandes conjuntos de dados de maneira distribuída em várias máquinas. Em relação à técnica MapReduce, selecione a opção que é responsável por consolidar os resultados produzidos ao longo do processamento. A Agregação B MapeamentoC Separação D Redução E Processamento 4 Marcar para revisão Os componentes do Spark têm como objetivo facilitar o desenvolvimento de projetos com finalidades específicas. Nesse sentido, selecione a opção que contém o componente responsável por estabelecer uma conexão com o Cluster. A Spark.Catalog B SparkSession C DataFrame D RDD E SparkContext5 Marcar para revisão Dado que Felipe quer fazer a junção entre dois conjuntos de dados e escreveu o seguinte código: import pandas as pd df1 = ['foo', 'bar', 'baz', 'foo'], 'value': 2, 3, 5]}) df2 = ['foo', 'bar', 'baz', 'foo'], 'value': [5, 6, 7, 8]}) df1.merge(df2, left_on='lkey', right_on='rkey') Qual destas alternativas descreve as saídas do código? I. O conjunto resultante terá colunas Ikey, value_x, rkey, value_y II. código não executará, pois Filipe não definiu os sufixos de coluna III. O resultado do código em questão retornará um pd.Series juntando os conjuntos pela Ikey e rkey. Apenas a opção está A correta. Apenas a opção B está correta. Apenas a opção III C está correta.Apenas as opções e D III estão corretas. Apenas as opções e E III estão corretas. 6 Marcar para revisão Gabriel entrou recentemente em uma empresa de gestão de fundos de investimento. No seu primeiro dia de trabalho, lhe é conferida a tarefa de buscar os relatórios do pessoal da contabilidade para fazer suas análises exploratórias SM2 Tópicos De Big Data Em Python T dados de seus relatorios de um SAP que retorna valores brutos de compras, quantidades de produtos 00 : 42 : 55 etc. Então os contadores Ocultar hora min seg organizam, por agregação, informação relevante no relatório em planilhas por Questão 9 de 10 eles desenvolvidos. Por questões de acesso e 1 2 3 4 5 segurança, Gabriel só pode lidar com essas planilhas. 6 7 8 9 10 Este tipo de coleta feita por Gabriel e pelos Contadores Respondidas (10) Em branco (0) é respectivamente dos tipos: Finalizar provaA Secundária; Primária. B Primária; Primária. C Secundária; Terciária. D Primária; Secundária. Secundária; E Secundária. 7 Marcar para revisão Sobre o Pandas DataFrame, o que podemos afirmar? - É o coletivo de séries temporais pandas.Series - a estrutura de dados que representa os dados em painel - uma matriz conjunto de vetores IV - É o bloco fundamental da análise de dados moderna, principalmente para aprendizado de máquina. Analise as frases listadas e assinale a alternativa correta. A Apenas a opção III. Apenas as opções I, B II, IV.Apenas as opções I, II, C III. Apenas as opções II, D III. Todas as opções I, II, E III, IV. 8 Marcar para revisão termo mineração de dados é amplamente usado na comunidade técnica a esmo, mas, na realidade, ele se refere ao processo de: A CNN B KDD C DNN D LSTM E RNN 9 Marcar para revisãoQual o tipo de método nos permite visualizar a árvore de decisão na biblioteca Scikit- Learn? A console.log B print C plot_tree D cout E printf 10 Marcar para revisão As técnicas de aprendizado de máquina para aprendizado supervisionado são: - Classificação - - Agrupamento III - Regressão A Apenas I e B Apenas e III C Apenas e IIID Apenas I E Apenas