Baixe o app para aproveitar ainda mais
Prévia do material em texto
Avaliação: NPG2062_AV_201905016841 » PRÁTICA E LABORATÓRIO I Tipo de Avaliação: AV Aluno: 201905016841 - VIVIANE PEREIRA RODRIGUES LOPES Professor: DENIS GONCALVES COPLE Turma: 9001/AA Nota da Prova: 6,0 Nota de Partic.: 0 Av. Parcial 0 Data: 08/09/2019 14:35:39 1a Questão (Ref.: 201906057703) Pontos: 0,6 / 0,6 Em Pig, uma Bag significa: Uma coleção de tuplas Uma coleção de campos Uma coleção de átomos Uma saída brusca de um processamento Um problema na execução dos dados 2a Questão (Ref.: 201906057708) Pontos: 0,6 / 0,6 Os dados de uma base de nome "origem.dat" deve ser carregada para posterior processamento por Pig. Os dados de seus campos são separados por um caractere de tabulação. Em Pig, quem especifica o caractere de delimitação na execução de LOAD é: FILTER DUMP INTO PigStorage USING 3a Questão (Ref.: 201906070419) Pontos: 0,6 / 0,6 Desenvolvido em 2009 pela Universidade da Califórnia e, hoje, um projeto da Apache Software Foundation, Spark é uma ferramenta big data que apresenta um desempenho bem maior do que o apresentado por Hadoop. Qual das opções seguintes NÃO representa uma característica do Spark? Processa grandes massas de dados de forma paralela e distribuída. Realiza operações MapReduce (Spark Core) e consultas SQL (SparkSQL). Utiliza um mecanismo de DAG avançado, que permite, partindo-se de um nó A para um nó B, o retorno ao nó A. Permite encadear uma sequência de estágios (pipeline). Pode ser cem vezes mais rápido que o Hadoop para operações em memória. 4a Questão (Ref.: 201906124734) Pontos: 0,6 / 0,6 Elementos RDD suportam dois tipos de operações específicas, sendo um dos grupos constituído por operações de transformação. Qual das opções abaixo apresenta apenas operações de transformação? collect, count, first first, foreach, reduce map, filter, collect flatMap, collect, reduce flatMap, groupByKey, reduceByKey 5a Questão (Ref.: 201906057725) Pontos: 0,6 / 0,6 Uma _______ não utiliza a palavra-chave new. Qual opção completa corretamente a lacuna acima? var case class val class def 6a Questão (Ref.: 201906057723) Pontos: 0,6 / 0,6 Na expressão: val linha = s"Resultado = $raiz" "s" é: Um erro de digitação Uma variável Um indicador de início de operação aritmética Um erro de sintaxe Um interpolador 7a Questão (Ref.: 201906057731) Pontos: 0,6 / 0,6 Um Dataset organizado em termos de colunas nomeadas é chamado de: Array Variável RDD DataFrame Coleção 8a Questão (Ref.: 201906057699) Pontos: 0,6 / 0,6 Após o processamento por "map", os dados são: Salvos no sistema de arquivos local. Enviados para Hadoop, para que haja a execução de "shuffle" e "sort" sobre os mesmos. Entregues para processamento por "reduce". Armazenados no HDFS Excluídos, pois o HDFS é uma área nobre, e não pode ter sobrecarga de armazenamento. 9a Questão (Ref.: 201906124649) Pontos: 0,6 / 0,6 A ferramenta de linha de comando do HBase permite a execução de diversos comandos para a manutenção e consulta aos dados. Para exibir o conteúdo de uma tabela deverá ser utilizado o comando: truncate put describe list scan 10a Questão (Ref.: 201906057720) Pontos: 0,6 / 0,6 No HBase, uma região é... Uma partição horizontal de uma tabela Um tipo de tabela especial de formação O mesmo que uma tabela Uma área de controle onde só podem existir dados de configuração O espaço onde o HBase é executado
Compartilhar