Buscar

Prática de Laboratorio I

Prévia do material em texto

Avaliação: NPG2062_AV_201905016841 » PRÁTICA E LABORATÓRIO I
	Tipo de Avaliação: AV
	Aluno: 201905016841 - VIVIANE PEREIRA RODRIGUES LOPES
	Professor:
	DENIS GONCALVES COPLE
	Turma: 9001/AA
	Nota da Prova: 6,0    Nota de Partic.: 0   Av. Parcial 0  Data: 08/09/2019 14:35:39
	
	 1a Questão (Ref.: 201906057703)
	Pontos: 0,6  / 0,6
	Em Pig, uma Bag significa:
		
	 
	Uma coleção de tuplas
	
	Uma coleção de campos
	
	Uma coleção de átomos
	
	Uma saída brusca de um processamento
	
	Um problema na execução dos dados
	
	
	 2a Questão (Ref.: 201906057708)
	Pontos: 0,6  / 0,6
	Os dados de uma base de nome "origem.dat" deve ser carregada para posterior processamento por Pig. Os dados de seus campos são separados por um caractere de tabulação. Em Pig, quem especifica o caractere de delimitação na execução de LOAD é:
		
	
	FILTER
	
	DUMP
	
	INTO
	 
	PigStorage
	
	USING
	
	
	 3a Questão (Ref.: 201906070419)
	Pontos: 0,6  / 0,6
	Desenvolvido em 2009 pela Universidade da Califórnia e, hoje, um projeto da Apache Software Foundation, Spark é uma ferramenta big data que apresenta um desempenho bem maior do que o apresentado por Hadoop. Qual das opções seguintes NÃO representa uma característica do Spark?
		
	
	Processa grandes massas de dados de forma paralela e distribuída.
	
	Realiza operações MapReduce (Spark Core) e consultas SQL (SparkSQL).
	 
	Utiliza um mecanismo de DAG avançado, que permite, partindo-se de um nó A para um nó B, o retorno ao nó A.
	
	Permite encadear uma sequência de estágios (pipeline).
	
	Pode ser cem vezes mais rápido que o Hadoop para operações em memória.
	
	
	 4a Questão (Ref.: 201906124734)
	Pontos: 0,6  / 0,6
	Elementos RDD suportam dois tipos de operações específicas, sendo um dos grupos constituído por operações de transformação. Qual das opções abaixo apresenta apenas operações de transformação?
		
	
	collect, count, first
	
	first, foreach, reduce
	
	map, filter, collect
	
	flatMap, collect, reduce
	 
	flatMap, groupByKey, reduceByKey
	
	
	 5a Questão (Ref.: 201906057725)
	Pontos: 0,6  / 0,6
	Uma _______ não utiliza a palavra-chave new.
Qual opção completa corretamente a lacuna acima?
		
	
	var
	 
	case class
	
	val
	
	class
	
	def
	
	
	 6a Questão (Ref.: 201906057723)
	Pontos: 0,6  / 0,6
	Na expressão:
                val linha = s"Resultado = $raiz"
"s" é:
		
	
	Um erro de digitação
	
	Uma variável
	
	Um indicador de início de operação aritmética
	
	Um erro de sintaxe
	 
	Um interpolador
	
	
	 7a Questão (Ref.: 201906057731)
	Pontos: 0,6  / 0,6
	Um Dataset organizado em termos de colunas nomeadas é chamado de:
		
	
	Array
	
	Variável
	
	RDD
	 
	DataFrame
	
	Coleção
	
	
	 8a Questão (Ref.: 201906057699)
	Pontos: 0,6  / 0,6
	Após o processamento por "map", os dados são:
		
	 
	Salvos no sistema de arquivos local.
	
	Enviados para Hadoop, para que haja a execução de "shuffle" e "sort" sobre os mesmos.
	
	Entregues para processamento por "reduce".
	
	Armazenados no HDFS
	
	Excluídos, pois o HDFS é uma área nobre, e não pode ter sobrecarga de armazenamento.
	
	
	 9a Questão (Ref.: 201906124649)
	Pontos: 0,6  / 0,6
	A ferramenta de linha de comando do HBase permite a execução de diversos comandos para a manutenção e consulta aos dados. Para exibir o conteúdo de uma tabela deverá ser utilizado o comando:
		
	
	truncate
	
	put
	
	describe
	
	list
	 
	scan
	
	
	 10a Questão (Ref.: 201906057720)
	Pontos: 0,6  / 0,6
	No HBase, uma região é...
		
	 
	Uma partição horizontal de uma tabela
	
	Um tipo de tabela especial de formação
	
	O mesmo que uma tabela
	
	Uma área de controle onde só podem existir dados de configuração
	
	O espaço onde o HBase é executado

Continue navegando