Buscar

BIG DATA

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

BIG DATA
	 
	 
	 1.
	Ref.: 5175431
	Pontos: 1,00  / 1,00
	
	(FCC 2017 , DPE-RS - Analista Banco de Dados) Os sistemas de Big Data costumam ser caracterizados pelos chamados 3 Vs, sendo que o V de:
		
	
	Volume corresponde à rapidez na geração e obtenção de dados.
	
	Veracidade corresponde à rapidez na geração e obtenção de dados.
	 
	Variedade corresponde ao grande número de tipos ou formas de dados.
	
	Valor corresponde à grande quantidade de dados acumulada.
	
	Velocidade corresponde à confiança na geração e obtenção dos dados.
	
	
	 2.
	Ref.: 5181258
	Pontos: 1,00  / 1,00
	
	(Instituto AOCP - 2018 - PRODEB - Especialista de TIC - B.I) A ciência dos dados é um campo emergente. A demanda é elevada, e encontrar pessoal qualificado é um dos principais desafios associados à análise de Big Data. Sobre conhecimento técnico em administração de dados, é correto afirmar que o cientista de dados agrega ao trabalho, EXCETO:
 
		
	
	Conhecimento empresarial para aplicar um contexto.
	
	Habilidade para integrar e preparar grandes e variados conjuntos de dados.
	
	Habilidade avançada de análise e modelagem para revelar e compreender relacionamentos obscuros. 
	
	Habilidades de comunicação para apresentar resultados. 
	 
	Conhecimento e habilidades para recrutamento e seleção de pessoas por competências.
	
	
	 3.
	Ref.: 5193438
	Pontos: 1,00  / 1,00
	
	(CCV-UFC - 2019 - UFC - Técnico de Tecnologia da Informação - Desenvolvimento de Sistemas) Sobre os banco de dados NoSQL, assinale a afirmativa correta.
		
	
	São exemplos de bancos de dados NoSQL: MongoDB, Firebird, DynamoDB, SQLite, Microsoft Access e Azure Table Storage.
	 
	Os bancos de dados NoSQL usam diversos modelos para acessar e gerenciar dados, como documento, grafo, chave-valor, em memória e, pesquisa.
	
	Nos bancos de dados NoSQL devem ser definidos um esquema de dados fixo antes de qualquer operação.
	
	Bancos de dados NoSQL não podem ser indexados.
	
	Bancos de dados NoSQL são considerados banco de dados relacionais.
	
	
	 4.
	Ref.: 5196337
	Pontos: 1,00  / 1,00
	
	As evoluções da era digital levaram a geração de muitas informações digitais. As empresas para se manterem no mercado precisam ter capacidade de observar e absorver rapidamente tais informações para identificar mudanças no mercado e novas oportunidades. Um dos recursos que pode ser utilizado para viabilizar essa rapidez de resposta é: 
		
	
	Processamento paralelo
 
	 
	Processamento em tempo real
	
	Processamento centralizado
	
	Processamento em lote
	
	Processamento distribuído
	
	
	 5.
	Ref.: 5196341
	Pontos: 1,00  / 1,00
	
	Nome da biblioteca java de aprendizado de máquina recomendada para ser utilizada com o Apache Spark. 
		
	
	Apache accumulo
	
	Apache storm
	
	Apache Commons Modeler
	 
	Apache mahout
	
	Apache CouchDB
	
	
	 6.
	Ref.: 5196345
	Pontos: 1,00  / 1,00
	
	Um projeto de Big Data que tem como foco o aumento da percepção deve conter uma visualização de dados capaz de alavancar esse objetivo. A melhor forma de visualizar dados é através de:   
		
	
	Planilha eletrônica
	
	Formato tabular
	
	Apresentação oral
	
	Relato textual
	 
	Gráfico
	
	
	 7.
	Ref.: 5193451
	Pontos: 1,00  / 1,00
	
	A comunicação entre os elementos no MapReduce ocorre:
		
	
	Pelo protocolo HTTP
	
	Por sistema de mensageria, como JMS (Java Message Service)
	
	Pelo Banco de Dados
	
	Por RMI (Remote Method Invocation)
	 
	No sistema de arquivos compartilhados entre os nós
	
	
	 8.
	Ref.: 5196353
	Pontos: 1,00  / 1,00
	
	Com referência a Big Data, assinale a opção correta.
		
	
	A definição mais ampla de Big Data restringe o termo a duas partes ¿ o volume absoluto e a velocidade ¿, o que facilita a extração das informações e dos insights de negócios.
	
	O sistema de arquivos distribuído Hadoop implementa o algoritmo Dijkstra modificado para busca irrestrita de dados em árvores     aglomeradas em clusters com criptografia.     
	
	Em Big Data, o sistema de arquivos HDFS é usado para armazenar arquivos muito grandes de forma distribuída, tendo como princípio o write-many, read-once.     
	
	Para armazenar e recuperar grande volume de dados, o Big Data utiliza bancos SQL nativos, que são bancos de dados que podem estar configurados em quatro tipos diferentes de armazenamentos: valor chave, colunar, gráfico ou documento.
 
	 
	A ideia fundamental do YARN é dividir as funcionalidades de gerenciamento de recursos e monitoramento de tarefas em daemons separados. A ideia é ter um ResourceManager que controla os recursos entre todos os aplicativos do sistema e um ApplicationMaster por aplicativo para negociar recursos do ResourceManager.
	
	
	 9.
	Ref.: 5190792
	Pontos: 1,00  / 1,00
	
	Indique a afirmativa incorreta:
		
	
	O Cliente HDFS comunica-se diretamente aos DataNodes quando obtém a ordem e blocos a serem recuperados do NameNode.
	
	O NameNode armazena as localizações dos arquivos dos DataNodes e seus respectivos blocos;
	
	O HDFS pode viabilizar serviços de armazenamento em nuvem;
	 
	HDFS significa Hadoop Divided FileSystem;
	
	O HDFS foi baseado no modelo GFS;
	
	
	 10.
	Ref.: 5196360
	Pontos: 1,00  / 1,00
	
	 Qual o módulo do Spark que permite o processamento escalonável, de alto rendimento e tolerante a falhas de fluxos de dados em tempo real?
		
	
	Hive.
	
	Storm;
	
	Sqoop;
	
	Flume;
	 
	Streaming;

Continue navegando