Buscar

BIG DATA - AV1

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Disciplina: CCT0854 - BIG DATA 
 
 
 
 
 
 
 1a Questão (Ref.: 202006277850) 
(FCC 2017 , DPE-RS - Analista Banco de Dados) Os sistemas de Big Data 
costumam ser caracterizados pelos chamados 3 Vs, sendo que o V de: 
 
 
Veracidade corresponde à rapidez na geração e obtenção de dados. 
 
Volume corresponde à rapidez na geração e obtenção de dados. 
 
Velocidade corresponde à confiança na geração e obtenção dos dados. 
 
Valor corresponde à grande quantidade de dados acumulada. 
 
Variedade corresponde ao grande número de tipos ou formas de dados. 
 
 
 
 2a Questão (Ref.: 202006283677) 
(Instituto AOCP - 2018 - PRODEB - Especialista de TIC - B.I) A ciência dos 
dados é um campo emergente. A demanda é elevada, e encontrar pessoal 
qualificado é um dos principais desafios associados à análise de Big Data. Sobre 
conhecimento técnico em administração de dados, é correto afirmar que o cientista 
de dados agrega ao trabalho, EXCETO: 
 
 
 
Habilidade para integrar e preparar grandes e variados conjuntos de dados. 
 
Habilidade avançada de análise e modelagem para revelar e compreender 
relacionamentos obscuros. 
 
Habilidades de comunicação para apresentar resultados. 
 
Conhecimento empresarial para aplicar um contexto. 
 
Conhecimento e habilidades para recrutamento e seleção de pessoas por 
competências. 
 
 
 
 3a Questão (Ref.: 202006295857) 
(CCV-UFC - 2019 - UFC - Técnico de Tecnologia da Informação - 
Desenvolvimento de Sistemas) Sobre os banco de dados NoSQL, assinale a 
afirmativa correta. 
 
 
São exemplos de bancos de dados NoSQL: MongoDB, Firebird, DynamoDB, 
SQLite, Microsoft Access e Azure Table Storage. 
javascript:alert('Código%20da%20questão:%205175431/n/nStatus%20da%20questão:%20Liberada%20para%20Uso.');
javascript:alert('Código%20da%20questão:%205181258/n/nStatus%20da%20questão:%20Liberada%20para%20Uso.');
javascript:alert('Código%20da%20questão:%205193438/n/nStatus%20da%20questão:%20Liberada%20para%20Uso.');
 
Nos bancos de dados NoSQL devem ser definidos um esquema de dados fixo 
antes de qualquer operação. 
 
Bancos de dados NoSQL não podem ser indexados. 
 
Os bancos de dados NoSQL usam diversos modelos para acessar e gerenciar 
dados, como documento, grafo, chave-valor, em memória e, pesquisa. 
 
Bancos de dados NoSQL são considerados banco de dados relacionais. 
 
 
 
 4a Questão (Ref.: 202006298756) 
As evoluções da era digital levaram a geração de muitas informações digitais. As 
empresas para se manterem no mercado precisam ter capacidade de observar e 
absorver rapidamente tais informações para identificar mudanças no mercado e 
novas oportunidades. Um dos recursos que pode ser utilizado para viabilizar essa 
rapidez de resposta é: 
 
 
Processamento centralizado 
 
Processamento distribuído 
 
Processamento em tempo real 
 
Processamento em lote 
 
Processamento paralelo 
 
 
 
 
 5a Questão (Ref.: 202006298760) 
Nome da biblioteca java de aprendizado de máquina recomendada para ser 
utilizada com o Apache Spark. 
 
 
Apache storm 
 
Apache accumulo 
 
Apache CouchDB 
 
Apache mahout 
 
Apache Commons Modeler 
 
 
 
 
 
 
 
 
 
 
javascript:alert('Código%20da%20questão:%205196337/n/nStatus%20da%20questão:%20Liberada%20para%20Uso.');
javascript:alert('Código%20da%20questão:%205196341/n/nStatus%20da%20questão:%20Liberada%20para%20Uso.');
6a Questão (Ref.: 202006298764) 
Um projeto de Big Data que tem como foco o aumento da percepção deve conter 
uma visualização de dados capaz de alavancar esse objetivo. A melhor forma de 
visualizar dados é através de: 
 
 
Relato textual 
 
Apresentação oral 
 
Gráfico 
 
Formato tabular 
 
Planilha eletrônica 
 
 
 
 7a Questão (Ref.: 202006295870) 
A comunicação entre os elementos no MapReduce ocorre: 
 
 
Por sistema de mensageria, como JMS (Java Message Service) 
 
Por RMI (Remote Method Invocation) 
 
No sistema de arquivos compartilhados entre os nós 
 
Pelo protocolo HTTP 
 
Pelo Banco de Dados 
 
 
 
 8a Questão (Ref.: 202006298772) 
Com referência a Big Data, assinale a opção correta. 
 
 
A definição mais ampla de Big Data restringe o termo a duas partes ¿ o volume 
absoluto e a velocidade ¿, o que facilita a extração das informações e dos 
insights de negócios. 
 
Para armazenar e recuperar grande volume de dados, o Big Data utiliza bancos 
SQL nativos, que são bancos de dados que podem estar configurados em quatro 
tipos diferentes de armazenamentos: valor chave, colunar, gráfico ou 
documento. 
 
 
Em Big Data, o sistema de arquivos HDFS é usado para armazenar arquivos 
muito grandes de forma distribuída, tendo como princípio o write-many, read-
once. 
 
O sistema de arquivos distribuído Hadoop implementa o algoritmo Dijkstra 
modificado para busca irrestrita de dados em árvores aglomeradas em clusters 
com criptografia. 
 
A ideia fundamental do YARN é dividir as funcionalidades de gerenciamento de 
recursos e monitoramento de tarefas em daemons separados. A ideia é ter um 
ResourceManager que controla os recursos entre todos os aplicativos do sistema 
javascript:alert('Código%20da%20questão:%205196345/n/nStatus%20da%20questão:%20Liberada%20para%20Uso.');
javascript:alert('Código%20da%20questão:%205193451/n/nStatus%20da%20questão:%20Liberada%20para%20Uso.');
javascript:alert('Código%20da%20questão:%205196353/n/nStatus%20da%20questão:%20Liberada%20para%20Uso.');
e um ApplicationMaster por aplicativo para negociar recursos do 
ResourceManager. 
 
 
 
 9a Questão (Ref.: 202006293211) 
Indique a afirmativa incorreta: 
 
 
O NameNode armazena as localizações dos arquivos dos DataNodes e seus 
respectivos blocos; 
 
HDFS significa Hadoop Divided FileSystem; 
 
O Cliente HDFS comunica-se diretamente aos DataNodes quando obtém a 
ordem e blocos a serem recuperados do NameNode. 
 
O HDFS foi baseado no modelo GFS; 
 
O HDFS pode viabilizar serviços de armazenamento em nuvem; 
 
 
 
 10a Questão (Ref.: 202006298779) 
 Qual o módulo do Spark que permite o processamento escalonável, de alto 
rendimento e tolerante a falhas de fluxos de dados em tempo real? 
 
 
Flume; 
 
Storm; 
 
Streaming; 
 
Sqoop; 
 
Hive. 
 
 
javascript:alert('Código%20da%20questão:%205190792/n/nStatus%20da%20questão:%20Liberada%20para%20Uso.');
javascript:alert('Código%20da%20questão:%205196360/n/nStatus%20da%20questão:%20Liberada%20para%20Uso.');

Continue navegando