Buscar

Frameworks para Big Data II

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1. 
Existem diferentes frameworks para o desenvolvimento de visualizações de grandes 
quantidades de dados, alguns são similares, e outros apresentam características 
bastante específicas. Qual das seguintes afirmativas apresenta características 
relacionadas a visualização de big data? 
 
Você acertou! 
C. 
O Hadoop serve como base para inúmeras aplicações de big data, que podem ser usadas 
em conjunto com o Zepelin e o Spark Notebook. 
 
2. 
O Apache Zeppelin é uma ferramenta computacional que vem desempenhando papel 
importante nos projetos de big data e em empresas que precisam conciliar dados de 
fontes diversas. 
Das alternativas a seguir, assinale aquela que caracteriza corretamente o Apache 
Zeppelin. 
 
Você acertou! 
D. 
Ferramenta gratuita, que opera na plataforma Web, apta para ser integrada com outras 
ferramentas e que fornece múltiplos interpretadores. 
 
3. 
O Apache Spark Notebook é uma ferramenta que possibilita a geração de 
um notebook por meio de programação. 
Nesse contexto, assinale a alternativa que define corretamente o termo notebook. 
Você acertou! 
A. 
Arquivo, documento ou página Web que contém células que podem ser executadas por meio 
de programação. 
 
 
 
4. 
O Zeppelin é capaz de se conectar a um recurso computacional de processamento de 
dados por meio de um interpretador. 
Em relação ao interpretador, assinale a alternativa que o caracteriza corretamente. 
 
Você acertou! 
C. 
O Apache disponibiliza vários interpretadores, todos gratuitos e distribuídos como um plug-
in. 
 
 
5. 
A imensa quantidade de dados coletados em um projeto de big data teria valor 
bastante relativo se não existissem ferramentas que fizessem o processamento 
destes dados e permitissem a extração de insights e análises. Considerando as 
características e as aplicações das ferramentas Zeppelin e Spark Notebook, analise 
as afirmações a seguir: 
I. Ambas as ferramentas suportam todas as fases de um projeto big data, com 
destaque para a fase de aquisição de dados. 
II. O Spark Notebook permite, assim como o Zeppelin, a criação de gráficos em vários 
formatos, bem como a criação de mapas. 
III. O conceito de notebook aplicado ao Spark difere do conceito de notebook aplicado 
ao Zeppelin. 
É verdadeiro o que se afirma em: 
 
Você acertou! 
B. 
II apenas. 
 
 
 
 
1. 
Os dados podem ser classificados em estruturados, semiestruturados e não 
estruturados de acordo com a sua estrutura. Com relação a essas classificações, 
assinale a alternativa correta. 
 
Você acertou! 
C. 
Dados estruturados são organizados em blocos semânticos e apresentam atributos fixos. 
 
2. 
Formulários, e-mails, áudios e vídeos são alguns exemplos de dados, os quais podem 
ser classificados quanto à sua estrutura. Sabendo dos diferentes tipos de dados 
existentes, selecione a alternativa que apresenta um dado semiestruturado. 
 
Você acertou! 
B. 
E-mail. 
 
3. 
Fotos, e-mails e tabelas apresentam diferentes características que determinam o tipo 
de armazenamento utilizado. A estrutura de uma tabela, por exemplo, é mais rígida, 
enquanto uma foto tem estrutura mais flexível. 
Sobre a flexibilidade da estrutura que distingue os diferentes tipos de dados 
estudados, os dados estruturados apresentam uma estrutura: 
Você acertou! 
A. 
pré-definida, regular e independente dos dados. 
 
 
 
 
4. 
Por conta do tamanho e da falta de padrão dos dados não estruturados, o seu 
armazenamento exige uma estrutura diferente do SQL, como o NoSQL. Em relação 
aos bancos com esta linguagem, é correto afirmar que: 
 
Você acertou! 
E. 
podem ser mais velozes que os bancos baseados em SQL. 
 
5. 
Algumas das soluções de armazenamento mais utilizadas para dados não 
estruturados são Hadoop, MongoDB, ElasticSearch e Redis. Em relação a elas, é 
correto afirmar que: 
 
Você acertou! 
E. 
o ElasticSearch só é capaz de armazenar elementos textuais. 
 
 
 
1. 
Big data é uma expressão relativamente nova. Com o avanço da Tecnologia da 
Informação e Comunicação (TIC), lidar com quantidades enormes de dados tem se 
tornado algo comum em empresas e instituições públicas. 
Sobre o conceito de big data, qual é a alternativa correta? 
 
Você acertou! 
B. 
Trata-se dA descoberta de informação baseada em dados da instituição ou da empresa. 
 
 
2. 
Existem diferentes tipos de dados: estruturados, não estruturados e 
semiestruturados. Sobre os tipos de dados, analise as afirmações a seguir: 
I. Dados tratados e prontos para uso 
II. Dados de arquivo de texto 
III. Arquivos de imagem, vídeo e áudio 
IV. Arquivo de tipo heterogêneo 
V. Dados de um formulário de cadastro 
Quais afirmativas contêm dados do tipo estruturado? 
 
Você acertou! 
E. 
I e V. 
 
3. 
O particionamento de dados é a forma de fragmentar ou particionar os dados em 
diferentes meios físicos. 
A forma de armazenamento de dados utilizando um formato comumente aceito em se 
tratanto de big data é o que se encontra em qual alternativa? 
Você acertou! 
A. 
Sistemas distribuídos. 
 
4. 
Mannino (2014) diz que há dois fatores que influenciam no processamento paralelo 
de dados: scaleup e speedup. Sobre esses conceitos, analise as afirmações a seguir: 
I. Envolve a quantidade de trabalhos que podem ser realizados 
II. Trata do aumento da capacidade computacional 
III. Tem a ver com tempo de resposta de uma transação com dados 
IV. Tem a ver com a escalabilidade 
Das afirmações acima, quais afirmativas estão corretas no que se refere ao scaleup? 
Você acertou! 
E. 
I, II e IV. 
5. 
O particionamento horizontal é amplamente utilizado por sistemas que suportam big 
data, como alguns bancos de dados NoSQL. Qual seria o método de particionamento 
mais adequado para uma aplicação que precisa de um desempenho excelente em 
consultas por intervalo a conjuntos de dados , que devem ser consultados a partir de 
uma ordem global? 
 
Você acertou! 
D. 
Range 
 
1. 
Os bancos de dados não relacionais abrangem inúmeras soluções de armazenamento 
que não utilizam apenas SQL, sendo representados principalmente por quatro tipos. 
Quanto a esses tipos, é correto afirmar que: 
 
Você acertou! 
C. 
o modelo de grafos é utilizado principalmente quando há a necessidade de identificar uma 
conectividade entre os dados. 
 
2. 
CouchDB é um sistema de banco de dados muito utilizado para aplicações on-line em 
diferentes dispositivos. 
Isso ocorre porque: 
 
Você acertou! 
D. 
a replicação é bidirecional e há um controle de alteração de arquivos para garantir que não 
haja conflito de versões. 
 
 
3. 
MongoDb é o banco de dados NoSQL mais utilizado do mundo. 
Sobre ele, é possível afirmar que: 
Você acertou! 
A. 
é um banco orientado a documentos. 
 
4. 
Para que um banco de dados seja mantido, é necessário que seja possível realizar 
quatro funções básicas. 
Quais são elas? 
 
Você acertou! 
B. 
Criar, consultar, atualizar e apagar. 
 
5. 
Sabe-se que são necessárias quatro funções básicas para o funcionamento de um 
sistema de armazenamento. Uma dessas funções é atualizar. 
Quanto a isso, qual é a alternativa correta? 
 
Você acertou! 
E. 
O valor do campo correspondente é modificado em um documento já existente.

Continue navegando