Buscar

A4 FRAMEWORKS PARA BIG DATA

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

 Pergunta 1 
1 em 1 pontos
	
	
	
	O HBase foi criado sob o conceito do BigTable , da Google, e também é um banco de dados não relacional que lida com bilhões de dados. Ele se divide em cluster, onde cada máquina dentro do cluster é chamado de nó. Existem dois tipos de nós no HBase. 
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. 
I. O nó máster requer alta disponibilidade, uma vez que é elemento central do processo.
Pois:
II.  Esse tipo de nó é responsável pela realização de armazenamento, leitura e escrita em tabelas.
 
A seguir, assinale a alternativa correta:
  
	
	
	
	
		Resposta Selecionada: 
	
A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa. 
	Resposta Correta: 
	
A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa. 
	Comentário da resposta: 
	Resposta correta. A alternativa está correta, pois 
a asserção I é uma proposição verdadeira, pois o nó Master é o único nó a ser executado. Requer alta disponibilidade, uma vez que é elemento central do processo. Esse nó é responsável pela gestão de operações de cluster. 
	
	
	
 Pergunta 2 
1 em 1 pontos
	
	
	
	Todo um projeto de Big Data é feito de etapas. Cada etapa precisa passar por fases que definem bem o problema. A visualização de dados é, geralmente, a última etapa de um processo. Mas vale lembrar que a visualização é uma etapa importante, assim como todas as etapas que compõem o Big Data.
 
Considerando o excerto apresentado, e das características de visualização de dados, analise as afirmativas a seguir:
I. Dentro do Hadoop, existem diferentes tecnologias para cada necessidade.
II. Dados em tempo real não extintos nesta ferramenta, para eliminar processamento indevido.
III. O banco HBase necessita de ferramentas visuais de interface para gerenciar serviços.
IV. A etapa de visualização exige o uso de novas soluções, que simplifiquem processos.
 
Assinale a alternativa que apresenta a(s) afirmativa(s) correta(s):
  
	
	
	
	
		Resposta Selecionada: 
	
I e IV apenas. 
	Resposta Correta: 
	
I e IV apenas. 
	Comentário da resposta: 
	Resposta correta. A afirmativa I está correta. A afirmativa I está correta, pois dentro do ecossistema Hadoop, como você já pôde perceber, existem diferentes tecnologias para cada necessidade. O pacote inteiro não foi lançado todo de uma só vez, mas foram surgindo necessidades nos trabalhos. A afirmativa IV está correta, pois quando falamos de visualização de dados, é exigido soluções que oferecem recursos com a finalidade de simplificar processos, bem como têm a presença de características que enriquecem a experiência com usuários ao visualizarem dos dados. 
	
	
	
 Pergunta 3 
1 em 1 pontos
	
	
	
	Dentro do contexto de Big Data, é comum que os dados surjam a partir de diferentes origens e que sejam de diferentes formatos. Claro, lidar com grandes conjuntos de dados dentro da estrutura de bancos de dados relacionais não é a melhor opção. 
Nesse sentido, surgiram diversos bancos de dados chamados de não relacionais. 
Considerando o exposto acima, assinale a alternativa que indica corretamente um exemplo de banco de dados não relacional.
  
	
	
	
	
		Resposta Selecionada: 
	
HBase 
	Resposta Correta: 
	
HBase 
	Comentário da resposta: 
	Resposta correta. A alternativa está correta, pois o HBase surge para atender a demanda de bancos de dados não relacionais orientado a coluna ou família de colunas dentro do ecossistema Hadoop. Diferente do Hive, que não é considerado um banco de dados, mas um repositório de dados, HBase é um banco de dados sim, mas fora do padrão tradicional relacional. 
	
	
	
 Pergunta 4 
1 em 1 pontos
	
	
	
	O HBase é um banco de dados que se divide em cluster, onde cada máquina dentro do cluster é chamado de nó. Existem 2 tipos de nodes , sendo o Master e o RegionServer. Existem grandes diferenças entre utilizar o HBase e um banco de dados relacional. 
 
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. 
I. O HBase requer hardware potente para que a manipulação dos dados sejam realizados de forma mais rápida. 
Pois:
II.  Um banco de dados relacional possui uma arquitetura mais rígida com a expansão possuindo maior limitação.
  
A seguir, assinale a alternativa correta:
  
	
	
	
	
		Resposta Selecionada: 
	
A asserção I é uma proposição falsa, e a II é uma proposição verdadeira. 
	Resposta Correta: 
	
A asserção I é uma proposição falsa, e a II é uma proposição verdadeira. 
	Comentário da resposta: 
	Resposta correta. A alternativa está correta, pois 
a asserção II é uma proposição verdadeira, pois o banco de dados relacional possui uma arquitetura mais rígida, com a expansão possuindo maior limitação, seja em recursos financeiros ou em tempo. 
	
	
	
 Pergunta 5 
1 em 1 pontos
	
	
	
	O Apache Hive é uma aplicação de código aberto, com sua licença pertence ao Apache. É uma aplicação de data warehouse construído para a leitura, escrita e gerenciamento de grande volumes de dados em ambientes com a característica de ser distribuído. 
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas.  
I. O Hive é um sistema de armazenamento pertencente ao ecossistema Hadoop.
Pois:
II. Possui a característica de facilitar a junção de dados para a análise.
 
A seguir, assinale a alternativa correta:
  
	
	
	
	
		Resposta Selecionada: 
	
As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. 
	Resposta Correta: 
	
As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. 
	Comentário da resposta: 
	Resposta correta. A alternativa está correta, pois 
a asserção I é uma proposição verdadeira, pois o Hive é um sistema de armazenamento ou depósito de dados, pertencente ao ecossistema Hadoop, da Apache Foundation. A asserção II também é verdadeira e justifica/complementa a I, pois ele busca facilitar a junção de dados para geração de análise de grandes conjuntos de dados, que chamamos comumente de Big Data. 
	
	
	
 Pergunta 6 
1 em 1 pontos
	
	
	
	Dado é algo importante para o Big Data, afinal, é através de grandes volumes de dados que o Big Data trabalha. Grandes volumes de dados começaram a surgir a partir do “boom” da internet e foi necessário surgir ferramentas que os manipulam de forma rápida. 
Neste sentido, assinale a alternativa que indique corretamente o nome da técnica destinada a análise de grandes volumes de dados:
	
	
	
	
		Resposta Selecionada: 
	
Big Data Analytics. 
	Resposta Correta: 
	
Big Data Analytics. 
	Comentário da resposta: 
	Resposta correta. A alternativa está correta, O termo Big Data Analytics representa as formas de analisar grandes volumes de dados. Tem estado em evidência a partir de 2012 devido ao aumento considerável na quantidade de dados geradas desde a década de 2010 em diante, com o aumento massivo de comunicadores instantâneos como Messenger e WhatsApp e as redes sociais. Ainda segundo Marquesone (2018), existem hoje quatro técnicas de analytics 
que são distintas entre si pelo tipo de resultado gerado. 
	
	
	
 Pergunta 7 
1 em 1 pontos
	
	
	
	O HBase é um modelo de banco de dados distribuído de código aberto e orientado a coluna. Ele é baseado no Google BigTable e tem fácil interação com o Hadoop, podendo utilizar o MapReduce para distribuir todo os processamento de dados.
 
A respeito de características do HBase, analise as afirmativas a seguir e assinale V 
para a(s) Verdadeira(s) e F para a(s) Falsa(s).  
I. ( ) O esquema HBase permite que novos dados e novas colunas sejam incluídas a qualquer momento.
II. ( ) O HBase possui característica de versionamento, onde os dados podem ser armazenados gerando séries.
III. ( ) Caso um dados não venha com um timestamp definido, o próprio banco irá definir.
IV. ( )  Por ser um banco de dados não relacional, o HBase não possui procedures e views.
 
Assinale a alternativa que apresenta a sequência correta:
  
	
	
	
	
		RespostaSelecionada: 
	
V, V, V, F. 
	Resposta Correta: 
	
V, V, V, F. 
	Comentário da resposta: 
	Resposta correta. A sequência está correta. A afirmativa I está correta, pois o esquema HBase permite que novos dados e novas colunas sejam incluídas a qualquer momento, o que o diferencia substancialmente aos bancos de dados relacionais, que são muito mais rígidos quanto a alteração da estrutura de uma tabela. A afirmativa II está correta, pois o HBase possui versionamento, onde os dados podem ser armazenados gerando séries histórias na própria base. A afirmativa III está correta, pois o HBase se utiliza de TimeStamp, e caso um dado não venha com timestamp 
definido, o próprio banco define. 
	
	
	
 Pergunta 8 
1 em 1 pontos
	
	
	
	O Hive trabalha tanto com dado estruturados como não estruturados. Assim, é possível utilizar recursos como DDL (Linguagem de Definição de Dados) e DML (Linguagem de Manipulação de dados) da linguagem SQL, por meio através de scripts criar estruturas de tabelas ou manipular dados. 
Nesse sentido, analise o trecho abaixo.
  
	CREATE EXTERNAL TABLE logs (  s1 string, s2 string, s3 string, s4 string, s5 string, s6 string, s7 string) ROW FORMAT DELIMITED FIELDS TERMINATED BY '  ' STORED AS TEXTFILE LOCATION '/example/data/'; 
 elaborada pelo autor
 
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. 
I. O trecho possui código em hiveQL e irá criar uma tabela com nome logs.
Pois:
II.  O código possui delimitador de espaço vazio, o que indica que não possui um local de armazenamento.
 
A seguir, assinale a alternativa correta:
  
	
	
	
	
		Resposta Selecionada: 
	
A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa. 
	Resposta Correta: 
	
A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa. 
	Comentário da resposta: 
	Resposta correta. A alternativa está correta, pois somente a asserção I é uma proposição verdadeira, pois apresenta um exemplo de instrução HiveQL na criação de uma tabela com dados separados por espaços em branco, sendo utilizado o comando CREATE EXTERNAL TABLE para criar uma tabela chamada “logs”. 
	
	
	
 Pergunta 9 
0 em 1 pontos
	
	
	
	O HBase é um banco de dados não relacional lançado em 2008 e possui sua licença pertencente ao Apache 2.0. É um banco de dados open source que foi projetado para grandes volumes de dados, como todo o contexto do framework Hadoop.
 
Considerando o excerto apresentado, a da característica do banco de dados não relacional HBase, analise as afirmativas a seguir:
I. Tem o objetivo de lidar com o armazenamento de milhões de tabelas e colunas e é tolerante a falhas.
II. O banco de dados HBase possui uma arquitetura mais rígida, com a expansão possuindo maior limitação.
III. Seu conceito é fundamentado no Big Google, que é focado na análise de grandes dados off-line .
IV. O HBase se divide em cluster e possui dois tipos de nós, sendo o Master e o RegionServer.
 
Assinale a alternativa que apresenta a(s) afirmativa(s) correta(s):
  
	
	
	
	
		Resposta Selecionada: 
	
I, II e IV apenas. 
	Resposta Correta: 
	
I e IV apenas. 
	Comentário da resposta: 
	Sua resposta está incorreta. A alternativa está incorreta. A afirmativa II está incorreta, pois o banco de dados relacional que possui uma arquitetura mais rígida, com a expansão possuindo maior limitação, já o HBase requer hardware menos potente e poder expandido com mais recursos de hardware sem a necessidade de lidar com grandes equipamentos de ponta. A afirmativa III está incorreta, pois o HBase foi criado sob o conceito do BigTable, da Google, que é um banco de dados NoSQL focada em serviços online de análise de dados em grande escala. 
	
	
	
 Pergunta 10 
1 em 1 pontos
	
	
	
	O termo Big Data Analytics está relacionado às formas de se analisar grande volumes de dados. A partir do grande aumento de dados nos últimos anos, o seu conceito vem sendo muito utilizado a partir do ano de 2012. Hoje, há quatro técnicas analytics.
 
Considerando o exposto acima, relacione a coluna de tipos de técnicas analytics com suas respectivas características.
 
I) Análise Descritiva
II) Análise Preditiva
III) Análise Prescritiva
IV) Análise Diagnóstica
 
(   ) busca responder perguntas de porque algo aconteceu.
(   ) diferente das demais, busca projeções futuras.
(   ) se baseia nas predições evitar problemas antes de acontecerem.
(   ) é uma análise do estado atual de uma instituição ou empresa.
 
A seguir, assinale a alternativa com a sequência correta.
 
  
	
	
	
	
		Resposta Selecionada: 
	
IV, II, III, I. 
	Resposta Correta: 
	
IV, II, III, I. 
	Comentário da resposta: 
	Resposta correta. A alternativa está correta, pois A análise Descritiva (1) analisa o estado atual de uma instituição. Perguntas a responder: Qual produto mais vendido? A Análise Preditiva (2) diferente das demais, busca por projeções futuras. Perguntas a responder: Qual a probabilidade de um cliente voltar a comprar com desconto de X%? A Análise Prescritiva (3) é a análise que se baseia nas predições para indicar sugestões para que problemas sejam evitados. A Análise Diagnóstica (4) busca responder a pergunta de “porque isso aconteceu”. Perguntas: Motivo do aumento de vendas no trimestre X?

Continue navegando