Buscar

Atividade 4 - Frameworks para Big Data - UAM

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

· Pergunta 1
1 em 1 pontos
	
	
	
	O termo Big Data Analytics está relacionado às formas de se analisar grande volumes de dados. A partir do grande aumento de dados nos últimos anos, o seu conceito vem sendo muito utilizado a partir do ano de 2012. Hoje, há quatro técnicas analytics.
 
Considerando o exposto acima, relacione a coluna de tipos de técnicas analytics com suas respectivas características.
 
I) Análise Descritiva
II) Análise Preditiva
III) Análise Prescritiva
IV) Análise Diagnóstica
 
(   ) busca responder perguntas de porque algo aconteceu.
(   ) diferente das demais, busca projeções futuras.
(   ) se baseia nas predições evitar problemas antes de acontecerem.
(   ) é uma análise do estado atual de uma instituição ou empresa.
 
A seguir, assinale a alternativa com a sequência correta.
 
 
	
	
	
	
		Resposta Selecionada:
	 
IV, II, III, I.
	Resposta Correta:
	 
IV, II, III, I.
	Feedback da resposta:
	Resposta correta. A alternativa está correta, pois A análise Descritiva (1) analisa o estado atual de uma instituição. Perguntas a responder: Qual produto mais vendido? A Análise Preditiva (2) diferente das demais, busca por projeções futuras. Perguntas a responder: Qual a probabilidade de um cliente voltar a comprar com desconto de X%? A Análise Prescritiva (3) é a análise que se baseia nas predições para indicar sugestões para que problemas sejam evitados. A Análise Diagnóstica (4) busca responder a pergunta de “porque isso aconteceu”. Perguntas: Motivo do aumento de vendas no trimestre X?
	
	
	
· Pergunta 2
0 em 1 pontos
	
	
	
	A visualização de dados é, geralmente, a última etapa do processo e exige o uso de novas soluções, oferecendo recursos que simplificam o processo de visualização. Podemos dizer que lidar com dados requer cuidado, visualizar dados pode ser uma grande arte.
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas.
I. No HBase é possível interagir via shell script, prompt de comando ou interface gráfica.
 Pois:
II.  Há uma ferramenta chamada HB TOP que realiza o monitoramento em tempo real.
 
A seguir, assinale a alternativa correta:
 
	
	
	
	
		Resposta Selecionada:
	 
A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
	Resposta Correta:
	 
As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I.
	Feedback da resposta:
	Sua resposta está incorreta. A alternativa está incorreta, pois as duas asserções são proposições verdadeiras, no entanto, uma não justifica a outra. No HBase  é possível interagir via shell script, prompt de comando ou interface gráfica. Há uma ferramenta chamada HB TOPHBTOP que realiza o monitoramento em tempo real.
	
	
	
· Pergunta 3
1 em 1 pontos
	
	
	
	O termos Big Data Analytics refere-se a analisar grandes quantidades de dados que são produzidos diariamente a fim de obter informações para um determinado negócio. Além disso, é muito utilizado na tomada de decisões e para testar processos existentes. O conceito ainda apresenta técnicas analytics.
 
A respeito das técnicas analytics, analise as afirmativas a seguir e assinale V
para a(s) Verdadeira(s) e F para a(s) Falsa(s). 
I. ( ) A análise descritiva se baseia nas predições para prescrever sugestões para que problemas sejam evitados antes mesmo de acontecerem.
II. ( ) A análise prescritiva é uma análise do estado atual de uma instituição ou empresa, respondendo perguntas como: Que produto tem maior saída?.
III. ( ) A análise diagnóstica busca responder perguntas para entender por qual motivo algo aconteceu, como: porque tal serviço teve queda.
IV. ( ) A análise preditiva busca realizar projeções futuras a respeito de algo, respondendo perguntas como a estima de clientes para o próximo ano.
 
Assinale a alternativa que apresenta a sequência correta:
 
	
	
	
	
		Resposta Selecionada:
	 
F, F, V, V.
	Resposta Correta:
	 
F, F, V, V.
	Feedback da resposta:
	Resposta correta.  A sequência está correta. A afirmativa III é verdadeira, pois a análise diagnóstica possui característica de analisar algo e responde a pergunta porque algo aconteceu, como por exemplo, um aumento ou queda de vendas. A afirmativa IV é verdadeira, pois a análise preditiva busca por projeções futuras, baseando-se em realizar perguntas do tipo: probabilidade de um cliente voltar a comprar, ou estimativa de novos clientes para o próximo ano.
	
	
	
· Pergunta 4
1 em 1 pontos
	
	
	
	O Apache Hive é um software de código aberto destinado ao conceito de data warehouse que foi desenvolvido a partir do Apache Hadoop. Ele oferece uma interface muito parecida com o SQL em diferentes bancos de dados, auxilia na leitura, escrita e gerenciamento de grandes volumes, e também, em sistemas de arquivos integrados ao Hadoop.
 
A respeito de características do apache hive, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s).
(  ) O hive é um sistema de armazenamento que facilita a junção de dados para análise.
( ) Por trabalhar com grandes dados, o hive ocasiona muitas falhas, mesmo sendo distribuído.
( ) O hive consegue se conectar a ferramentas de análise de dados, devido a sua conexão via bibliotecas.
( )  O hive possui somente uma linguagem query para consultas em SQL.
 
Assinale a alternativa que apresenta a sequência correta:
 
	
	
	
	
		Resposta Selecionada:
	 
V, F, V, F.
	Resposta Correta:
	 
V, F, V, F.
	Feedback da resposta:
	Resposta correta.  A sequência está correta. A afirmativa I está correta, pois o Hive é um sistema de armazenamento ou depósito de dados, pertencente ao ecossistema Hadoop, que busca facilitar a junção de dados para geração de análises de grandes conjuntos de dados, que chamamos comumente de Big Data. A afirmativa III está correta, pois o hive possibilita a conexão de dados via bibliotecas como JDBC e ODBC, consegue se conectar a ferramentas de análise de dados amplamente utilizadas no mercado como o Tableau, o Power BI (da Microsoft), entre outras.
	
	
	
· Pergunta 5
1 em 1 pontos
	
	
	
	Dentro do contexto de Big Data, é comum que os dados surjam a partir de diferentes origens e que sejam de diferentes formatos. Claro, lidar com grandes conjuntos de dados dentro da estrutura de bancos de dados relacionais não é a melhor opção.
Nesse sentido, surgiram diversos bancos de dados chamados de não relacionais.
Considerando o exposto acima, assinale a alternativa que indica corretamente um exemplo de banco de dados não relacional.
 
	
	
	
	
		Resposta Selecionada:
	 
HBase
	Resposta Correta:
	 
HBase
	Feedback da resposta:
	Resposta correta. A alternativa está correta, pois o HBase surge para atender a demanda de bancos de dados não relacionais orientado a coluna ou família de colunas dentro do ecossistema Hadoop. Diferente do Hive, que não é considerado um banco de dados, mas um repositório de dados, HBase é um banco de dados sim, mas fora do padrão tradicional relacional.
	
	
	
· Pergunta 6
0 em 1 pontos
	
	
	
	A quantidade de dados estão aumento exponencialmente, sendo cada vez mais coletados e analisados ​​pelo setor para BI, o que também torna as soluções de armazenamento tradicionais caras demais. Nesse aspecto, o Hive se apresenta como uma solução de data warehousing
com suporte a consultas de maneira mais expressa.
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas.
I. O hiveQL inclui um sistema com suporte para tabelas contendo tipos primitivos.
Pois:
II.  Possui ainda, um catálogo do sistema que contém esquemas estatísticos úteis na exploração de dados.
 
A seguir, assinale a alternativa correta:
 
	
	
	
	
		Resposta Selecionada:
	 
A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
	Resposta Correta:
	 
As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
	Feedback da resposta:
	Sua resposta está incorreta. A alternativa está incorreta, pois as duas proposições apresentadas são verdadeiras e a asserção II justificaa I, O hiveQL inclui um sistema com suporte para tabelas contendo tipos primitivos e possui um catálogo do sistema que contém esquemas estatísticos úteis na exploração de dados.
	
	
	
· Pergunta 7
0 em 1 pontos
	
	
	
	O HBase foi criado sob o conceito do BigTable , da Google, e também é um banco de dados não relacional que lida com bilhões de dados. Ele se divide em cluster, onde cada máquina dentro do cluster é chamado de nó. Existem dois tipos de nós no HBase.
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas.
I. O nó máster requer alta disponibilidade, uma vez que é elemento central do processo.
Pois:
II.  Esse tipo de nó é responsável pela realização de armazenamento, leitura e escrita em tabelas.
 
A seguir, assinale a alternativa correta:
 
	
	
	
	
		Resposta Selecionada:
	 
As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
	Resposta Correta:
	 
A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
	Feedback da resposta:
	Sua resposta está incorreta. A alternativa está incorreta, pois somente a asserção I é verdadeira. A asserção II é uma proposição falsa, sendo que, a característica exposta refere-se ao nó RegionServer, que é responsável pela realização de armazenamento, leitura e escrita em tabelas. Um cliente faz comunicação com um nó Region ServerRegionServer
para fazer leitura e escrita na base.
	
	
	
· Pergunta 8
0 em 1 pontos
	
	
	
	Trabalhar com Big Data significa trabalhar com um grande volume de dados. E claro, analisar esses dados requer muita atenção e um processamento específico necessitando rapidez. Porém, não adianta ter os dados certos, mas com a informação errada.
 
Considerando o excerto apresentado, sobre a análise de Big Data, analise as afirmativas a seguir:
 
I. O termo Big Data Analytics representa as formas de analisar grandes volumes de dados; a técnica analytics possui quatro técnicas.
II. Utilizar métodos estatísticos e algoritmos de aprendizagem de máquina necessitam que modelos sejam adaptados para processamento paralelo.
III. A análise descritiva busca responder a pergunta de porque algo aconteceu, e vem depois da análise diagnóstica.
IV. Ter parte dos dados ou realizar um cálculo errado pode dar um retorno incorreto de uma informação.
 
Assinale a alternativa que apresenta a(s) afirmativa(s) correta(s):
 
	
	
	
	
		Resposta Selecionada:
	 
I, II e IV apenas.
 
	Resposta Correta:
	 
I e II apenas.
	Feedback da resposta:
	Sua resposta está incorreta. A alternativa está incorreta, A afirmativa III está incorreta, pois a análise descritiva, na verdade, é uma análise do estado atual de uma instituição ou empresa. Como exemplo, uma base de dados de clientes que respondam a perguntas como: Qual produto mais vendido? Quanto foi vendido nos últimos meses? Esses resultados são apresentados geralmente em forma de gráficos e dashboards.
	
	
	
· Pergunta 9
1 em 1 pontos
	
	
	
	O HBase é um banco de dados não relacional lançado em 2008 e possui sua licença pertencente ao Apache 2.0. É um banco de dados open source que foi projetado para grandes volumes de dados, como todo o contexto do framework Hadoop.
 
Considerando o excerto apresentado, a da característica do banco de dados não relacional HBase, analise as afirmativas a seguir:
I. Tem o objetivo de lidar com o armazenamento de milhões de tabelas e colunas e é tolerante a falhas.
II. O banco de dados HBase possui uma arquitetura mais rígida, com a expansão possuindo maior limitação.
III. Seu conceito é fundamentado no Big Google, que é focado na análise de grandes dados off-line .
IV. O HBase se divide em cluster e possui dois tipos de nós, sendo o Master e o RegionServer.
 
Assinale a alternativa que apresenta a(s) afirmativa(s) correta(s):
 
	
	
	
	
		Resposta Selecionada:
	 
I e IV apenas.
	Resposta Correta:
	 
I e IV apenas.
	Feedback da resposta:
	Resposta correta. A afirmativa I está correta. A afirmativa I está correta, pois o HBase tem o objetivo lidar com armazenamento de milhões de tabelas e colunas, tendo característica como tolerância a falhas, se aproveitando deste controle vindo do Hadoop HDFS. A afirmativa IV está correta, pois o HBase se divide em cluster, onde cada máquina dentro do cluster é chamado de nó. Existem 2 tipos de nodes, sendo o Master e o RegionServer.
	
	
	
· Pergunta 10
1 em 1 pontos
	
	
	
	O HBase é um modelo de banco de dados distribuído de código aberto e orientado a coluna. Ele é baseado no Google BigTable e tem fácil interação com o Hadoop, podendo utilizar o MapReduce para distribuir todo os processamento de dados.
 
A respeito de características do HBase, analise as afirmativas a seguir e assinale V
para a(s) Verdadeira(s) e F para a(s) Falsa(s). 
I. ( ) O esquema HBase permite que novos dados e novas colunas sejam incluídas a qualquer momento.
II. ( ) O HBase possui característica de versionamento, onde os dados podem ser armazenados gerando séries.
III. ( ) Caso um dados não venha com um timestamp definido, o próprio banco irá definir.
IV. ( )  Por ser um banco de dados não relacional, o HBase não possui procedures e views.
 
Assinale a alternativa que apresenta a sequência correta:
 
	
	
	
	
		Resposta Selecionada:
	 
V, V, V, F.
	Resposta Correta:
	 
V, V, V, F.
	Feedback da resposta:
	Resposta correta. A sequência está correta. A afirmativa I está correta, pois o esquema HBase permite que novos dados e novas colunas sejam incluídas a qualquer momento, o que o diferencia substancialmente aos bancos de dados relacionais, que são muito mais rígidos quanto a alteração da estrutura de uma tabela. A afirmativa II está correta, pois o HBase possui versionamento, onde os dados podem ser armazenados gerando séries histórias na própria base. A afirmativa III está correta, pois o HBase se utiliza de TimeStamp, e caso um dado não venha com timestamp
definido, o próprio banco define.

Outros materiais