A4 FRAMEWORKS PARA BIG DATA

•

UAM

1

0

1

0

Tiago Custódio

02/10/2021

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Big Data

5.896 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

 Pergunta 1
1 em 1 pontos

O HBase foi criado sob o conceito do BigTable , da Google, e também é um banco de dados não relacional que lida com bilhões de dados. Ele se divide em cluster, onde cada máquina dentro do cluster é chamado de nó. Existem dois tipos de nós no HBase.
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas.
I. O nó máster requer alta disponibilidade, uma vez que é elemento central do processo.
Pois:
II. Esse tipo de nó é responsável pela realização de armazenamento, leitura e escrita em tabelas.
A seguir, assinale a alternativa correta:

Resposta Selecionada:

A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
Resposta Correta:

A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
Comentário da resposta:
Resposta correta. A alternativa está correta, pois
a asserção I é uma proposição verdadeira, pois o nó Master é o único nó a ser executado. Requer alta disponibilidade, uma vez que é elemento central do processo. Esse nó é responsável pela gestão de operações de cluster.

 Pergunta 2
1 em 1 pontos

Todo um projeto de Big Data é feito de etapas. Cada etapa precisa passar por fases que definem bem o problema. A visualização de dados é, geralmente, a última etapa de um processo. Mas vale lembrar que a visualização é uma etapa importante, assim como todas as etapas que compõem o Big Data.
Considerando o excerto apresentado, e das características de visualização de dados, analise as afirmativas a seguir:
I. Dentro do Hadoop, existem diferentes tecnologias para cada necessidade.
II. Dados em tempo real não extintos nesta ferramenta, para eliminar processamento indevido.
III. O banco HBase necessita de ferramentas visuais de interface para gerenciar serviços.
IV. A etapa de visualização exige o uso de novas soluções, que simplifiquem processos.
Assinale a alternativa que apresenta a(s) afirmativa(s) correta(s):

Resposta Selecionada:

I e IV apenas.
Resposta Correta:

I e IV apenas.
Comentário da resposta:
Resposta correta. A afirmativa I está correta. A afirmativa I está correta, pois dentro do ecossistema Hadoop, como você já pôde perceber, existem diferentes tecnologias para cada necessidade. O pacote inteiro não foi lançado todo de uma só vez, mas foram surgindo necessidades nos trabalhos. A afirmativa IV está correta, pois quando falamos de visualização de dados, é exigido soluções que oferecem recursos com a finalidade de simplificar processos, bem como têm a presença de características que enriquecem a experiência com usuários ao visualizarem dos dados.

 Pergunta 3
1 em 1 pontos

Dentro do contexto de Big Data, é comum que os dados surjam a partir de diferentes origens e que sejam de diferentes formatos. Claro, lidar com grandes conjuntos de dados dentro da estrutura de bancos de dados relacionais não é a melhor opção.
Nesse sentido, surgiram diversos bancos de dados chamados de não relacionais.
Considerando o exposto acima, assinale a alternativa que indica corretamente um exemplo de banco de dados não relacional.

Resposta Selecionada:

HBase
Resposta Correta:

HBase
Comentário da resposta:
Resposta correta. A alternativa está correta, pois o HBase surge para atender a demanda de bancos de dados não relacionais orientado a coluna ou família de colunas dentro do ecossistema Hadoop. Diferente do Hive, que não é considerado um banco de dados, mas um repositório de dados, HBase é um banco de dados sim, mas fora do padrão tradicional relacional.

 Pergunta 4
1 em 1 pontos

O HBase é um banco de dados que se divide em cluster, onde cada máquina dentro do cluster é chamado de nó. Existem 2 tipos de nodes , sendo o Master e o RegionServer. Existem grandes diferenças entre utilizar o HBase e um banco de dados relacional.
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas.
I. O HBase requer hardware potente para que a manipulação dos dados sejam realizados de forma mais rápida.
Pois:
II. Um banco de dados relacional possui uma arquitetura mais rígida com a expansão possuindo maior limitação.
A seguir, assinale a alternativa correta:

Resposta Selecionada:

A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
Resposta Correta:

A asserção I é uma proposição falsa, e a II é uma proposição verdadeira.
Comentário da resposta:
Resposta correta. A alternativa está correta, pois
a asserção II é uma proposição verdadeira, pois o banco de dados relacional possui uma arquitetura mais rígida, com a expansão possuindo maior limitação, seja em recursos financeiros ou em tempo.

 Pergunta 5
1 em 1 pontos

O Apache Hive é uma aplicação de código aberto, com sua licença pertence ao Apache. É uma aplicação de data warehouse construído para a leitura, escrita e gerenciamento de grande volumes de dados em ambientes com a característica de ser distribuído.
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas.
I. O Hive é um sistema de armazenamento pertencente ao ecossistema Hadoop.
Pois:
II. Possui a característica de facilitar a junção de dados para a análise.
A seguir, assinale a alternativa correta:

Resposta Selecionada:

As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
Resposta Correta:

As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I.
Comentário da resposta:
Resposta correta. A alternativa está correta, pois
a asserção I é uma proposição verdadeira, pois o Hive é um sistema de armazenamento ou depósito de dados, pertencente ao ecossistema Hadoop, da Apache Foundation. A asserção II também é verdadeira e justifica/complementa a I, pois ele busca facilitar a junção de dados para geração de análise de grandes conjuntos de dados, que chamamos comumente de Big Data.

 Pergunta 6
1 em 1 pontos

Dado é algo importante para o Big Data, afinal, é através de grandes volumes de dados que o Big Data trabalha. Grandes volumes de dados começaram a surgir a partir do “boom” da internet e foi necessário surgir ferramentas que os manipulam de forma rápida.
Neste sentido, assinale a alternativa que indique corretamente o nome da técnica destinada a análise de grandes volumes de dados:

Resposta Selecionada:

Big Data Analytics.
Resposta Correta:

Big Data Analytics.
Comentário da resposta:
Resposta correta. A alternativa está correta, O termo Big Data Analytics representa as formas de analisar grandes volumes de dados. Tem estado em evidência a partir de 2012 devido ao aumento considerável na quantidade de dados geradas desde a década de 2010 em diante, com o aumento massivo de comunicadores instantâneos como Messenger e WhatsApp e as redes sociais. Ainda segundo Marquesone (2018), existem hoje quatro técnicas de analytics
que são distintas entre si pelo tipo de resultado gerado.

 Pergunta 7
1 em 1 pontos

O HBase é um modelo de banco de dados distribuído de código aberto e orientado a coluna. Ele é baseado no Google BigTable e tem fácil interação com o Hadoop, podendo utilizar o MapReduce para distribuir todo os processamento de dados.
A respeito de características do HBase, analise as afirmativas a seguir e assinale V
para a(s) Verdadeira(s) e F para a(s) Falsa(s).
I. ( ) O esquema HBase permite que novos dados e novas colunas sejam incluídas a qualquer momento.
II. ( ) O HBase possui característica de versionamento, onde os dados podem ser armazenados gerando séries.
III. ( ) Caso um dados não venha com um timestamp definido, o próprio banco irá definir.
IV. ( ) Por ser um banco de dados não relacional, o HBase não possui procedures e views.
Assinale a alternativa que apresenta a sequência correta:

RespostaSelecionada:

V, V, V, F.
Resposta Correta:

V, V, V, F.
Comentário da resposta:
Resposta correta. A sequência está correta. A afirmativa I está correta, pois o esquema HBase permite que novos dados e novas colunas sejam incluídas a qualquer momento, o que o diferencia substancialmente aos bancos de dados relacionais, que são muito mais rígidos quanto a alteração da estrutura de uma tabela. A afirmativa II está correta, pois o HBase possui versionamento, onde os dados podem ser armazenados gerando séries histórias na própria base. A afirmativa III está correta, pois o HBase se utiliza de TimeStamp, e caso um dado não venha com timestamp
definido, o próprio banco define.

 Pergunta 8
1 em 1 pontos

O Hive trabalha tanto com dado estruturados como não estruturados. Assim, é possível utilizar recursos como DDL (Linguagem de Definição de Dados) e DML (Linguagem de Manipulação de dados) da linguagem SQL, por meio através de scripts criar estruturas de tabelas ou manipular dados.
Nesse sentido, analise o trecho abaixo.
CREATE EXTERNAL TABLE logs ( s1 string, s2 string, s3 string, s4 string, s5 string, s6 string, s7 string) ROW FORMAT DELIMITED FIELDS TERMINATED BY ' ' STORED AS TEXTFILE LOCATION '/example/data/';
elaborada pelo autor
A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas.
I. O trecho possui código em hiveQL e irá criar uma tabela com nome logs.
Pois:
II. O código possui delimitador de espaço vazio, o que indica que não possui um local de armazenamento.
A seguir, assinale a alternativa correta:

Resposta Selecionada:

A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
Resposta Correta:

A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa.
Comentário da resposta:
Resposta correta. A alternativa está correta, pois somente a asserção I é uma proposição verdadeira, pois apresenta um exemplo de instrução HiveQL na criação de uma tabela com dados separados por espaços em branco, sendo utilizado o comando CREATE EXTERNAL TABLE para criar uma tabela chamada “logs”.

 Pergunta 9
0 em 1 pontos

O HBase é um banco de dados não relacional lançado em 2008 e possui sua licença pertencente ao Apache 2.0. É um banco de dados open source que foi projetado para grandes volumes de dados, como todo o contexto do framework Hadoop.
Considerando o excerto apresentado, a da característica do banco de dados não relacional HBase, analise as afirmativas a seguir:
I. Tem o objetivo de lidar com o armazenamento de milhões de tabelas e colunas e é tolerante a falhas.
II. O banco de dados HBase possui uma arquitetura mais rígida, com a expansão possuindo maior limitação.
III. Seu conceito é fundamentado no Big Google, que é focado na análise de grandes dados off-line .
IV. O HBase se divide em cluster e possui dois tipos de nós, sendo o Master e o RegionServer.
Assinale a alternativa que apresenta a(s) afirmativa(s) correta(s):

Resposta Selecionada:

I, II e IV apenas.
Resposta Correta:

I e IV apenas.
Comentário da resposta:
Sua resposta está incorreta. A alternativa está incorreta. A afirmativa II está incorreta, pois o banco de dados relacional que possui uma arquitetura mais rígida, com a expansão possuindo maior limitação, já o HBase requer hardware menos potente e poder expandido com mais recursos de hardware sem a necessidade de lidar com grandes equipamentos de ponta. A afirmativa III está incorreta, pois o HBase foi criado sob o conceito do BigTable, da Google, que é um banco de dados NoSQL focada em serviços online de análise de dados em grande escala.

 Pergunta 10
1 em 1 pontos

O termo Big Data Analytics está relacionado às formas de se analisar grande volumes de dados. A partir do grande aumento de dados nos últimos anos, o seu conceito vem sendo muito utilizado a partir do ano de 2012. Hoje, há quatro técnicas analytics.
Considerando o exposto acima, relacione a coluna de tipos de técnicas analytics com suas respectivas características.
I) Análise Descritiva
II) Análise Preditiva
III) Análise Prescritiva
IV) Análise Diagnóstica
( ) busca responder perguntas de porque algo aconteceu.
( ) diferente das demais, busca projeções futuras.
( ) se baseia nas predições evitar problemas antes de acontecerem.
( ) é uma análise do estado atual de uma instituição ou empresa.
A seguir, assinale a alternativa com a sequência correta.

Resposta Selecionada:

IV, II, III, I.
Resposta Correta:

IV, II, III, I.
Comentário da resposta:
Resposta correta. A alternativa está correta, pois A análise Descritiva (1) analisa o estado atual de uma instituição. Perguntas a responder: Qual produto mais vendido? A Análise Preditiva (2) diferente das demais, busca por projeções futuras. Perguntas a responder: Qual a probabilidade de um cliente voltar a comprar com desconto de X%? A Análise Prescritiva (3) é a análise que se baseia nas predições para indicar sugestões para que problemas sejam evitados. A Análise Diagnóstica (4) busca responder a pergunta de “porque isso aconteceu”. Perguntas: Motivo do aumento de vendas no trimestre X?