Baixe o app para aproveitar ainda mais
Prévia do material em texto
Pergunta 1 1 em 1 pontos O HBase foi criado sob o conceito do BigTable , da Google, e também é um banco de dados não relacional que lida com bilhões de dados. Ele se divide em cluster, onde cada máquina dentro do cluster é chamado de nó. Existem dois tipos de nós no HBase. A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. I. O nó máster requer alta disponibilidade, uma vez que é elemento central do processo. Pois: II. Esse tipo de nó é responsável pela realização de armazenamento, leitura e escrita em tabelas. A seguir, assinale a alternativa correta: Resposta Selecionada: A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa. Resposta Correta: A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa. Comentário da resposta: Resposta correta. A alternativa está correta, pois a asserção I é uma proposição verdadeira, pois o nó Master é o único nó a ser executado. Requer alta disponibilidade, uma vez que é elemento central do processo. Esse nó é responsável pela gestão de operações de cluster. Pergunta 2 1 em 1 pontos Todo um projeto de Big Data é feito de etapas. Cada etapa precisa passar por fases que definem bem o problema. A visualização de dados é, geralmente, a última etapa de um processo. Mas vale lembrar que a visualização é uma etapa importante, assim como todas as etapas que compõem o Big Data. Considerando o excerto apresentado, e das características de visualização de dados, analise as afirmativas a seguir: I. Dentro do Hadoop, existem diferentes tecnologias para cada necessidade. II. Dados em tempo real não extintos nesta ferramenta, para eliminar processamento indevido. III. O banco HBase necessita de ferramentas visuais de interface para gerenciar serviços. IV. A etapa de visualização exige o uso de novas soluções, que simplifiquem processos. Assinale a alternativa que apresenta a(s) afirmativa(s) correta(s): Resposta Selecionada: I e IV apenas. Resposta Correta: I e IV apenas. Comentário da resposta: Resposta correta. A afirmativa I está correta. A afirmativa I está correta, pois dentro do ecossistema Hadoop, como você já pôde perceber, existem diferentes tecnologias para cada necessidade. O pacote inteiro não foi lançado todo de uma só vez, mas foram surgindo necessidades nos trabalhos. A afirmativa IV está correta, pois quando falamos de visualização de dados, é exigido soluções que oferecem recursos com a finalidade de simplificar processos, bem como têm a presença de características que enriquecem a experiência com usuários ao visualizarem dos dados. Pergunta 3 1 em 1 pontos Dentro do contexto de Big Data, é comum que os dados surjam a partir de diferentes origens e que sejam de diferentes formatos. Claro, lidar com grandes conjuntos de dados dentro da estrutura de bancos de dados relacionais não é a melhor opção. Nesse sentido, surgiram diversos bancos de dados chamados de não relacionais. Considerando o exposto acima, assinale a alternativa que indica corretamente um exemplo de banco de dados não relacional. Resposta Selecionada: HBase Resposta Correta: HBase Comentário da resposta: Resposta correta. A alternativa está correta, pois o HBase surge para atender a demanda de bancos de dados não relacionais orientado a coluna ou família de colunas dentro do ecossistema Hadoop. Diferente do Hive, que não é considerado um banco de dados, mas um repositório de dados, HBase é um banco de dados sim, mas fora do padrão tradicional relacional. Pergunta 4 1 em 1 pontos O HBase é um banco de dados que se divide em cluster, onde cada máquina dentro do cluster é chamado de nó. Existem 2 tipos de nodes , sendo o Master e o RegionServer. Existem grandes diferenças entre utilizar o HBase e um banco de dados relacional. A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. I. O HBase requer hardware potente para que a manipulação dos dados sejam realizados de forma mais rápida. Pois: II. Um banco de dados relacional possui uma arquitetura mais rígida com a expansão possuindo maior limitação. A seguir, assinale a alternativa correta: Resposta Selecionada: A asserção I é uma proposição falsa, e a II é uma proposição verdadeira. Resposta Correta: A asserção I é uma proposição falsa, e a II é uma proposição verdadeira. Comentário da resposta: Resposta correta. A alternativa está correta, pois a asserção II é uma proposição verdadeira, pois o banco de dados relacional possui uma arquitetura mais rígida, com a expansão possuindo maior limitação, seja em recursos financeiros ou em tempo. Pergunta 5 1 em 1 pontos O Apache Hive é uma aplicação de código aberto, com sua licença pertence ao Apache. É uma aplicação de data warehouse construído para a leitura, escrita e gerenciamento de grande volumes de dados em ambientes com a característica de ser distribuído. A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. I. O Hive é um sistema de armazenamento pertencente ao ecossistema Hadoop. Pois: II. Possui a característica de facilitar a junção de dados para a análise. A seguir, assinale a alternativa correta: Resposta Selecionada: As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. Resposta Correta: As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. Comentário da resposta: Resposta correta. A alternativa está correta, pois a asserção I é uma proposição verdadeira, pois o Hive é um sistema de armazenamento ou depósito de dados, pertencente ao ecossistema Hadoop, da Apache Foundation. A asserção II também é verdadeira e justifica/complementa a I, pois ele busca facilitar a junção de dados para geração de análise de grandes conjuntos de dados, que chamamos comumente de Big Data. Pergunta 6 1 em 1 pontos Dado é algo importante para o Big Data, afinal, é através de grandes volumes de dados que o Big Data trabalha. Grandes volumes de dados começaram a surgir a partir do “boom” da internet e foi necessário surgir ferramentas que os manipulam de forma rápida. Neste sentido, assinale a alternativa que indique corretamente o nome da técnica destinada a análise de grandes volumes de dados: Resposta Selecionada: Big Data Analytics. Resposta Correta: Big Data Analytics. Comentário da resposta: Resposta correta. A alternativa está correta, O termo Big Data Analytics representa as formas de analisar grandes volumes de dados. Tem estado em evidência a partir de 2012 devido ao aumento considerável na quantidade de dados geradas desde a década de 2010 em diante, com o aumento massivo de comunicadores instantâneos como Messenger e WhatsApp e as redes sociais. Ainda segundo Marquesone (2018), existem hoje quatro técnicas de analytics que são distintas entre si pelo tipo de resultado gerado. Pergunta 7 1 em 1 pontos O HBase é um modelo de banco de dados distribuído de código aberto e orientado a coluna. Ele é baseado no Google BigTable e tem fácil interação com o Hadoop, podendo utilizar o MapReduce para distribuir todo os processamento de dados. A respeito de características do HBase, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). I. ( ) O esquema HBase permite que novos dados e novas colunas sejam incluídas a qualquer momento. II. ( ) O HBase possui característica de versionamento, onde os dados podem ser armazenados gerando séries. III. ( ) Caso um dados não venha com um timestamp definido, o próprio banco irá definir. IV. ( ) Por ser um banco de dados não relacional, o HBase não possui procedures e views. Assinale a alternativa que apresenta a sequência correta: RespostaSelecionada: V, V, V, F. Resposta Correta: V, V, V, F. Comentário da resposta: Resposta correta. A sequência está correta. A afirmativa I está correta, pois o esquema HBase permite que novos dados e novas colunas sejam incluídas a qualquer momento, o que o diferencia substancialmente aos bancos de dados relacionais, que são muito mais rígidos quanto a alteração da estrutura de uma tabela. A afirmativa II está correta, pois o HBase possui versionamento, onde os dados podem ser armazenados gerando séries histórias na própria base. A afirmativa III está correta, pois o HBase se utiliza de TimeStamp, e caso um dado não venha com timestamp definido, o próprio banco define. Pergunta 8 1 em 1 pontos O Hive trabalha tanto com dado estruturados como não estruturados. Assim, é possível utilizar recursos como DDL (Linguagem de Definição de Dados) e DML (Linguagem de Manipulação de dados) da linguagem SQL, por meio através de scripts criar estruturas de tabelas ou manipular dados. Nesse sentido, analise o trecho abaixo. CREATE EXTERNAL TABLE logs ( s1 string, s2 string, s3 string, s4 string, s5 string, s6 string, s7 string) ROW FORMAT DELIMITED FIELDS TERMINATED BY ' ' STORED AS TEXTFILE LOCATION '/example/data/'; elaborada pelo autor A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. I. O trecho possui código em hiveQL e irá criar uma tabela com nome logs. Pois: II. O código possui delimitador de espaço vazio, o que indica que não possui um local de armazenamento. A seguir, assinale a alternativa correta: Resposta Selecionada: A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa. Resposta Correta: A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa. Comentário da resposta: Resposta correta. A alternativa está correta, pois somente a asserção I é uma proposição verdadeira, pois apresenta um exemplo de instrução HiveQL na criação de uma tabela com dados separados por espaços em branco, sendo utilizado o comando CREATE EXTERNAL TABLE para criar uma tabela chamada “logs”. Pergunta 9 0 em 1 pontos O HBase é um banco de dados não relacional lançado em 2008 e possui sua licença pertencente ao Apache 2.0. É um banco de dados open source que foi projetado para grandes volumes de dados, como todo o contexto do framework Hadoop. Considerando o excerto apresentado, a da característica do banco de dados não relacional HBase, analise as afirmativas a seguir: I. Tem o objetivo de lidar com o armazenamento de milhões de tabelas e colunas e é tolerante a falhas. II. O banco de dados HBase possui uma arquitetura mais rígida, com a expansão possuindo maior limitação. III. Seu conceito é fundamentado no Big Google, que é focado na análise de grandes dados off-line . IV. O HBase se divide em cluster e possui dois tipos de nós, sendo o Master e o RegionServer. Assinale a alternativa que apresenta a(s) afirmativa(s) correta(s): Resposta Selecionada: I, II e IV apenas. Resposta Correta: I e IV apenas. Comentário da resposta: Sua resposta está incorreta. A alternativa está incorreta. A afirmativa II está incorreta, pois o banco de dados relacional que possui uma arquitetura mais rígida, com a expansão possuindo maior limitação, já o HBase requer hardware menos potente e poder expandido com mais recursos de hardware sem a necessidade de lidar com grandes equipamentos de ponta. A afirmativa III está incorreta, pois o HBase foi criado sob o conceito do BigTable, da Google, que é um banco de dados NoSQL focada em serviços online de análise de dados em grande escala. Pergunta 10 1 em 1 pontos O termo Big Data Analytics está relacionado às formas de se analisar grande volumes de dados. A partir do grande aumento de dados nos últimos anos, o seu conceito vem sendo muito utilizado a partir do ano de 2012. Hoje, há quatro técnicas analytics. Considerando o exposto acima, relacione a coluna de tipos de técnicas analytics com suas respectivas características. I) Análise Descritiva II) Análise Preditiva III) Análise Prescritiva IV) Análise Diagnóstica ( ) busca responder perguntas de porque algo aconteceu. ( ) diferente das demais, busca projeções futuras. ( ) se baseia nas predições evitar problemas antes de acontecerem. ( ) é uma análise do estado atual de uma instituição ou empresa. A seguir, assinale a alternativa com a sequência correta. Resposta Selecionada: IV, II, III, I. Resposta Correta: IV, II, III, I. Comentário da resposta: Resposta correta. A alternativa está correta, pois A análise Descritiva (1) analisa o estado atual de uma instituição. Perguntas a responder: Qual produto mais vendido? A Análise Preditiva (2) diferente das demais, busca por projeções futuras. Perguntas a responder: Qual a probabilidade de um cliente voltar a comprar com desconto de X%? A Análise Prescritiva (3) é a análise que se baseia nas predições para indicar sugestões para que problemas sejam evitados. A Análise Diagnóstica (4) busca responder a pergunta de “porque isso aconteceu”. Perguntas: Motivo do aumento de vendas no trimestre X?
Compartilhar