Baixe o app para aproveitar ainda mais
Prévia do material em texto
· Pergunta 1 1 em 1 pontos O termo Big Data Analytics está relacionado às formas de se analisar grande volumes de dados. A partir do grande aumento de dados nos últimos anos, o seu conceito vem sendo muito utilizado a partir do ano de 2012. Hoje, há quatro técnicas analytics. Considerando o exposto acima, relacione a coluna de tipos de técnicas analytics com suas respectivas características. I) Análise Descritiva II) Análise Preditiva III) Análise Prescritiva IV) Análise Diagnóstica ( ) busca responder perguntas de porque algo aconteceu. ( ) diferente das demais, busca projeções futuras. ( ) se baseia nas predições evitar problemas antes de acontecerem. ( ) é uma análise do estado atual de uma instituição ou empresa. A seguir, assinale a alternativa com a sequência correta. Resposta Selecionada: IV, II, III, I. Resposta Correta: IV, II, III, I. Feedback da resposta: Resposta correta. A alternativa está correta, pois A análise Descritiva (1) analisa o estado atual de uma instituição. Perguntas a responder: Qual produto mais vendido? A Análise Preditiva (2) diferente das demais, busca por projeções futuras. Perguntas a responder: Qual a probabilidade de um cliente voltar a comprar com desconto de X%? A Análise Prescritiva (3) é a análise que se baseia nas predições para indicar sugestões para que problemas sejam evitados. A Análise Diagnóstica (4) busca responder a pergunta de “porque isso aconteceu”. Perguntas: Motivo do aumento de vendas no trimestre X? · Pergunta 2 0 em 1 pontos A visualização de dados é, geralmente, a última etapa do processo e exige o uso de novas soluções, oferecendo recursos que simplificam o processo de visualização. Podemos dizer que lidar com dados requer cuidado, visualizar dados pode ser uma grande arte. A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. I. No HBase é possível interagir via shell script, prompt de comando ou interface gráfica. Pois: II. Há uma ferramenta chamada HB TOP que realiza o monitoramento em tempo real. A seguir, assinale a alternativa correta: Resposta Selecionada: A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa. Resposta Correta: As asserções I e II são proposições verdadeiras, mas a II não é uma justificativa correta da I. Feedback da resposta: Sua resposta está incorreta. A alternativa está incorreta, pois as duas asserções são proposições verdadeiras, no entanto, uma não justifica a outra. No HBase é possível interagir via shell script, prompt de comando ou interface gráfica. Há uma ferramenta chamada HB TOPHBTOP que realiza o monitoramento em tempo real. · Pergunta 3 1 em 1 pontos O termos Big Data Analytics refere-se a analisar grandes quantidades de dados que são produzidos diariamente a fim de obter informações para um determinado negócio. Além disso, é muito utilizado na tomada de decisões e para testar processos existentes. O conceito ainda apresenta técnicas analytics. A respeito das técnicas analytics, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). I. ( ) A análise descritiva se baseia nas predições para prescrever sugestões para que problemas sejam evitados antes mesmo de acontecerem. II. ( ) A análise prescritiva é uma análise do estado atual de uma instituição ou empresa, respondendo perguntas como: Que produto tem maior saída?. III. ( ) A análise diagnóstica busca responder perguntas para entender por qual motivo algo aconteceu, como: porque tal serviço teve queda. IV. ( ) A análise preditiva busca realizar projeções futuras a respeito de algo, respondendo perguntas como a estima de clientes para o próximo ano. Assinale a alternativa que apresenta a sequência correta: Resposta Selecionada: F, F, V, V. Resposta Correta: F, F, V, V. Feedback da resposta: Resposta correta. A sequência está correta. A afirmativa III é verdadeira, pois a análise diagnóstica possui característica de analisar algo e responde a pergunta porque algo aconteceu, como por exemplo, um aumento ou queda de vendas. A afirmativa IV é verdadeira, pois a análise preditiva busca por projeções futuras, baseando-se em realizar perguntas do tipo: probabilidade de um cliente voltar a comprar, ou estimativa de novos clientes para o próximo ano. · Pergunta 4 1 em 1 pontos O Apache Hive é um software de código aberto destinado ao conceito de data warehouse que foi desenvolvido a partir do Apache Hadoop. Ele oferece uma interface muito parecida com o SQL em diferentes bancos de dados, auxilia na leitura, escrita e gerenciamento de grandes volumes, e também, em sistemas de arquivos integrados ao Hadoop. A respeito de características do apache hive, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). ( ) O hive é um sistema de armazenamento que facilita a junção de dados para análise. ( ) Por trabalhar com grandes dados, o hive ocasiona muitas falhas, mesmo sendo distribuído. ( ) O hive consegue se conectar a ferramentas de análise de dados, devido a sua conexão via bibliotecas. ( ) O hive possui somente uma linguagem query para consultas em SQL. Assinale a alternativa que apresenta a sequência correta: Resposta Selecionada: V, F, V, F. Resposta Correta: V, F, V, F. Feedback da resposta: Resposta correta. A sequência está correta. A afirmativa I está correta, pois o Hive é um sistema de armazenamento ou depósito de dados, pertencente ao ecossistema Hadoop, que busca facilitar a junção de dados para geração de análises de grandes conjuntos de dados, que chamamos comumente de Big Data. A afirmativa III está correta, pois o hive possibilita a conexão de dados via bibliotecas como JDBC e ODBC, consegue se conectar a ferramentas de análise de dados amplamente utilizadas no mercado como o Tableau, o Power BI (da Microsoft), entre outras. · Pergunta 5 1 em 1 pontos Dentro do contexto de Big Data, é comum que os dados surjam a partir de diferentes origens e que sejam de diferentes formatos. Claro, lidar com grandes conjuntos de dados dentro da estrutura de bancos de dados relacionais não é a melhor opção. Nesse sentido, surgiram diversos bancos de dados chamados de não relacionais. Considerando o exposto acima, assinale a alternativa que indica corretamente um exemplo de banco de dados não relacional. Resposta Selecionada: HBase Resposta Correta: HBase Feedback da resposta: Resposta correta. A alternativa está correta, pois o HBase surge para atender a demanda de bancos de dados não relacionais orientado a coluna ou família de colunas dentro do ecossistema Hadoop. Diferente do Hive, que não é considerado um banco de dados, mas um repositório de dados, HBase é um banco de dados sim, mas fora do padrão tradicional relacional. · Pergunta 6 0 em 1 pontos A quantidade de dados estão aumento exponencialmente, sendo cada vez mais coletados e analisados pelo setor para BI, o que também torna as soluções de armazenamento tradicionais caras demais. Nesse aspecto, o Hive se apresenta como uma solução de data warehousing com suporte a consultas de maneira mais expressa. A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. I. O hiveQL inclui um sistema com suporte para tabelas contendo tipos primitivos. Pois: II. Possui ainda, um catálogo do sistema que contém esquemas estatísticos úteis na exploração de dados. A seguir, assinale a alternativa correta: Resposta Selecionada: A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa. Resposta Correta: As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. Feedback da resposta: Sua resposta está incorreta. A alternativa está incorreta, pois as duas proposições apresentadas são verdadeiras e a asserção II justificaa I, O hiveQL inclui um sistema com suporte para tabelas contendo tipos primitivos e possui um catálogo do sistema que contém esquemas estatísticos úteis na exploração de dados. · Pergunta 7 0 em 1 pontos O HBase foi criado sob o conceito do BigTable , da Google, e também é um banco de dados não relacional que lida com bilhões de dados. Ele se divide em cluster, onde cada máquina dentro do cluster é chamado de nó. Existem dois tipos de nós no HBase. A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. I. O nó máster requer alta disponibilidade, uma vez que é elemento central do processo. Pois: II. Esse tipo de nó é responsável pela realização de armazenamento, leitura e escrita em tabelas. A seguir, assinale a alternativa correta: Resposta Selecionada: As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. Resposta Correta: A asserção I é uma proposição verdadeira e a asserção II é uma proposição falsa. Feedback da resposta: Sua resposta está incorreta. A alternativa está incorreta, pois somente a asserção I é verdadeira. A asserção II é uma proposição falsa, sendo que, a característica exposta refere-se ao nó RegionServer, que é responsável pela realização de armazenamento, leitura e escrita em tabelas. Um cliente faz comunicação com um nó Region ServerRegionServer para fazer leitura e escrita na base. · Pergunta 8 0 em 1 pontos Trabalhar com Big Data significa trabalhar com um grande volume de dados. E claro, analisar esses dados requer muita atenção e um processamento específico necessitando rapidez. Porém, não adianta ter os dados certos, mas com a informação errada. Considerando o excerto apresentado, sobre a análise de Big Data, analise as afirmativas a seguir: I. O termo Big Data Analytics representa as formas de analisar grandes volumes de dados; a técnica analytics possui quatro técnicas. II. Utilizar métodos estatísticos e algoritmos de aprendizagem de máquina necessitam que modelos sejam adaptados para processamento paralelo. III. A análise descritiva busca responder a pergunta de porque algo aconteceu, e vem depois da análise diagnóstica. IV. Ter parte dos dados ou realizar um cálculo errado pode dar um retorno incorreto de uma informação. Assinale a alternativa que apresenta a(s) afirmativa(s) correta(s): Resposta Selecionada: I, II e IV apenas. Resposta Correta: I e II apenas. Feedback da resposta: Sua resposta está incorreta. A alternativa está incorreta, A afirmativa III está incorreta, pois a análise descritiva, na verdade, é uma análise do estado atual de uma instituição ou empresa. Como exemplo, uma base de dados de clientes que respondam a perguntas como: Qual produto mais vendido? Quanto foi vendido nos últimos meses? Esses resultados são apresentados geralmente em forma de gráficos e dashboards. · Pergunta 9 1 em 1 pontos O HBase é um banco de dados não relacional lançado em 2008 e possui sua licença pertencente ao Apache 2.0. É um banco de dados open source que foi projetado para grandes volumes de dados, como todo o contexto do framework Hadoop. Considerando o excerto apresentado, a da característica do banco de dados não relacional HBase, analise as afirmativas a seguir: I. Tem o objetivo de lidar com o armazenamento de milhões de tabelas e colunas e é tolerante a falhas. II. O banco de dados HBase possui uma arquitetura mais rígida, com a expansão possuindo maior limitação. III. Seu conceito é fundamentado no Big Google, que é focado na análise de grandes dados off-line . IV. O HBase se divide em cluster e possui dois tipos de nós, sendo o Master e o RegionServer. Assinale a alternativa que apresenta a(s) afirmativa(s) correta(s): Resposta Selecionada: I e IV apenas. Resposta Correta: I e IV apenas. Feedback da resposta: Resposta correta. A afirmativa I está correta. A afirmativa I está correta, pois o HBase tem o objetivo lidar com armazenamento de milhões de tabelas e colunas, tendo característica como tolerância a falhas, se aproveitando deste controle vindo do Hadoop HDFS. A afirmativa IV está correta, pois o HBase se divide em cluster, onde cada máquina dentro do cluster é chamado de nó. Existem 2 tipos de nodes, sendo o Master e o RegionServer. · Pergunta 10 1 em 1 pontos O HBase é um modelo de banco de dados distribuído de código aberto e orientado a coluna. Ele é baseado no Google BigTable e tem fácil interação com o Hadoop, podendo utilizar o MapReduce para distribuir todo os processamento de dados. A respeito de características do HBase, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). I. ( ) O esquema HBase permite que novos dados e novas colunas sejam incluídas a qualquer momento. II. ( ) O HBase possui característica de versionamento, onde os dados podem ser armazenados gerando séries. III. ( ) Caso um dados não venha com um timestamp definido, o próprio banco irá definir. IV. ( ) Por ser um banco de dados não relacional, o HBase não possui procedures e views. Assinale a alternativa que apresenta a sequência correta: Resposta Selecionada: V, V, V, F. Resposta Correta: V, V, V, F. Feedback da resposta: Resposta correta. A sequência está correta. A afirmativa I está correta, pois o esquema HBase permite que novos dados e novas colunas sejam incluídas a qualquer momento, o que o diferencia substancialmente aos bancos de dados relacionais, que são muito mais rígidos quanto a alteração da estrutura de uma tabela. A afirmativa II está correta, pois o HBase possui versionamento, onde os dados podem ser armazenados gerando séries histórias na própria base. A afirmativa III está correta, pois o HBase se utiliza de TimeStamp, e caso um dado não venha com timestamp definido, o próprio banco define.
Compartilhar