Prévia do material em texto
20/06/2020 Blackboard Learn https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 1/5 Curso GRA0749 FRAMEWORKS PARA BIG DATA BIGDA201 - 202010.ead-29770518.06 Teste ATIVIDADE 4 (A4) Iniciado 23/05/20 10:46 Enviado 20/06/20 09:21 Status Completada Resultado da tentativa 10 em 10 pontos Tempo decorrido 670 horas, 35 minutos Resultados exibidos Respostas enviadas, Respostas corretas, Comentários Pergunta 1 Resposta Selecionada: Resposta Correta: Feedback da resposta: A quantidade de dados estão aumento exponencialmente, sendo cada vez mais coletados e analisados pelo setor para BI, o que também torna as soluções de armazenamento tradicionais caras demais. Nesse aspecto, o Hive se apresenta como uma solução de data warehousing com suporte a consultas de maneira mais expressa. A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. I. O hiveQL inclui um sistema com suporte para tabelas contendo tipos primitivos. Pois: II. Possui ainda, um catálogo do sistema que contém esquemas estatísticos úteis na exploração de dados. A seguir, assinale a alternativa correta: As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. Resposta correta. A alternativa está correta, pois a asserção I é uma proposição verdadeira, pois o hiveQL inclui um sistema com suporte para tabelas contendo tipos primitivos, coleções como matrizes e composições agrupadas de diferentes tipos. A asserção II também é verdadeira e justifica/complementa a I, pois O Hive também inclui uma espécie de catálogo do sistema, chamado de Metastore, que contém esquemas e estatísticas de tabelas e seus atributos (colunas), que são úteis na exploração de dados, otimização de consultas e compilação de consultas. Pergunta 2 Resposta Selecionada: Resposta Correta: Feedback O Apache Hive é um software de código aberto destinado ao conceito de data warehouse que foi desenvolvido a partir do Apache Hadoop. Ele oferece uma interface muito parecida com o SQL em diferentes bancos de dados, auxilia na leitura, escrita e gerenciamento de grandes volumes, e também, em sistemas de arquivos integrados ao Hadoop. A respeito de características do apache hive, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). ( ) O hive é um sistema de armazenamento que facilita a junção de dados para análise. ( ) Por trabalhar com grandes dados, o hive ocasiona muitas falhas, mesmo sendo distribuído. ( ) O hive consegue se conectar a ferramentas de análise de dados, devido a sua conexão via bibliotecas. ( ) O hive possui somente uma linguagem query para consultas em SQL. Assinale a alternativa que apresenta a sequência correta: V, F, V, F. V, F, V, F. Resposta correta. A sequência está correta. A afirmativa I está correta, pois o Hive é um 1 em 1 pontos 1 em 1 pontos 20/06/2020 Blackboard Learn https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 2/5 da resposta: sistema de armazenamento ou depósito de dados, pertencente ao ecossistema Hadoop, que busca facilitar a junção de dados para geração de análises de grandes conjuntos de dados, que chamamos comumente de Big Data. A afirmativa III está correta, pois o hive possibilita a conexão de dados via bibliotecas como JDBC e ODBC, consegue se conectar a ferramentas de análise de dados amplamente utilizadas no mercado como o Tableau, o Power BI (da Microsoft), entre outras. Pergunta 3 Resposta Selecionada: Resposta Correta: Feedback da resposta: O HBase é um banco de dados que se divide em cluster, onde cada máquina dentro do cluster é chamado de nó. Existem 2 tipos de nodes , sendo o Master e o RegionServer. Existem grandes diferenças entre utilizar o HBase e um banco de dados relacional. A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. I. O HBase requer hardware potente para que a manipulação dos dados sejam realizados de forma mais rápida. Pois: II. Um banco de dados relacional possui uma arquitetura mais rígida com a expansão possuindo maior limitação. A seguir, assinale a alternativa correta: A asserção I é uma proposição falsa, e a II é uma proposição verdadeira. A asserção I é uma proposição falsa, e a II é uma proposição verdadeira. Resposta correta. A alternativa está correta, pois a asserção II é uma proposição verdadeira, pois o banco de dados relacional possui uma arquitetura mais rígida, com a expansão possuindo maior limitação, seja em recursos financeiros ou em tempo. Pergunta 4 Resposta Selecionada: Resposta Correta: Feedback da resposta: O termos Big Data Analytics refere-se a analisar grandes quantidades de dados que são produzidos diariamente a fim de obter informações para um determinado negócio. Além disso, é muito utilizado na tomada de decisões e para testar processos existentes. O conceito ainda apresenta técnicas analytics. A respeito das técnicas analytics, analise as afirmativas a seguir e assinale V para a(s) Verdadeira(s) e F para a(s) Falsa(s). I. ( ) A análise descritiva se baseia nas predições para prescrever sugestões para que problemas sejam evitados antes mesmo de acontecerem. II. ( ) A análise prescritiva é uma análise do estado atual de uma instituição ou empresa, respondendo perguntas como: Que produto tem maior saída?. III. ( ) A análise diagnóstica busca responder perguntas para entender por qual motivo algo aconteceu, como: porque tal serviço teve queda. IV. ( ) A análise preditiva busca realizar projeções futuras a respeito de algo, respondendo perguntas como a estima de clientes para o próximo ano. Assinale a alternativa que apresenta a sequência correta: F, F, V, V. F, F, V, V. Resposta correta. A sequência está correta. A afirmativa III é verdadeira, pois a análise diagnóstica possui característica de analisar algo e responde a pergunta porque algo aconteceu, como por exemplo, um aumento ou queda de vendas. A afirmativa IV é verdadeira, pois a análise preditiva busca por projeções futuras, baseando-se em realizar perguntas do tipo: probabilidade de um cliente voltar a comprar, ou estimativa de novos clientes para o próximo ano. 1 em 1 pontos 1 em 1 pontos 20/06/2020 Blackboard Learn https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 3/5 Pergunta 5 Resposta Selecionada: Resposta Correta: Feedback da resposta: Dentro do ecossistema Hadoop existem diferentes tecnologias para cada necessidade. O pacote não foi lançado todo de uma só vez, mas foram surgindo necessidades conforme o tempo foi passando. Assim, novas tecnologias apareceram para atender a demanda. A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. I. O banco HBase é oferecido como um serviço por empresas que os fornecem em nuvem como a Amazon, a Microsoft e Google. Pois: II. A grande vantagem de se utilizar os serviços oferecidos por estas empresas é que elas já oferecem todo o necessário para que tais ferramentas funcionem A seguir, assinale a alternativa correta: As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. Resposta correta. A alternativa está correta, pois a asserção I é verdadeira, pois o banco HBase não precisa de ferramentas visuais de interface para ser gerenciado, mas ele é oferecido como um serviço por empresas que os fornecem em nuvem como a Amazon, a Microsoft (por meio através do servidor Azure), a Google, entre outras. A asserção II é verdadeira, e complementa a I, pois a grande vantagem de se utilizar os serviços de empresas como Amazon, Microsoft, Google e demais organizações da área de dados, é que elas já oferecem todo o necessário para que tais ferramentas funcionem. Pergunta 6 RespostaSelecionada: Resposta Correta: Feedback da resposta: A análise em grandes conjuntos de dados tem sido essencial para as funções de várias equipes de analistas de dados. São utilizados diversos aplicativos de BI para análise de dados, como aplicativos de relatórios simples, dashboards dinâmicos, ferramentas de análise preditiva e prescritiva. Considerando o exposto acima, podemos afirmar corretamente que as tecnologias mais utilizadas para atender grandes empresas são: Hive e Hadoop. Hive e Hadoop. Resposta correta. A alternativa está correta, pois Hive e Hadoop são as tecnologias mais utilizadas para atender a esses requisitos em grandes empresas e organizações em todo o mundo, como a Microsoft, a rede de tv americana CBS, Digg (uma espécie de centralizador de links, notícias e podcasts), Hi5 (rede social). SQL é uma linguagem, e DDL e DML são recursos dessa linguagem. Pergunta 7 Resposta Selecionada: Resposta Correta: Feedback da Dado é algo importante para o Big Data, afinal, é através de grandes volumes de dados que o Big Data trabalha. Grandes volumes de dados começaram a surgir a partir do “boom” da internet e foi necessário surgir ferramentas que os manipulam de forma rápida. Neste sentido, assinale a alternativa que indique corretamente o nome da técnica destinada a análise de grandes volumes de dados: Big Data Analytics. Big Data Analytics. Resposta correta. A alternativa está correta, O termo Big Data Analytics representa as formas de analisar grandes volumes de dados. Tem estado em evidência a partir de 2012 1 em 1 pontos 1 em 1 pontos 1 em 1 pontos 20/06/2020 Blackboard Learn https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 4/5 resposta: devido ao aumento considerável na quantidade de dados geradas desde a década de 2010 em diante, com o aumento massivo de comunicadores instantâneos como Messenger e WhatsApp e as redes sociais. Ainda segundo Marquesone (2018), existem hoje quatro técnicas de analytics que são distintas entre si pelo tipo de resultado gerado. Pergunta 8 Resposta Selecionada: Resposta Correta: Feedback da resposta: Realizar uma boa análise de dados é sempre muito importante, seja em qualquer área. Uma das áreas que vem se utilizando muito disso é a Business Intelligence, ou ainda, inteligência de negócios. Este é um setor que tem crescido muito para atender cada vez mais empresas de diversos ramos. Considerando o excerto apresentado, a respeito da análise de grandes dados, analise as afirmativas a seguir: I. O MapReduce, do Hadoop , é muito utilizado porque desenvolvedores escrevem programas de fácil manutenção. II. O Hive suporta consultas de maneira expressa, por meio de sua linguagem conhecida como HiveQL. III. A linguagem Hive suporta tabelas contendo tipos primitivos, matrizes e agrupamento de tipos. IV. O Hive possui um problema, um catálogo do sistema, que o deixa lento ao retornar dados. Assinale a alternativa que apresenta a(s) afirmativa(s) correta(s): II e III apenas. II e III apenas. Resposta correta. A afirmativa I está correta. A afirmativa II está correta, pois o Hive se apresenta como uma solução de data warehousing de código aberto com suporte a consultas de maneira mais expressa, por meio através de uma linguagem declarativa do tipo SQL - o HiveQL. A afirmativa III está correta, pois a linguagem hive inclui um sistema com suporte para tabelas contendo tipos primitivos, coleções como matrizes e composições agrupadas de diferentes tipos. Pergunta 9 Resposta Selecionada: Resposta Correta: Feedback da resposta: Todo um projeto de Big Data é feito de etapas. Cada etapa precisa passar por fases que definem bem o problema. A visualização de dados é, geralmente, a última etapa de um processo. Mas vale lembrar que a visualização é uma etapa importante, assim como todas as etapas que compõem o Big Data. Considerando o excerto apresentado, e das características de visualização de dados, analise as afirmativas a seguir: I. Dentro do Hadoop, existem diferentes tecnologias para cada necessidade. II. Dados em tempo real não extintos nesta ferramenta, para eliminar processamento indevido. III. O banco HBase necessita de ferramentas visuais de interface para gerenciar serviços. IV. A etapa de visualização exige o uso de novas soluções, que simplifiquem processos. Assinale a alternativa que apresenta a(s) afirmativa(s) correta(s): I e IV apenas. I e IV apenas. Resposta correta. A afirmativa I está correta. A afirmativa I está correta, pois dentro do ecossistema Hadoop, como você já pôde perceber, existem diferentes tecnologias para cada necessidade. O pacote inteiro não foi lançado todo de uma só vez, mas foram surgindo necessidades nos trabalhos. A afirmativa IV está correta, pois quando falamos de visualização de dados, é exigido soluções que oferecem recursos com a finalidade de simplificar processos, bem como têm a presença de características que enriquecem a experiência com usuários ao visualizarem dos dados. Pergunta 10 O Hive possui um linguagem própria para consulta, chamada de HQL ou HiveQL. Esta linguagem possui características semelhantes a linguagem SQL. Além desta linguagem, ainda possui outra, uma 1 em 1 pontos 1 em 1 pontos 1 em 1 pontos 20/06/2020 Blackboard Learn https://fmu.blackboard.com/webapps/late-Course_Landing_Page_Course_100-BBLEARN/Controller# 5/5 Sábado, 20 de Junho de 2020 09h21min42s BRT Resposta Selecionada: Resposta Correta: Feedback da resposta: linguagem procedural, chamada HPL ( Hive Procedural Language ). Nesse sentido, analise o exemplo abaixo: hive> select * from tb_clientes; hive> show tables; elaborado pelo autor A partir do apresentado, analise as asserções a seguir e a relação proposta entre elas. I. No exemplo é utilizado um exemplo em linguagem HQL com a presença de comandos select e show tables. Pois: II. Possui a característica de comandos semelhantes ao da linguagem SQL. A seguir, assinale a alternativa correta: As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. As asserções I e II são proposições verdadeiras, e a II é uma justificativa correta da I. Resposta correta. A alternativa está correta, pois a asserção I é uma proposição verdadeira, pois no exemplo podemos verificar a presença de comando HQL, com a presença de comando select e show tables. A asserção II também é verdadeira e justifica/complementa a I, pois a linguagem HQL é semelhante aos comandos da linguagem SQL, muito utilizada em transações de bancos de dados relacionais.