Baixe o app para aproveitar ainda mais
Prévia do material em texto
Avaliação Acadêmico / Notas e Avaliações / Gabarito Avaliação da Disciplina Disciplina: Análise de Dados Usando Dashboards (17321) Prova: 42380630 As tecnologias em cloud têm dominado a rotina de todos nós. Tais plataformas que antes serviam apenas para armazenar arquivos na internet, permitem o armazenamento de dados e principalmente um conjunto de recursos para analisá-los. Selecione a alternativa correta que contenha as ferramentas de cloud computing que permitem a criação de dashboards. A) Pentaho Business, Pentaho Data Integration e PostgreSQL. B) Pentaho Data Integration, Tableau, Power Bi, ETL. C) Pentaho Business, Tableau, Power Bi, Qlik. D) IBM Cognos Analytics, Amazon QuickSight, Google Data Studio. A startup do Data Warehouse, Yellowbrick Data, levantou US $ 81 milhões em uma série C de �nanciamento liderado pela DFJ Growth, com a participação do braço de VC da Alphabet, Menlo Ventures, Third Point Ventures, DFJ Growth, BMW i Ventures, IVP, Next47 e Threshold Ventures. O mercado mundial de data warehousing teria gerado mais de US $ 18 bilhões em 2017, um número que deve crescer para quase US $ 35 bilhões até 2025, segundo a Allied Market Research. Isso parece estar impulsionando o recente aumento nos investimentos em data warehousing. Sobre Data Warehouse, selecione a alternativa CORRETA: A) São bancos de dados analíticos, projetados para armazenar os dados de fontes diversas, já transformados e preparados para serem explorados por aplicações de tomada de decisão. B) São, de maneira simples, um software que é responsável por gerenciar o acesso aos dados. O DW é responsável por fazer a interface entre os dados com aplicações e usuários, encapsulando-os, garantindo sua segurança e integridade. C) São fatos e números que transmitem algo especí�co, mas que não são organizados de maneira formal. Assim não têm contexto, de modo geral, pode-se dizer que dados são a informação de uma maneira bruta. D) Surgiram nos anos 2000, a partir da ascensão de grandes empresas da internet como Amazon e Google, que cada vez mais produziam dados gradativamente, tendo a necessidade de escalabilidade em escrita e principalmente leitura de dados após o aumento de tecnologias voltadas à nuvem. Durante a criação de Dashboards, mesmo existindo ferramentas muito poderosas para gerar dashboards, quando se conhece o cenário de dados pode-se chegar à conclusão que nenhuma atende à sua necessidade. Para isto, pode criar um dashboard utilizando alguma ou várias bibliotecas grá�cas já existentes. Selecione a alternativa correta que contenha bibliotecas web que podem auxiliar a criação de dashboards. A) IBM Cognos Analytics, Amazon QuickSight,Google Data Studio. B) Pentaho Data Integration, Tableau, Power Bi, ETL. C) Pentaho Business, Tableau, Power Bi, Qlik. Alterar modo de visualização 1 2 3 https://ava.uniasselvi.com.br/academico/notas_e_avaliacaoes D) Chart.js, P5.js, Total.js. A solução Pentaho de�ne-se a si mesma como uma plataforma de BI orientada para a solução e centrada em processos. Ou seja, não só apresenta os resultados de uma forma única e dando uma visão geral do estado da empresa, como implementa os próprios processos (work�ow) para a resolução de problemas detectados e apresentados. A disponibilização da informação é feita via Web para que, de uma forma fácil, se consiga distribuir a informação pelos utilizadores, usando obviamente segurança e disponibilidade de conteúdos consoante o utilizador. Sobre os componentes Pehtaho, selecione a alternativa CORRETA sobre o JOB: A) Um job é a biblioteca grá�ca responsável por plotar os grá�cos em um Dashboard. B) Um job é a interface grá�ca do Pentaho Data Integration, que facilita na concepção de rotinas e lógica ETL. C) Um job é o programa que executa transformações. O Pan pode executar uma transformação a partir de qualquer uma destas origens. D) Um job é uma sequência operações. Ao contrário de uma transformação, que opera sobre as linhas de dados em paralelo, um job realiza operações completas, uma por uma. Segundo Date (2004), “Data Warehouse é um depósito de dados orientado por assunto, integrado, não volátil, variável com o tempo. No contexto de tal de�nição, assinale a alternativa correta sobre o que signi�ca integrado. A) O termo integrado l se refere a não poder haver alteração nas fontes de dados utilizadas para alimentar um data warehouse. B) Um Data Warehouse pode integrar vários sistemas internos que usam SGBD e ao mesmo tempo integrar com redes sociais via JSON, fazendo dessa dinâmica nas fontes de dados sua principal característica, bem como um dos principais desa�os. C) O termo integrado se refere ao fato de que todo dado armazenado em um Data Warehouse não será excluído, e sim armazenado em decorrer do tempo. Em caso de exclusões na fonte, o mesmo não acontece em um Data Warehouse. D) O Termo integrado l se refere às fontes de dados diversas e com baixa volatilidade. O mundo em que vivemos está a mudar de forma drástica e constante. Novas tecnologias como a Inteligência Arti�cial (IA), a Internet das Coisas (IoT), ou a análise de dados, estão a transformar a forma como as organizações gerem os seus negócios, o modo como se relacionam com os seus clientes e gerem o aumento dos seus níveis de produtividade para gerar lucro. Assinale a alternativa CORRETA que contenha o outro nome para o Analista de Dados: A) Analista de Business Intelligence. B) Analista de Data Centers. C) Analista de Data Lake. D) Analista de Sistemas. As visualizações que vê no dashboard são denominadas mosaicos. Pode a�xar os mosaicos num dashboard a partir de relatórios. As visualizações num dashboard são provenientes de relatórios e cada relatório baseia-se num conjunto de dados. Uma forma de pensar num dashboard é pensar numa entrada para os relatórios e conjuntos de dados subjacentes. Selecionar uma visualização leva-o ao relatório (e ao conjunto de dados) em que se baseia. 4 5 6 7 Selecione a alternativa INCORRETA que contenha exemplo de aplicações de Dashboards analíticos. A) Exemplo de um dashboard de visão diária da web consegue rastrear o desempenho da internet por hora em relação a objetivos predeterminados para uma equipe de marketing digital. B) Departamento de fabricação: nele, um sistema de controle completamente novo pode ser implementado. É realmente um aspecto importante, e que antes era difícil de ser operado. A qualidade é fundamental no caso desse setor, e os painéis analíticos podem ser utilizados para estabelecer reuniões regulares de revisão de qualidade. C) Departamento de recursos humanos: suportam a introdução do plano de participação nos lucros, por exemplo, o que certamente in�uencia a moral dos funcionários. D) Departamento de atendimento: os painéis táticos fornecem habilidades de treinamento ampliadas, o que é importante durante a implementação de um novo software de help desk, por exemplo. Quando tratamos de análise de dados, é muito difícil que o termo business intelligence não apareça, a�nal, faz parte do coração da análise de informações. No que se refere ao business intelligence, assinale a alternativa correta: A) Business Intelligence, ou Inteligência de Negócio, é uma ferramenta que tem origem na administração de empresas a partir de análise SWOT. B) Business Intelligence compõe a etapa de ETL de um Data Warehouse, sendo uma importante ferramenta para isso. C) Business Intelligence é uma ferramenta, um software utilizado para que gestores tomem decisões baseado em tomada de decisão. D) Business Intelligence é uma metodologia pela qual se estabelecem ferramentas para obter, organizar, analisar e prover acesso às informações necessárias aos tomadores de decisão das empresas para analisarem os fenômenos acerca de seus negócios O Pentaho é um software patenteado nos EUA: os fundadores da empresa queriam desenvolver um pacote Java que pudesse ser usado para construir qualquersolução de BI. Eles queriam isso porque achavam que nenhuma ferramenta era �exível e poderosa o bastante para atender a qualquer necessidade, de qualquer empresa. Eles acreditavam que devia haver uma maneira melhor de montar soluções de BI, e que seria possível fundar uma empresa sobre essa "maneira melhor". E foi o que eles �zeram. Sobre os componentes Pehtaho, selecione a alternativa CORRETA sobre o SPOON: A) Um Spoon é uma sequência operações. Ao contrário de uma transformação, que opera sobre as linhas de dados em paralelo, um spoon realiza operações completas, uma por uma. B) O Spoon é o programa que executa transformações. C) O Spoon é a interface grá�ca do Pentaho Data Integration, que facilita na concepção de rotinas e lógica ETL. D) O Spoon pode executar uma transformação a partir de qualquer uma destas origens. Em ambientes de Data Warehouse, nos quais se têm as análises como principal objetivo, serão realizadas operações OLAP (Online Analytical Processing – Processamento Analítico On-line). De maneira simples, OLAP é a capacidade do sistema processar os dados analiticamente, explorando a multidimensionalidade do banco de dados em que os dados estão armazenados. O foco da realização de operações OLAP é o processamento on-line de dados com foco em análise para tarefas de tomada de decisão. No que se refere a estas implementações, elas podem ser ROLAP, MOLAP e HOLAP. Selecione a alternativa CORRETA sobre o HOLAP. 8 9 10 A) Partindo do nome, nessa implementação, o servidor para manipular os dados será implementado utilizando um sistema gerenciador de banco de dados relacional. B) Os servidores HOLAP adotam uma forma de armazenamento em dois níveis, um para dados densos, que são colocados em matrizes e outro para dados esparsos, que são alocados em tabelas. Ou seja, torna-se uma aplicação robusta integrando tanto matrizes quanto tabelas armazenando o modelo multidimensional, o que demanda um maior requisito de equipe para desenvolvê-lo. C) Nessa implementação especí�ca para a multidimensionalidade, para este �m e para isto armazenam e executam operações diretamente sobre uma matriz de dados. D) Esse tipo de OLAP não se refere à implementação do armazenamento, mas à distribuição de dados. Essa abordagem tem como objetivo otimizar as consultas através do armazenamento no computador do usuário. O estudo “A Universe of Opportunities and Challenges”, desenvolvido pela Consultoria EMC, aponta que de 2006 a 2010 o volume de dados digitais gerado cresceu de 166 exabytes para 988 exabytes. Assim, existe a perspectiva de que o volume de dados alcance a casa dos 40.000 exabytes, ou 40 zettabytes (ou 40 trilhões de gigabytes). Sendo a maioria desses dados não estruturados e semiestruturados. No que se refere aos tipos de dados, as imagens são: A) Dados semiestruturados. B) Dados não estruturados. C) Dados do tipo NoSQL. D) Dados estruturados. O IDC (International Data Corporation) realizou um estudo intitulado “O universo digital das oportunidades: riquezas de dados e valor crescente da internet das coisas”, com pesquisa e análise da IDC, foi reportado que no ano de 2013 havia um conjunto composto por 4,4 trilhões de gigabytes (ou 4,4 zettabytes) de informação. Utilizando diversos conjuntos de métricas e análises, o instituto realizou uma previsão que o mundo saltará para 44 trilhões de gigabytes (44 zettabytes) em 2020 e que 10% desse volume de dados corresponderá à internet das coisas. Sobre o volume de informações, analise as assertivas a seguir: ( ) Nesse contexto não é necessário se preocupar com armazenamento de dados. ( ) O grande desa�o é buscar alternativas para armazenar e processar estes dados, gerando informação e conhecimento. ( ) Para resolver os problemas de dados em excesso, basta aumentar o tamanho do disco. ( ) O caso mais conhecido da análise de dados e geração de conhecimento para a tomada de decisão é o caso da fralda e da cerveja. A) V, V, V, F. B) F, V, F, V. C) V, V, V, V. D) V, V, F, F. 11 12 JSON (JavaScript object Notation) é uma forma de armazenamento e transmissão de dados em formato de texto. Sua forma simples e compacta de estruturar informações tem ganhado espaço em aplicações em que o formato XML reinava até então como em aplicações web, por exemplo. A Google é uma das empresas que se destaca na utilização de JSON, tendo inclusive desenvolvido a biblioteca Gson, inicialmente para �ns internos, que tem como �nalidade a conversão de objetos Java em JSON. Selecione a alternativa CORRETA sobre o tipo de dados de um documento JSON. A) Dados semiestruturados. B) Dados estruturados. C) Dados do tipo NoSQL. D) Dados não estruturados. Segundo Farobi (2017), o dashboard é um painel de bordo com as principais informações �nanceiras, comerciais, recursos humanos, logísticas e processos de manutenção da sua empresa. Ou seja: é uma consolidação dos dados mais relevantes para o seu negócio. As informações mais importantes da sua organização devem estar sempre disponíveis de forma rápida e prática. Com uma boa ferramenta de business intelligence, é possível visualizar claramente as demandas problemáticas para o seu negócio. Selecione a alternativa correta que contenha os tipos de Dashboards. A) Dashboards de extração, dashboards de transformação, dashboards de carga. B) Dashboards OLAP e dashboards OLTP. C) Dashboards operacionais, dashboards estratégicos, dashboards analíticos. D) Business intelligence dashboards e data warehouse dashboards. O Data Warehouse (DW) se trata da mais importante tecnologia existente no desenvolvimento de soluções de Business Intelligence (BI). Ela é a base para o armazenamento das informações necessárias para a utilização por gestores e analistas na tomada de decisão. O DW possui estrutura e características que suportam análise de grandes volumes de dados. Em um Data Warehouse a modelagem multidimensional se torna muito importante. Assinale a alternativa CORRETA sobre modelagem multidimensional. A) A modelagem multidimensional tem como objetivo otimizar as transações em banco de dados . B) A modelagem multidimensional tem como objetivo melhorar a integridade, sendo mais e�ciente do que o emprego das formas normais. C) A modelagem multidimensional é uma técnica de modelagem de bancos de dados que se destina a apoiar as consultas realizadas pelo usuário �nal em um Data Warehouse. D) A modelagem multidimensional tem como objetivo diminuir o espaço em disco ao máximo. OLAP é uma ferramenta de Business Intelligence utilizada para apoiar as empresas na análise de suas informações, visando obter novos conhecimentos que são empregados na tomada de decisão. O termo OLAP refere-se a um conjunto de ferramentas voltadas para acesso e análise ad hoc de dados, com o objetivo �nal de transformar dados em informações capazes de dar suporte às decisões gerenciais de forma amigável e �exível ao usuário e em tempo hábil. 13 14 15 16 A) Slice, Dice, Roll-up e Roll-Down. B) Slice, Dice, Insert e Update. C) Slice, Dice, Roll-up e Drill-Down. D) Insert, Update, Roll-up e Roll-Down. PostgreSQL começou a ser desenvolvido em 1986 e tem ganhado bastante destaque nos últimos anos, como o banco de dados que mais cresce no mercado. No encontro, ele mostrou as vantagens e desvantagens de utilizar o banco de dados Open Source, que ele considera o mais avançado do mundo. O PostgreSQL é um sistema gerenciador de banco de dados objeto relacional (SGBD), desenvolvido como projeto de código aberto. Assinale a alternativa CORRETA, que contenha a de�nição correta de SGBD: A) Para que os SGBDS se tornem informação , eles devem ser contextualizados, categorizados, calculados e condensados, deste modo a informação são os dados organizados. De um modo geral, pode-se dizer que o conhecimento é quando se traz um sentido ao dado. B) São documentos XML utilizados para armazenar informação. C) Sistemas Gerenciadoresde Bancos de Dados, ou Sistemas Gerenciadores de Bancos de Dados Relacionais são, de maneira simples, um software que é responsável por gerenciar o acesso aos dados. O SGBD é responsável por fazer a interface entre os dados com aplicações e usuários, encapsulando-os, garantindo sua segurança e integridade. D) São fatos e números que transmitem algo especí�co, mas que não são organizados de maneira formal. Assim não têm contexto, de modo geral, pode-se dizer que dados são a informação de uma maneira bruta. Segundo INMON (2005), um Data Warehouse é uma coleção de dados, orientado a um assunto, integrado, com tempo variável e não volátil; este banco de dados é desenvolvido para suporte ao gerenciamento dos processos de tomada de decisão. No contexto de tal de�nição, assinale a alternativa correta sobre o que signi�ca não volátil. A) O termo não volátil se refere ao fato de que sempre há mudanças nos dados e isso deve ser considerado em um Data Warehouse. B) O termo não volátil se refere porque as fontes de dados são diversas e com baixa volatilidade. C) O termo não volátil se refere a não poder haver alteração nas fontes de dados utilizadas para alimentar um data warehouse. D) O termo não volátil se refere ao fato de que todo dado armazenado em um Data Warehouse não será excluído, e sim armazenado em decorrer do tempo. Em caso de exclusões na fonte o mesmo não acontece em um Data Warehouse. Em um cenário de análise de dados a primeira etapa é a coleta, a segunda é a preparação e por último o armazenamento que permite futuras análises. A última camada é composta geralmente por ferramentas de Dashboard. Sobre Dashboards, selecione a alternativa correta: A) Dashboards são ferramentas de mineração de dados que não dependem de um Data Warehouse para serem utilizadas. B) Sua tradução literal, painel, trata exatamente do que é. Por exemplo, em um cenário corporativo um Dashboard tem o mesmo objetivo de um painel de voo: mostrar tudo que está acontecendo em uma organização. 17 18 19 Uniasselvi © 2023 C) Dashboard são ferramentas utilizadas para armazenar dados em ambientes de Data Warehouse. D) Dashboard é onde acontece o L (Load) de uma etapa de ETL. Os Data Warehouses têm sido amplamente utilizados para armazenamento de dados em larga escala, principalmente quando oriundos de diversas fontes. O conceito de Data Warehouse permeia o meio acadêmico desde os anos 80, sendo um dos principais elementos na análise de dados. O conceito de Data Warehouse tem a paternidade dividida entre Ralph Kimball e Bill Imnon. Sobre o conceito de Data Warehouse selecione a alternativa correta: A) Não há diferença entre um Data Warehouse e um banco de dados transacional. B) Um Data Warehouse é um banco de dados NoSQL. C) Um Data Warehouse pode ser compreendido como um banco de dados com ênfase em transação, alimentado por diversas fontes. D) Um Data Warehouse pode ser compreendido como um banco de dados com ênfase em análise, alimentado por diversas fontes. 20 Voltar
Compartilhar