Buscar

Análise de Dados Usando Dashboards

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 15 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 15 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 15 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Na mais tradicional definição do conceito de um Data Warehouse, Inmon (2005) nos traz que as principais características de um Data Warehouse é uma coleção de dados:
●  orientado a um assunto;
● integrado;
● com tempo variável;
● não volátil.
 
No contexto de tal definição, assinale a alternativa correta sobre o que significa orientado a um assunto. 
A
 O assunto se refere a qual fonte de dados é mais importante para ser utilizada. 
B
 O termo assunto se refere ao fato de que sempre há mudanças nos dados e isso deve ser considerado em um Data Warehouse.
C
 O assunto e refere a um tema de análise, ou seja sob qual assunto as análises irão convergir. 
D
 O assunto se refere a qual ferramenta será utilizada, uma vez escolhida esta será a ferramenta.
O data warehouse deve ser desenhado para transpor os limites de cada um dos sistemas transacionais. Ele é construído para responder questões que não estão limitadas às transações ou aos sistemas individuais, apresentando, desta forma, uma visão integrada e completa dos negócios. Uma das técnicas utilizadas para se obter um modelo para o data warehouse que identifique e represente as informações importantes para o modelo de negócios é a modelagem dimensional ou multidimensional.
 
Na abordagem da literatura existem duas estratégias de modelagem multidimensional, assinale a alternativa CORRETA que contenha essas estratégias.
A
 Star Schema e Snowflake. 
B
 1FN, 2FN e 3FN. 
C
 SQL e SGBD. 
D
 Data Warehouse e Data Marts.
O estudo “A Universe of Opportunities and Challenges”, desenvolvido pela Consultoria EMC, aponta que de 2006 a 2010 o volume de dados digitais gerado cresceu de 166 exabytes para 988 exabytes. Assim, existe a perspectiva de que o volume de dados alcance a casa dos 40.000 exabytes, ou 40 zettabytes (ou 40 trilhões de gigabytes). Sendo a maioria desses dados não estruturados e semiestruturados.
 
No que se refere aos tipos de dados, as imagens são: 
A
 Dados não estruturados. 
B
 Dados estruturados. 
C
 Dados do tipo NoSQL.
D
 Dados semiestruturados. 
As informações mais importantes da sua organização devem estar sempre disponíveis de forma rápida e prática. Com uma boa ferramenta de Business Intelligence, é possível visualizar claramente as demandas problemáticas para o seu negócio. Por meio das plataformas é possível configurar rapidamente a sua ferramenta de BI e a exibição das informações consolidadas na forma de Dashboards.
 
Selecione a alternativa correta que contenha ferramentas de Dashboards. 
A
 Pentaho Data Integration, Tableau, Power Bi, ETL. 
B
 Pentaho Business, Tableau, Power Bi, Qlik. 
C
 Pentaho Business, Pentaho Data Integration e PostgreSQL. 
D
 SQL Server, MySQL, PostgreSQL e Oracle.
Os Data Warehouses têm sido amplamente utilizados para armazenamento de dados em larga escala, principalmente quando oriundos de diversas fontes. O conceito de Data Warehouse permeia o meio acadêmico desde os anos 80, sendo um dos principais elementos na análise de dados. O conceito de Data Warehouse tem a paternidade dividida entre Ralph Kimball e Bill Imnon.
 
Sobre o conceito de Data Warehouse selecione a alternativa correta: 
A
 Um Data Warehouse pode ser compreendido como um banco de dados com ênfase em transação, alimentado por diversas fontes.
B
 Um Data Warehouse é um banco de dados NoSQL. 
C
 Não há diferença entre um Data Warehouse e um banco de dados transacional. 
D
 Um Data Warehouse pode ser compreendido como um banco de dados com ênfase em análise, alimentado por diversas fontes.
O IDC (International Data Corporation) realizou um estudo intitulado “O universo digital das oportunidades: riquezas de dados e valor crescente da internet das coisas”, com pesquisa e análise da IDC, foi reportado que no ano de 2013 havia um conjunto composto por 4,4 trilhões de gigabytes (ou 4,4 zettabytes) de informação. Utilizando diversos conjuntos de métricas e análises, o instituto realizou uma previsão que o mundo saltará para 44 trilhões de gigabytes (44 zettabytes) em 2020 e que 10% desse volume de dados corresponderá à internet das coisas.
 
Sobre o volume de informações, analise as assertivas a seguir:
 
( ) Nesse contexto não é necessário se preocupar com armazenamento de dados.
 
( ) O grande desafio é buscar alternativas para armazenar e processar estes dados, gerando informação e conhecimento.
 
( ) Para resolver os problemas de dados em excesso, basta aumentar o tamanho do disco.
 
( ) O caso mais conhecido da análise de dados e geração de conhecimento para a tomada de decisão é o caso da fralda e da cerveja. 
A
 F, V, F, V. 
B
 V, V, V, F. 
C
 V, V, F, F.
D
 V, V, V, V. 
Em ambientes de Data Warehouse, nos quais se têm as análises como principal objetivo, serão realizadas operações OLAP (Online Analytical Processing – Processamento Analítico On-line). De maneira simples, OLAP é a capacidade do sistema processar os dados analiticamente, explorando a multidimensionalidade do banco de dados em que os dados estão armazenados. O foco da realização de operações OLAP é o processamento on-line de dados com foco em análise para tarefas de tomada de decisão.
 
No que se refere a estas implementações, elas podem ser ROLAP, MOLAP e HOLAP. Selecione a alternativa CORRETA sobre o HOLAP. 
A
 Os servidores HOLAP adotam uma forma de armazenamento em dois níveis, um para dados densos, que são colocados em matrizes e outro para dados esparsos, que são alocados em tabelas. Ou seja, torna-se uma aplicação robusta integrando tanto matrizes quanto tabelas armazenando o modelo multidimensional, o que demanda um maior requisito de equipe para desenvolvê-lo. 
B
 Partindo do nome, nessa implementação, o servidor para manipular os dados será implementado utilizando um sistema gerenciador de banco de dados relacional.
C
 Esse tipo de OLAP não se refere à implementação do armazenamento, mas à distribuição de dados. Essa abordagem tem como objetivo otimizar as consultas através do armazenamento no computador do usuário. 
D
 Nessa implementação específica para a multidimensionalidade, para este fim e para isto armazenam e executam operações diretamente sobre uma matriz de dados. 
Segundo Date (2004), “Data Warehouse é um depósito de dados orientado por assunto, integrado, não volátil, variável com o tempo.
 
No contexto de tal definição, assinale a alternativa correta sobre o que significa integrado.
A
 O termo integrado se refere ao fato de que todo dado armazenado em um Data Warehouse não será excluído, e sim armazenado em decorrer do tempo. Em caso de exclusões na fonte, o mesmo não acontece em um Data Warehouse. 
B
 Um Data Warehouse pode integrar vários sistemas internos que usam SGBD e ao mesmo tempo integrar com redes sociais via JSON, fazendo dessa dinâmica nas fontes de dados sua principal característica, bem como um dos principais desafios. 
C
 O termo integrado l se refere a não poder haver alteração nas fontes de dados utilizadas para alimentar um data warehouse. 
D
 O Termo integrado l se refere às fontes de dados diversas e com baixa volatilidade.
De acordo com o especialista, estima-se que o número de aparelhos ligados à internet, em 2017, atinja os 8,4 mil milhões, o que representa um crescimento de 31% em relação a 2016, número que poderá chegar aos 20 mil milhões em 2020.
 
Selecione a alternativa CORRETA sobre o tipo de dados de um sistema gerenciador de bancos de dados relacionais. 
A
 Dados do tipo NoSQL.
B
 Dados semiestruturados. 
C
 Dados não estruturados. 
D
 Dados estruturados. 
software Pentaho é uma plataforma para criação de soluções de Business Intelligence (BI), que inclui recursos de geração de relatórios, integração e armazenamento de dados (datawarehousing), análise de informações (OLAP), painéis (dashboards) para controle gerencial e mineração de dados (Data Mining), constituindo o mais popular e poderoso sistema de BI software livre mundial. 
  
Sobre os componentes Pehtaho, selecione a alternativa CORRETA sobre o PAN:
A
 Um Pan é uma sequência operações. Ao contrário de uma transformação, que opera sobre as linhasde dados em paralelo, um spoon realiza operações completas, uma por uma. 
B
 O Pan é o programa que executa transformações. O Pan pode executar uma transformação a partir de qualquer uma destas origens. 
C
 O Pan é a biblioteca gráfica responsável por plotar os gráficos em um Dashboard.
D
 O Pan é a interface gráfica do Pentaho Data Integration, que facilita na concepção de rotinas e lógica ETL. 
Quando tratamos de análise de dados, é muito difícil que o termo business intelligence não apareça, afinal, faz parte do coração da análise de informações.
 
No que se refere ao business intelligence, assinale a alternativa correta: 
A
 Business Intelligence, ou Inteligência de Negócio, é uma ferramenta que tem origem na administração de empresas a partir de análise SWOT.
B
 Business Intelligence é uma ferramenta, um software utilizado para que gestores tomem decisões baseado em tomada de decisão. 
C
 Business Intelligence compõe a etapa de ETL de um Data Warehouse, sendo uma importante ferramenta para isso. 
D
 Business Intelligence é uma metodologia pela qual se estabelecem ferramentas para obter, organizar, analisar e prover acesso às informações necessárias aos tomadores de decisão das empresas para analisarem os fenômenos acerca de seus negócios 
Modelagem dimensional é uma das técnicas e conhecimentos mais utilizadas e mais importantes para modelar o Data Warehouse. Até para utilizar ferramentas, na parte de modelar os metadados ou cubos OLAP, você vai precisar entender de modelagem dimensional, a não ser que você utilize outro tipo de arquitetura de modelo de dados. Existem dois tipos de metodologias de modelagem de dados usadas no Data Warehouse, a Snowflake e a Star Schema, que é a mais utilizada.
 
Selecione a alternativa CORRETA que contenha os principais componentes do modelo multidimensional. 
A
 Corpus data e data lake.
B
 Data Warehouse e Data Marts.
C
 Tabelas de fato, as tabelas com dimensões e as métricas. 
D
 SGBD e SQL. 
Os Data Warehouse podem ser explorados por diversas perspectivas, ou seja, explorando a multidimensionalidade do modelo criado. O cubo de dados é uma representação abstrata da representação analítica dos dados armazenados multidimensionalmente. De modo simples, o cubo é uma metáfora visual. Os dados são vistos de acordo com as dimensões.
 
Selecione a alternativa CORRETA que contenha o conceito de cuboide. 
A
 Um cuboide é muito próximo do que é conhecido da modelagem tradicional de banco de dados, uma vez que durante sua construção são levadas em consideração as formas normais. 
B
 Um cuboide é uma combinação de dimensões, é uma maneira visual de compreender a análise multidimensional dos dados.um cuboide básico possui os dados mais detalhados, exceto os próprios dados de origem. 
C
 Um cuboide torna o carregamento dos dados menos complexo, mas o uso dessa estrutura para consulta é difícil, pois envolve muitas tabelas e junções.
D
 Um cuboide é uma ferramenta gráfica para modelagem de banco de dados. Existem diversos recursos, desde a simples modelagem e geração do banco de dados, até mesmo a conexão com engenharia reversa para diversos SGBDs. 
PostgreSQL começou a ser desenvolvido em 1986 e tem ganhado bastante destaque nos últimos anos, como o banco de dados que mais cresce no mercado. No encontro, ele mostrou as vantagens e desvantagens de utilizar o banco de dados Open Source, que ele considera o mais avançado do mundo. O PostgreSQL é um sistema gerenciador de banco de dados objeto relacional (SGBD), desenvolvido como projeto de código aberto.
 
Assinale a alternativa CORRETA, que contenha a definição correta de SGBD:
A
 São documentos XML utilizados para armazenar informação. 
B
 Sistemas Gerenciadores de Bancos de Dados, ou Sistemas Gerenciadores de Bancos de Dados Relacionais são, de maneira simples, um software que é responsável por gerenciar o acesso aos dados. O SGBD é responsável por fazer a interface entre os dados com aplicações e usuários, encapsulando-os, garantindo sua segurança e integridade. 
C
 São fatos e números que transmitem algo específico, mas que não são organizados de maneira formal. Assim não têm contexto, de modo geral, pode-se dizer que dados são a informação de uma maneira bruta. 
D
 Para que os SGBDS se tornem informação , eles devem ser contextualizados, categorizados, calculados e condensados, deste modo a informação são os dados organizados. De um modo geral, pode-se dizer que o conhecimento é quando se traz um sentido ao dado.
Após realizar a coleta e armazenamento dos dados em um data warehouse, as ferramentas de dashboards são utilizadas para extrair métricas e indicadores.
 
Selecione a alternativa correta sobre a definição de métrica. 
A
 As métricas são ferramentas que permitem extrair conhecimento, além do que é realizado pelas ferramentas de dashboard. 
B
 As métricas são medidas calculadas e são compostos pelas métricas. Estão um nível acima das métricas, pois possuem uma visão mais ampla e direcionada da realidade observada. 
C
 As métricas são as medidas brutas, atômicas e de simples composição. Em uma estrutura de Data Warehouse, são armazenados na tabela Fato e medem os descritivos salvos nas dimensões. 
D
 As métricas são dados brutos, antes de serem armazenados em um data warehouse.
As tecnologias em cloud têm dominado a rotina de todos nós. Tais plataformas que antes serviam apenas para armazenar arquivos na internet, permitem o armazenamento de dados e principalmente um conjunto de recursos para analisá-los.
 
Selecione a alternativa correta que contenha as ferramentas de cloud computing que permitem a criação de dashboards. 
A
 IBM Cognos Analytics, Amazon QuickSight, Google Data Studio. 
B
 Pentaho Data Integration, Tableau, Power Bi, ETL. 
C
 Pentaho Business, Tableau, Power Bi, Qlik. 
D
 Pentaho Business, Pentaho Data Integration e PostgreSQL.
As métricas são as medidas brutas, atômicas e de simples composição. Em uma estrutura de data warehouse são armazenados na tabela Fato e medem os descritivos salvos nas dimensões. Valores e quantidades são exemplos de formatos das métricas. Os indicadores de desempenho são medidas calculadas e são compostos pelas métricas. Estão um nível acima das métricas, pois possuem uma visão mais ampla e direcionada da realidade observada. 
 
Selecione a alternativa correta que contenha um exemplo de indicador de desempenho 
A
 Quantidade de Vendas. 
B
 Percentual de itens X vendidos em março de 2014.
C
 Quantidade de itens X.
D
 Percentual de itens. 
No modelo relacional, os dados são organizados em tabelas e cada dado armazenado tem um determinado tipo de dados associado. Por exemplo, se um dado é um nome será do tipo VARCHAR (que representa textos), se for um valor em reais R$ será do tipo DOUBLE (que representa números com casas decimais. São diversos os tipos de dados e isto pode variar da tecnologia que seu banco de dados, seja relacional ou multidimensional será implementado, para ter uma visão geral.
 
Na construção de um modelo de dados, as formas normais são de importante função para garantir a integridade dos dados. Selecione a alternativa CORRETA sobre a 1FN: 
A
 A primeira forma normal trata da atomicidade dos atributos, proibindo atributos compostos, multivalorados e relações aninhadas.
B
 A primeira forma normal está relacionada à chamada dependência transitiva, ou seja, um campo não deve depender de um outro campo “não chave”.
C
 A primeira forma normal é onde estão todas as outras formas normais.
D
 A primeira forma normal está relacionada à dependência funcional da chave primária. 
O mercado de gestão de dados – chamado pelo jargão de "big data & analytics" – deve movimentar US$ 4,2 bilhões, em 2019, no Brasil, o que representa um crescimento de "um dígito alto", segundo a International Data Corporation. A IDC avaliou que as empresas têm mostrado dificuldade para fazer uma gestão de dados eficiente e tirar proveito de ferramentas como acompanhamento de performance ou alerta de produtividade, por exemplo.
 
 Sobre BIG DATA assinale a alternativa CORRETA:A
 Big Data é um termo que tem como tradução literal mais próxima “grandes quantidades de dados” e é também o termo instituído pela IBM para determinar a grande quantidade de dados gerados pelos sistemas de informação. Geralmente, utiliza-se a combinação de volume, velocidade e variedade para chegar em Big Data.
B
 São fatos e números que transmitem algo específico, mas que não são organizados de maneira formal. Assim não têm contexto, de modo geral, pode-se dizer que dados são a informação de uma maneira bruta. 
C
 São, de maneira simples, um software que é responsável por gerenciar o acesso aos dados. O Big Data é responsável por fazer a interface entre os dados com aplicações e usuários, encapsulando-os, garantindo sua segurança e integridade.
D
 São bancos de dados analíticos, projetados para armazenar os dados de fontes diversas, já transformados e preparados para serem explorados por aplicações de tomada de decisão. 
JSON (JavaScript object Notation) é uma forma de armazenamento e transmissão de dados em formato de texto. Sua forma simples e compacta de estruturar informações tem ganhado espaço em aplicações em que o formato XML reinava até então como em aplicações web, por exemplo. A Google é uma das empresas que se destaca na utilização de JSON, tendo inclusive desenvolvido a biblioteca Gson, inicialmente para fins internos, que tem como finalidade a conversão de objetos Java em JSON.
 
Selecione a alternativa CORRETA sobre o tipo de dados de um documento JSON. 
A
 Dados do tipo NoSQL.
B
 Dados não estruturados. 
C
 Dados estruturados. 
D
 Dados semiestruturados. 
Na mais tradicional definição do conceito de um Data Warehouse, Inmon (2005) nos 
traz que as principais características de um Data Warehouse é uma coleção de dados:
 
?
 
 
orientado a um assunto;
 
?
 integrado;
 
?
 com tempo variável;
 
?
 não volátil.
 
 
 
No contexto de tal definição, assinale a alternativa correta sobre o que significa 
orientado a um assunto.
 
 
A
 
 
O assunto se refere a qual fonte de dados é mais importante para ser utilizada.
 
 
B
 
 
O termo assunto se refere ao fato de que sempre há mudanças n
os dados e isso deve ser 
considerado em um Data Warehouse.
 
C
 
 
O assunto e refere a um tema de análise, ou seja sob qual assunto as análises irão 
convergir.
 
 
D
 
 
O assunto se refere a qual ferramenta será utilizada, uma vez escolhida esta será a 
ferramenta.
 
 
 
 
 
O data warehouse deve ser desenhado para transpor os limites de cada um dos sistemas 
transacionais. Ele é construído para responder questões que não estão limitadas às 
transações ou aos sistemas individuais, apresentando, desta forma, uma visão integrada 
e completa dos negócios. Uma das técnicas utilizadas para se obter um modelo para o 
data warehouse que identifique e represente as informações importantes para o modelo 
de negócios é a modelagem dimensional ou multidimensional.
 
 
 
Na mais tradicional definição do conceito de um Data Warehouse, Inmon (2005) nos 
traz que as principais características de um Data Warehouse é uma coleção de dados: 
? orientado a um assunto; 
? integrado; 
? com tempo variável; 
? não volátil. 
 
No contexto de tal definição, assinale a alternativa correta sobre o que significa 
orientado a um assunto. 
A 
 O assunto se refere a qual fonte de dados é mais importante para ser utilizada. 
B 
 O termo assunto se refere ao fato de que sempre há mudanças nos dados e isso deve ser 
considerado em um Data Warehouse. 
C 
 O assunto e refere a um tema de análise, ou seja sob qual assunto as análises irão 
convergir. 
D 
 O assunto se refere a qual ferramenta será utilizada, uma vez escolhida esta será a 
ferramenta. 
 
 
 
 
O data warehouse deve ser desenhado para transpor os limites de cada um dos sistemas 
transacionais. Ele é construído para responder questões que não estão limitadas às 
transações ou aos sistemas individuais, apresentando, desta forma, uma visão integrada 
e completa dos negócios. Uma das técnicas utilizadas para se obter um modelo para o 
data warehouse que identifique e represente as informações importantes para o modelo 
de negócios é a modelagem dimensional ou multidimensional.

Outros materiais