Buscar

ANÁLISE DE DADOS USANDO DASHBOARDS

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

PÓS EM GESTÃO COMERCIAL E INTELIGÊNCIA DE MERCADO 
Análise de Dados Usando Dashboards 
 
1) Os Data Warehouse podem ser explorados por diversas perspectivas, ou seja, 
explorando a multidimensionalidade do modelo criado. O cubo de dados é uma 
representação abstrata da representação analítica dos dados armazenados 
multidimensionalmente. De modo simples, o cubo é uma metáfora visual. Os dados 
são vistos de acordo com as dimensões. 
 
Selecione a alternativa CORRETA que contenha o conceito de cuboide. 
 
A) Um cuboide é uma ferramenta gráfica para modelagem de banco de dados. 
Existem diversos recursos, desde a simples modelagem e geração do banco de 
dados, até mesmo a conexão com engenharia reversa para diversos SGBDs. 
 
B) Um cuboide é muito próximo do que é conhecido da modelagem tradicional de 
banco de dados, uma vez que durante sua construção são levadas em consideração 
as formas normais. 
 
C) Um cuboide torna o carregamento dos dados menos complexo, mas o uso dessa 
estrutura para consulta é difícil, pois envolve muitas tabelas e junções. 
 
D) Um cuboide é uma combinação de dimensões, é uma maneira visual de 
compreender a análise multidimensional dos dados.um cuboide básico 
possui os dados mais detalhados, exceto os próprios dados de origem. 
 
2) Após realizar a coleta e armazenamento dos dados em um data warehouse, as 
ferramentas de dashboards são utilizadas para extrair métricas e indicadores. 
 
Selecione a alternativa correta sobre a definição de métrica. 
 
A) As métricas são medidas calculadas e são compostos pelas métricas. Estão um 
nível acima das métricas, pois possuem uma visão mais ampla e direcionada da 
realidade observada. 
 
B) As métricas são as medidas brutas, atômicas e de simples composição. Em 
uma estrutura de Data Warehouse, são armazenados na tabela Fato e 
medem os descritivos salvos nas dimensões. 
 
C) As métricas são ferramentas que permitem extrair conhecimento, além do que 
é realizado pelas ferramentas de dashboard. 
 
D) As métricas são dados brutos, antes de serem armazenados em um data 
warehouse. 
 
3) As tecnologias em cloud têm dominado a rotina de todos nós. Tais plataformas 
que antes serviam apenas para armazenar arquivos na internet, permitem o 
armazenamento de dados e principalmente um conjunto de recursos para analisá-
los. 
 
Selecione a alternativa correta que contenha as ferramentas de cloud computing 
que permitem a criação de dashboards. 
 
A) IBM Cognos Analytics, Amazon QuickSight, Google Data Studio. 
 
B) Pentaho Business, Pentaho Data Integration e PostgreSQL. 
 
C) Pentaho Business, Tableau, Power Bi, Qlik. 
 
D) Pentaho Data Integration, Tableau, Power Bi, ETL. 
4) O mercado de gestão de dados – chamado pelo jargão de "big data & analytics" – 
deve movimentar US$ 4,2 bilhões, em 2019, no Brasil, o que representa um 
crescimento de "um dígito alto", segundo a International Data Corporation. A IDC 
avaliou que as empresas têm mostrado dificuldade para fazer uma gestão de dados 
eficiente e tirar proveito de ferramentas como acompanhamento de performance 
ou alerta de produtividade, por exemplo. 
 
 Sobre BIG DATA assinale a alternativa CORRETA: 
 
A) São, de maneira simples, um software que é responsável por gerenciar o acesso 
aos dados. O Big Data é responsável por fazer a interface entre os dados com 
aplicações e usuários, encapsulando-os, garantindo sua segurança e integridade. 
 
B) São bancos de dados analíticos, projetados para armazenar os dados de fontes 
diversas, já transformados e preparados para serem explorados por aplicações de 
tomada de decisão. 
 
C) São fatos e números que transmitem algo específico, mas que não são 
organizados de maneira formal. Assim não têm contexto, de modo geral, pode-se 
dizer que dados são a informação de uma maneira bruta. 
 
D) Big Data é um termo que tem como tradução literal mais próxima 
“grandes quantidades de dados” e é também o termo instituído pela IBM 
para determinar a grande quantidade de dados gerados pelos sistemas de 
informação. Geralmente, utiliza-se a combinação de volume, velocidade e 
variedade para chegar em Big Data. 
 
5) Em ambientes de Data Warehouse, nos quais se têm as análises como principal 
objetivo, serão realizadas operações OLAP (Online Analytical Processing – 
Processamento Analítico On-line). De maneira simples, OLAP é a capacidade do 
sistema processar os dados analiticamente, explorando a multidimensionalidade 
do banco de dados em que os dados estão armazenados. O foco da realização de 
operações OLAP é o processamento on-line de dados com foco em análise para 
tarefas de tomada de decisão. 
 
No que se refere a estas implementações, elas podem ser ROLAP, MOLAP e HOLAP. 
Selecione a alternativa CORRETA sobre o HOLAP. 
 
A) Nessa implementação específica para a multidimensionalidade, para este fim e 
para isto armazenam e executam operações diretamente sobre uma matriz de 
dados. 
 
B) Esse tipo de OLAP não se refere à implementação do armazenamento, mas à 
distribuição de dados. Essa abordagem tem como objetivo otimizar as consultas 
através do armazenamento no computador do usuário. 
 
C) Partindo do nome, nessa implementação, o servidor para manipular os dados 
será implementado utilizando um sistema gerenciador de banco de dados 
relacional. 
 
D) Os servidores HOLAP adotam uma forma de armazenamento em dois 
níveis, um para dados densos, que são colocados em matrizes e outro para 
dados esparsos, que são alocados em tabelas. Ou seja, torna-se uma 
aplicação robusta integrando tanto matrizes quanto tabelas armazenando o 
modelo multidimensional, o que demanda um maior requisito de equipe 
para desenvolvê-lo. 
6) O IDC (International Data Corporation) realizou um estudo intitulado “O 
universo digital das oportunidades: riquezas de dados e valor crescente da internet 
das coisas”, com pesquisa e análise da IDC, foi reportado que no ano de 2013 havia 
um conjunto composto por 4,4 trilhões de gigabytes (ou 4,4 zettabytes) de 
informação. Utilizando diversos conjuntos de métricas e análises, o instituto 
realizou uma previsão que o mundo saltará para 44 trilhões de gigabytes (44 
zettabytes) em 2020 e que 10% desse volume de dados corresponderá à internet 
das coisas. 
 
Sobre o volume de informações, analise as assertivas a seguir: 
 
( ) Nesse contexto não é necessário se preocupar com armazenamento de dados. 
 
( ) O grande desafio é buscar alternativas para armazenar e processar estes dados, 
gerando informação e conhecimento. 
 
( ) Para resolver os problemas de dados em excesso, basta aumentar o tamanho do 
disco. 
 
( ) O caso mais conhecido da análise de dados e geração de conhecimento para a 
tomada de decisão é o caso da fralda e da cerveja. 
 
A) V, V, F, F. 
 
B) F, V, F, V. 
 
C) V, V, V, F. 
 
D) V, V, V, V. 
 
7) As informações mais importantes da sua organização devem estar sempre 
disponíveis de forma rápida e prática. Com uma boa ferramenta de Business 
Intelligence, é possível visualizar claramente as demandas problemáticas para o 
seu negócio. Por meio das plataformas é possível configurar rapidamente a sua 
ferramenta de BI e a exibição das informações consolidadas na forma de 
Dashboards. 
 
Selecione a alternativa correta que contenha ferramentas de Dashboards. 
 
A) Pentaho Data Integration, Tableau, Power Bi, ETL. 
 
B) SQL Server, MySQL, PostgreSQL e Oracle. 
 
C) Pentaho Business, Tableau, Power Bi, Qlik. 
 
D) Pentaho Business, Pentaho Data Integration e PostgreSQL. 
 
8) PostgreSQL começou a ser desenvolvido em 1986 e tem ganhado bastante 
destaque nos últimos anos, como o banco de dados que mais cresce no mercado. 
No encontro, ele mostrou as vantagens e desvantagens de utilizar o banco de dados 
Open Source, que ele considera o mais avançado do mundo. O PostgreSQL é um 
sistema gerenciador de banco de dados objeto relacional (SGBD), desenvolvido 
como projeto de código aberto. 
 
Assinale a alternativaCORRETA, que contenha a definição correta de SGBD: 
 
A) Sistemas Gerenciadores de Bancos de Dados, ou Sistemas Gerenciadores 
de Bancos de Dados Relacionais são, de maneira simples, um software que é 
responsável por gerenciar o acesso aos dados. O SGBD é responsável por 
fazer a interface entre os dados com aplicações e usuários, encapsulando-os, 
garantindo sua segurança e integridade. 
 
B) São documentos XML utilizados para armazenar informação. 
 
C) São fatos e números que transmitem algo específico, mas que não são 
organizados de maneira formal. Assim não têm contexto, de modo geral, pode-se 
dizer que dados são a informação de uma maneira bruta. 
 
D) Para que os SGBDS se tornem informação , eles devem ser contextualizados, 
categorizados, calculados e condensados, deste modo a informação são os dados 
organizados. De um modo geral, pode-se dizer que o conhecimento é quando se 
traz um sentido ao dado. 
 
9) No modelo relacional, os dados são organizados em tabelas e cada dado 
armazenado tem um determinado tipo de dados associado. Por exemplo, se um 
dado é um nome será do tipo VARCHAR (que representa textos), se for um valor 
em reais R$ será do tipo DOUBLE (que representa números com casas decimais. 
São diversos os tipos de dados e isto pode variar da tecnologia que seu banco de 
dados, seja relacional ou multidimensional será implementado, para ter uma visão 
geral. 
 
Na construção de um modelo de dados, as formas normais são de importante 
função para garantir a integridade dos dados. Selecione a alternativa CORRETA 
sobre a 1FN: 
 
A) A primeira forma normal é onde estão todas as outras formas normais. 
 
B) A primeira forma normal trata da atomicidade dos atributos, proibindo 
atributos compostos, multivalorados e relações aninhadas. 
 
C) A primeira forma normal está relacionada à dependência funcional da chave 
primária. 
 
D) A primeira forma normal está relacionada à chamada dependência transitiva, 
ou seja, um campo não deve depender de um outro campo “não chave”. 
 
10) A arquitetura de um Data Warehouse é composta pela estratégia de coleta, 
pré-processamento e análise dos dados. São diversas as arquiteturas propostas na 
literatura, as variações acontecem principalmente pelo fato de existirem variações 
nas formas e formatos de dados. As arquiteturas de Data Warehouse geralmente 
são compostas por: fontes provedoras, área de trabalho, área de apresentação de 
dados e ferramentas de acesso aos dados. 
 
Selecione a alternativa CORRETA sobre a área de trabalho de um ambiente de Data 
Warehouse. 
 
A) Esta é a camada em que as ferramentas de visualização fazendo uso do 
servidor OLAP submetem requisições de acesso aos dados armazenados. No que 
se refere ao objetivo do nosso livro, será nesta camada que os dados estarão 
prontos e as ferramentas de construção de Dashboards serão conectadas aos 
dados, permitindo a exploração e análises multidimensionais. 
 
B) Nesta camada são realizados os processos de integração das fontes de 
dados, bem como as transformações necessárias para armazenar os dados 
de acordo com o modelo definido para Data Warehouse. Nesta camada são 
realizados os principais procedimentos da chamada ETL (Extract, Transform 
and Load). 
 
C) Um ambiente de Data Warehouse tem como características a integração entre 
os dados, ou seja, eles são oriundos de diversas fontes. Esta camada contém todos 
os dados possíveis de serem armazenados no Data Warehouse (relacional, 
orientado a objetos, não estruturados, textual, web etc.) que possam ajudar a 
cumprir as tarefas de análise. 
 
D) Esta trata de um Data Warehouse em si, em que os dados já coletados e 
transformados serão armazenados em um banco de dados projetado a partir de 
um modelo multidimensional. 
 
11) De acordo com o especialista, estima-se que o número de aparelhos ligados à 
internet, em 2017, atinja os 8,4 mil milhões, o que representa um crescimento de 
31% em relação a 2016, número que poderá chegar aos 20 mil milhões em 2020. 
 
Selecione a alternativa CORRETA sobre o tipo de dados de um sistema gerenciador 
de bancos de dados relacionais. 
 
A) Dados do tipo NoSQL. 
 
B) Dados estruturados. 
 
C) Dados semiestruturados. 
 
D) Dados não estruturados. 
 
12) Segundo INMON (2005), um Data Warehouse é uma coleção de dados, 
orientado a um assunto, integrado, com tempo variável e não volátil; este banco de 
dados é desenvolvido para suporte ao gerenciamento dos processos de tomada de 
decisão. 
 
No contexto de tal definição, assinale a alternativa correta sobre o que significa não 
volátil. 
 
A) O termo não volátil se refere porque as fontes de dados são diversas e com 
baixa volatilidade. 
 
B) O termo não volátil se refere ao fato de que sempre há mudanças nos dados e 
isso deve ser considerado em um Data Warehouse. 
 
C) O termo não volátil se refere a não poder haver alteração nas fontes de dados 
utilizadas para alimentar um data warehouse. 
 
D) O termo não volátil se refere ao fato de que todo dado armazenado em 
um Data Warehouse não será excluído, e sim armazenado em decorrer do 
tempo. Em caso de exclusões na fonte o mesmo não acontece em um Data 
Warehouse. 
 
13) Na mais tradicional definição do conceito de um Data Warehouse, Inmon 
(2005) nos traz que as principais características de um Data Warehouse é uma 
coleção de dados: 
● orientado a um assunto; 
● integrado; 
● com tempo variável; 
● não volátil. 
 
No contexto de tal definição, assinale a alternativa correta sobre o que significa 
orientado a um assunto. 
 
A) O termo assunto se refere ao fato de que sempre há mudanças nos dados e isso 
deve ser considerado em um Data Warehouse. 
 
B) O assunto se refere a qual fonte de dados é mais importante para ser utilizada. 
 
C) O assunto e refere a um tema de análise, ou seja sob qual assunto as 
análises irão convergir. 
 
D) O assunto se refere a qual ferramenta será utilizada, uma vez escolhida esta 
será a ferramenta. 
 
14) O software Pentaho é uma plataforma para criação de soluções de Business 
Intelligence (BI), que inclui recursos de geração de relatórios, integração e 
armazenamento de dados (datawarehousing), análise de informações (OLAP), 
painéis (dashboards) para controle gerencial e mineração de dados (Data Mining), 
constituindo o mais popular e poderoso sistema de BI software livre mundial. 
 
Sobre os componentes Pehtaho, selecione a alternativa CORRETA sobre o PAN: 
 
A) O Pan é a biblioteca gráfica responsável por plotar os gráficos em um 
Dashboard. 
 
B) Um Pan é uma sequência operações. Ao contrário de uma transformação, que 
opera sobre as linhas de dados em paralelo, um spoon realiza operações 
completas, uma por uma. 
 
C) O Pan é a interface gráfica do Pentaho Data Integration, que facilita na 
concepção de rotinas e lógica ETL. 
 
D) O Pan é o programa que executa transformações. O Pan pode executar 
uma transformação a partir de qualquer uma destas origens. 
 
15) Quando tratamos de análise de dados, é muito difícil que o termo business 
intelligence não apareça, afinal, faz parte do coração da análise de informações. 
 
No que se refere ao business intelligence, assinale a alternativa correta: 
 
A) Business Intelligence é uma metodologia pela qual se estabelecem 
ferramentas para obter, organizar, analisar e prover acesso às informações 
necessárias aos tomadores de decisão das empresas para analisarem os 
fenômenos acerca de seus negócios 
 
B) Business Intelligence é uma ferramenta, um software utilizado para que 
gestores tomem decisões baseado em tomada de decisão. 
 
C) Business Intelligence, ou Inteligência de Negócio, é uma ferramenta que tem 
origem na administração de empresas a partir de análise SWOT. 
 
D) Business Intelligence compõe a etapa de ETL de um Data Warehouse, sendo 
uma importante ferramenta para isso. 
 
16) Em um cenário de análise de dados a primeira etapa é a coleta, a segunda é a 
preparação e por último oarmazenamento que permite futuras análises. A última 
camada é composta geralmente por ferramentas de Dashboard. 
 
Sobre Dashboards, selecione a alternativa correta: 
 
A) Sua tradução literal, painel, trata exatamente do que é. Por exemplo, em 
um cenário corporativo um Dashboard tem o mesmo objetivo de um painel 
de voo: mostrar tudo que está acontecendo em uma organização. 
 
B) Dashboards são ferramentas de mineração de dados que não dependem de um 
Data Warehouse para serem utilizadas. 
 
C) Dashboard é onde acontece o L (Load) de uma etapa de ETL. 
 
D) Dashboard são ferramentas utilizadas para armazenar dados em ambientes de 
Data Warehouse. 
 
17) O data warehouse deve ser desenhado para transpor os limites de cada um dos 
sistemas transacionais. Ele é construído para responder questões que não estão 
limitadas às transações ou aos sistemas individuais, apresentando, desta forma, 
uma visão integrada e completa dos negócios. Uma das técnicas utilizadas para se 
obter um modelo para o data warehouse que identifique e represente as 
informações importantes para o modelo de negócios é a modelagem dimensional 
ou multidimensional. 
 
Na abordagem da literatura existem duas estratégias de modelagem 
multidimensional, assinale a alternativa CORRETA que contenha essas estratégias. 
 
A) Star Schema e Snowflake. 
 
B) 1FN, 2FN e 3FN. 
 
C) Data Warehouse e Data Marts. 
 
D) SQL e SGBD. 
 
18) Modelagem dimensional é uma das técnicas e conhecimentos mais utilizadas e 
mais importantes para modelar o Data Warehouse. Até para utilizar ferramentas, 
na parte de modelar os metadados ou cubos OLAP, você vai precisar entender de 
modelagem dimensional, a não ser que você utilize outro tipo de arquitetura de 
modelo de dados. Existem dois tipos de metodologias de modelagem de dados 
usadas no Data Warehouse, a Snowflake e a Star Schema, que é a mais utilizada. 
 
Selecione a alternativa CORRETA que contenha os principais componentes do 
modelo multidimensional. 
 
A) Data Warehouse e Data Marts. 
 
B) SGBD e SQL. 
 
C) Tabelas de fato, as tabelas com dimensões e as métricas. 
 
D) Corpus data e data lake. 
 
19) O estudo “A Universe of Opportunities and Challenges”, desenvolvido pela 
Consultoria EMC, aponta que de 2006 a 2010 o volume de dados digitais gerado 
cresceu de 166 exabytes para 988 exabytes. Assim, existe a perspectiva de que o 
volume de dados alcance a casa dos 40.000 exabytes, ou 40 zettabytes (ou 40 
trilhões de gigabytes). Sendo a maioria desses dados não estruturados e 
semiestruturados. 
 
No que se refere aos tipos de dados, as imagens são: 
 
A) Dados não estruturados. 
 
B) Dados estruturados. 
 
C) Dados semiestruturados. 
 
D) Dados do tipo NoSQL. 
 
20) As métricas são as medidas brutas, atômicas e de simples composição. Em uma 
estrutura de data warehouse são armazenados na tabela Fato e medem os 
descritivos salvos nas dimensões. Valores e quantidades são exemplos de formatos 
das métricas. Os indicadores de desempenho são medidas calculadas e são 
compostos pelas métricas. Estão um nível acima das métricas, pois possuem uma 
visão mais ampla e direcionada da realidade observada. 
 
Selecione a alternativa correta que contenha um exemplo de indicador de 
desempenho 
 
A) Quantidade de Vendas. 
 
B) Quantidade de itens X. 
 
C) Percentual de itens X vendidos em março de 2014. 
 
D) Percentual de itens.

Outros materiais