Buscar

Análise de Dados Usando Dashboards

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1
No modelo relacional, os dados são organizados em tabelas e cada dado armazenado tem um determinado tipo de dados associado. Por exemplo, se um dado é um nome será do tipo VARCHAR (que representa textos), se for um valor em reais R$ será do tipo DOUBLE (que representa números com casas decimais. São diversos os tipos de dados e isto pode variar da tecnologia que seu banco de dados, seja relacional ou multidimensional será implementado, para ter uma visão geral.
 
Na construção de um modelo de dados, as formas normais são de importante função para garantir a integridade dos dados. Selecione a alternativa CORRETA sobre a 1FN: 
	
	A)  A primeira forma normal está relacionada à dependência funcional da chave primária. 
	
	B)  A primeira forma normal está relacionada à chamada dependência transitiva, ou seja, um campo não deve depender de um outro campo “não chave”.
	
	C)  A primeira forma normal é onde estão todas as outras formas normais.
	
	D)  A primeira forma normal trata da atomicidade dos atributos, proibindo atributos compostos, multivalorados e relações aninhadas.
2
JSON (JavaScript object Notation) é uma forma de armazenamento e transmissão de dados em formato de texto. Sua forma simples e compacta de estruturar informações tem ganhado espaço em aplicações em que o formato XML reinava até então como em aplicações web, por exemplo. A Google é uma das empresas que se destaca na utilização de JSON, tendo inclusive desenvolvido a biblioteca Gson, inicialmente para fins internos, que tem como finalidade a conversão de objetos Java em JSON.
 
Selecione a alternativa CORRETA sobre o tipo de dados de um documento JSON. 
	
	A)  Dados estruturados. 
	
	B)  Dados do tipo NoSQL.
	
	C)  Dados não estruturados. 
	
	D)  Dados semiestruturados. 
3
A startup do Data Warehouse, Yellowbrick Data, levantou US $ 81 milhões em uma série C de financiamento liderado pela DFJ Growth, com a participação do braço de VC da Alphabet, Menlo Ventures, Third Point Ventures, DFJ Growth, BMW i Ventures, IVP, Next47 e Threshold Ventures. O mercado mundial de data warehousing teria gerado mais de US $ 18 bilhões em 2017, um número que deve crescer para quase US $ 35 bilhões até 2025, segundo a Allied Market Research. Isso parece estar impulsionando o recente aumento nos investimentos em data warehousing.
 
Sobre Data Warehouse, selecione a alternativa CORRETA: 
	
	A)  São bancos de dados analíticos, projetados para armazenar os dados de fontes diversas, já transformados e preparados para serem explorados por aplicações de tomada de decisão. 
	
	B)  São, de maneira simples, um software que é responsável por gerenciar o acesso aos dados. O DW é responsável por fazer a interface entre os dados com aplicações e usuários, encapsulando-os, garantindo sua segurança e integridade.
	
	C)  São fatos e números que transmitem algo específico, mas que não são organizados de maneira formal. Assim não têm contexto, de modo geral, pode-se dizer que dados são a informação de uma maneira bruta. 
	
	D)  Surgiram nos anos 2000, a partir da ascensão de grandes empresas da internet como Amazon e Google, que cada vez mais produziam dados gradativamente, tendo a necessidade de escalabilidade em escrita e principalmente leitura de dados após o aumento de tecnologias voltadas à nuvem. 
4
O mercado de gestão de dados – chamado pelo jargão de "big data & analytics" – deve movimentar US$ 4,2 bilhões, em 2019, no Brasil, o que representa um crescimento de "um dígito alto", segundo a International Data Corporation. A IDC avaliou que as empresas têm mostrado dificuldade para fazer uma gestão de dados eficiente e tirar proveito de ferramentas como acompanhamento de performance ou alerta de produtividade, por exemplo.
 
 Sobre BIG DATA assinale a alternativa CORRETA:
	
	A)  São bancos de dados analíticos, projetados para armazenar os dados de fontes diversas, já transformados e preparados para serem explorados por aplicações de tomada de decisão. 
	
	B)  São fatos e números que transmitem algo específico, mas que não são organizados de maneira formal. Assim não têm contexto, de modo geral, pode-se dizer que dados são a informação de uma maneira bruta. 
	
	C)  São, de maneira simples, um software que é responsável por gerenciar o acesso aos dados. O Big Data é responsável por fazer a interface entre os dados com aplicações e usuários, encapsulando-os, garantindo sua segurança e integridade.
	
	D)  Big Data é um termo que tem como tradução literal mais próxima “grandes quantidades de dados” e é também o termo instituído pela IBM para determinar a grande quantidade de dados gerados pelos sistemas de informação. Geralmente, utiliza-se a combinação de volume, velocidade e variedade para chegar em Big Data.
5
De acordo com o especialista, estima-se que o número de aparelhos ligados à internet, em 2017, atinja os 8,4 mil milhões, o que representa um crescimento de 31% em relação a 2016, número que poderá chegar aos 20 mil milhões em 2020.
 
Selecione a alternativa CORRETA sobre o tipo de dados de um sistema gerenciador de bancos de dados relacionais. 
	
	A)  Dados semiestruturados. 
	
	B)  Dados não estruturados. 
	
	C)  Dados estruturados. 
	
	D)  Dados do tipo NoSQL.
6
As informações mais importantes da sua organização devem estar sempre disponíveis de forma rápida e prática. Com uma boa ferramenta de Business Intelligence, é possível visualizar claramente as demandas problemáticas para o seu negócio. Por meio das plataformas é possível configurar rapidamente a sua ferramenta de BI e a exibição das informações consolidadas na forma de Dashboards.
 
Selecione a alternativa correta que contenha ferramentas de Dashboards. 
	
	A)  Pentaho Data Integration, Tableau, Power Bi, ETL. 
	
	B)  SQL Server, MySQL, PostgreSQL e Oracle.
	
	C)  Pentaho Business, Pentaho Data Integration e PostgreSQL. 
	
	D)  Pentaho Business, Tableau, Power Bi, Qlik. 
7
O Pentaho Data Integration é o componente da suíte Pentaho usado para criar processos ETL que alimentam o banco de dados, o Pentaho é a suite mais madura da ferramenta e já possui mais de 10 anos de existência. Sua principal vantagem é a fácil integração a diferentes programas. Por ter código aberto, pode ser customizado de acordo com as necessidades de cada usuário. Para ficar ainda melhor, a aquisição ou licenciamento da sua versão Community é grátis, o que faz deste software uma das soluções mais viáveis do mercado, aliando baixo custo e bons resultados.
 
Sobre a suite pentaho selecione a alternativa CORRETA com componentes do Pentaho:
	
	A)  Google, IBM e Azure. 
	
	B)  Hadoop e Spark.
	
	C)  Cloudera e Hortonworks. 
	
	D)  Spoon, Jobs, Pan, Kitchen. 
8
Os Data Warehouses têm sido amplamente utilizados para armazenamento de dados em larga escala, principalmente quando oriundos de diversas fontes. O conceito de Data Warehouse permeia o meio acadêmico desde os anos 80, sendo um dos principais elementos na análise de dados. O conceito de Data Warehouse tem a paternidade dividida entre Ralph Kimball e Bill Imnon.
 
Sobre o conceito de Data Warehouse selecione a alternativa correta: 
	
	A)  Um Data Warehouse é um banco de dados NoSQL. 
	
	B)  Não há diferença entre um Data Warehouse e um banco de dados transacional. 
	
	C)  Um Data Warehouse pode ser compreendido como um banco de dados com ênfase em análise, alimentado por diversas fontes.
	
	D)  Um Data Warehouse pode ser compreendido como um banco de dados com ênfase em transação, alimentado por diversas fontes.
9
Após realizar a coleta e armazenamento dos dados em um data warehouse, as ferramentas de dashboards são utilizadas para extrair métricas e indicadores.
 
Selecione a alternativa correta sobre a definição de métrica. 
	
	A)  As métricas são medidas calculadas e são compostos pelas métricas. Estão um nível acima das métricas, pois possuem uma visão mais ampla e direcionada da realidade observada. 
	
	B)  As métricas são as medidas brutas, atômicas e de simples composição. Em uma estrutura de Data Warehouse, são armazenados natabela Fato e medem os descritivos salvos nas dimensões. 
	
	C)  As métricas são dados brutos, antes de serem armazenados em um data warehouse.
	
	D)  As métricas são ferramentas que permitem extrair conhecimento, além do que é realizado pelas ferramentas de dashboard. 
10
Durante a criação de Dashboards, mesmo existindo ferramentas muito poderosas para gerar dashboards, quando se conhece o cenário de dados pode-se chegar à conclusão que nenhuma atende à sua necessidade. Para isto, pode criar um dashboard utilizando alguma ou várias bibliotecas gráficas já existentes.
 
Selecione a alternativa correta que contenha bibliotecas web que podem auxiliar a criação de dashboards. 
	
	A)  Chart.js, P5.js, Total.js. 
	
	B)  Pentaho Business, Tableau, Power Bi, Qlik. 
	
	C)  Pentaho Data Integration, Tableau, Power Bi, ETL.
	
	D)  IBM Cognos Analytics, Amazon QuickSight,Google Data Studio. 
11
Segundo Date (2004), “Data Warehouse é um depósito de dados orientado por assunto, integrado, não volátil, variável com o tempo.
 
No contexto de tal definição, assinale a alternativa correta sobre o que significa integrado.
	
	A)  O termo integrado l se refere a não poder haver alteração nas fontes de dados utilizadas para alimentar um data warehouse. 
	
	B)  O Termo integrado l se refere às fontes de dados diversas e com baixa volatilidade.
	
	C)  Um Data Warehouse pode integrar vários sistemas internos que usam SGBD e ao mesmo tempo integrar com redes sociais via JSON, fazendo dessa dinâmica nas fontes de dados sua principal característica, bem como um dos principais desafios. 
	
	D)  O termo integrado se refere ao fato de que todo dado armazenado em um Data Warehouse não será excluído, e sim armazenado em decorrer do tempo. Em caso de exclusões na fonte, o mesmo não acontece em um Data Warehouse. 
12
Na mais tradicional definição do conceito de um Data Warehouse, Inmon (2005) nos traz que as principais características de um Data Warehouse é uma coleção de dados:
●  orientado a um assunto;
● integrado;
● com tempo variável;
● não volátil.
 
No contexto de tal definição, assinale a alternativa correta sobre o que significa orientado a um assunto. 
	
	A)  O assunto se refere a qual ferramenta será utilizada, uma vez escolhida esta será a ferramenta.
	
	B)  O assunto e refere a um tema de análise, ou seja sob qual assunto as análises irão convergir. 
	
	C)  O assunto se refere a qual fonte de dados é mais importante para ser utilizada. 
	
	D)  O termo assunto se refere ao fato de que sempre há mudanças nos dados e isso deve ser considerado em um Data Warehouse.
13Dashboard (ou “Painel de Controle” em livre tradução) mesmo não sabendo que era um, mas eu vou explicar melhor o que é essa ferramenta e suas vantagens no dia a dia. Dashboard nada mais é do que um painel que reúne todas as principais informações como métricas e KPIs facilitando a forma de visualização e compreensão dos seus dados, ajudando você a ter mais controle sobre os objetivos desejados. FONTE: . Acesso em: 27 jun. 2019. Sobre a ferramenta Tableau selecione a alternativa CORRETA:
	
	A)  O Tableau construiu seu produto na filosofia de “ver e explorar” os dados. Isso significa que o Tableau é projetado para criar imagens visuais interativas. Os recursos do Tableau foram implementados de tal forma que o usuário pode fazer uma pergunta sobre seus dados e receber uma resposta quase que imediata, manipulando as ferramentas disponíveis. 
	
	B)  É uma ferramenta desenvolvida pela Microsoft, que permite gerar relatórios dinâmicos junto ao MS Excel.
	
	C)  É uma suíte 100% open source, com recursos estão disponíveis componentes para execução de processos de ETL, que fazem carga de Data Warehouses, criação de relatórios pré-formatados e ad hoc, cubos OLAP. 
	
	D)  Mantido pela Hitchi, o Tableau é uma poderosa ferramenta de business intelligence do mercado, oferecendo muitos recursos: relatórios, tabelas dinâmicas de OLAP. 
14
PostgreSQL começou a ser desenvolvido em 1986 e tem ganhado bastante destaque nos últimos anos, como o banco de dados que mais cresce no mercado. No encontro, ele mostrou as vantagens e desvantagens de utilizar o banco de dados Open Source, que ele considera o mais avançado do mundo. O PostgreSQL é um sistema gerenciador de banco de dados objeto relacional (SGBD), desenvolvido como projeto de código aberto.
 
Assinale a alternativa CORRETA, que contenha a definição correta de SGBD:
	
	A)  São documentos XML utilizados para armazenar informação. 
	
	B)  Sistemas Gerenciadores de Bancos de Dados, ou Sistemas Gerenciadores de Bancos de Dados Relacionais são, de maneira simples, um software que é responsável por gerenciar o acesso aos dados. O SGBD é responsável por fazer a interface entre os dados com aplicações e usuários, encapsulando-os, garantindo sua segurança e integridade. 
	
	C)  Para que os SGBDS se tornem informação , eles devem ser contextualizados, categorizados, calculados e condensados, deste modo a informação são os dados organizados. De um modo geral, pode-se dizer que o conhecimento é quando se traz um sentido ao dado.
	
	D)  São fatos e números que transmitem algo específico, mas que não são organizados de maneira formal. Assim não têm contexto, de modo geral, pode-se dizer que dados são a informação de uma maneira bruta. 
15
As visualizações que vê no dashboard são denominadas mosaicos. Pode afixar os mosaicos num dashboard a partir de relatórios. As visualizações num dashboard são provenientes de relatórios e cada relatório baseia-se num conjunto de dados. Uma forma de pensar num dashboard é pensar numa entrada para os relatórios e conjuntos de dados subjacentes. Selecionar uma visualização leva-o ao relatório (e ao conjunto de dados) em que se baseia.
  
Selecione a alternativa INCORRETA que contenha exemplo de aplicações de Dashboards analíticos.
	
	A)  Departamento de recursos humanos: suportam a introdução do plano de participação nos lucros, por exemplo, o que certamente influencia a moral dos funcionários.
	
	B)  Exemplo de um dashboard de visão diária da web consegue rastrear o desempenho da internet por hora em relação a objetivos predeterminados para uma equipe de marketing digital. 
	
	C)  Departamento de fabricação: nele, um sistema de controle completamente novo pode ser implementado. É realmente um aspecto importante, e que antes era difícil de ser operado. A qualidade é fundamental no caso desse setor, e os painéis analíticos podem ser utilizados para estabelecer reuniões regulares de revisão de qualidade.
	
	D)  Departamento de atendimento: os painéis táticos fornecem habilidades de treinamento ampliadas, o que é importante durante a implementação de um novo software de help desk, por exemplo. 
16
A arquitetura de um Data Warehouse é composta pela estratégia de coleta, pré-processamento e análise dos dados. São diversas as arquiteturas propostas na literatura, as variações acontecem principalmente pelo fato de existirem variações nas formas e formatos de dados. As arquiteturas de Data Warehouse geralmente são compostas por: fontes provedoras, área de trabalho, área de apresentação de dados e ferramentas de acesso aos dados.
 
Selecione a alternativa CORRETA sobre a área de trabalho de um ambiente de Data Warehouse. 
	
	A)  Nesta camada são realizados os processos de integração das fontes de dados, bem como as transformações necessárias para armazenar os dados de acordo com o modelo definido para Data Warehouse. Nesta camada são realizados os principais procedimentos da chamada ETL (Extract, Transform and Load). 
	
	B)  Um ambiente de Data Warehouse tem como características a integração entre os dados, ou seja, eles são oriundos de diversas fontes. Esta camada contém todos os dados possíveis de serem armazenados no Data Warehouse (relacional, orientado a objetos, não estruturados, textual, web etc.) que possam ajudar a cumprir as tarefas de análise. 
	
	C)  Esta trata de um Data Warehouse em si, em que os dados já coletados e transformados serão armazenados em um banco dedados projetado a partir de um modelo multidimensional.
	
	D)  Esta é a camada em que as ferramentas de visualização fazendo uso do servidor OLAP submetem requisições de acesso aos dados armazenados. No que se refere ao objetivo do nosso livro, será nesta camada que os dados estarão prontos e as ferramentas de construção de Dashboards serão conectadas aos dados, permitindo a exploração e análises multidimensionais.
17
OLAP é uma ferramenta de Business Intelligence utilizada para apoiar as empresas na análise de suas informações, visando obter novos conhecimentos que são empregados na tomada de decisão. O termo OLAP refere-se a um conjunto de ferramentas voltadas para acesso e análise ad hoc de dados, com o objetivo final de transformar dados em informações capazes de dar suporte às decisões gerenciais de forma amigável e flexível ao usuário e em tempo hábil.
 
 
	
	A)  Slice, Dice, Insert e Update. 
	
	B)  Slice, Dice, Roll-up e Roll-Down. 
	
	C)  Insert, Update, Roll-up e Roll-Down.
	
	D)  Slice, Dice, Roll-up e Drill-Down.
18
Em um cenário de análise de dados a primeira etapa é a coleta, a segunda é a preparação e por último o armazenamento que permite futuras análises. A última camada é composta geralmente por ferramentas de Dashboard.
 
Sobre Dashboards, selecione a alternativa correta: 
	
	A)  Dashboards são ferramentas de mineração de dados que não dependem de um Data Warehouse para serem utilizadas.
	
	B)  Dashboard é onde acontece o L (Load) de uma etapa de ETL. 
	
	C)  Dashboard são ferramentas utilizadas para armazenar dados em ambientes de Data Warehouse. 
	
	D)  Sua tradução literal, painel, trata exatamente do que é. Por exemplo, em um cenário corporativo um Dashboard tem o mesmo objetivo de um painel de voo: mostrar tudo que está acontecendo em uma organização. 
19
As métricas são as medidas brutas, atômicas e de simples composição. Em uma estrutura de data warehouse são armazenados na tabela Fato e medem os descritivos salvos nas dimensões. Valores e quantidades são exemplos de formatos das métricas. Os indicadores de desempenho são medidas calculadas e são compostos pelas métricas. Estão um nível acima das métricas, pois possuem uma visão mais ampla e direcionada da realidade observada. 
 
Selecione a alternativa correta que contenha um exemplo de indicador de desempenho 
	
	A)  Percentual de itens X vendidos em março de 2014.
	
	B)  Quantidade de Vendas. 
	
	C)  Quantidade de itens X.
	
	D)  Percentual de itens. 
20
A solução Pentaho define-se a si mesma como uma plataforma de BI orientada para a solução e centrada em processos. Ou seja, não só apresenta os resultados de uma forma única e dando uma visão geral do estado da empresa, como implementa os próprios processos (workflow) para a resolução de problemas detectados e apresentados. A disponibilização da informação é feita via Web para que, de uma forma fácil, se consiga distribuir a informação pelos utilizadores, usando obviamente segurança e disponibilidade de conteúdos consoante o utilizador.
  
Sobre os componentes Pehtaho, selecione a alternativa CORRETA sobre o JOB:
	
	A)  Um job é a interface gráfica do Pentaho Data Integration, que facilita na concepção de rotinas e lógica ETL.
	
	B)  Um job é o programa que executa transformações. O Pan pode executar uma transformação a partir de qualquer uma destas origens. 
	
	C)  Um job é uma sequência operações. Ao contrário de uma transformação, que opera sobre as linhas de dados em paralelo, um job realiza operações completas, uma por uma. 
	
	D)  Um job é a biblioteca gráfica responsável por plotar os gráficos em um Dashboard.

Outros materiais