Buscar

Prova Análise de dados usando Dashboards

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1 JSON (JavaScript object Notation) é uma forma de armazenamento e transmissão de 
dados em formato de texto. Sua forma simples e compacta de estruturar informações tem 
ganhado espaço em aplicações em que o formato XML reinava até então como em 
aplicações web, por exemplo. A Google é uma das empresas que se destaca na utilização 
de JSON, tendo inclusive desenvolvido a biblioteca Gson, inicialmente para fins internos, 
que tem como finalidade a conversão de objetos Java em JSON. 
 
Selecione a alternativa CORRETA sobre o tipo de dados de um documento JSON. 
A) Dados do tipo NoSQL. 
B) Dados semiestruturados. 
C) Dados estruturados. 
D) Dados não estruturados. 
 
2 Dashboard (ou “Painel de Controle” em livre tradução) mesmo não sabendo que era um, 
mas eu vou explicar melhor o que é essa ferramenta e suas vantagens no dia a dia. 
Dashboard nada mais é do que um painel que reúne todas as principais informações como 
métricas e KPIs facilitando a forma de visualização e compreensão dos seus dados, 
ajudando você a ter mais controle sobre os objetivos desejados. FONTE: . Acesso em: 27 
jun. 2019. Sobre a ferramenta Tableau selecione a alternativa CORRETA: 
A) Mantido pela Hitchi, o Tableau é uma poderosa ferramenta de business 
intelligence do mercado, oferecendo muitos recursos: relatórios, tabelas dinâmicas de 
OLAP. 
B) É uma ferramenta desenvolvida pela Microsoft, que permite gerar relatórios 
dinâmicos junto ao MS Excel. 
C) É uma suíte 100% open source, com recursos estão disponíveis componentes 
para execução de processos de ETL, que fazem carga de Data Warehouses, criação de 
relatórios pré-formatados e ad hoc, cubos OLAP. 
D) O Tableau construiu seu produto na filosofia de “ver e explorar” os dados. Isso 
significa que o Tableau é projetado para criar imagens visuais interativas. Os recursos do 
Tableau foram implementados de tal forma que o usuário pode fazer uma pergunta sobre 
seus dados e receber uma resposta quase que imediata, manipulando as ferramentas 
disponíveis. 
 
3 O software Pentaho é uma plataforma para criação de soluções de Business Intelligence 
(BI), que inclui recursos de geração de relatórios, integração e armazenamento de dados 
(datawarehousing), análise de informações (OLAP), painéis (dashboards) para controle 
gerencial e mineração de dados (Data Mining), constituindo o mais popular e poderoso 
sistema de BI software livre mundial. 
 
Sobre os componentes Pehtaho, selecione a alternativa CORRETA sobre o PAN: 
A) Um Pan é uma sequência operações. Ao contrário de uma transformação, que 
opera sobre as linhas de dados em paralelo, um spoon realiza operações completas, uma 
por uma. 
B) O Pan é a interface gráfica do Pentaho Data Integration, que facilita na concepção 
de rotinas e lógica ETL. 
C) O Pan é a biblioteca gráfica responsável por plotar os gráficos em um Dashboard. 
D) O Pan é o programa que executa transformações. O Pan pode executar uma 
transformação a partir de qualquer uma destas origens. 
 
4 Em um cenário de análise de dados a primeira etapa é a coleta, a segunda é a 
preparação e por último o armazenamento que permite futuras análises. A última camada 
é composta geralmente por ferramentas de Dashboard. 
 
Sobre Dashboards, selecione a alternativa correta: 
A) Sua tradução literal, painel, trata exatamente do que é. Por exemplo, em um 
cenário corporativo um Dashboard tem o mesmo objetivo de um painel de voo: mostrar 
tudo que está acontecendo em uma organização. 
B) Dashboards são ferramentas de mineração de dados que não dependem de um 
Data Warehouse para serem utilizadas. 
C) Dashboard são ferramentas utilizadas para armazenar dados em ambientes de 
Data Warehouse. 
D) Dashboard é onde acontece o L (Load) de uma etapa de ETL. 
 
5 As informações mais importantes da sua organização devem estar sempre disponíveis 
de forma rápida e prática. Com uma boa ferramenta de Business Intelligence, é possível 
visualizar claramente as demandas problemáticas para o seu negócio. Por meio das 
plataformas é possível configurar rapidamente a sua ferramenta de BI e a exibição das 
informações consolidadas na forma de Dashboards. 
 
Selecione a alternativa correta que contenha ferramentas de Dashboards. 
A) Pentaho Business, Pentaho Data Integration e PostgreSQL. 
B) Pentaho Data Integration, Tableau, Power Bi, ETL. 
C) Pentaho Business, Tableau, Power Bi, Qlik. 
D) SQL Server, MySQL, PostgreSQL e Oracle. 
 
6 A arquitetura de um Data Warehouse é composta pela estratégia de coleta, pré-
processamento e análise dos dados. São diversas as arquiteturas propostas na literatura, 
as variações acontecem principalmente pelo fato de existirem variações nas formas e 
formatos de dados. As arquiteturas de Data Warehouse geralmente são compostas por: 
fontes provedoras, área de trabalho, área de apresentação de dados e ferramentas de 
acesso aos dados. 
 
Selecione a alternativa CORRETA sobre a área de trabalho de um ambiente de Data 
Warehouse. 
A) Esta é a camada em que as ferramentas de visualização fazendo uso do servidor 
OLAP submetem requisições de acesso aos dados armazenados. No que se refere ao 
objetivo do nosso livro, será nesta camada que os dados estarão prontos e as ferramentas 
de construção de Dashboards serão conectadas aos dados, permitindo a exploração e 
análises multidimensionais. 
B) Um ambiente de Data Warehouse tem como características a integração entre os 
dados, ou seja, eles são oriundos de diversas fontes. Esta camada contém todos os dados 
possíveis de serem armazenados no Data Warehouse (relacional, orientado a objetos, não 
estruturados, textual, web etc.) que possam ajudar a cumprir as tarefas de análise. 
C) Esta trata de um Data Warehouse em si, em que os dados já coletados e 
transformados serão armazenados em um banco de dados projetado a partir de um 
modelo multidimensional. 
D) Nesta camada são realizados os processos de integração das fontes de dados, 
bem como as transformações necessárias para armazenar os dados de acordo com o 
modelo definido para Data Warehouse. Nesta camada são realizados os principais 
procedimentos da chamada ETL (Extract, Transform and Load). 
 
7 De acordo com o especialista, estima-se que o número de aparelhos ligados à internet, 
em 2017, atinja os 8,4 mil milhões, o que representa um crescimento de 31% em relação a 
2016, número que poderá chegar aos 20 mil milhões em 2020. 
 
Selecione a alternativa CORRETA sobre o tipo de dados de um sistema gerenciador de 
bancos de dados relacionais. 
A) Dados estruturados. 
B) Dados não estruturados. 
C) Dados semiestruturados. 
D) Dados do tipo NoSQL. 
 
8 O IDC (International Data Corporation) realizou um estudo intitulado “O universo digital 
das oportunidades: riquezas de dados e valor crescente da internet das coisas”, com 
pesquisa e análise da IDC, foi reportado que no ano de 2013 havia um conjunto composto 
por 4,4 trilhões de gigabytes (ou 4,4 zettabytes) de informação. Utilizando diversos 
conjuntos de métricas e análises, o instituto realizou uma previsão que o mundo saltará 
para 44 trilhões de gigabytes (44 zettabytes) em 2020 e que 10% desse volume de dados 
corresponderá à internet das coisas. 
 
Sobre o volume de informações, analise as assertivas a seguir: 
 
( ) Nesse contexto não é necessário se preocupar com armazenamento de dados. 
 
( ) O grande desafio é buscar alternativas para armazenar e processar estes dados, 
gerando informação e conhecimento. 
 
( ) Para resolver os problemas de dados em excesso, basta aumentar o tamanho do disco. 
 
( ) O caso mais conhecido da análise de dados e geração de conhecimento para a tomada 
de decisão é o caso da fralda e da cerveja. 
A) V, V, F, F. 
B) V, V, V, F. 
C) F, V, F, V. 
D) V, V, V, V. 
 
9 As métricas são as medidas brutas, atômicas e de simples composição. Em uma 
estrutura de data warehouse são armazenados na tabela Fato e medem os descritivos 
salvos nas dimensões. Valorese quantidades são exemplos de formatos das métricas. Os 
indicadores de desempenho são medidas calculadas e são compostos pelas métricas. 
Estão um nível acima das métricas, pois possuem uma visão mais ampla e direcionada da 
realidade observada. 
 
Selecione a alternativa correta que contenha um exemplo de indicador de desempenho 
A) Quantidade de Vendas. 
B) Percentual de itens X vendidos em março de 2014. 
C) Percentual de itens. 
D) Quantidade de itens X. 
 
10 O Pentaho Data Integration é o componente da suíte Pentaho usado para criar 
processos ETL que alimentam o banco de dados, o Pentaho é a suite mais madura da 
ferramenta e já possui mais de 10 anos de existência. Sua principal vantagem é a fácil 
integração a diferentes programas. Por ter código aberto, pode ser customizado de acordo 
com as necessidades de cada usuário. Para ficar ainda melhor, a aquisição ou 
licenciamento da sua versão Community é grátis, o que faz deste software uma das 
soluções mais viáveis do mercado, aliando baixo custo e bons resultados. 
 
Sobre a suite pentaho selecione a alternativa CORRETA com componentes do Pentaho: 
A) Cloudera e Hortonworks. 
B) Hadoop e Spark. 
C) Spoon, Jobs, Pan, Kitchen. 
D) Google, IBM e Azure. 
 
11 PostgreSQL começou a ser desenvolvido em 1986 e tem ganhado bastante destaque 
nos últimos anos, como o banco de dados que mais cresce no mercado. No encontro, ele 
mostrou as vantagens e desvantagens de utilizar o banco de dados Open Source, que ele 
considera o mais avançado do mundo. O PostgreSQL é um sistema gerenciador de banco 
de dados objeto relacional (SGBD), desenvolvido como projeto de código aberto. 
 
Assinale a alternativa CORRETA, que contenha a definição correta de SGBD: 
A) Sistemas Gerenciadores de Bancos de Dados, ou Sistemas Gerenciadores de 
Bancos de Dados Relacionais são, de maneira simples, um software que é responsável 
por gerenciar o acesso aos dados. O SGBD é responsável por fazer a interface entre os 
dados com aplicações e usuários, encapsulando-os, garantindo sua segurança e 
integridade. 
B) São documentos XML utilizados para armazenar informação. 
C) Para que os SGBDS se tornem informação , eles devem ser contextualizados, 
categorizados, calculados e condensados, deste modo a informação são os dados 
organizados. De um modo geral, pode-se dizer que o conhecimento é quando se traz um 
sentido ao dado. 
D) São fatos e números que transmitem algo específico, mas que não são 
organizados de maneira formal. Assim não têm contexto, de modo geral, pode-se dizer 
que dados são a informação de uma maneira bruta. 
 
12 No modelo relacional, os dados são organizados em tabelas e cada dado armazenado 
tem um determinado tipo de dados associado. Por exemplo, se um dado é um nome será 
do tipo VARCHAR (que representa textos), se for um valor em reais R$ será do tipo 
DOUBLE (que representa números com casas decimais. São diversos os tipos de dados e 
isto pode variar da tecnologia que seu banco de dados, seja relacional ou multidimensional 
será implementado, para ter uma visão geral. 
 
Na construção de um modelo de dados, as formas normais são de importante função para 
garantir a integridade dos dados. Selecione a alternativa CORRETA sobre a 1FN: 
A) A primeira forma normal está relacionada à dependência funcional da chave 
primária. 
B) A primeira forma normal é onde estão todas as outras formas normais. 
C) A primeira forma normal trata da atomicidade dos atributos, proibindo atributos 
compostos, multivalorados e relações aninhadas. 
D) A primeira forma normal está relacionada à chamada dependência transitiva, ou 
seja, um campo não deve depender de um outro campo “não chave”. 
 
13 Após realizar a coleta e armazenamento dos dados em um data warehouse, as 
ferramentas de dashboards são utilizadas para extrair métricas e indicadores. 
 Selecione a alternativa correta sobre a definição de métrica. 
A) As métricas são ferramentas que permitem extrair conhecimento, além do que é 
realizado pelas ferramentas de dashboard. 
B) As métricas são as medidas brutas, atômicas e de simples composição. Em uma 
estrutura de Data Warehouse, são armazenados na tabela Fato e medem os descritivos 
salvos nas dimensões. 
C) As métricas são dados brutos, antes de serem armazenados em um data 
warehouse. 
D) As métricas são medidas calculadas e são compostos pelas métricas. Estão um 
nível acima das métricas, pois possuem uma visão mais ampla e direcionada da realidade 
observada. 
 
14 A startup do Data Warehouse, Yellowbrick Data, levantou US $ 81 milhões em uma 
série C de financiamento liderado pela DFJ Growth, com a participação do braço de VC da 
Alphabet, Menlo Ventures, Third Point Ventures, DFJ Growth, BMW i Ventures, IVP, 
Next47 e Threshold Ventures. O mercado mundial de data warehousing teria gerado mais 
de US $ 18 bilhões em 2017, um número que deve crescer para quase US $ 35 bilhões até 
2025, segundo a Allied Market Research. Isso parece estar impulsionando o recente 
aumento nos investimentos em data warehousing. 
 
Sobre Data Warehouse, selecione a alternativa CORRETA: 
A) São fatos e números que transmitem algo específico, mas que não são 
organizados de maneira formal. Assim não têm contexto, de modo geral, pode-se dizer 
que dados são a informação de uma maneira bruta. 
B) São bancos de dados analíticos, projetados para armazenar os dados de fontes 
diversas, já transformados e preparados para serem explorados por aplicações de tomada 
de decisão. 
C) Surgiram nos anos 2000, a partir da ascensão de grandes empresas da internet 
como Amazon e Google, que cada vez mais produziam dados gradativamente, tendo a 
necessidade de escalabilidade em escrita e principalmente leitura de dados após o 
aumento de tecnologias voltadas à nuvem. 
D) São, de maneira simples, um software que é responsável por gerenciar o acesso 
aos dados. O DW é responsável por fazer a interface entre os dados com aplicações e 
usuários, encapsulando-os, garantindo sua segurança e integridade. 
 
15 Os Data Warehouse podem ser explorados por diversas perspectivas, ou seja, 
explorando a multidimensionalidade do modelo criado. O cubo de dados é uma 
representação abstrata da representação analítica dos dados armazenados 
multidimensionalmente. De modo simples, o cubo é uma metáfora visual. Os dados são 
vistos de acordo com as dimensões. 
 
Selecione a alternativa CORRETA que contenha o conceito de cuboide. 
A) Um cuboide é muito próximo do que é conhecido da modelagem tradicional de 
banco de dados, uma vez que durante sua construção são levadas em consideração as 
formas normais. 
B) Um cuboide torna o carregamento dos dados menos complexo, mas o uso dessa 
estrutura para consulta é difícil, pois envolve muitas tabelas e junções. 
C) Um cuboide é uma ferramenta gráfica para modelagem de banco de dados. 
Existem diversos recursos, desde a simples modelagem e geração do banco de dados, até 
mesmo a conexão com engenharia reversa para diversos SGBDs. 
D) Um cuboide é uma combinação de dimensões, é uma maneira visual de 
compreender a análise multidimensional dos dados.um cuboide básico possui os dados 
mais detalhados, exceto os próprios dados de origem. 
 
16 Na mais tradicional definição do conceito de um Data Warehouse, Inmon (2005) nos 
traz que as principais características de um Data Warehouse é uma coleção de dados: 
● orientado a um assunto; 
● integrado; 
● com tempo variável; 
● não volátil. 
 
No contexto de tal definição, assinale a alternativa correta sobre o que significa orientado a 
um assunto. 
A) O assunto e refere a um tema de análise, ou seja sob qual assunto as análises irão 
convergir. 
B) O assunto se refere a qual ferramenta será utilizada, uma vez escolhida esta será 
a ferramenta. 
C) O assunto se refere a qual fonte de dados é mais importante para ser utilizada. 
D) O termo assunto se refere ao fato de que sempre há mudanças nos dados e isso 
deve ser considerado emum Data Warehouse. 
 
17 Segundo INMON (2005), um Data Warehouse é uma coleção de dados, orientado a um 
assunto, integrado, com tempo variável e não volátil; este banco de dados é desenvolvido 
para suporte ao gerenciamento dos processos de tomada de decisão. 
 
No contexto de tal definição, assinale a alternativa correta sobre o que significa não volátil. 
A) O termo não volátil se refere a não poder haver alteração nas fontes de dados 
utilizadas para alimentar um data warehouse. 
B) O termo não volátil se refere ao fato de que sempre há mudanças nos dados e isso 
deve ser considerado em um Data Warehouse. 
C) O termo não volátil se refere porque as fontes de dados são diversas e com baixa 
volatilidade. 
D) O termo não volátil se refere ao fato de que todo dado armazenado em um Data 
Warehouse não será excluído, e sim armazenado em decorrer do tempo. Em caso de 
exclusões na fonte o mesmo não acontece em um Data Warehouse. 
 
18 O mercado de gestão de dados – chamado pelo jargão de "big data & analytics" – deve 
movimentar US$ 4,2 bilhões, em 2019, no Brasil, o que representa um crescimento de "um 
dígito alto", segundo a International Data Corporation. A IDC avaliou que as empresas têm 
mostrado dificuldade para fazer uma gestão de dados eficiente e tirar proveito de 
ferramentas como acompanhamento de performance ou alerta de produtividade, por 
exemplo. 
Sobre BIG DATA assinale a alternativa CORRETA: 
A) São fatos e números que transmitem algo específico, mas que não são 
organizados de maneira formal. Assim não têm contexto, de modo geral, pode-se dizer 
que dados são a informação de uma maneira bruta. 
B) Big Data é um termo que tem como tradução literal mais próxima “grandes 
quantidades de dados” e é também o termo instituído pela IBM para determinar a grande 
quantidade de dados gerados pelos sistemas de informação. Geralmente, utiliza-se a 
combinação de volume, velocidade e variedade para chegar em Big Data. 
C) São, de maneira simples, um software que é responsável por gerenciar o acesso 
aos dados. O Big Data é responsável por fazer a interface entre os dados com aplicações 
e usuários, encapsulando-os, garantindo sua segurança e integridade. 
D) São bancos de dados analíticos, projetados para armazenar os dados de fontes 
diversas, já transformados e preparados para serem explorados por aplicações de tomada 
de decisão. 
 
19 O data warehouse deve ser desenhado para transpor os limites de cada um dos 
sistemas transacionais. Ele é construído para responder questões que não estão limitadas 
às transações ou aos sistemas individuais, apresentando, desta forma, uma visão 
integrada e completa dos negócios. Uma das técnicas utilizadas para se obter um modelo 
para o data warehouse que identifique e represente as informações importantes para o 
modelo de negócios é a modelagem dimensional ou multidimensional. 
 
Na abordagem da literatura existem duas estratégias de modelagem multidimensional, 
assinale a alternativa CORRETA que contenha essas estratégias. 
A) Star Schema e Snowflake. 
B) Data Warehouse e Data Marts. 
C) 1FN, 2FN e 3FN. 
D) SQL e SGBD. 
 
20 Segundo Date (2004), “Data Warehouse é um depósito de dados orientado por assunto, 
integrado, não volátil, variável com o tempo. 
No contexto de tal definição, assinale a alternativa correta sobre o que significa integrado. 
A) O Termo integrado l se refere às fontes de dados diversas e com baixa 
volatilidade. 
B) O termo integrado l se refere a não poder haver alteração nas fontes de dados 
utilizadas para alimentar um data warehouse. 
C) O termo integrado se refere ao fato de que todo dado armazenado em um Data 
Warehouse não será excluído, e sim armazenado em decorrer do tempo. Em caso de 
exclusões na fonte, o mesmo não acontece em um Data Warehouse. 
D) Um Data Warehouse pode integrar vários sistemas internos que usam SGBD e ao 
mesmo tempo integrar com redes sociais via JSON, fazendo dessa dinâmica nas fontes de 
dados sua principal característica, bem como um dos principais desafios.

Continue navegando