Baixe o app para aproveitar ainda mais
Prévia do material em texto
Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital Autores: Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago 22 de Fevereiro de 2021 00774823100 - Juliana Souza Ferreira 1 81 Conceitos e ferramentas voltados para WEB, OLAP. ........................................................... 2 OLAP .................................................................................................................................. 2 Introdução ....................................................................................................................................... 2 Conceitos básicos ............................................................................................................................ 7 OLAP x OLTP .................................................................................................................................... 8 Operações OLAP ............................................................................................................................ 11 Arquitetura de servidores OLAP .................................................................................................... 21 Critérios de avaliação de produtos OLAP ...................................................................................... 27 Questões .......................................................................................................................... 30 Questões OLAP - Comentadas ....................................................................................................... 30 Lista de Exercícios.......................................................................................................................... 62 Gabarito ........................................................................................................................................ 80 Considerações Finais ........................................................................................................ 81 Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 2 81 CONCEITOS E FERRAMENTAS VOLTADOS PARA WEB, OLAP. Nosso objetivo é apresentar técnicas e ferramentas que fazem acesso ao Data Warehouse (DW). É preciso entender que cada uma delas atende a uma necessidade específica de usuários e clientes. OLAP O termo On-Line Analitical Processing OLAP foi proposto por E.F. Codd, o pai do modelo relacional. O modelo relacional põe os dados em tabelas, enquanto o OLAP usa a representação de arrays multidimensionais. Essa representação de dados já existia previamente na estatística e em outras áreas. Existe muitas operações de análise de dados e exploração de dados que são facilitadas como esse modelo de representação. Vamos entender o conceito por trás desse modelo. INTRODUÇÃO Vamos falar um pouco sobre OLAP! O que é isso? Cara, é um conjunto de ferramentas de software que permite aos gerentes e diretores de empresas a terem acesso dinâmico a informações armazenadas nos diversos sistemas corporativos, podendo realizar cruzamentos e análises de informações em tempo real sob diversas perspectivas com o intuito de auxiliar na tomada de decisões. Definição tranquila, né? Uma ferramenta OLAP é caracterizada pela análise multidimensional dinâmica dos dados, apoiando o usuário final nas suas atividades e permitindo consultas ad-hoc. O que seriam essas consultas ad-hoc? São consultas específicas ou exclusivas que geralmente nunca foram pensadas ou realizadas. Sabe quando você tem uma ideia de tentar construir um relatório de uma maneira que ninguém nunca tentou antes? Pois é, essa ferramenta permite que você brinque à vontade... Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 3 81 Ela permite que você realize diversas operações em modelos de dados multidimensionais navegando por dimensões e hierarquias com o intuito de enxergar informações preciosas que, de alguma forma, te auxiliem na tomada de decisões estratégicas. Exemplo: no contexto de uma Rede de Fast-food, pode-se analisar dados de vendas em dimensões como cliente, filiais, regiões, tempo, produtos, entre outros. Sabe outra coisa bem legal? Você não precisa ser um ninja dos computadores para fazer tudo isso! A OLAP abstrai as complexidades de forma que qualquer pessoa consiga manipular essa ferramenta. Aliás, já te digo que se você passar em um concurso para um órgão grande que lide com muitos dados, você poderá acabar tendo que lidar com esses softwares que permitem uma análise/visualização rápida, consistente e interativa de dados corporativos. Isso mesmo! Você provavelmente terá que visualizar um conjunto de dados, navegar por eles e analisá-los em busca de alguma informação relevante. Então vejam só: a disciplina de banco de dados se inicia falando diversos conceitos básicos, principais características, transações de dados, arquiteturas e projetos, depois fala-se dos tipos de modelagem de bases de dados transacionais, em seguida descobrimos o que é DW/BI, até chegar ao ponto que estamos agora... No contexto atual, é interessante apresentar a título de comparação as diferenças entre as ferramentas que lidam com bancos de dados transacionais e as ferramentas que lidam com bancos de dados analíticos. Por quê? Porque dessa forma ficará mais claro para vocês as grandes vantagens e desvantagens do OLAP. Nada melhor do que comparar para entender um conceito, então vejam a tabela a seguir:] Lembre-se que os dados operacionais são aqueles que auxiliam no dia a dia de uma organização, permitindo que as ações associadas aos processos de negócios sejam realizadas e armazenadas de maneira eficiente. Esse tipo de dados é armazenado em Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira ==1c090b== 4 81 sistemas conhecidos como OLTP (On-line transaction processing). Os sistemas transacionais permitem a execução de um grande conjunto de pequenas operações, por exemplo, um supermercado tem vários caixas que registram as vendas dos produtos. Cada compra é considerada uma transação e tem uma quantidade relativamente pequena de itens (por maior que seja a compra que uma pessoa faz no supermercado, estamos falando de algumas centenas de itens.) Os sistemas OLTP são comparados com os sistemas OLAP na tabela abaixo. Perceba cada uma das características e tente refletir sobre os impactos destas propriedades. OLTP (ONLINE TRANSACTION PROCESSING) OLAP (ONLINE ANALYTICAL PROCESSING) ▪ Sistema de gerenciamento de transações em um banco de dados. ▪ Sistema de gerenciamento de consultas e análise de dados. ▪ Foco no nível operacional da organização, visando a execução rotineira do negócio. ▪ Foco no nível estratégico da organização, visando a análise empresarial e a tomada de decisão. ▪ Tabelas formadas por linhas e colunas e geralmente normalizadas. ▪ Tabelas formadas por fatos, dimensões e medidas e geralmente desnormalizadas. ▪ Lidam com Bancos de Dados Transacionais em geral estruturados em um modelo relacional.▪ Lidam com Bancos de Dados Dimensionais (DW/DM) em geral estruturados em modelo dimensional. ▪ Executados de forma mais rápida com tempo de resposta de milissegundos até segundos. ▪ Executados de forma mais lenta com tempo de resposta de segundos até horas. ▪ Apresentam dados detalhados (baixa granularidade). ▪ Apresentam dados sumarizados (alta granularidade). ▪ Atualizações de dados são realizadas no momento de cada transação e são altamente frequentes. ▪ Atualizações de dados são realizadas no processo de carga de dados e são bem menos frequentes. ▪ Não é otimizado para lidar com uma grande quantidade de dados (baixo armazenamento) ▪ É otimizado para lidar com uma massiva quantidade de dados (alto armazenamento) ▪ Dados voláteis e passíveis de inserção, alteração ou exclusão. ▪ Dados históricos e não-voláteis, não podendo ser alterados ou excluídos (salvo casos específicos) ▪ São orientados a registros ou tuplas e possuem consultas pré-definidas. ▪ São orientados a arrays ou vetores e possuem consultas ad-hoc. Agora podemos fazer algumas questões sobre o assunto: Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 5 81 (Ministério da Economia Desenvolvimento de Sistemas - 2020) A respeito de OLTP e OLAP, julgue o item a seguir. Um OLTP é formado por um conjunto de sistemas para a visualização de dados estratégicos, os quais ficam guardados em armazém de dados analíticos, para a exploração de estudos e cenários prospectivos. _______________________ Comentários: OLTP refere-se aos sistemas que dão suporte ao dia a dia operacional dos negócios ou da empresa. Eles são formados por sistemas que trabalham com as transações diárias de uma organização para que seus processos de negócios sejam executados. Ou seja, não tem relação com visualização de dados estratégico, mas com a execução de tarefas operacionais. Gabarito Errado. (CESPE SERPRO Analista de Sistemas) É comum o armazenamento maior de dados para OLAP, em relação a OLTP (on-line transaction processing), com a finalidade de se manter histórico para análise. _______________________ Comentários: conforme vimos em aula, OLAP lida com uma quantidade massiva de dados e por isso geralmente possuem um armazenamento de dados maior do que o OLTP (Correto). (FUNDEP CODEMIG Analista de Sistemas) O recurso que permite aos gerentes e diretores nas empresas terem acesso dinâmico a informações armazenadas nos diversos sistemas das empresas, podendo realizar cruzamentos e análises de informações em tempo real é chamado: a) OLTP. b) OLAP. c) REALTIME. d) OLT. _______________________ Comentários: conforme vimos em aula, trata-se do OLAP (Letra B). (CESEAC DATAPREV Analista de Sistemas) Uma ferramenta OLAP nos permite: Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 6 81 a) manipular e analisar um largo volume de dados sob múltiplas perspectivas; b) ter uma visão fixa dos dados; c) armazenar informações; d) disparar requisições diretamente ao servidor de Banco de Dados multidimensional, tendo um ganho de desempenho; e) registrar todas as transações contidas em uma determinada operação organizacional. _______________________ Comentários: (a) Correto, ele permite manipular, navegar e analisar grandes volumes de dados sob diversas perspectivas; (b) Errado, ele tem uma visão dinâmica dos dados; (c) Errado, trata-se de uma ferramenta e visualização e análise e, não, armazenamento; (d) Errado, quem permite isso é o MOLAP; (e) Errado, OLAP não permite registrar nada porque não é um banco de dados (Letra A). (COSEAC UFF Analista de Sistemas) É a ferramenta mais popular para exploração de um datawarehouse: a) OLAP. b) Data Mining. c) OLTP. d) SGBD. e) Data Mart. _______________________ Comentários: conforme vimos em aula, trata-se do OLAP (Letra A). (FCC TRT/SC Analista de Sistemas) Em uma comparação entre bancos de dados OLTP (Online Transaction Processing), com bancos de dados OLAP (Online Analytical Processing), para os bancos OLAP: a) não é necessário um grande espaço de armazenamento, pois as informações são buscadas em tempo real. b) as operações podem levar horas para serem executadas para certas queries. c) as operações de INSERT e UPDATE são efetuadas somente pelos usuários finais. d) o principal objetivo é rodar e controlar tarefas básicas de regras de negócio. e) os dados são obtidos ad hoc, ou seja, sempre que um relatório é requisitado, os bancos OLTP são acessados dinamicamente para a obtenção imediata desta informação. _______________________ Comentários: (a) Errado, é necessário um grande espaço de armazenamento porque lidam com uma massiva quantidade de dados desnormalizados; (b) Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 7 81 Correto, o processamento é bem mais complexo; (c) Errado, não são realizadas operações INSERT e UPDATE; (d) Errado, esses são objetivos operacionais e, não, analíticos; (e) Errado, Ad-hoc significa que não há consultas pré-definidas, logo relatórios não são requisitados, mas montados dinamicamente (Letra B). CONCEITOS BÁSICOS Acredito que, depois dessa nossa rápida introdução, você já seja capaz de responder a seguinte pergunta: O que é OLAP? Lembre-se: trata de um processamento de dados dedicado ao suporte a decisão. Essa análise é feita por meio da visualização de dados agregados ao longo de várias dimensões analíticas do modelo de dados dimensional (ex.: tempo, espaço, categoria de produto, quantidade vendida, preço). Esse processamento é feito sobre dados armazenados em Banco de Dados especializadas. Eles seguem um modelo lógico de dados multidimensional e são chamados de Data Warehouse, Data Mart ou BD multidimensionais. Sabemos inclusive que os dados são estruturados de forma hierarquizada em diferentes níveis de granularidade. Outra definição possível para OLAP seria um recurso que permite manipular e analisar grandes volumes de dados sobe múltiplas perspectivas. Ou ainda, um software que permite ao usuário interagir com um grande banco de dados on-line (data warehouse) e solicitar e receber praticamente qualquer relatório no formato desejado. Partindo dos três conceitos vistos até agora, passaremos para uma sistematização do conhecimento dentro do assunto. Os conceitos de OLAP, mais precisamente quando tratamos de questões para concursos, podem ser classificados da seguinte forma: 1. OLAP x OLTP 2. Operações OLAP 3. Taxonomias de servidores OLAP. Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 8 81 OLAP X OLTP On-Line Analytical Processing (OLAP) é muito diferente do tradicional On-Line Transaction Processing (OLTP). Quando utilizamos OLTP, o foco é sobre as transações individuais. Considere, por exemplo, um sistema OLTP simples usado por um vendedor de livros para se manter a par dos livrosque possui em estoque. Quando uma cópia de um determinado livro é vendida, o sistema diminui o número que informa quantas cópias de estão em estoque. Da mesma forma, o número é aumenta quando mais cópias são entregues pela editora do livro. O sistema só mantém o controle dos dados atuais, isto é, o que existe hoje no estoque. Detalhes sobre vendas individuais não são armazenados em um formato fácil de analisar. O varejista pode até saber quem é o cliente, mas esta informação não é mantida com a finalidade de uma análise posterior. O sistema OLTP armazena suas informações em um banco de dados relacional que é normalizado para evitar redundância e anomalias de atualização. Ele é otimizado para recuperação e/ou atualização de uma pequena quantidade de tuplas. Em contraste, um sistema OLAP para o varejista de livros mantém o controle de cada venda individual. Isso também inclui informações específicas sobre a venda, como a cidade onde a venda ocorreu, a data da venda, o vendedor que vendeu o livro, e outras informações que são armazenadas em um banco de dados multidimensional. Desta forma é mais fácil achar, por exemplo, o livro de receitas mais vendido e o número médio de livros infantis vendidos antes de uma operação/ação de vendas. O sistema OLAP geralmente não apaga nem atualiza seus dados; apenas adições de novos registros ocorrerão no sistema. O OLAP é assim otimizado para recuperar (e sumarizar) grandes quantidades de dados. A comparação entre OLAP e OLTP passa por diversos critérios individuais. Cada autor valoriza critérios diferentes, ou seja, se você observar algumas características são comparadas em um livro e não em outro. Vamos começar exibindo uma primeira tabela que faz algumas distinções entre os dois modelos: Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 9 81 Características OLTP OLAP Operação típica Atualização Análise Telas Imutáveis Definida pelo usuário Nível de dados Atomizado Sumarizados Recuperação Poucos Registros Muitos registros Orientação Registros Arrays de dados Modelagem, organização dos dados. Processos de negócio, por aplicação, sistema de informação Assuntos/Negócios Natureza dos dados /Conteúdo Permitem atualizações (dinâmica), Valores Correntes Dados históricos, sumarizados e integrados. (estática não volátil) Formato das estruturas Relacional, próprio para computação transacional. Dimensional, simplificado, próprio para atividades analíticas Uso Processamento repetitivo, altamente estruturado em tabelas. Estruturados em fatos e dimensões, com processamento analítico Tempo de resposta Otimizado para faixas abaixo de 1 seg. Análises mais complexas, com tempos de respostas maiores. A ideia fundamental por trás da programação de matriz ou array é de que as operações se aplicam de uma vez para todo um conjunto de valores. Isto o torna um modelo de programação de alto nível bem mais performático, uma vez que permite ao programador pensar e operar sobre os agregados inteiros de dados, sem ter de recorrer às linhas explícitas de operações escalares individuais. Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 10 81 A base da programação por array e do seu pensamento é encontrar e explorar as propriedades de dados onde os elementos individuais são semelhantes e/ou adjacente. Ao contrário da orientação a objetos que implicitamente quebra de dados para suas partes constituintes (ou quantidades escalares), a orientação serial olha para um grupo de dados e aplica um tratamento uniforme. Os meteorologistas têm uma necessidade particular de estruturar seus dados como matrizes. Por exemplo, geralmente eles trabalham com conjuntos de variáveis climáticas (por exemplo, temperatura e precipitação) que variam no espaço e no tempo e são representadas em matrizes. Frequentemente, é necessário definir um subgrupo para examinar os dados de uma região específica ou selecionar um intervalo de tempo específico. Então, podemos aplicar funções estatísticas a esses subconjuntos para gerar informações resumidas. Figura 1 - Imagine que temperatura e precipitação são as variáveis armazenadas em matrizes de dados. Elas armazenam as informações sobre o cruzamento dos dados de latitude, longitude e tempo. É como se cada "cubo" dentro da matriz representasse um valor correspondente a temperatura ou a precipitação num local e data específicos. Resumindo quando pensamos em OLTP temos as seguintes características: • Ele é usado para acesso à dados em tempo real, baseado em transação, os dados podem existir em mais do que uma tabela. • Eles são otimizados para transações mais rápidas e incluem operações de inserir, atualizar e excluir. • Não são construídos para a execução de consultas complexas. • Bancos de dados de sistemas Line-of-Business (LOB) e Enterprise-Resource-Planning (ERP) usam este modelo. • A ferramenta da Microsoft que gerencia este modelo é o SQL Server Management Studio (SSMS). • Segue as regras de normalização de banco de dados (DB) e usa banco de dados relacional. Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 11 81 • Armazena dados da chave. • Usa menos índices e mais junção. • E faz consultas de várias tabelas. Quando nosso foco é OLAP temos: • O uso de dados on-line ou históricos. • Usado para análise e navegação sobre os dados. • Os dados podem existir em mais do que uma tabela. Otimizado para desempenho analítico dos dados. • Banco de dados apenas de leitura. • Construído para executar consultas complexas. • Bancos de dados analíticos, como Cognos, a Business Objects, e assim por diante utilizam este modelo. • A ferramenta da Microsoft para esse tipo de modelo é o SQL Server Analysis Services (SSAS). • Relaxa as regras de normalização de banco de dados. • Utiliza banco de dados relacional ou multidimensional. • Armazenam dados agregados em relação à chave. • Comparado com OLTP usa relativamente mais índices e menos junção. • Consulta pode ser executada em menos tabelas. OPERAÇÕES OLAP Passamos agora para as operações OLAP, conhecidas também como funcionalidades. Aqui estão as funções que podem ser aplicadas sobre os dados disponíveis nos cubos ou nos Data Warehouse. Antes de tratarmos das funções vamos relembrar o conceito de granularidade. Granularidade A granularidade diz respeito ao nível de detalhe ou de resumo nas unidades de dados no DW. Quanto maior o nível de detalhes, menor o nível de granularidade. O nível de granularidade afeta diretamente o volume de dados armazenado no DW e, ao mesmo tempo, o tipo de consulta que pode ser respondida. Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 12 81 OLAP oferece recursos de modelagem analítica, incluindo um mecanismo de cálculo para desvio padrão, variância, entre outros; e processamento de medidas em múltiplasdimensões. Os recursos também permitem gerar sumarizações, agregações e hierarquias em cada nível de granularidade e em cada cruzamento de dimensão. Ele ainda suporta modelos funcionais para previsão, análise de tendências e análise estatística. Neste contexto, um motor OLAP é uma ferramenta poderosa a análise de dados. Que tal darm detalhar cada uma delas? Em modelos multidimensionais, como próprio nome sugere, os dados são organizados em múltiplas dimensões. Cada uma delas contém múltiplos níveis de abstração. Esses níveis são, ainda, definidos pelo conceito de hierarquia. Essa organização provê ao usuário uma flexibilidade para observar os dados a partir de diferentes perspectivas e em diferentes níveis de detalhe. Graficamente, esses modelos podem ser representados por meio de um cubo. As operações sobre um cubo de dados nos permitem materializar diferentes perspectivas (também conhecidas como visões), permitem consultas e análises interativas sobre dados armazenados. Vamos, então, entender as peculiaridades de cada uma dessas operações de OLAP. Roll-up Roll-up: também conhecida como drill-up, aplica uma agregação sobre o cubo de dados. Ou ainda, aumentar o nível de granularidade dentro de uma dimensão, reduzindo o Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 13 81 detalhamento da informação. É, basicamente, subir na hierarquia. A figura abaixo, retirada do livro Data Mining: Concepts and Techniques, mostra o resultado da operação de roll- up aplicada no cubo central subindo na hierarquia de location. Basicamente, essa hierarquia é definida na seguinte ordem: street < city < province_or_state < country. Essa agregação mostra uma ascensão na hierarquia de location do nível de city para o nível de country. Drill-down Drill-down: É o inverso da operação de roll-up. É uma forma de navegar de um dado com menor nível de detalhe para um dado com maior nível de detalhe. Essa operação pode ser realizada tanto descendo em uma hierarquia de uma dimensão quanto introduzindo dimensões adicionais. A figura abaixo exibe o resultado de uma operação de drill-down sobre o cubo central, basicamente, descendo sobre a hierarquia de tempo (day < month < quater < year). A operação desce do nível de semestre (quater) para mês (month). Outra forma de executar o drill-down seria adicionando uma nova dimensão ao cubo. Por exemplo, imagine, a partir do cubo central, uma operação de drill-down que introduz uma dimensão adicional. Por exemplo, grupo_de_consumidores. (Ministério da Economia Desenvolvimento de Sistemas - 2020) A respeito de OLTP e OLAP, julgue o item a seguir. A operação de ROLLUP consiste em selecionar valores específicos para os atributos, que são exibidos em uma tabulação cruzada para um maior detalhamento. _______________________ Comentários: A operação OLAP de Roll up consistem em agrupar os dados de um cubo em duma determinada dimensão. Ela vai sumarizar os dados, por exemplo, agrupar as vendas diárias em vendas mensais. Gabarito Errado. Slice e Dice Slice e dice: A operação de slice executa uma seleção sobre uma das dimensões de um determinado cubo, resultando em um subcubo. A figura mostra um exemplo da operação de slice que seleciona as vendas por cidade em um determinado semestre (neste caso, quarter = Q1). A operação de dice és de umaseleção sobre duas ou mais dimensões. A figura também mostra uma operação de dice que envolve três Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 14 81 dimensões seguindo os seguintes critérios ( ). Pivot Pivot: Também conhecida como rotate ou rotação, é uma operação de visualização que rotaciona os eixos de um determinado cubo, provendo uma visão alternativa dos dados. A figura mostra uma operação de pivot sobre o resultado da operação de slice. Neste caso, observamos uma rotação em duas dimensões. Contudo o mesmo pode ser feito, também, em um cubo 3-D. Figura 2 - A figura acima apresenta as operações de drill-down, roll-up, slice, dice e pivot. Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 15 81 Até aqui vimos as mais simples operações de OLAP, que podem, inclusive, ser consideradas operações básicas. Contudo, ainda não tratamos das famosas Drill-across e Drill-through. Vamos agora definir cada um deles: Drill-across e Drill-through Sobre a operação de drill-across encontramos na literatura uma divergência entre os principais autores. Vejam algumas definições abaixo: Drill-across: Executa uma consulta envolvendo mais de uma tabela fato! Essa operação exige que os dois cubos tenham pelo menos uma das dimensões em comum. A ideia é você conseguir consultar as múltiplas tabelas fato e colocar o resultado em um único data set. Esta é a visão de Kimball (você pode ver um exemplo aqui1). Para entender como efetuar essa operação, que tal mostrarmos um exemplo prático? Imagine que uma determinada livraria tenha duas formas de venda de produtos: nas suas lojas físicas ou pela Internet. Para cada um desses processos de venda temos um cubo. No primeiro caso o cubo é montado com as hierarquias de livros, tempo e localização geográfica. Na internet, não existe a dimensão geográfica. Desta forma, esta foi substituída pela dimensão cliente. Suponha que um gerente deseja fazer uma consulta para saber qual livro foi o mais vendido nos anos de 2008 e 2009. Para fazer o drill-across, nós atendemos à primeira premissa segundo Kimball: trata-se de uma operação sobre dois cubos. Os dados nos dois cubos são combinados nas dimensões comuns aos mesmos. Nesse caso, livros e tempo. O analista vai, então, utilizar uma medida derivada para somar as vendas dos dois cubos e dessa forma obter o livro com maior quantidade de vendas. Veja que o drill-across abre um novo caminho para que você possa analisar os dados. A figura abaixo ilustra esse exemplo: Figura 3 - Exemplo de uma operação de drill-across 1http://www.kimballgroup.com/html/designtipsPDF/DesignTips2005/DTKU68SimpleDrill- AcrossinSQL.pdf Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 16 81 Existem outas definições que podem ser usadas para drill-across, elas aparecem em alguns sites e livros sobre o assunto. Resolvemos colocar essas definições no quadro abaixo para que você pudesse conhecê-las. Drill-across: Significa mudar de uma classificação em uma dimensão para outra em uma dimensão diferente. Drill-across: É uma técnica similar ao drill-down. A diferença é que o drilling ser feito horizontalmente, ao invés de verticalmente. Por exemplo, depois de inicialmente exibir o resultado das vendas anuais, o drill-across pode ser usado para exibir as vendas em cada mês. Dentre as definições acima eu ficaria com a primeira. Contudo acho que é importante ver as demais para ter um entendimento mais amplo a respeito do assunto. Vamos agora tratar de drill-through. Drill-through: Essa operação podese utilizar das facilidades de SQL para, a partir do cubo de dados, penetrar (drill through) até as tabelas relacionais de back-end. Ela visa acessar as informações em um nível de detalhe que não está disponível no cubo de dados. Assim, garantimos um melhor entendimento das informações, considerando os registros armazenados em outras bases de dados, a partir dos quais o cubo é derivado. Assim, permite a movimentação de um dado, em um determinado nível do cubo para dados de nível operacional. Pode ser usado, por exemplo, se você está tentando determinar a razão de um ponto fora da curva (outlier) dentro do cubo de dados. Vejamos um exemplo. A tabela a esquerda abaixo considera dados de vendas por continentes. Nesta temos o total de vendas de todos os produtos, mas não conseguimos verificar quanto foi vendido de cada tipo de produto. Para acessar esse nível de detalhamento, que não está presente no cubo de dados, devemos usar a operação de drill- through para acessar os dados em outra estrutura. Esta estrutura pode ser, tanto uma base de dados operacional (OTLP) quanto um outro cubo dentro do ambiente analítico. Figura 4 - Exemplo de uma operação de drill-through Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 17 81 Outras definições de drill-through podem ser vistas no quadro abaixo: Drill-Through: As tabelas de drill-through permitem que você exiba, em tempo de consulta, os detalhes dos dados não sumarizados a partir dos quais uma célula de uma tabela ou uma seleção de células é sumarizada. A capacidade de drill- through permite as empresas acesso aos dados que não estão armazenados no servidor OLAP, fazendo-as acessíveis para os usuários finais das aplicações OLAP. Esses dados podem vir tanto do DW quanto das bases transacionais. Drill-Through to Detail Level: Permite uma transição suave de uma base multidimensional e agregada para o nível de detalhamento de registro nas fontes de dados do repositório de DW. Vejam que, ao contrário das definições de drill-across que divergem entre si, as definições de drill-through são complementares. O objetivo, nesse caso, é mergulhar na hierarquia dos dados para observá-los no maior nível de detalhamento, chegando, às vezes, a consultar as bases de dados transacionais que deram origem aos dados agregados do DW. Além das definições de drill-across e drill-through vistas acima, existem outras, bastante difundidas na Internet, estas são definições equivocadas, mas utilizadas por algumas bancas, como a FCC. (Espero que isso mude um dia!) Drill-Across: ocorre quando o usuário pula um nível intermediário dentro de uma mesma dimensão. Por exemplo, a dimensão tempo é composta por ano, semestre, trimestre, mês e dia. A operação drill-across é executada quando o usuário passa de ano direto para trimestre ou mês. Por essa definição podemos representar a operação de drill- across conforme a figura abaixo: Drill-Through: ocorre quando o usuário passa de uma informação contida em uma dimensão para outra. Por exemplo, inicia na dimensão do tempo e no próximo passo analisa a informação por região. Mais uma vez, podemos visualizar essa definição no cubo abaixo. Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 18 81 Outras operações Até aqui falamos das principais operações de OLAP, outras que às vezes aparecem na literatura são listadas abaixo com suas respectivas definições: Drill-within: É a passagem de uma classificação para outra classificação diferente dentro da mesma dimensão. Para entendermos um pouco melhor que os autores quiseram dizer com isso, precisamos voltar ao conceito de hierarquia e classificação. Em uma determinada dimensão é possível que exista diferentes classificações. Vamos pensar em um exemplo de produto. Produto pode ter uma classificação grupo de produto que pode ser dividido em categorias e essas por sua vez divididas em setores. Veja que essa é uma classificação de produto e possui uma hierarquia dentro dela. Contudo a dimensão produto pode ter outras classificações como, por exemplo, marca (Brand), VideoSystem e AudioSistem. A operação de drill- within é basicamente passar de uma classificação para outra dentro da mesma dimensão. Veja a figura a seguir: Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 19 81 Rank: Ordena os membros de uma dimensão de acordo com algum critério. Essa operação é basicamente cria um ranking os n maiores ou n menores itens em uma lista, é possível ainda calcular as médias móveis, o crescimento dos índices, a taxa de retorno interno, depreciação e funções estatísticas. Os resultados dessas operações são tipicamente visualizados em uma forma de tabela cruzada (cross-tabular). Nest-unnest: Redução das dimensões. Slipt: Planificação das faces do cubo Push/Pull: Junção de valores Algumas operações podem ser efetuadas entre cubos e que são baseadas na teoria dos conjuntos, são elas: Junção, União, Intersecção e Diferença. Vejamos o exemplo da operação cross-join (produto cartesiano) abaixo: Cross-join É usado para gerar um produto cartesiano entre os conjuntos passados como parâmetro. Vejamos uma questão para confirmarmos seu entendimento a respeito do assunto: (Ano: 2017 Banca: FGV Órgão: Alerj Cargo: Analista de Tecnologia da Informação Q. 41) Observe o seguinte relatório OLAP. Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 20 81 A alternativa que ilustra o resultado da operação Dice é: _______________________ Comentário: O DICE corta o cubo de dados em mais de uma dimensão. Ou, em outras palavras, restringe o escopo de análise em duas dimensões distintas. Tal fato pode ser observado na alternativa B, nela da dimensão localização é reduzida apenas ao escopo do estado de São Paulo e a dimensão produto é restrita apenas a óculos e camisa. de SLICE, que corta o cubo restringindo os valores pela dimensão localização quando o Estado for igual a Rio de Janeiro. Na alternativa C, não temos condições de dizer qual operação OLAP foi executada para obtenção dessa visão. Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 21 81 A alternativa D apresenta uma operação de ROLL-UP, agregando os valores das quantidades e agrupando os tipos de produtos. Por fim, a alternativa E apresenta a operação de PIVOT. Gabarito: B. ARQUITETURA DE SERVIDORES OLAP Logicamente, servidores OLAP apresentam aos usuários de negócio os dados multidimensionais de um Data Mart ou de um Data Warehouse, sem a preocupação de mostrar como e onde os dados são de fato armazenados. Todavia, a arquitetura física e a implementação de servidores OLAP devem consideraraspectos de armazenamento. A implementação de um DW para processamento OLAP pode ser feita das seguintes formas: ROLAP, MOLAP, HOLAP, DOLAP e WOLAP. Vamos agora analisar as peculiaridades de cada uma dessas estruturas. Os dados são transferidos das fontes e copiados dentro do servidor OLAP, lá eles são organizados e preparados para prover dados de consulta de forma rápida. Essa estrutura está dividida nos seguintes componentes: Data Sources. São as fontes que provem dados para serem analisados. Dependendo do produto OLAP pode ser um Data Warehouse, um banco de dados legado, uma coleção de spreadsheets, ou ainda, uma combinação de todos. A habilidade do produto OLAP em trabalhar com várias fontes diferentes é importante. OLAP Server. Considerado o back-end de um sistema OLAP. É ele que faz todo o trabalho de processamento (dependendo do modelo do sistema), é nele que os dados efetivamente acessados são armazenados. Diferentes filosofias governam a arquitetura dos servidores. Em particular a grandes características de um produto OLAP é se o servidor usa um banco de dados multidimensional ou um banco de dados relacional para armazenar os dados. OLAP Customer ou Interface OLAP. São aqueles que fornecem aplicações de mineração de dados, mas também suportam a geração de resultados (gráficos, relatórios etc.). OLAP ROLAP HOLAP MOLAP Outros DOLAP WOLAP SOLAP MOBILE OLAP Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 22 81 A figura abaixo mostra a arquitetura de sistemas OLAP, que variam dependendo da forma como o armazenamento e o processamento de dados ocorrem, mas geralmente podemos identificar três níveis de dados: as fontes de dados, o servidor OLAP e a apresentação dos dados ou usuário interface. Quanto maior a necessidades de cálculos para produzir um conjunto de informação, maior será o tempo de resposta. Pedaços de informação que são frequentemente acessados devem ser pré-agregados. São, portanto, pré-calculados e armazenados como um novo dado dentro da base. Por exemplo: Vendas por mês. Vamos agora analisar cada uma das categorias de servidores OLAP. MOLAP O Multidimensional On-Line Analytical Processing ou MOLAP refere-se aos servidores que usam um MDDB para armazenar dados. Estratégia pela qual são usados gerenciadores de banco de dados proprietários, com características de armazenamento especiais e ferramentas para tratamento dimensional de dados. Esse modelo dispõe de propriedades especiais de armazenamento como matrizes esparsas, operações com array e indexações de bitmap. Porém não oferece toda a gama de recursos encontrada num SGBDR, como debug, paralelismo, log, otimizadores e monitoração. DB Data Warehouse Fontes externas OLAP SERVER INTERFACE OLAP Figura 5 - Fontes de dados, o servidor OLAP e a apresentação dos dados ou usuário interface. Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 23 81 Exige a migração dos dados do SGBD relacional para o armazenamento multidimensional e a sua constante atualização. Pode ser limitada na sua capacidade máxima de armazenamento, mas por ser voltada exclusivamente para essas aplicações pode apresentar, em tese, melhor desempenho do que as alternativas relacionais. Pode ser entendida como uma planilha multidimensional, e algumas oferecem a opção de memória RAM-MD, permitindo a manipulação dos dados diretamente em memória. No caso de MOLAP, tanto as estruturas básicas (maior granularidade) quanto às estruturas agregadas/cubos são armazenadas nesse formato. Um conceito que faz parte dos modelos MOLAP é a explosão dos dados. É difícil determinar condições para a explosão de dados, ou para prever se uma configuração particular vai explodir. Uma abordagem que parece ajudar a resolver o problema é a manipulação de dados esparsos dinamicamente. Manipulação de dados esparsos de forma dinâmica permite que um banco de dados analise seus padrões de armazenamento próprios e aperfeiçoe-os para evitar a explosão de dados. Resumindo as características da arquitetura MOLAP: • Dados são armazenados em um banco de dados multidimensional em uma estrutura do tipo Array para prover um melhor desempenho das consultas. • A implementação varia de acordo com a ferramenta OLAP utilizada, mas frequentemente é implementado em um banco de dados relacional, porém não na terceira forma normal. • O acesso aos dados ocorre diretamente no banco de dados do servidor multidimensional, e o utilizador trabalha, constrói e manipula os dados do cubo diretamente no servidor. (SGBD multidimensional) • Apresenta como vantagem a grande gama de funções de análises presentes nos bancos multidimensionais. • Utiliza Cubos pré-calculados o que aumenta o desempenho nas consultas. • Permite Consultas Ad-hoc com dinamismo OLTP Fontes externas DATABASE LAYER CAMADA DE APLICAÇÃO CAMADA DE APRESENTAÇÃO MULTIDIMENSIONAL DATABASE INTERFACE OLAP Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 24 81 ROLAP O termo ROLAP especifica que o servidor OLAP se baseia numa base de dados relacional: Relational On-Line Analytical Processing. Os dados de origem são inseridos em um banco de dados relacional, geralmente em um esquema estrela ou esquema floco de neve, o que ajuda em tempos de recuperação mais rápidos. O servidor fornece um modelo multidimensional dos dados, através de consultas SQL otimizadas. Um dos motivos para escolher pelo uso do ROLAP está no fato dos bancos de dados relacionais serem uma tecnologia bem estabelecida que tem muitas oportunidades para otimização. Os data warehouse relacional suporta uma maior quantidade de dados que uma base multidimensional. O Servidor ROLAP é um servidor intermediário que fica entra a base de dados relacional de back-end e as ferramentas de front-end. Eles usam SGBDs relacionais ou relacionais estendidos para gravar e gerenciar os dados do DW, e um middleware ou engine OLAP para dar suporte às funcionalidades faltantes. Nessa estratégia são usados os próprios sistemas de banco de dados relacionais, com as tabelas sendo implementadas como estruturas relacionais clássicas. Esse modelo oferece todas as vantagens de um SGBDR, porém exige um projeto cuidadoso do ponto de vista de desempenho, em que o excesso de tabelas normalizadas poderá comprometer a performance das buscas. É importante lembrar-se dos conceitos de esquema estrela e floco de neve discutidos anteriormente. As tabelas básicas e os agregados (visões) são armazenados nesse formato. O modelo relacional poderá ser usado tanto para desenhar o projeto físico do data warehouse, considerando a abordagem top-down, em que o DW será construído primeiramente, a partir dos arquivos fontes, quanto na abordagem de data marts integrados, em que os data marts, na forma ROLAP são estruturados. Resumindo os pontos positivos e negativos do uso da abordagem relacional em sistemas OLAP: OLTP Fontes externas DATABASE LAYER CAMADA DE APLICAÇÃO CAMADA DE APRESENTAÇÃO ENGINE OLAP RELACIONAL INTERFACE OLAP Figura 6 - Acima temos a hierarquia de camadas de uma arquitetura ROLAP composta por (1) camada dearmazenamento - data warehouse, (2) camada de aplicação - engine OLAP e (3) camada de apresentação - interface OLAP. Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 25 81 Pros Contras Ideal para grandes volumes de dados SQL não é otimizado para consultas complexas Tecnologia otimizada e aprovada Determinar um esquema para armazenamento ótimo é mais importante e difícil É mais tolerante às mudanças de fontes de dados originais quando elas são OLTP, pois também utiliza OLTP. - HOLAP, DOLAP e SOLAP O Hybrid OLAP Server representa uma abordagem de uso misto das duas estratégias anteriores, em que as estruturas relacionais são normalmente utilizadas para os dados de menor granularidade e as estruturas dimensionais nativas são dedicadas ao armazenamento de agregados (maior granularidade). O Desktop Olap Server representa uma abordagem na qual as estruturas dimensionais ou relacionais são transferidas do DW/DM para as estações cliente. São armazenadas com o objetivo de facilitar o desempenho de certas análises, minimizando o tráfego de informações entre o ambiente cliente e o ambiente servidor. O SOLAP SPATIAL OLAP - É a união de aplicação de OLAP e com aplicação Sistema de informações Geográficas (SIG), para possibilitar análises. Permite localizar sobre uma carta geográfica as informações correspondentes às áreas através OLAP e vice-versa. Os usuários podem navegar através dos dados, através de duas abordagens: seja a partir da interface de OLAP, seja através do SIG. Vamos tentar organizar e resumir essas diferentes arquiteturas OLAP: Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 26 81 A rq ui te tu ra s O LA P ROLAP Utiliza tecnologia de BD Relacional Escalabilidade, Flexibilidade e padronização É indicado para Data Warehouse MOLAP Manipula os dados diretamente no servidor Ganho de desempenho - Cubos pré-calculados o que aumenta o desempenho nas consultas. Indicado para Data Marts HOLAP (Híbrido) BASE (ROLAP) Agregado (MOLAP) DOLAP (Desktop) Portabilidade SOLAP (Spatial) Informações geográficas Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 27 81 CRITÉRIOS DE AVALIAÇÃO DE PRODUTOS OLAP Uma estrutura arquitetural era necessária dentro da qual as funções poderiam aparecer e se tornariam parte dos produtos habituais do analista de dados ou usuário final. Esta estrutura tornou-se uma medida significativa da eficácia do produto para análise de dados multidimensional em si, e, na verdade, representou o primeiro critério de avaliação de produtos de OLAP. Ela se baseia em 12 regras de avalição que são listadas de descritas de forma sucinta a seguir. 1. Visão conceitual multidimensional Já falamos sobre a visão multidimensional na aula anterior. De certa forma ela se aproxima da perspectiva que um usuário ou analista tem sobre os dados. Sendo assim, temos que nos preocupas em criamos um modelo com essa estrutura. Ela facilita a execução de operação de Slice and Dice, Pivot and rotate tornando a manipulação dos dados mais simples. 2. Transparência - OLAP deve ser fornecido dentro do contexto de uma verdadeira arquitetura de sistemas aberta, permitindo que a ferramenta analítica possa ser incorporada em qualquer necessidade do analista/usuário, sem afetar negativamente a funcionalidade das ferramentas do host. 3. Acessibilidade - O sistema OLAP deve acessar apenas os dados realmente necessários para realizar a análise solicitada e não tomar a "pia da cozinha" abordagem comum que traz dados desnecessários. 4. Desempenho consistente na geração de relatórios - É imperativo que o componente do servidor de ferramentas OLAP seja suficientemente inteligente de tal forma que vários clientes possam ser conectados com o mínimo de esforço e programação de integração. 5. Arquitetura cliente-servidor - A maioria dos dados que atualmente exigem o processamento analítico on-line é armazenada em sistemas de mainframe e eles são Visão conceitual multidimensional. Dimensionalidade genérica. Dimensões e níveis de agregação ilimitados. Operações irrestritas entre dimensões. Tratamento dinâmico de matriz esparsa. Arquitetura cliente- servidor. Suporte para múltiplos usuários. Acessibilidade. Transparência. Manipulação de dados intuitiva. Desempenho de relatório consistente. Recurso de relatório flexível. Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 28 81 acessados através de computadores pessoais. Por conseguinte, é obrigatório que os produtos OLAP sejam capazes de funcionar num ambiente cliente-servidor. Para este fim, é imperativo que o componente servidor das ferramentas OLAP seja suficientemente inteligente de tal forma que vários clientes possam ser conectados com o mínimo esforço e programação de integração. 6. Dimensionalidade genérica - Cada dimensão dos dados deve ser equivalente em suas estruturas e capacidades operacionais. Capacidades operacionais adicionais podem ser concedidas a dimensões selecionadas, mas desde que as dimensões sejam simétricas, uma determinada função adicional pode ser concedida a qualquer dimensão. A estrutura básica de dados, fórmulas e formatos de relatórios não deve ser inclinada para uma dimensão específica dos dados. 7. Manuseio dinâmico de matriz esparsa - Esta é disponibilizada através de uma tecnologia de servidor poderosa que pode ser intimamente ligada com o banco de dados da empresa. Ela pode ajustar o seu esquema físico para o máximo desempenho com base na densidade dos dados de entrada da empresa e na distribuição real dos valores dos dados. 8. Suporte a multiusuários - Esta função é fornecida pelo produto de software, mas pode ser limitada pelo número de clientes que podem ser suportados pela plataforma de hardware do servidor. Além disso, ela permite o acesso multiusuário para um modelo analítico comum e controla o acesso e permissões para o nível de células individuais através de uma "concessão" e "revogar" de esquemas baseada nos menus. 9. Operações irrestritas de cruzamento de dimensões - Quaisquer duas (ou mais) células, independentemente da dimensão em que aparecem dentro de um determinado modelo de análise, podem ser utilizadas em qualquer fórmula. As fórmulas não estão restritas a uma dimensão por vez. Qualquer termo em uma fórmula pode ser ainda modificado através da inclusão de atributos a partir de qualquer dimensão. Em outras palavras, qualquer célula de dados ou intervalo no modelo de dados pode ser acessada por meio de cálculos em qualquer momento. 10. Manipulação de dados intuitiva - A maior parte de toda a criação do modelo, manipulação e tarefas de animação ocorrem por meio de cliques no mouse diretamente associados com os dados em análise. 11. Relatório flexível relata que capacidade vai significativamente além dos front- ends disponíveis para os produtos de RDBMS comerciais. Consultas e relatórios quenormalmente requerem SQL significativos e sofisticados (e esforço de codificação processual talvez associado) podem ser criados facilmente com e processados significativamente mais rápido. Analistas são capazes de apresentar dados em qualquer formato, de acordo com qualquer trajetória de consolidação, abrangendo qualquer número de dimensões de dados. 12. Dimensões e agregação de níveis ilimitados - Permite a especificação e manipulação de um número ilimitado de dimensões de dados dentro de um determinado modelo. Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 29 81 (Ano: 2019 Banca: CESPE Órgão: SEFAZ-RS Prova: Auditor Assunto: OLAP/Data Warehouse) O data warehouse diferencia-se dos bancos de dados transacionais porque A trabalha com dados atuais, mas não com dados históricos. B faz uso intenso de operações diárias e de processamento de transações continuamente. C possui milhares de usuários de diferentes níveis hierárquicos dentro da organização. D tem dimensionalidade genérica e níveis de agregação ilimitados. E utiliza ferramentas de prospecção e consulta de dados baseadas em OLTP (on- line transaction processing). _______________________ Comentário: Observem a lista das 12 regras de Codd para avaliação de ferramentas de OLAP: 1. Visão conceitual multidimensional 2. Transparência 3. Acessibilidade 4. Desempenho de Informações consistentes 5. Arquitetura Cliente Servidor 6. Dimensionalidade genérica 7. Manipulação de dados dinâmicos 8. Suporte a multiusuários 9. Operações ilimitadas em dimensões cruzadas 10. Manipulação intuitiva de dados 11. Flexibilidade nas consultas 12. Níveis de dimensão e agregação ilimitados Logo, podemos marcar nossa resposta na alternativa D. Gabarito: D Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 30 81 QUESTÕES Abaixo apresentamos uma lista com mais de 40 questões das mais variadas bancas sobre o conteúdo que aprendemos nesta aula. Espero que gostem. Caso tenham alguma dúvida não deixe de me enviar no fórum de dúvida. Vamos que vamos CANETA PRETA!!! QUESTÕES OLAP - COMENTADAS 1. Instituto AOCP - Ana TI (UFPB)/UFPB/2019 Sobre Processamento Analítico On-Line (OLAP), analise as assertivas e assinale a alternativa que aponta as corretas. I. Trabalha sobre histórico de dados com o objetivo de analisar informações. II. Opera com dados em tempo real. III. Suporta operações cotidianas do processo operacional. IV. Usado para realizar análise de dados a fim de se obter informações desejadas. V. Disponibiliza relatórios de forma dinâmica para análise e tratamento. a) Apenas I, IV e V. b) Apenas I, II e III. c) Apenas II e IV. d) Apenas II, IV e V. e) Apenas I e V. Comentário: Sabemos que OLAP (processamento analítico on-line) é um termo usado para descrever a análise de dados complexos do data warehouse. Sabemos também que um data warehouse é uma coleção de dados orientada a assunto, integrada, não volátil, variável no tempo para o suporte às decisões da gerência. I Certa. A partir das definições acima podemos verificar que a primeira afirmação é verdadeira pois ela fala que as ferramentas OLAP trabalham sobre os dados históricos com o objetivo de analisar informações. II Errada. Embora existam várias pesquisas avançadas no sentido empregar técnicas de processamento em paralelo para garantir o processamento OLAP em tempo real em grandes bases de dados, não podemos afirmar que isso é uma realidade disponível nas ferramentas de mercado. Logo, temos uma alternativa errada. III Errada. As operações cotidianas do processo operacional são suportadas pelas ferramentas OLTP. IV Certa. O resultado da execução de operações OLAP sobre uma base de dados deve ser um conjunto de informações úteis ou desejáveis. Não faz sentido executar consultas que gerem dados aleatórios sem significado. Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 31 81 V Certa. Essa capacidade de fazer diversos cruzamentos sobre os dados presentes no data warehouse permite que o usuário enxergue os dados de forma dinâmica, navegando pelas hierarquias das dimensões. Assim, como as afirmações I, IV e V estão corretas podemos marcar nossa resposta na alternativa A Gabarito: A 2. FEPESE - Ana (CELESC)/CELESC/Sistemas/Desenvolvimento/2019 Qual a operação OLAP que permite a sumarização de dados por subida na hierarquia ou por redução de uma dimensão? a) Roll up b) Roll across c) Drill across d) Drill down e) Slice down Comentário: Dentre as operações descritas nas alternativas as únicas que existem dentro do contexto das ferramentas OLAP são: ROLL-UP, DRILL ACROSS e DRILL DOWN. Vamos comentar cada uma delas: Roll-up. Os dados são resumidos com generalização cada vez maior (por exemplo, semanal para trimestral para anual). Drill-down. Apresenta os dados em níveis cada vez maiores de detalhes (o complemento ou inverso da operção roll-up). Drill-across. compara medidas numéricas distintas entre diferentes tabelas fatos que são relacionadas entre si através de pelo menos uma dimensão em comum. Desta forma, observamos nossa resposta na alternativa A. Gabarito: A 3. FCC - AJ TRF4/TRF 4/Apoio Especializado/Sistemas de Tecnologia da Informação/2019 Utilizando operações típicas de On-line Analytical Processing pretende obter dados para análise bimestral dos processos da cidade de Porto Alegre. Considerando que essa busca implica obter um nível maior de detalhe, uma vez que foca em um bimestre de uma dada cidade e não em um ano de todo o estado, por exemplo, a operação OLAP ideal para ser utilizada é a) slice. b) rotation. c) drill-down. Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 32 81 d) roll-up. e) dice. Comentário: Essa questão apresenta uma lista de operações válidas das ferramentas OLAP, contudo, apenas uma delas vai fazer o detalhamento dos dados que seria a operação de drill-down. Utilizamos essa operação quando estamos analisando os dados em níveis de agregação progressivamente mais detalhados, ou de menor granularidade. Gabarito: C 4. FCC - Ana TI (SANASA)/SANASA/Suporte DBA Banco de Dados/2019 Considere que uma Analista de TI realizou uma operação de análise multidimensional em um DW, operando em condições ideais, usando uma ferramenta OLAP. Após analisar os dados dos meses do 1o trimestre de 2018, relativos ao tratamento de água da estação ETA1, a Analista aumentou o nível de granularidade da informação para observar os dados de todos os 4 trimestres do mesmo ano da mesma estação. A Analista realizou uma operação a) drill down. b) roll down. c) drill up. d) drill across. e) roll through. Comentário: Vejam que esse tipo de questão se repete ao longo dos anos e nas diversas bancas. Agora o nosso objetivo é aumentar a granularidade, diminuindo o nível de detalhamento. Logo, estamos falando da operação de de drill-upou roll-up. Assim, temos nossa resposta na alternativa C. Gabarito: C 5. FCC - Ana TI (SANASA)/SANASA/Suporte DBA Banco de Dados/2019 Considere que um Analista da SANASA está usando uma ferramenta OLAP para realizar uma operação de análise multidimensional em um DW, operando em condições ideais. Após analisar os dados de abastecimento de água por bairros da cidade, passou imediatamente a analisar a informação por ano, em outra dimensão. O Analista realizou uma operação a) drill through. b) roll down. c) drill across. d) drill up. e) roll through. Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 33 81 Comentário: Essa questão é comum! Cobra a definição equivocada de drill through que apresento na aula, e veja, a FCC mais uma vez! Ela usa como referência o livro do Felipe Nery, Tecnologia e Projeto de Data Warehouse. Ela escreve esse texto sobre drill through: dimensão para uma outra. Por exemplo: estou na dimensão de tempo e no próximo passo começo a Logo, temos a resposta na alternativa A. Gabarito: A 6. Instituto AOCP - AC (IBGE)/IBGE/Análise de Sistemas/Desenvolvimento de Aplicações/2019 O IBGE está implantando novas ferramentas para auxiliar na tomada de decisão em diferentes níveis hierárquicos. Dessa forma, os analistas estão em dúvida da utilização do esquema estrela ou cubos OLAP em um Data Warehouse. Sabendo disso, analise as assertivas e assinale a alternativa que aponta a(s) correta(s). I. Quando os dados são carregados em um cubo OLAP, eles são armazenados e indexados usando formatos e técnicas projetadas para dados dimensionais. II. Uma das vantagens do esquema estrela é o suporte a hierarquias irregulares complexas e de profundidade indeterminada, como organogramas ou listas de materiais. III. O modelo dimensional, quando implementado em banco de dados multidimensional, é chamado de esquema em estrela. a) Apenas I. b) Apenas II. c) Apenas III. d) Apenas I e II. e) Apenas II e III. Comentário: Uma coisa interessante que essa questão consegue reforçar no nosso aprendizado é a diferença entre os modelos estrela e o cubo de dados multidimensionais. Perceba que o modelo estrela representa uma base de dados analítica construída sobre tabelas (fato central e dimensões). Já o cubo de dados é construído sobre uma estrutura de matricial otimizada para consultas analíticas que navegam sobre as hierarquias dos dados. Agora, vamos analisar as afirmações. I. Correta. Perceba que a definição se enquadra na ideia da geração de cubos OLAP como hipercubo, que apresenta a característica de possuir armazenamento e indexação em estruturas de dados que otimizam consultas ao invés de atualizações. Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 34 81 II. Errada. As vantagens do modelo estrela são: (1) melhor performance quando comparada com o modelo floco de neve, pois todas as tabelas dimensões estão ligadas diretamente a tabela fato. (2) Fácil entendimento e navegação. (3) Existência da integridade referencial. (4) Performance de carga e administração. Além disso, não podemos ter hierarquia irregulares dentro das dimensões. Cada hierarquia deve seguir a mesma lista de elementos. Outro ponto é que ela não pode ter profundidade indeterminada. O conjunto de níveis em uma hierarquia precisa ser definido. Veja que os exemplos de organogramas e lista de matérias são descritos em um conjunto de elementos determinados. (não existe um espaço em branco num organograma de uma empresa.) III. Errada. O modelo estrela descreve uma estrutura dimensional implementada em um banco de dados relacional. Gabarito: A 7. Instituto AOCP - Ana Sist (EMPREL)/EMPREL/2019 Como se denomina a ferramenta para acesso à informação de um Data Warehouse que armazena dados históricos para tomadas de decisão empresariais? a) OLTP (On-Line Transaction Process). b) Machine Learning. c) OLAP (On-Line Analytical Processing). d) Sistema de Informação Gerencial (SIG). e) ETL (Extraction, Transformation, Loader). Comentário: Sabemos que, pela descrição do enunciado trata-se da definição das ferramentas OLAP. Abaixo apresentamos uma comparação entre as ferramentas OLAP e OLTP. OLAP OLTP Foco Foco no nível estratégico da organização. Visa a análise e tomada de decisão. Foco no nível operacional da organização. Visa a execução dos processos de negócio. Performance Otimização para leitura e geração de análises e relatórios gerenciais. Alta velocidade na manipulação de dados operacionais, porém ineficiente para geração de análises gerenciais. Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 35 81 Estrutura dos dados Modelo dimensional. Os dados possuem alto nível de sumarização. Modelo relacional normalizado, otimizado para a utilização transacional. Os dados possuem alto nível de detalhes. Armazenamento Data Warehouse com otimização para grandes volumes de dados. O armazenamento é feito em sistemas convencionais do banco de dados através dos sistemas de informação Abrangência É utilizado pelos gestores e analistas para tomada de decisão. É utilizado por técnicos e analistas e engloba vários usuários da organização. Frequência de atualização A atualização das informações, por meio da inclusão de novos registros, é feita no processo de carga dos dados. A atualização dos dados é feita no momento da transação. Frequência muito alta de atualizações. Volatilidade Dados históricos e não voláteis. Os dados não sofrem alterações, salvo necessidades específicas (por motivos de erros ou inconsistências de informações). Dados voláteis, passíveis de modificação e exclusão. Tipos de permissões É permitido apenas operações de leitura e inserção. Sendo que, para o usuário final, apenas a leitura está disponível Podem ser feito leitura, inserção, modificação e exclusão dos dados. Assim, podemos marcar a resposta na alternativa C. Gabarito: C Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 36 81 8. FCC - Ana G (DPE AM)/DPE AM/Especializado em Tecnologia da Informação de Defensoria/Analista de Banco de Dados/2018 As ferramentas OLAP compreendem diversas formas de organização dos dados de um data warehouse. Dentre tais formas de organização, no tipo de ferramenta OLAP denominado a) ROLAP, os cubos pré-calculados são armazenados no servidor do ambiente de data warehouse. b) DOLAP, as consultas são feitas diretamente no modelo dimensional do data warehouse. c) MOLAP, as consultas são feitas diretamente no modelo dimensional do data warehouse. d) DOLAP, os cubos pré-calculados são armazenados no servidor do ambiente de data warehouse. e) MOLAP, os cubos pré-calculados são armazenados no servidor do ambiente de data warehouse. Comentário: Vamos relembrar as características do MOLAP: • Dados são armazenados em umbanco de dados multidimensional em uma estrutura do tipo Array para prover um melhor desempenho das consultas. • A implementação varia de acordo com a ferramenta OLAP utilizada, mas frequentemente é implementado em um banco de dados relacional, porém não na terceira forma normal. • O acesso aos dados ocorre diretamente no banco de dados do servidor multidimensional, e o utilizador trabalha, constrói e manipula os dados do cubo diretamente no servidor. (SGBD multidimensional) • Apresenta como vantagem a grande gama de funções de análises presentes nos bancos multidimensionais. • Utiliza Cubos pré-calculados o que aumenta o desempenho nas consultas. • Permite Consultas Ad-hoc com dinamismo Logo, temos a nossa resposta na alternativa E. Gabarito: E 9. AOCP - TGI (SUSIPE)/SUSIPE/Gestão de Informática/2018 Um dos métodos de manipular uma grande quantidade de dados em um banco de dados é utilizar uma aplicação com suporte OLAP. Sobre o OLAP, suas aplicações e características, assinale a alternativa correta. a) Um cubo pode ser caracterizado por uma unidade de análise que agrupa dados de um negócio relacionado. Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 37 81 b) Uma dimensão pode ser caracterizada por uma estrutura que armazena os dados de negócio. c) A operação de ROTATION permite a visualização dos dados sob uma nova perspectiva. d) Um membro é um usuário com permissão de acesso ao banco de dados. e) Medida é uma característica extraída a partir do banco de dados. Comentário: Um dos métodos de manipular uma grande quantidade de dados em um banco de dados é utilizar uma aplicação com suporte a operações OLAP. A partir desta perspectiva podemos analisar cada uma das alternativas. a) Errado. Essa é a definição de dimensão. A dimensão é um eixo do cubo que define um dos contextos de análise. Ex: produto, fornecedor, tempo. b) Errado. Definição de cubo. O cubo é composto por dimensões. c) Correto. A rotação permite mudar a perspectiva, mudando a orientação dos eixos do cubo permitindo a visualização dos dados de outro ângulo. d) Errado. Membro é um subconjunto da dimensão. e) Errado. Medida é um atributo geralmente numérico, usada para fazer comparações. Agrega valores como: total de vendas, valor médio dos produtos. Assim, temos nossa resposta na alternativa C. Gabarito: C 10. CESGRANRIO - Analista de Sistemas (TRANSPETRO)/TRANSPETRO/SAP/2018 Um gestor acessa o servidor OLAP de sua organização, com o objetivo de analisar os resultados anuais de seu desempenho. Após realizar uma consulta, ele pôde observar, a cada ano, o rendimento médio de suas unidades de produção por região brasileira e por produto produzido. Todavia, julgou, em um determinado momento, que sua decisão precisava de um novo enfoque e mudou a estrutura da análise, observando o mesmo rendimento médio anual por produto e por estado da federação. Quais as duas operações OLAP ele realizou? a) drill across e dicing b) pivoting e drill down c) roll down e drill through d) roll up e slicing e) slicing e dicing Comentário: Observamos na questão duas operações. Primeiramente uma das operações vai mudar a perspectiva dos dados fazendo uma rotação ou pivoting sobre os dados. Num segundo momento precisamos analisar o rendimento médio anual por produto e por estado da federação, veja que anteriormente estamos no nível região Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 38 81 da hierarquia presente na dimensão localização. Assim, passamos de um nível de granularidade mais alto para uma granularidade mais baixa, assim estamos aumentando o detalhamento por meio da operação de drill down. Logo, temos nossa resposta na alternativa B. Gabarito: B 11. FCC - Tec Gest (SABESP)/SABESP/Informática/2018 Um Técnico executou uma operação de visualização OLAP que rotacionou os eixos de um determinado cubo, provendo uma visão alternativa dos dados, ou seja, permitindo a visão de suas várias faces. Ele executou a operação a) slice. b) dice. c) drill across. d) pivot. e) roll up. Comentário: Vejamos cada uma das operações listadas acima: a) slice aplica uma restrição sobre uma única dimensão de um cubo OLAP. b) dice - extrai um subcubo do cubo original executando uma operação de seleção sobre duas ou mais dimensões. c) Opaeração de drill across elos dimensionais. Ele evolve mais de uma tabela fato que tenham dimensões em comum agrupando os dados em um único data-set. d) rotation pivot - permite visualizar dados de uma nova perspectiva a partir de uma rotação do cubo. e) Ope roll-up - é a combinação de células de uma ou mais dimensões definidas num cubo. Uma forma de agregação usa o conceito de associação hierárquica com uma dimensão para atingir um nível maior de generalização. A operação desejada pelo comando da questão é de uma visão alternativa, gabarito letra D Gabarito: D 12. CESGRANRIO - Esc BB/BB/"Sem Área"/2018 Considere as Tabelas abaixo. Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 39 81 O funcionário responsável pelo controle do material de expediente de determinada agência preparou a Tabela T com o registro do consumo de alguns itens mais relevantes e apresentou-a ao seu chefe. Esse, então, solicitou que o funcionário montasse mais duas tabelas com formas diferentes de apresentação desses dados. Dadas as instruções para a realização da tarefa, o resultado foi consolidado nas Tabelas X e Y. Diego Carvalho, Renato da Costa, Thiago Rodrigues Cavalcanti, Pedro Henrique Chagas Freitas, Raphael Henrique Lacerda Aula 05 - Prof. Thiago Informática Avançada (TI) p/ Banco do Brasil (Escriturário) - 2021 - Pré-Edital www.estrategiaconcursos.com.br 1837323 00774823100 - Juliana Souza Ferreira 40 81 Considerando-se o conceito de OLAP, quais foram as operações realizadas de T para X e de T para Y, respectivamente? a) Drill Down e Roll-Up b) Drill Down e Rotation c) Slice e Roll-Up d) Roll-Up e Drill Down e) Roll-Up e Rotation Comentário: A questão trata de operações OLAP. Queremos saber qual o nome das operações realizadas para levar os dados da: • Tabela T para tabela X: note que a tabela T apresenta a quantidade de cada produto por trimestre de 2017. Já na tabela X, temos a quantidade de cada produto consolidada pelo ano de 2017. Perceba que temos uma agregação dos dados com um aumento no nível de granularidade, diminuindo a quantidade de detalhes: trata-se, portanto, da operação de roll-up. • Tabela T para tabela Y: sabemos que a tabela T apresenta a quantidade de cada produto por trimestre de 2017. Já na tabela Y, temos os mesmos dados, porém com uma perspectiva diferente modando a orientação dos eixos das dimensões produto e trimestre: trata-se da operação de rotation ou pivot. Assim, temos uma resposta na alternativa E. Gabarito: E 13. FCC - AFRE SC/SEF SC/Auditoria e Fiscalização/2018 Para responder à questão, considere o seguinte caso hipotético: Um Auditor da Receita Estadual pretende descobrir, após denúncia, elementos que possam caracterizar e fundamentar a possível existência de
Compartilhar