Baixe o app para aproveitar ainda mais
Prévia do material em texto
13/09/2023, 14:46 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3036449/8184002 1/7 Modelagem e arquitetura do DW (Data Warehouse) Professor(a): Anderson da Silva Marcolino (Doutorado) 1) 2) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! A modelagem multidimensional representa uma abstração dos dados armazenados, consistindo em um modelo composto por tabelas de Fatos e de Dimensões, que proporcionam uma visão multidimensional de grande quantidade de dados. Existem algumas abordagens específicas para modelagem multidimensional, derivadas da aparência do esquema traçado, a partir do Diagrama de Entidades e Relacionamentos (DER), sendo o ___________________ composto de uma tabela dominante no centro, chamada de Fatos, rodeada por tabelas auxiliares, chamadas de tabelas de Dimensões, o qual a tabela de Fatos conecta-se às tabelas de Dimensões por várias junções e cada tabela de Dimensão se conecta com apenas uma junção à tabela de Fatos. E uma variante deste esquema é denominado de ___________________. Assinale a alternativa correta que indica os termos que preenchem as lacunas acima: Alternativas: Esquema Estrela; Esquema Cubo. Esquema Floco de Neve; Esquema Estrela. Esquema Floco de Neve; Esquema Cubo. Esquema Estrela; Esquema Floco de Neve. CORRETO Esquema MER; Esquema Cubo. Código da questão: 42591 Sobre a construção do DW, considere as seguintes afirmações: ( ) A construção de um DW inicia com a recuperação dos dados históricos da empresa. ( ) A construção pressupõe necessidades de informações especializadas, indicadores de performance da organização. ( ) Uma base histórica auxilia na criação de comparações com dados atuais e tendências futuras. ( ) Um banco de dados analítico é um sistema somente de leitura e escrita que armazena dados. ( ) A construção não prevê também a utilização de ferramentas. Assinale a alternativa que contenha a sequência correta: Alternativas: F – V – V – F – F. V –V - V – V – F. V – V – V – F – F. CORRETO F – V – F – V – F. F - F - F – V – V. Resolução comentada: o Esquema Estrela (Star Schema) é a abordagem, proposta por Kimball (1998), que visa criar esquemas físicos mais simples e incremental. O nome estrela se dá devido à disposição em que se encontram as tabelas, sendo a tabela de Fatos, centralizada no esquema, e as tabelas de Dimensões são relacionandas nas pontas do esquema. Elmasri e Navathe (2005) descrevem que o “esquema floco de neve é uma variação do esquema estrela em que as tabelas dimensões de um esquema estrela são organizadas em uma hierarquia ao normalizá-las” (ELMASRI; NAVATHE, 225, p. 725). Resolução comentada: 13/09/2023, 14:46 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3036449/8184002 2/7 3) 4) Código da questão: 52076 Segundo Rob e Coronel (2011), a característica mais marcante das modernas ferramentas OLAP é a capacidade de análise multidimensional. Os dados são processados e visualizados em uma estrutura multidimensional, sendo especialmente atrativos para os tomadores de decisões de negócios, sendo que, enquanto o DW mantém dados de suporte, a decisões integrados, orientados por assunto, variáveis no tempo e não voláteis, o sistema OLAP fornece o front end por meio do qual os usuários finais acessam e analisam esses dados. (ROB, P.; CORONEL, C. Sistemas de banco de dados: projeto, implementação e administração. 8. ed. São Paulo: Cengage Learning, 2011). Sobre os critérios que uma ferramenta OLAP deve ter, julgue os itens a seguir: I. Dimensionalidade genérica: a ferramenta deve proporcionar condições ao usuário para executar manipulações ou cálculos entre as dimensões. II. Manipulação de matriz esparsa dinâmica: para qualquer matriz esparsa de dados, existe um e somente um esquema físico, o qual provê a máxima eficiência e operacionalidade. III. Flexibilidade nas consultas: a análise e a apresentação dos dados tornam-se mais simples quando linhas, colunas e células, que vão ser comparadas visualmente, são organizados por agrupamentos lógicos. IV. Dimensões e níveis de agregação limitados: um modelo analítico comum deve conter uma matriz com dimensões de dados definidas entre quatro a cinco dimensões. Estão corretos os itens: Alternativas: I – II – III – IV. I – II. I – II – III. CORRETO III – IV. II – III. Código da questão: 42607 Um modelo é uma __________utilizada como técnica para refletir a realidade. Ao modelar os dados de uma organização, sejam operacionais ou analíticos, busca-se o que se quer realizar ou fazer com os dados. Armazenar dados em bancos relacionais para manter o histórico não reflete a realidade da empresa. É necessário desenhar uma organização desses dados e, para isso, um modelo _____________ funciona como uma ferramenta que auxilia na análise dos requisitos e no desenho da estrutura dos dados relacionada a esse negócio. Assinale a alternativa que completa adequadamente a lacuna acima: Alternativas: Granular; Abstração. A construção de um DW inicia com a recuperação dos dados históricos da empresa. Isso significa realizar cópias da história da organização, de acordo com os dois anos anteriores, como recomenda Machado (2010). A construção pressupõe necessidades de informações especializadas, indicadores de performance da organização. Uma base histórica auxilia na criação de comparações com dados atuais e tendências futuras. A construção prevê também a utilização de ferramentas de EIS e DSS. Essas ferramentas são utilizadas em diferentes níveis de gestão das organizações, de acordo com Turban (2007). Resolução comentada: o item IV está errado, porque as dimensões e níveis de agregação são ilimitados: um modelo analítico comum pode conter de quinze a vinte dimensões de dados. 13/09/2023, 14:46 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3036449/8184002 3/7 5) 6) Abstração; Transacional. Abstração; Entidade relacionamento. CORRETO Entidade relacionamento; Dimensional. Entidade; Sumarizado. Código da questão: 42586 O banco de dados analítico é diferente do banco de dados operacional, transacional ou OLTP (Online Transaction Processing), usado para processar as transações. Embora os bancos de dados transacionais possam ser usados para suportar o armazenamento de dados e as aplicações de BI, não se recomenda seu uso por questões de integridade e escalabilidade. I. O banco de dados convencional deve ser preservado, e o banco de dados analíticos deve estar em outro schema. PORQUE II. Um banco de dados analítico tem uma estrutura baseada em coluna, tornando os cálculos individuais muito rápidos. Já os bancos de dados transacionais dependem de armazenamento de dados baseado em linha, impróprio para operar com grandes volumes de dados. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: A primeira e a segunda asserções estão corretas, e a segunda complementa a primeira. CORRETO A primeira e a segunda asserções estão corretas, mas a segunda não tem relação com a primeira. A primeira asserção está correta e a segunda está incorreta. A primeira asserção está incorreta e a segunda está correta A primeira e a segunda asserções estão incorretas. Código da questão: 50534 Um modelo multidimensional é composto por três elementos básicos: fatos, dimensões e métricas. I. As dimensões são os elementos, dados, fórmulas, cálculos, processados, que participam ou são chamadas por meio de chaves estrangeiras dentro de uma Fato. PORQUE II. Uma tabela Fato é composta de dados, medidas e contexto, provenientes de dimensões. Assinale a alternativa acerca das asserções supracitadas, bem como arelação entre elas: Resolução comentada: O modelo entidade relacionamento é uma abstração, e tenta refletir o mundo real, que vislumbra o que ser quer realizar ou fazer. Este modelo é uma ferramenta que ajuda na análise de requisitos de negócio e no design da estrutura de dados relacionada com esse negócio e sua base histórica. O modelo ER descreve as operações relacionadas ao negócio e as ligações entre as entidades do modelo. Resolução comentada: Os bancos de dados transacionais são bancos baseados em armazenamento por linha, o que impossibilita o desempenho quando submetido a cálculos em processos analíticos. Isto deteriora o desempenho para a finalidade base ao qual foi projetado, que é armazenar, acessar, incluir e excluir os registros ali depositados. Portanto, para projetos que envolvam cálculos analíticos outro banco com processo de armazenamento por coluna é mais eficiente, como os bancos de dados analíticos, pois os registros ficam livres para serem submetidos aos cálculos volumétricos, essenciais para BI e Big Data. 13/09/2023, 14:46 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3036449/8184002 4/7 7) Alternativas: As duas asserções estão corretas e a segunda justifica a primeira. CORRETO A primeira e a segunda asserções estão corretas, mas a segunda não justifica a primeira. A primeira asserção está incorreta e a segunda está correta. A primeira asserção está correta e a segunda está incorreta. A primeira e a segunda asserções estão incorretas. Código da questão: 42589 As organizações precisam responder de maneira ágil e eficiente às mudanças e oportunidades de mercado. Muitas empresas iniciam o desenvolvimento de um Data Warehouse (DW), contemplando conjuntos de dados mais gerenciáveis e categorizados por assunto, para atenderem às necessidades de pequenos grupos de usuários ou níveis funcionais da empresa, investindo, assim, na implementação de Data Marts. Sobre Data Marts, assinale a alternativa correta: Alternativas: Um Data Mart é um ambiente intermediário de armazenamento e processamento dos dados para o processo de extração, transformação e carga ETL (Extraction, Transformation and Load). Um Data Mart é um depósito de dados especializado, orientado por assunto, integrado, volátil e variável no tempo, a partir de dados extraídos de um DW, com o objetivo específico de dar suporte a rápido determinado grupo ou função de usuários. CORRETO Um Data Mart refere-se ao processo de explorar grandes quantidades de informações, a partir de um conjunto de ferramentas de mineração de dados que se utilizam de algoritmos de aprendizagem baseados em redes neurais e estatísticas. Um Data Mart são sistemas transacionais que registram todas as transações operacionais das organizações, sendo utilizados no processamento dos dados que são gerados diariamente por meio dos sistemas informacionais das empresas. Um Data Mart é um ambiente de processamento analítico, caracterizado por consultas complexas, estruturadas e frequentes, envolvendo agregação ou relacionamento de dados para gerar informações que apoiam processos decisórios. Código da questão: 42580 Resolução comentada: Em um projeto de DW, o cubo multidimensional é formado por dimensões, fatos e medidas ou métricas. Uma tabela fato é formado por ligações provenientes das colunas das dimensões, essa ligação significa que a chave primária da dimensão é chave estrangeira da tabela Fato. A tabela Fato pode ser um item, uma transação ou um evento, que está relacionado ao negócio, tem valores numéricos, e contém medidas que são representadas sumariamente. Resolução comentada: considerando as inúmeras definições de Data Marts, na concepção de Rob e Coronel (2011), um Data Mart é um pequeno subconjunto de um DW, sobre um único assunto, que fornece suporte às decisões de um pequeno grupo de pessoas, que pode ser criado a partir de dados extraídos de um DW maior, com o objetivo específico de dar suporte a acessos mais rápido para determinado grupo ou função. A definição apresentada na alternativa a) refere-se ao conceito de Online Transaction Processing (OLTP – Processamento de Transações em Tempo Real). A definição apresentada na alternativa “Um Data Mart é um ambiente de processamento analítico...” refere-se ao conceito de Online Analytical Pocessing (OLAP – Processamento Analítico On-line. A definição apresentada na alternativa “Um Data Mart refere-se ao processo de explorar...” refere-se ao conceito de Data Mining. A definição apresentada na alternativa e) refere-se a uma parte do processo de funcionamento de um ambiente de Data Warehouse. 13/09/2023, 14:46 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3036449/8184002 5/7 8) 9) A mineração de dados é comumente classificada pela sua capacidade em realizar tarefas para diferentes domínios. A literatura indica que não existe um consenso de denominação quanto à classificação, funcionalidades, tarefas, métodos ou técnicas de mineração de dados. Contudo, Fayyad et al. (1996) apresentam alguns métodos de mineração de dados que têm como objetivo a predição ou descrição dos resultados: (FAYYAD, U.M. et al. Advances in knowledge discovery and data mining. California: AAAI Press, 1996). Sobre as técnicas de Data Mining, julgue os itens a seguir, indicando “V” para o item verdadeiro e “F” para o item falso: 1. ( ) Regressão: usa-se para associar ou classificar um item a uma ou a várias categorias pré-definidas, derivando uma regra que possa ser usada para classificar uma observação, referente a um conjunto de dados identificados que são categorizados por um assunto. 2. ( ) Análise de Séries Temporais: refere-se a tarefa similar à classificação, porém é usada quando os dados são identificados por predição de valores numéricos, considerados variáveis independentes ou exploratórias, e não pela categorização dos itens analisados, sendo possível verificar o eventual relacionamento funcional que possa existir entre duas ou mais variáveis quantitativas. 3. ( ) Agrupamentos (Clusters): refere-se à tarefa de segmentar um conjunto de dados em grupos diferentes, cujos itens são semelhantes, ou seja, subdivide o conjunto de dados em um conjunto menor, sendo similar no comportamento dos atributos de segmentação, descobrindo grupos diferentes entre o conjunto de dados selecionado. 4. ( ) Sumarização: refere-se à tarefa de descrever padrões e tendências que são reveladas por subconjuntos de dados compactados, a partir de um subconjunto de dados com características similares, demostrando as relações funcionais entre as variáveis definidas para a análise exploratória do subconjunto de dados 5. ( ) Análise de Séries Temporais: refere-se a tarefa similar à regra de associação com objetivo de aplicar algum tipo de padrão (tendências, variações sazonais, variações cíclicas e variações irregulares) no conjunto de dados, para determinar que tipos de sequências podem ocorrer em um determinado período. Assinale a alternativa que indica a sequência correta: Alternativas: F – V – F – V – F. V – V – V – V – V F – F – F – F – F. F – F – V – V – V. CORRETO V – V – F – V – F. Código da questão: 42615 As ferramentas que apresentam características OLAP passaram a ser referenciadas como ferramentas OLAP. As ferramentas OLAP podem ser classificadas de acordo com a estratégia de armazenamento, sendo chamadas de OLAP Multidimensional (MOLAP), OLAP Relacional (ROLAP), OLAP Híbrido e OLAP Web. Assinale a alternativa correta que descreve as características das ferramentas do tipo MOLAP. Resolução comentada: o Item 1 é falso, porque refere-se ao método classificação usado para associar ou classificar um item a uma ou a várias categorias pré-definidas, derivando uma regra que possa ser usada para classificar uma observação, referente a um conjunto de dados identificados que são categorizados por um assunto. O item 2 é falso, porque descreve o método de Regressão que se refere a tarefa similar à classificação, porém é usada quando os dadossão identificados por predição de valores numéricos, considerados variáveis independentes ou exploratórias, e não pela categorização dos itens analisados, sendo possível verificar o eventual relacionamento funcional que possa existir entre duas ou mais variáveis quantitativas. 13/09/2023, 14:46 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3036449/8184002 6/7 10) Alternativas: O MOLAP refere-se à utilização da ferramenta OLAP em ambiente remoto, disparando consultas via um navegador web para o servidor que, por sua vez, retorna o cubo processado para análise do usuário. O MOLAP refere-se à utilização de banco de dados com características multidimensionais, permitindo operações que ocorrem quando o usuário navega pelas informações contidas entre dimensões de esquemas diferentes, acessados remotamente. O MOLAP refere-se à abordagem de uso combinado de um banco de dados relacional com um banco de dados orientado a objetos, onde as estruturas relacionais são utilizadas para os dados com maior granularidade e as estruturas orientadas a objetos são utilizadas para dados com menor granularidade. O MOLAP refere-se à utilização de banco de dados com características multidimensionais, permitindo a navegação com níveis de detalhamento em tempo real, a partir da combinação das dimensões do cubo, proporcionando análises sofisticadas com ótimo desempenho. CORRETO O MOLAP refere-se à utilização de banco de dados relacional para implementar soluções OLAP, permitindo análise multidimensional dos dados que estão armazenados em uma base de dados relacional, sendo feito todo o processamento no servidor da base de dados e depois gerados os comandos SQL e as tabelas temporárias. Código da questão: 42604 Para a definição da arquitetura de um ambiente de Data Warehouse (DW) ou de Data Marts, deve-se levar em conta o porte da empresa, tempo, capacitação da equipe de desenvolvimento e recursos disponibilizados para os investimentos. Sobre a arquitetura de um Data Warehouse e de Data Marts, analise os itens a seguir: I. São classificadas como global, independente ou a combinada; e o tipo de implementação como top down, bottom up ou a integrada. II. A arquitetura global pode ser fisicamente centralizada ou pode ser fisicamente distribuída nas instalações da empresa. III. A arquitetura independente é considerada aquela que comporta as necessidades do DW organizacional com alto nível de acessos e utilização das informações geradas e disponibilizadas, a partir de ferramentas de apoio a decisão para todos os departamentos da empresa. IV. A arquitetura independente mantém Data Marts stand-alone, onde têm-se dados específicos da necessidade da empresa, considerando que cada departamento tem sua informação sem a integração com outros departamentos. V. A arquitetura integrada de Data Marts é implementada por Data Marts separadamente por grupos específicos ou departamentos, sendo integrados ou interconectados posteriormente, provendo uma visão organizacional maior dos dados e informações. Estão corretos os itens: Alternativas: II – IV – V. CORRETO III – IV – V. II – III – IV – V. I – II – III – IV – V. I – II – III. Resolução comentada: O MOLAP refere-se à utilização de banco de dados com características multidimensionais, permitindo a navegação com níveis de detalhamento em tempo real, a partir da combinação das dimensões do cubo, proporcionando análises sofisticadas com ótimo desempenho. Segundo Machado (2013), em um banco de dados multidimensional, os cruzamentos de valores são realizados automaticamente, agilizando a visualização multidimensional das informações sob o ponto de vista de todas as dimensões. A forma de acesso e de agregação dos dados faz com que esta ferramenta tenha um excelente desempenho. 13/09/2023, 14:46 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3036449/8184002 7/7 Código da questão: 42583 Resolução comentada: os itens I e III estão errados. O item I está errado porque a arquitetura é classificada como global, independente ou a integrada; e o tipo de implementação é do tipo top down, bottom up ou a combinada. O item III está errado porque é a arquitetura global que mais independente, considerada a arquitetura que comporta as necessidades do DW organizacional com alto nível de acessos e utilização das informações geradas e disponibilizadas, a partir de ferramentas de apoio a decisão para todos os departamentos da empresa. Arquivos e Links
Compartilhar