Baixe o app para aproveitar ainda mais
Prévia do material em texto
29/07/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2353654/2563000 1/6 Modelagem e arquitetura do DW (Data Warehouse) Professor(a): Marise de Barros Miranda Gomes (Doutorado) 1) 2) 3) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! O modelo de relacionamento entre _______________ captura as relações entre elas do mundo real. É usado para projetar um _____________conceitual. Auxilia nas visões dos relacionamentos entre as tabelas e também na construção de novas visões em um DW. Assinale a alternativa que completa adequadamente as lacunas acima: Alternativas: Tabelas; SGBD. Fontes de dados; Atributos. Entidades; Banco de dados. CORRETO Entidades; SGBD. Fontes de dados; Banco de dados. Código da questão: 42571 Um modelo é uma __________utilizada como técnica para refletir a realidade. Ao modelar os dados de uma organização, sejam operacionais ou analíticos, busca-se o que se quer realizar ou fazer com os dados. Armazenar dados em bancos relacionais para manter o histórico não reflete a realidade da empresa. É necessário desenhar uma organização desses dados e, para isso, um modelo _____________ funciona como uma ferramenta que auxilia na análise dos requisitos e no desenho da estrutura dos dados relacionada a esse negócio. Assinale a alternativa que completa adequadamente a lacuna acima: Alternativas: Entidade relacionamento; Dimensional. Abstração; Entidade relacionamento. CORRETO Abstração; Transacional. Granular; Abstração. Entidade; Sumarizado. Código da questão: 42586 O banco de dados analítico é diferente do banco de dados operacional, transacional ou OLTP (Online Transaction Processing), usado para processar as transações. Embora os bancos de dados transacionais possam ser usados para suportar o armazenamento de Resolução comentada: O modelo de relacionamento entre entidades, um modelo MER, captura as relações entre essas entidades, refletindo o mundo real. O MER é usado para projetar um banco de dados de maneira conceitual, o que contribui para as visões dos relacionamentos entre as tabelas e também na construção de novas visões em um DW. Resolução comentada: O modelo entidade relacionamento é uma abstração, e tenta refletir o mundo real, que vislumbra o que ser quer realizar ou fazer. Este modelo é uma ferramenta que ajuda na análise de requisitos de negócio e no design da estrutura de dados relacionada com esse negócio e sua base histórica. O modelo ER descreve as operações relacionadas ao negócio e as ligações entre as entidades do modelo. 29/07/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2353654/2563000 2/6 4) dados e as aplicações de BI, não se recomenda seu uso por questões de integridade e escalabilidade. I. O banco de dados convencional deve ser preservado, e o banco de dados analíticos deve estar em outro schema. PORQUE II. Um banco de dados analítico tem uma estrutura baseada em coluna, tornando os cálculos individuais muito rápidos. Já os bancos de dados transacionais dependem de armazenamento de dados baseado em linha, impróprio para operar com grandes volumes de dados. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: A primeira e a segunda asserções estão incorretas. A primeira asserção está incorreta e a segunda está correta A primeira e a segunda asserções estão corretas, e a segunda complementa a primeira. CORRETO A primeira asserção está correta e a segunda está incorreta. A primeira e a segunda asserções estão corretas, mas a segunda não tem relação com a primeira. Código da questão: 50534 Para a definição da arquitetura de um ambiente de Data Warehouse (DW) ou de Data Marts, deve-se levar em conta o porte da empresa, tempo, capacitação da equipe de desenvolvimento e recursos disponibilizados para os investimentos. Sobre a arquitetura de um Data Warehouse e de Data Marts, analise os itens a seguir: I. São classificadas como global, independente ou a combinada; e o tipo de implementação como top down, bottom up ou a integrada. II. A arquitetura global pode ser fisicamente centralizada ou pode ser fisicamente distribuída nas instalações da empresa. III. A arquitetura independente é considerada aquela que comporta as necessidades do DW organizacional com alto nível de acessos e utilização das informações geradas e disponibilizadas, a partir de ferramentas de apoio a decisão para todos os departamentos da empresa. IV. A arquitetura independente mantém Data Marts stand-alone, onde têm-se dados específicos da necessidade da empresa, considerando que cada departamento tem sua informação sem a integração com outros departamentos. V. A arquitetura integrada de Data Marts é implementada por Data Marts separadamente por grupos específicos ou departamentos, sendo integrados ou interconectados posteriormente, provendo uma visão organizacional maior dos dados e informações. Estão corretos os itens: Alternativas: II – III – IV – V. I – II – III – IV – V. II – IV – V. CORRETO III – IV – V. I – II – III. Resolução comentada: Os bancos de dados transacionais são bancos baseados em armazenamento por linha, o que impossibilita o desempenho quando submetido a cálculos em processos analíticos. Isto deteriora o desempenho para a finalidade base ao qual foi projetado, que é armazenar, acessar, incluir e excluir os registros ali depositados. Portanto, para projetos que envolvam cálculos analíticos outro banco com processo de armazenamento por coluna é mais eficiente, como os bancos de dados analíticos, pois os registros ficam livres para serem submetidos aos cálculos volumétricos, essenciais para BI e Big Data. 29/07/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2353654/2563000 3/6 5) 6) Código da questão: 42583 A abordagem analítica requer uma arquitetura de dados especializada, complemente a sentença a seguir. As necessidades analíticas sobre os dados provocaram mudanças na arquitetura da base de dados. Os _____________________ são os dados brutos. Os dados resumidos, agregados, sumarizados ou calculados são os dados ____________. Assinale a alternativa que completa adequadamente as lacunas acima: Alternativas: Segmentados; Transacionais Dados das operações; Amostrados. Segmentados; Matemáticos. Dados das operações; Segmentados. Dados das operações; Derivados. CORRETO Código da questão: 42576 Ferramentas de mineração de dados (Data Mining) são integradas aos ambientes de Data Warehouse para gerarem informações em conhecimento potencialmente útil. Sua função principal é a extração de grande volume de dados com o objetivo de encontrarem padrões e correlações significativas, estimarem tendências e novas perspectivas que agreguem, satisfatoriamente, com contexto do negócio explorado. Sobre as técnicas de Data Mining, julgue os itens a seguir: I. Árvores de Decisão (Decision Tree): caracterizam-se pelo método de classificação de dados, sendo conveniente adotar essa técnica quando o objetivo é gerar regras que possam ser entendidas, explicadas e traduzidas para a linguagem natural. II. Redes Neurais Artificiais: caracterizam-se em resolver problemas complexos e construir representações internas de modelos ou padrões detectados nos dados que envolvem o desenvolvimento de estruturas matemáticas com habilidade de aprendizado, por meio de experiências de operações da própria máquina. III. Predição com Séries Temporais: caracteriza-se em identificar a existência de diferentes grupos dentro de um conjunto de dados e, constatada está existência, agrupa-se os elementos estudados de acordo com suas similaridades, podendo refiná-los e definira priorização entre eles. IV. Análise de Regressão: utiliza-se algoritmos genéticos para encontrar soluções de problemas dinâmicos e complexos que envolvem centenas ou milhares de variáveis e/ou fórmulas para identificar as descobertas, gerando possíveis soluções simultaneamente. Estão corretos os itens: Alternativas: Resolução comentada: os itens I e III estão errados. O item I está errado porque a arquitetura é classificada como global, independente ou a integrada; e o tipo de implementação é do tipo top down, bottom up ou a combinada. O item III está errado porque é a arquitetura global que mais independente, considerada a arquitetura que comporta as necessidades do DW organizacional com alto nível de acessos e utilização das informações geradas e disponibilizadas, a partir de ferramentas de apoio a decisão para todos os departamentos da empresa. Resolução comentada: Inmon (1997) destaca a mudança na abordagem em relação aos dados brutos, que no início dos registros de dados não havia a experiência que pudesse prever arranjos diferentes para suportar análises. O objetivo de arquiteturas básicas para banco de dados eram armazenar os registros, sem a robustez necessária para suportar necessidades futuras. As necessidades analíticas sobre os dados provocaram mudanças na arquitetura, surgindo demandas provenientes de dados derivados. Os dados do dia a dia, das operações, in natura, são os dados brutos. Os dados resumidos, agregados, sumarizados ou calculados são os dados derivados. 29/07/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2353654/2563000 4/6 7) 8) I – II. CORRETO II – III. I – II – III. I – II – III – IV. III – IV. Código da questão: 42614 Um modelo multidimensional é composto por três elementos básicos: fatos, dimensões e métricas. I. As dimensões são os elementos, dados, fórmulas, cálculos, processados, que participam ou são chamadas por meio de chaves estrangeiras dentro de uma Fato. PORQUE II. Uma tabela Fato é composta de dados, medidas e contexto, provenientes de dimensões. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: A primeira asserção está correta e a segunda está incorreta. A primeira asserção está incorreta e a segunda está correta. A primeira e a segunda asserções estão corretas, mas a segunda não justifica a primeira. As duas asserções estão corretas e a segunda justifica a primeira. CORRETO A primeira e a segunda asserções estão incorretas. Código da questão: 42589 Os ambientes de Data Warehouses (DW) integram sofisticadas ferramentas para análises complexas de dados históricos e descoberta de conhecimento, assegurando o suporte à tomada de decisão. Um ________________ organizacional pode manter um armazém central de dados da organização inteira, ou pode manter armazéns menores, descentralizados, denominados ________________. Assinale a alternativa que completa adequadamente as lacunas acima: Alternativas: Data Mining; Data Warehouse. Data Mining; Data Source. Data Warehouse; Data Mining. Data Mining; Data Marts. Resolução comentada: o Item III está errado porque refere-se a técnica de Análise de Aglomerações (Cluster Analysis): caracteriza-se em identificar a existência de diferentes grupos dentro de um conjunto de dados e, constatada esta existência, agrupa-se os elementos estudados de acordo com suas similaridades, podendo refiná-los e definir a priorização entre eles. O item IV está errado, porque refere-se à técnica de Algoritmos Genéticos: utiliza-se algoritmos genéticos para encontrar soluções de problemas dinâmicos e complexos que envolvem centenas ou milhares de variáveis e/ou fórmulas para identificar as descobertas, gerando possíveis soluções simultaneamente. Resolução comentada: Em um projeto de DW, o cubo multidimensional é formado por dimensões, fatos e medidas ou métricas. Uma tabela fato é formado por ligações provenientes das colunas das dimensões, essa ligação significa que a chave primária da dimensão é chave estrangeira da tabela Fato. A tabela Fato pode ser um item, uma transação ou um evento, que está relacionado ao negócio, tem valores numéricos, e contém medidas que são representadas sumariamente. 29/07/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2353654/2563000 5/6 9) 10) Data Warehouse; Data Marts. CORRETO Código da questão: 42581 Uma característica importante que deve estar presente em ferramentas OLAP é a capacidade de efetuar operações sobre um conjunto de dados multidimensional que retorna uma apresentação ou sumarização diferente de informações. Existem diversos operadores OLAP que permitem acessar os dados em esquemas multidimensionais. As principais operações são do tipo Drill (Drill Down, Drill Up, Drill Across e Drill Throught) e as do tipo Slice and Dice. Sobre os tipos de operações, julgue os itens a seguir, indicando “V” para o item verdadeiro e “F” para o item falso: 1. ( ) O tipo de operação Drill Down ocorre quando o usuário aumenta o nível de detalhe da informação, diminuindo a granularidade, ou seja, navega verticalmente, descendo a hierarquia no sentido mais específico. 2. ( ) O tipo de operação Drill Up ocorre quando o usuário aumenta o nível de granularidade, diminuindo o nível de detalhamento da informação. 3. ( ) O tipo de operação Drill Across permite navegar transversalmente no eixo da árvore hierárquica, inserindo ou retirando posições da dimensão. 4. ( ) O tipo de operação Slice and Dice ocorre quando o usuário navega de uma informação contida em uma dimensão para uma outra dimensão. 5. ( ) O tipo de operação Drill Throught significa a redução do escopo dos dados em análise, além de mudar a ordem das dimensões, mudando, assim, a orientação segundo a qual os dados são visualizados. Assinale a alternativa correta Alternativas: V – V – V – V – V. F – F – F – V – V. F – F – F – F – F. V – F – V – F – V. V – V – V – F – F. CORRETO Código da questão: 42608 Na concepção de Poe, Klauer, Brobst (1998), o Esquema Estrela possui uma estrutura simples com poucas tabelas e associações bem definidas, aproximando do contexto do modelo de negócio e facilitando a geração de consultas complexas de forma intuitiva e interativa, por meio dos vários parâmetros de consultas. Neste esquema, o assunto principal fica ao centro do esquema, representada pela tabela de Fatos, e suas características, as dimensões, representadas por tabelas de Dimensões, ficam posicionadas ao seu redor, permitindo a leitura e compreensão até mesmo de usuários finais que não Resolução comentada: os ambientes de Data Warehouses (DW) integram sofisticadas ferramentas para análises complexas de dados históricos e descoberta de conhecimento, assegurando o suporte à tomada de decisão. Um Data Warehouse organizacional pode manter um armazém central de dados da organização inteira, ou pode manter armazéns menores, descentralizados, denominados Data Mart. Resolução comentada: o item 4 é falso, porque o tipo de operação Slice and Dice que significa a redução do escopo dos dados em análise, além de alterar a ordem das dimensões, altera, também, a orientação segundo a qual os dados são visualizados. Segundo Machado (2013), Slice é a operação que corta o cubo, mas mantém a mesma perspectiva de visualização dos dados. Dice, por sua vez, é a mudança de perspectiva da visão, ou seja, é a extração de um subcubo ou a interseção de vários Slices. O item 5 é falso, porque o tipo de operação Drill Throught ocorre quando o usuário navega de uma informação contida em uma dimensão para uma outra dimensão. Por exemplo, quando o usuário está na dimensão de tempo e no próximo passo começa a analisar a informação por região. 29/07/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2353654/2563000 6/6 estão adaptados com estruturas de banco de dados. (POE V.; KLAUER P.; BROBST S. Building a data warehouse for decision support. New Jersey: Prentice Hall PTR, 1998). Sobreas principais vantagens do Esquema Estrela, julgue os itens a seguir, indicando “V” para o item verdadeiro e “F” para o item falso: 1. ( ) A estrutura padronizada e regular do esquema é bastante simples, faciliatando a apresentação, o desempenho das consultas geradas e a compreensão até mesmo de usuários finais que não estão adaptados com estruturas de banco de dados. 2. ( ) As consultas ocorrem inicialmente nas tabelas de Dimensões e depois nas tabelas de Fatos, assegurando a consistência dos dados por meio de uma estrutura de chaves que garante o acesso aos dados com melhor desempenho. 3. ( ) A aplicação da técnica de normalização nas tabelas de Dimensões aumenta o número de dimensões, consequentemente diminuindo a performance das consultas dinâmicas. 4. ( ) A facilidade e a flexibilidade da inclusão de novos elementos de dados, a partir do relacionamento da tabela de Fatos com uma nova tabela de Dimensão, bem como o acréscimo de novas colunas às mesmas tabelas de Dimensões. 5. O suporte para transformar e proceder à carga dos dados, para recuperar, analisar e extrair os dados dos sistemas transacionais. Assinale a alternativa correta: Alternativas: V – V – V – V – V. F – F – V – F – V. V – V – F – V – F. CORRETO F – F – F – F – F. F – V – F – V – F. Código da questão: 42602 Resolução comentada: o item 3 é falso, porque é o Esquema Floco de Neve que separa as hierarquias das dimensões em tabelas diferentes, especificando variantes da dimensão principal. Considera-se que a aplicação da técnica de normalização nas tabelas de Dimensões aumenta consideravelmente o número de dimensões e, consequentemente, diminuindo a performance das consultas dinâmicas. O item 5 é falso, porque o processo de transformar e proceder à carga dos dados, para recuperar, analisar e extrair os dados dos sistemas transacionais refere-se a uma etapa do processo de criação de um Data Warehouse, conhecido como ETL. Arquivos e Links
Compartilhar