Prévia do material em texto
23/12/2022 16:18 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2811011/5995906 1/5 Modelagem e arquitetura do DW (Data Warehouse) 1) 2) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! As organizações precisam responder de maneira ágil e eficiente às mudanças e oportunidades de mercado. Muitas empresas iniciam o desenvolvimento de um Data Warehouse (DW), contemplando conjuntos de dados mais gerenciáveis e categorizados por assunto, para atenderem às necessidades de pequenos grupos de usuários ou níveis funcionais da empresa, investindo, assim, na implementação de Data Marts. Sobre Data Marts, assinale a alternativa correta: Alternativas: Um Data Mart é um depósito de dados especializado, orientado por assunto, integrado, volátil e variável no tempo, a partir de dados extraídos de um DW, com o objetivo específico de dar suporte a rápido determinado grupo ou função de usuários. CORRETO Um Data Mart é um ambiente de processamento analítico, caracterizado por consultas complexas, estruturadas e frequentes, envolvendo agregação ou relacionamento de dados para gerar informações que apoiam processos decisórios. Um Data Mart são sistemas transacionais que registram todas as transações operacionais das organizações, sendo utilizados no processamento dos dados que são gerados diariamente por meio dos sistemas informacionais das empresas. Um Data Mart refere-se ao processo de explorar grandes quantidades de informações, a partir de um conjunto de ferramentas de mineração de dados que se utilizam de algoritmos de aprendizagem baseados em redes neurais e estatísticas. Um Data Mart é um ambiente intermediário de armazenamento e processamento dos dados para o processo de extração, transformação e carga ETL (Extraction, Transformation and Load). Código da questão: 42580 A modelagem multidimensional representa uma abstração dos dados armazenados, consistindo em um modelo composto por tabelas de Fatos e de Dimensões, que proporcionam uma visão multidimensional de grande quantidade de dados. Existem algumas abordagens específicas para modelagem multidimensional, derivadas da aparência do esquema traçado, a partir do Diagrama de Entidades e Relacionamentos (DER), sendo o ___________________ composto de uma tabela dominante no centro, chamada de Fatos, rodeada por tabelas auxiliares, chamadas de tabelas de Dimensões, o qual a tabela de Fatos conecta-se às tabelas de Dimensões por várias junções e cada tabela de Dimensão se conecta com apenas uma junção à tabela de Fatos. E uma variante deste esquema é denominado de ___________________. Assinale a alternativa correta que indica os termos que preenchem as lacunas acima: Alternativas: Esquema Estrela; Esquema Cubo. Esquema Floco de Neve; Esquema Cubo. Esquema Floco de Neve; Esquema Estrela. Esquema MER; Esquema Cubo. Esquema Estrela; Esquema Floco de Neve. CORRETO Resolução comentada: considerando as inúmeras definições de Data Marts, na concepção de Rob e Coronel (2011), um Data Mart é um pequeno subconjunto de um DW, sobre um único assunto, que fornece suporte às decisões de um pequeno grupo de pessoas, que pode ser criado a partir de dados extraídos de um DW maior, com o objetivo específico de dar suporte a acessos mais rápido para determinado grupo ou função. A definição apresentada na alternativa a) refere-se ao conceito de Online Transaction Processing (OLTP – Processamento de Transações em Tempo Real). A definição apresentada na alternativa “Um Data Mart é um ambiente de processamento analítico...” refere-se ao conceito de Online Analytical Pocessing (OLAP – Processamento Analítico On-line. A definição apresentada na alternativa “Um Data Mart refere-se ao processo de explorar...” refere-se ao conceito de Data Mining. A definição apresentada na alternativa e) refere-se a uma parte do processo de funcionamento de um ambiente de Data Warehouse. Resolução comentada: 23/12/2022 16:18 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2811011/5995906 2/5 3) 4) Código da questão: 42591 Ferramentas de mineração de dados (Data Mining) são utilizadas nos diferentes segmentos do mercado para sustentar e consolidar estratégias que auxiliem no processo de tomada de decisão, a partir da geração das informações em conhecimento potencialmente útil. Sobre o conceito de Data Mining, assinale a alternativa correta Alternativas: Refere-se à abordagem de uso combinado de banco de dados relacional com banco de dados orientado a objetos, onde as estruturas relacionais são utilizadas para os dados com maior granularidade e as estruturas orientadas a objetos são utilizadas para dados com menor granularidade. Refere-se à descrição de padrões e tendências que são reveladas por subconjuntos de dados compactados de diferentes bases de dados, a partir de um subconjunto de dados com características idênticas, demostrando as relações funcionais entre as variáveis definidas. Refere-se às atividades que analisam grande volume de dados, descobrem problemas e oportunidades ocultas em seus relacionamentos, formam modelos computacionais com base nessas descobertas e, então, utilizam esses modelos para prever o comportamento do negócio. CORRETO Refere-se à utilização de banco de dados com características multidimensionais, permitindo a navegação com níveis de detalhamento em tempo real, a partir da combinação das dimensões do cubo, proporcionando análises sofisticadas com ótimo desempenho. Refere-se a um pequeno subconjunto de um Data Warehouse, sobre um único assunto, que fornece suporte às decisões para um grupo de pessoas, podendo ser criado a partir de dados extraídos de um DW maior, com o objetivo específico de dar suporte a acessos mais rápido para determinado grupo ou função. Código da questão: 42609 Machado (2013) afirma que uma das principais vantagens de se implantar um Data Mart em uma empresa, é a possibilidade de retorno rápido, garantindo um maior envolvimento do usuário final, capaz de avaliar os benefícios extraídos de seu investimento. (MACHADO, Felipe N. Tecnologia e projeto de data warehouse. 6. ed. São Paulo, SP: Erica, 2013). Sobre as características dos Data Marts, analise os itens a seguir: I. São orientado por assunto, integrado, volátil e variável no tempo. II. Fornecem suporte às decisões de um pequeno grupo de pessoas, departamentos ou área específica do negócio. III. Demandam menos investimento porque são mais baratos, em função de serem implementados mais rápidos. IV. Simulam o raciocínio e a capacidade de aprender de um ser humano, permitindo às organizações administrarem melhor seus processos. Estão corretos os itens: Alternativas: I – II – III – IV. II – III. I – II – III. CORRETO I – II. III – IV. o Esquema Estrela (Star Schema) é a abordagem, proposta por Kimball (1998), que visa criar esquemas físicos mais simples e incremental. O nome estrela se dá devido à disposição em que se encontram as tabelas, sendo a tabela de Fatos, centralizada no esquema, e as tabelas de Dimensões são relacionandas nas pontas do esquema. Elmasri e Navathe (2005) descrevem que o “esquema floco de neve é uma variação do esquema estrela em que as tabelas dimensões de um esquema estrela são organizadas em uma hierarquia ao normalizá-las” (ELMASRI; NAVATHE, 225, p. 725). Resolução comentada: Segundo Rob e Coronel (2011, p. 580), a mineração de dados refere-se às atividades que analisam os dados, descobrem problemas e oportunidades ocultas em seus relacionamentos, formam modelos computacionais com base nessas descobertas e, então, utilizam esses modelos para prever o comportamento do negócio – exigindo a mínima intervenção do usuário final. Resoluçãocomentada: 23/12/2022 16:18 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2811011/5995906 3/5 5) 6) 7) Código da questão: 42582 O modelo multidimensional permite encontrar respostas de comportamento do desempenho dos negócios, por meio dos aspectos a seguir. I. Realizar simulações de cenários. II. Embasar análises estratégicas e alocar decisões. III. Podem ser realizadas abstrações de localidade (onde). IV. Permite resumir a temporalidade (quando). V. Não associa responsabilidades (quem) e classificações (o quê). São verdadeiras: Alternativas: I - II – III – IV. CORRETO II – III – V. I – IV – V. I – III, somente. I – II – III. Código da questão: 42587 O modelo de relacionamento entre _______________ captura as relações entre elas do mundo real. É usado para projetar um _____________conceitual. Auxilia nas visões dos relacionamentos entre as tabelas e também na construção de novas visões em um DW. Assinale a alternativa que completa adequadamente as lacunas acima: Alternativas: Entidades; SGBD. Fontes de dados; Atributos. Tabelas; SGBD. Fontes de dados; Banco de dados. Entidades; Banco de dados. CORRETO Código da questão: 42571 Sobre a construção do DW, considere as seguintes afirmações: ( ) A construção de um DW inicia com a recuperação dos dados históricos da empresa. ( ) A construção pressupõe necessidades de informações especializadas, indicadores de performance da organização. ( ) Uma base histórica auxilia na criação de comparações com dados atuais e tendências futuras. ( ) Um banco de dados analítico é um sistema somente de leitura e escrita que armazena dados. ( ) A construção não prevê também a utilização de ferramentas. Assinale a alternativa que contenha a sequência correta: os itens I, II e III referem-se às características e/ou vantagens dos Data Marts. O item IV é uma característica dos sistemas de inteligência artificial. Resolução comentada: a abordagem do modelo multidimensional permite que respostas sobre o comportamento do desempenho do negócio sejam encontradas por meio de simulações de cenários para embasar as análises estratégicas e alocar decisões. Esta abordagem remete à necessidade de construir um modelo dimensional, em que são feitas perguntas sob abstrações de localidade (onde), temporalidade (quando), responsabilidade (quem) e classificação (o quê). Resolução comentada: O modelo de relacionamento entre entidades, um modelo MER, captura as relações entre essas entidades, refletindo o mundo real. O MER é usado para projetar um banco de dados de maneira conceitual, o que contribui para as visões dos relacionamentos entre as tabelas e também na construção de novas visões em um DW. 23/12/2022 16:18 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2811011/5995906 4/5 8) 9) Alternativas: V –V - V – V – F. F – V – F – V – F. F – V – V – F – F. F - F - F – V – V. V – V – V – F – F. CORRETO Código da questão: 52076 Considerando a temporalidade, conforme referido no material didático, a informação é a combinação de dados e o tratamento inserido nela. Esse tratamento é uma sentença associada, gerando um conceito, um conhecimento, uma afirmação sobre os dados armazenados. Cada sentença permite a criação das bases de informação para realizar as análises. Considerando uma empresa de atacado, em que um DW possibilita a realização de análises, aponte a alternativa que exemplifica pelo menos três tipos de análises geradas. Alternativas: Contratos de qualquer natureza, contas a pagar, performance de vendas. Indicadores climáticos, contratos de qualquer natureza, vendas de produtos. Vendas dos produtos, quantidades do estoque, segmentação de clientes. Listagem de matéria-prima, relação de clientes, endereço dos clientes. Segmentação de clientes, indicadores da campanha de marketing, performance das vendas. CORRETO Código da questão: 42575 Para a definição da arquitetura de um ambiente de Data Warehouse (DW) ou de Data Marts, deve-se levar em conta o porte da empresa, tempo, capacitação da equipe de desenvolvimento e recursos disponibilizados para os investimentos. Sobre a arquitetura de um Data Warehouse e de Data Marts, analise os itens a seguir: I. São classificadas como global, independente ou a combinada; e o tipo de implementação como top down, bottom up ou a integrada. II. A arquitetura global pode ser fisicamente centralizada ou pode ser fisicamente distribuída nas instalações da empresa. III. A arquitetura independente é considerada aquela que comporta as necessidades do DW organizacional com alto nível de acessos e utilização das informações geradas e disponibilizadas, a partir de ferramentas de apoio a decisão para todos os departamentos da empresa. IV. A arquitetura independente mantém Data Marts stand-alone, onde têm-se dados específicos da necessidade da empresa, considerando que cada departamento tem sua informação sem a integração com outros departamentos. V. A arquitetura integrada de Data Marts é implementada por Data Marts separadamente por grupos específicos ou departamentos, sendo integrados ou interconectados posteriormente, provendo uma visão organizacional maior dos dados e informações. Estão corretos os itens: Resolução comentada: A construção de um DW inicia com a recuperação dos dados históricos da empresa. Isso significa realizar cópias da história da organização, de acordo com os dois anos anteriores, como recomenda Machado (2010). A construção pressupõe necessidades de informações especializadas, indicadores de performance da organização. Uma base histórica auxilia na criação de comparações com dados atuais e tendências futuras. A construção prevê também a utilização de ferramentas de EIS e DSS. Essas ferramentas são utilizadas em diferentes níveis de gestão das organizações, de acordo com Turban (2007). Resolução comentada: na alternativa a), a viabilização de um DW pode-se encontrar o detalhamento de um repositório ou armazém de dados deve possuir um DW em que se realizem análises como os exemplos a seguir: Segmentação de clientes. Indicadores da campanha de marketing. Performance das vendas. Análise da fidelização dos clientes. Mensuração do atendimento ao cliente. Status da lucratividade. Comportamento das oscilações dos negócios. 23/12/2022 16:18 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2811011/5995906 5/5 10) Alternativas: III – IV – V. I – II – III. II – IV – V. CORRETO I – II – III – IV – V. II – III – IV – V. Código da questão: 42583 Na concepção de Poe, Klauer, Brobst (1998), o Esquema Estrela possui uma estrutura simples com poucas tabelas e associações bem definidas, aproximando do contexto do modelo de negócio e facilitando a geração de consultas complexas de forma intuitiva e interativa, por meio dos vários parâmetros de consultas. Neste esquema, o assunto principal fica ao centro do esquema, representada pela tabela de Fatos, e suas características, as dimensões, representadas por tabelas de Dimensões, ficam posicionadas ao seu redor, permitindo a leitura e compreensão até mesmo de usuários finais que não estão adaptados com estruturas de banco de dados. (POE V.; KLAUER P.; BROBST S. Building a data warehouse for decision support. New Jersey: Prentice Hall PTR, 1998). Sobre as principais vantagens do Esquema Estrela, julgue os itens a seguir, indicando “V” para o item verdadeiro e “F” para o item falso: 1. ( ) A estrutura padronizada e regular do esquema é bastante simples, faciliatando a apresentação, o desempenho das consultas geradas e a compreensão até mesmo de usuários finais que não estão adaptados com estruturas de banco de dados. 2. ( ) As consultas ocorrem inicialmente nas tabelas de Dimensões e depois nas tabelas de Fatos, assegurando a consistência dos dados por meio de uma estrutura de chaves que garante o acesso aos dados com melhor desempenho. 3. ( ) A aplicação da técnica de normalização nas tabelas de Dimensões aumenta o número de dimensões, consequentemente diminuindo aperformance das consultas dinâmicas. 4. ( ) A facilidade e a flexibilidade da inclusão de novos elementos de dados, a partir do relacionamento da tabela de Fatos com uma nova tabela de Dimensão, bem como o acréscimo de novas colunas às mesmas tabelas de Dimensões. 5. O suporte para transformar e proceder à carga dos dados, para recuperar, analisar e extrair os dados dos sistemas transacionais. Assinale a alternativa correta: Alternativas: V – V – F – V – F. CORRETO F – F – V – F – V. F – F – F – F – F. V – V – V – V – V. F – V – F – V – F. Código da questão: 42602 Resolução comentada: os itens I e III estão errados. O item I está errado porque a arquitetura é classificada como global, independente ou a integrada; e o tipo de implementação é do tipo top down, bottom up ou a combinada. O item III está errado porque é a arquitetura global que mais independente, considerada a arquitetura que comporta as necessidades do DW organizacional com alto nível de acessos e utilização das informações geradas e disponibilizadas, a partir de ferramentas de apoio a decisão para todos os departamentos da empresa. Resolução comentada: o item 3 é falso, porque é o Esquema Floco de Neve que separa as hierarquias das dimensões em tabelas diferentes, especificando variantes da dimensão principal. Considera-se que a aplicação da técnica de normalização nas tabelas de Dimensões aumenta consideravelmente o número de dimensões e, consequentemente, diminuindo a performance das consultas dinâmicas. O item 5 é falso, porque o processo de transformar e proceder à carga dos dados, para recuperar, analisar e extrair os dados dos sistemas transacionais refere-se a uma etapa do processo de criação de um Data Warehouse, conhecido como ETL. Arquivos e Links