Buscar

Modelagem e arquitetura do DW 2021

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

1)
Na concepção de Poe, Klauer, Brobst (1998), o Esquema Estrela possui uma estrutura simples com poucas tabelas e associações bem definidas, aproximando do contexto do modelo de negócio e facilitando a geração de consultas complexas de forma intuitiva e interativa, por meio dos vários parâmetros de consultas. Neste esquema, o assunto principal fica ao centro do esquema, representada pela tabela de Fatos, e suas características, as dimensões, representadas por tabelas de Dimensões, ficam posicionadas ao seu redor, permitindo a leitura e compreensão até mesmo de usuários finais que não estão adaptados com estruturas de banco de dados.
(POE V.; KLAUER P.; BROBST S. Building a data warehouse for decision support. New Jersey: Prentice Hall PTR, 1998).
Sobre as principais vantagens do Esquema Estrela, julgue os itens a seguir, indicando “V” para o item verdadeiro e “F” para o item falso:
1. ( ) A estrutura padronizada e regular do esquema é bastante simples, faciliatando a apresentação, o desempenho das consultas geradas e a compreensão até mesmo de usuários finais que não estão adaptados com estruturas de banco de dados.
2. ( ) As consultas ocorrem inicialmente nas tabelas de Dimensões e depois nas tabelas de Fatos, assegurando a consistência dos dados por meio de uma estrutura de chaves que garante o acesso aos dados com melhor desempenho.
3. ( ) A aplicação da técnica de normalização nas tabelas de Dimensões aumenta o número de dimensões, consequentemente diminuindo a performance das consultas dinâmicas.
4. ( ) A facilidade e a flexibilidade da inclusão de novos elementos de dados, a partir do relacionamento da tabela de Fatos com uma nova tabela de Dimensão, bem como o acréscimo de novas colunas às mesmas tabelas de Dimensões.
5. O suporte para transformar e proceder à carga dos dados, para recuperar, analisar e extrair os dados dos sistemas transacionais.
Assinale a alternativa correta:
Alternativas:
V – V – F – V – F.checkCORRETO
F – F – V – F – V.
F – F – F – F – F.
V – V – V – V – V.
F – V – F – V – F.
Resolução comentada:
o item 3 é falso, porque é o Esquema Floco de Neve que separa as hierarquias das dimensões em tabelas diferentes, especificando variantes da dimensão principal. Considera-se que a aplicação da técnica de normalização nas tabelas de Dimensões aumenta consideravelmente o número de dimensões e, consequentemente, diminuindo a performance das consultas dinâmicas.
O item 5 é falso, porque o processo de transformar e proceder à carga dos dados, para recuperar, analisar e extrair os dados dos sistemas transacionais refere-se a uma etapa do processo de criação de um Data Warehouse, conhecido como ETL.
código da questão: 42602
2)
Ferramentas de mineração de dados (Data Mining) são integradas aos ambientes de Data Warehouse para gerarem informações em conhecimento potencialmente útil. Sua função principal é a extração de grande volume de dados com o objetivo de encontrarem padrões e correlações significativas, estimarem tendências e novas perspectivas que agreguem, satisfatoriamente, com contexto do negócio explorado.
Sobre as técnicas de Data Mining, julgue os itens a seguir:
I. Árvores de Decisão (Decision Tree): caracterizam-se pelo método de classificação de dados, sendo conveniente adotar essa técnica quando o objetivo é gerar regras que possam ser entendidas, explicadas e traduzidas para a linguagem natural.
II. Redes Neurais Artificiais: caracterizam-se em resolver problemas complexos e construir representações internas de modelos ou padrões detectados nos dados que envolvem o desenvolvimento de estruturas matemáticas com habilidade de aprendizado, por meio de experiências de operações da própria máquina.
III. Predição com Séries Temporais: caracteriza-se em identificar a existência de diferentes grupos dentro de um conjunto de dados e, constatada está existência, agrupa-se os elementos estudados de acordo com suas similaridades, podendo refiná-los e definir a priorização entre eles.
IV. Análise de Regressão: utiliza-se algoritmos genéticos para encontrar soluções de problemas dinâmicos e complexos que envolvem centenas ou milhares de variáveis e/ou fórmulas para identificar as descobertas, gerando possíveis soluções simultaneamente.
Estão corretos os itens:
Alternativas:
I – II – III.
III – IV.
II – III.
I – II – III – IV.
I – II.checkCORRETO
Resolução comentada:
o Item III está errado porque refere-se a técnica de Análise de Aglomerações (Cluster Analysis): caracteriza-se em identificar a existência de diferentes grupos dentro de um conjunto de dados e, constatada esta existência, agrupa-se os elementos estudados de acordo com suas similaridades, podendo refiná-los e definir a priorização entre eles.
O item IV está errado, porque refere-se à técnica de Algoritmos Genéticos: utiliza-se algoritmos genéticos para encontrar soluções de problemas dinâmicos e complexos que envolvem centenas ou milhares de variáveis e/ou fórmulas para identificar as descobertas, gerando possíveis soluções simultaneamente.
Código da questão: 42614
3)
As fontes de dados são armazenadas segundo um modelo de banco de dados, em geral organizados de acordo com uma estrutura lógica. Essas fontes de dados, além de serem mantidas em repositórios organizados, também incluem características determinantes quanto ao armazenamento e acesso. Aponte a alternativa que estabelece essas características.
Alternativas:
As características associadas às fontes de dados são os relacionamentos, os tipos e as restrições desses dados.checkCORRETO
As fontes de dados podem ser armazenadas e acessadas sem a necessidade de caracterização quanto ao tipo de dados.
As características associadas às fontes de dados são somente os relacionamentos entre os dados.
As características associadas às fontes de dados são os relacionamentos, os índices de armazenamento e as tabelas dos repositórios.
Somente as restrições são associadas às fontes de dados.
Resolução comentada:
Toda fonte de dados que será armazenada e acessada em um banco de dados deve manter a integridade do conteúdo. A exemplo, como um dado de número de RG, deve estar relacionado à pessoa a qual pertence esse documento, o dado precisa ter consistência quanto ao tipo, se numérico ou texto, para viabilizar cálculos ou buscas, e as restrições, dado em determinado campo não pode ser nulo.
Código da questão: 42570
4)
Em um processo de tomada de decisões, a disponibilidade e o fácil acesso às informações organizacionais contribuem para uma decisão de sucesso. Assim, a extração eficaz de informações de um ambiente de Data Warehouse (DW) para gerar conhecimento é proporcionada por ferramentas que disponibilizam recursos avançados para suportar operações sobre o conjunto de dados multidimensional. Pela maior popularidade do uso das ferramentas de acesso a um DW, destaca-se as ferramentas __________________________.
Assinale a alternativa correta que indica o termo que preenche a lacuna acima:
Alternativas:
Staging Area.
Business Inteligence (BI).
Operational Data Store (ODS).
Online Transaction Processing (OLTP).
Online Analytical Processing (OLAP).checkCORRETO
Resolução comentada:
Machado (2013) descreve que as ferramentas OLAP surgiram com os sistemas de apoio à decisão para fazerem a consulta e análise dos dados dos DW, sendo às aplicações às quais os usuários têm acesso para extrair os dados de suas bases e construir os relatórios com recursos que atendem os gestores.
Código da questão: 42605
5)
A abordagem analítica requer uma arquitetura de dados especializada, complemente a sentença a seguir.
As necessidades analíticas sobre os dados provocaram mudanças na arquitetura da base de dados. Os _____________________ são os dados brutos. Os dados resumidos, agregados, sumarizados ou calculados são os dados ____________.
Assinale a alternativa que completa adequadamente as lacunas acima:
Alternativas:
Dados das operações; Segmentados.
Segmentados; Transacionais
Dados
das operações; Amostrados.
Dados das operações; Derivados.checkCORRETO
Segmentados; Matemáticos.
Resolução comentada:
Inmon (1997) destaca a mudança na abordagem em relação aos dados brutos, que no início dos registros de dados não havia a experiência que pudesse prever arranjos diferentes para suportar análises. O objetivo de arquiteturas básicas para banco de dados eram armazenar os registros, sem a robustez necessária para suportar necessidades futuras.
As necessidades analíticas sobre os dados provocaram mudanças na arquitetura, surgindo demandas provenientes de dados derivados. Os dados do dia a dia, das operações, in natura, são os dados brutos. Os dados resumidos, agregados, sumarizados ou calculados são os dados derivados.
Código da questão: 42576
6)
Um modelo é uma __________utilizada como técnica para refletir a realidade. Ao modelar os dados de uma organização, sejam operacionais ou analíticos, busca-se o que se quer realizar ou fazer com os dados. Armazenar dados em bancos relacionais para manter o histórico não reflete a realidade da empresa. É necessário desenhar uma organização desses dados e, para isso, um modelo _____________ funciona como uma ferramenta que auxilia na análise dos requisitos e no desenho da estrutura dos dados relacionada a esse negócio.
Assinale a alternativa que completa adequadamente a lacuna acima:
Alternativas:
Abstração; Entidade relacionamento.checkCORRETO
Granular; Abstração.
Entidade; Sumarizado.
Entidade relacionamento; Dimensional.
Abstração; Transacional.
Resolução comentada:
O modelo entidade relacionamento é uma abstração, e tenta refletir o mundo real, que vislumbra o que ser quer realizar ou fazer. Este modelo é uma ferramenta que ajuda na análise de requisitos de negócio e no design da estrutura de dados relacionada com esse negócio e sua base histórica. O modelo ER descreve as operações relacionadas ao negócio e as ligações entre as entidades do modelo.
Código da questão: 42586
7)
Uma característica importante que deve estar presente em ferramentas OLAP é a capacidade de efetuar operações sobre um conjunto de dados multidimensional que retorna uma apresentação ou sumarização diferente de informações. Existem diversos operadores OLAP que permitem acessar os dados em esquemas multidimensionais. As principais operações são do tipo Drill (Drill Down, Drill Up, Drill Across e Drill Throught) e as do tipo Slice and Dice.
Sobre os tipos de operações, julgue os itens a seguir, indicando “V” para o item verdadeiro e “F” para o item falso:
( ) O tipo de operação Drill Down ocorre quando o usuário aumenta o nível de detalhe da informação, diminuindo a granularidade, ou seja, navega verticalmente, descendo a hierarquia no sentido mais específico.
( ) O tipo de operação Drill Up ocorre quando o usuário aumenta o nível de granularidade, diminuindo o nível de detalhamento da informação.
( ) O tipo de operação Drill Across permite navegar transversalmente no eixo da árvore hierárquica, inserindo ou retirando posições da dimensão.
( ) O tipo de operação Slice and Dice ocorre quando o usuário navega de uma informação contida em uma dimensão para uma outra dimensão.
( ) O tipo de operação Drill Throught significa a redução do escopo dos dados em análise, além de mudar a ordem das dimensões, mudando, assim, a orientação segundo a qual os dados são visualizados.
Assinale a alternativa correta
Alternativas:
F – F – F – V – V.
V – V – V – V – V.
V – F – V – F – V.
V – V – V – F – F.checkCORRETO
F – F – F – F – F.
Resolução comentada:
o item 4 é falso, porque o tipo de operação Slice and Dice que significa a redução do escopo dos dados em análise, além de alterar a ordem das dimensões, altera, também, a orientação segundo a qual os dados são visualizados. Segundo Machado (2013), Slice é a operação que corta o cubo, mas mantém a mesma perspectiva de visualização dos dados. Dice, por sua vez, é a mudança de perspectiva da visão, ou seja, é a extração de um subcubo ou a interseção de vários Slices.
O item 5 é falso, porque o tipo de operação Drill Throught ocorre quando o usuário navega de uma informação contida em uma dimensão para uma outra dimensão. Por exemplo, quando o usuário está na dimensão de tempo e no próximo passo começa a analisar a informação por região.
Código da questão: 42608
8)
Um modelo multidimensional é composto por três elementos básicos: fatos, dimensões e métricas.
I. As dimensões são os elementos, dados, fórmulas, cálculos, processados, que participam ou são chamadas por meio de chaves estrangeiras dentro de uma Fato.
PORQUE
II. Uma tabela Fato é composta de dados, medidas e contexto, provenientes de dimensões.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
A primeira e a segunda asserções estão incorretas.
A primeira e a segunda asserções estão corretas, mas a segunda não justifica a primeira.
A primeira asserção está incorreta e a segunda está correta.
A primeira asserção está correta e a segunda está incorreta.
As duas asserções estão corretas e a segunda justifica a primeira.checkCORRETO
Resolução comentada:
Em um projeto de DW, o cubo multidimensional é formado por dimensões, fatos e medidas ou métricas. Uma tabela fato é formado por ligações provenientes das colunas das dimensões, essa ligação significa que a chave primária da dimensão é chave estrangeira da tabela Fato. A tabela Fato pode ser um item, uma transação ou um evento, que está relacionado ao negócio, tem valores numéricos, e contém medidas que são representadas sumariamente.
Código da questão: 42589
9)
O DW tem uma composição que separa a carga de trabalho para análise da carga de trabalho para transações. No primeiro caso, permite a consolidação de diferentes fontes nessa carga de trabalho analítica.
I. Um DW possui um conjunto característico personalizado, distintamente dos ambientes convencionais das organizações.
PORQUE
II. Há como replicar um DW de uma empresa para outra. Cada projeto de DW não é único em sua essência, mas no seu modo de operação e aplicação.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
A primeira asserção está correta e a segunda incorreta.checkCORRETO
A primeira asserção está incorreta e a segunda justifica a primeira.
A primeira e a segunda asserções estão incorretas.
A primeira asserção está incorreta e a segunda está correta.
A primeira e a segunda asserções estão corretas, mas a segunda não justifica a primeira.
Resolução comentada:
DW tem uma composição que separa a carga de trabalho para sua análise para transações. No primeiro caso, permite a consolidação de diferentes fontes nessa carga de trabalho analítica.
Um DW possui um conjunto característico personalizado, distintamente dos ambientes convencionais das organizações. Por este motivo, não há como replicar um DW de uma empresa para outra. Cada projeto de DW não na essência mas no seu modo de operação e aplicação.
Código da questão: 42579
10)
Em um banco de dados relacional, a granularidade é baixa, mas é muito importante, o que significa que ela é inversamente proporcional ao detalhe do dado armazenado lá. Para se obter granularidade alta, a importância do detalhe não pode ser considerada. Marque a alternativa que relaciona a granularidade em diferentes níveis e a disponibilidade de detalhamento dos dados.
Alternativas:
Tabela Fato.
Relacionamento.
Dimensão.
 Entidade.
Sumarização.checkCORRETO
Resolução comentada:
um DW tem níveis de granularidade elevados por conta da necessidade de sumarizações para refletir a realidade dos dados do negócio. As sumarizações são necessárias, pois refletem medidas resumidas ou condessadas, com alguma transformação dos dados originais. Sem essa técnica, seria impraticável obter respostas que refletem o comportamento de um conjunto de dados. Sumarizações podem ser somas, médias, medianas, quartis,
etc.
Código da questão: 42585

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Mais conteúdos dessa disciplina