Buscar

Modelagem e arquitetura do DW (Data Warehouse)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1)Segundo Kimball (1998), o esquema de dados mais utilizado na especificação de um Data Warehouse é o Esquema Estrela (Star Schema) composto por tabelas de Fatos e de Dimensões que proporcionam uma visão multidimensional de grande volume de dados.
(KIMBALL, R. et al. The data warehouse lifecycle toolkit. New York: John Wiley & Sons, 1998).
Sobre as características das tabelas de Fatos e de Dimensões, julgue os itens a seguir:
O contexto das funcionalidades que determinam os processos de negócio de uma empresa é especificado em tabelas de Fatos.
A tabela de Fatos é a principal tabela de um esquema dimensional que geralmente contém vários fatos que indicam valores para análise dimensional.
A tabela de Fatos relaciona-se com as tabelas de Dimensões, que representam as entidades de negócio e constituem as estruturas de entrada que realizam os filtros de valores aplicados na manipulação dos fatos.
As tabelas de Dimensões contêm a descrição textual do negócio, representada pelos atributos e com a indicação da chave primária, que serve como base para manter a integridade referencial quando relacionada com a tabela de Fatos.
As tabelas de Dimensões representam as características numéricas e classificatórias que fornecem as perspectivas adicionais a um determinado fato por meio de seus atributos.
Estão corretos os itens:
Alternativas:
I – II – III – IV.
I – II – III.
II – IV – V.
I – II – III – IV – V.
I – III – V.INCORRETO
Código da questão: 42592
2)O banco de dados analítico é diferente do banco de dados operacional, transacional ou OLTP (Online Transaction Processing), usado para processar as transações. Embora os bancos de dados transacionais possam ser usados para suportar o armazenamento de dados e as aplicações de BI, não se recomenda seu uso por questões de integridade e escalabilidade.
I. O banco de dados convencional deve ser preservado, e o banco de dados analíticos deve estar em outro schema.
PORQUE
II. Um banco de dados analítico tem uma estrutura baseada em coluna, tornando os cálculos individuais muito rápidos. Já os bancos de dados transacionais dependem de armazenamento de dados baseado em linha, impróprio para operar com grandes volumes de dados.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
A primeira e a segunda asserções estão incorretas.
A primeira e a segunda asserções estão corretas, mas a segunda não tem relação com a primeira.
A primeira asserção está correta e a segunda está incorreta.
A primeira asserção está incorreta e a segunda está correta
A primeira e a segunda asserções estão corretas, e a segunda complementa a primeira.CORRETO
Código da questão: 50534
3)A mineração de dados é comumente classificada pela sua capacidade em realizar tarefas para diferentes domínios. A literatura indica que não existe um consenso de denominação quanto à classificação, funcionalidades, tarefas, métodos ou técnicas de mineração de dados. Contudo, Fayyad et al. (1996) apresentam alguns métodos de mineração de dados que têm como objetivo a predição ou descrição dos resultados:
(FAYYAD, U.M. et al. Advances in knowledge discovery and data mining. California: AAAI Press, 1996).
Sobre as técnicas de Data Mining, julgue os itens a seguir, indicando “V” para o item verdadeiro e “F” para o item falso:
( ) Regressão: usa-se para associar ou classificar um item a uma ou a várias categorias pré-definidas, derivando uma regra que possa ser usada para classificar uma observação, referente a um conjunto de dados identificados que são categorizados por um assunto.
( ) Análise de Séries Temporais: refere-se a tarefa similar à classificação, porém é usada quando os dados são identificados por predição de valores numéricos, considerados variáveis independentes ou exploratórias, e não pela categorização dos itens analisados, sendo possível verificar o eventual relacionamento funcional que possa existir entre duas ou mais variáveis quantitativas.
( ) Agrupamentos (Clusters): refere-se à tarefa de segmentar um conjunto de dados em grupos diferentes, cujos itens são semelhantes, ou seja, subdivide o conjunto de dados em um conjunto menor, sendo similar no comportamento dos atributos de segmentação, descobrindo grupos diferentes entre o conjunto de dados selecionado.
( ) Sumarização: refere-se à tarefa de descrever padrões e tendências que são reveladas por subconjuntos de dados compactados, a partir de um subconjunto de dados com características similares, demostrando as relações funcionais entre as variáveis definidas para a análise exploratória do subconjunto de dados
( ) Análise de Séries Temporais: refere-se a tarefa similar à regra de associação com objetivo de aplicar algum tipo de padrão (tendências, variações sazonais, variações cíclicas e variações irregulares) no conjunto de dados, para determinar que tipos de sequências podem ocorrer em um determinado período.
Assinale a alternativa que indica a sequência correta:
Alternativas:
V – V – F – V – F.
F – F – F – F – F.
F – V – F – V – F.
F – F – V – V – V.CORRETO
V – V – V – V – V
Código da questão: 42615
4)Na concepção de Poe, Klauer, Brobst (1998), o Esquema Estrela possui uma estrutura simples com poucas tabelas e associações bem definidas, aproximando do contexto do modelo de negócio e facilitando a geração de consultas complexas de forma intuitiva e interativa, por meio dos vários parâmetros de consultas. Neste esquema, o assunto principal fica ao centro do esquema, representada pela tabela de Fatos, e suas características, as dimensões, representadas por tabelas de Dimensões, ficam posicionadas ao seu redor, permitindo a leitura e compreensão até mesmo de usuários finais que não estão adaptados com estruturas de banco de dados.
(POE V.; KLAUER P.; BROBST S. Building a data warehouse for decision support. New Jersey: Prentice Hall PTR, 1998).
Sobre as principais vantagens do Esquema Estrela, julgue os itens a seguir, indicando “V” para o item verdadeiro e “F” para o item falso:
1. ( ) A estrutura padronizada e regular do esquema é bastante simples, faciliatando a apresentação, o desempenho das consultas geradas e a compreensão até mesmo de usuários finais que não estão adaptados com estruturas de banco de dados.
2. ( ) As consultas ocorrem inicialmente nas tabelas de Dimensões e depois nas tabelas de Fatos, assegurando a consistência dos dados por meio de uma estrutura de chaves que garante o acesso aos dados com melhor desempenho.
3. ( ) A aplicação da técnica de normalização nas tabelas de Dimensões aumenta o número de dimensões, consequentemente diminuindo a performance das consultas dinâmicas.
4. ( ) A facilidade e a flexibilidade da inclusão de novos elementos de dados, a partir do relacionamento da tabela de Fatos com uma nova tabela de Dimensão, bem como o acréscimo de novas colunas às mesmas tabelas de Dimensões.
5. O suporte para transformar e proceder à carga dos dados, para recuperar, analisar e extrair os dados dos sistemas transacionais.
Assinale a alternativa correta:
Alternativas:
V – V – V – V – V.
F – F – F – F – F.
F – V – F – V – F.
V – V – F – V – F.CORRETO
F – F – V – F – V.
Código da questão: 42602
5)Para implementar projetos de Data Warehouse, são necessárias algumas considerações conceituais que permitem manter o foco nas referências analíticas como finalidade. Nesse sentido, analise as afirmações a seguir.
I. DW é uma coleção orientada por assuntos, integrada, variante no tempo e não volátil.
II. Os resultados do DW servem para apoiar o processo de tomada de decisão das organizações.
III. DW é a cópia específica de tabelas do banco analítico para consultas e análises, criando visões funcionais.
IV. A construção de um DW depende fundamentalmente de arquitetura.
V. DW é uma arquitetura e não uma tecnologia.
São verdadeiras:
Alternativas:
I – II – III.INCORRETO
II – III – V.
I – II – IV – V.
I – IV – V.
I – IV.
Código da questão: 42577
6)Em um banco de dados relacional, a granularidade é baixa, mas é muito importante, o que significa que elaé inversamente proporcional ao detalhe do dado armazenado lá. Para se obter granularidade alta, a importância do detalhe não pode ser considerada. Marque a alternativa que relaciona a granularidade em diferentes níveis e a disponibilidade de detalhamento dos dados.
Alternativas:
Sumarização.CORRETO
Dimensão.
 Entidade.
Relacionamento.
Tabela Fato.
Código da questão: 42585
7)O DW tem uma composição que separa a carga de trabalho para análise da carga de trabalho para transações. No primeiro caso, permite a consolidação de diferentes fontes nessa carga de trabalho analítica.
I. Um DW possui um conjunto característico personalizado, distintamente dos ambientes convencionais das organizações.
PORQUE
II. Há como replicar um DW de uma empresa para outra. Cada projeto de DW não é único em sua essência, mas no seu modo de operação e aplicação.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
A primeira e a segunda asserções estão incorretas.
A primeira asserção está correta e a segunda incorreta.CORRETO
A primeira asserção está incorreta e a segunda está correta.
A primeira e a segunda asserções estão corretas, mas a segunda não justifica a primeira.
A primeira asserção está incorreta e a segunda justifica a primeira.
Código da questão: 42579
8)As fontes de dados são armazenadas segundo um modelo de banco de dados, em geral organizados de acordo com uma estrutura lógica. Essas fontes de dados, além de serem mantidas em repositórios organizados, também incluem características determinantes quanto ao armazenamento e acesso. Aponte a alternativa que estabelece essas características.
Alternativas:
Somente as restrições são associadas às fontes de dados.
As características associadas às fontes de dados são somente os relacionamentos entre os dados.
As características associadas às fontes de dados são os relacionamentos, os tipos e as restrições desses dados.CORRETO
As características associadas às fontes de dados são os relacionamentos, os índices de armazenamento e as tabelas dos repositórios.
As fontes de dados podem ser armazenadas e acessadas sem a necessidade de caracterização quanto ao tipo de dados.
Código da questão: 42570
9)Para a definição da arquitetura de um ambiente de Data Warehouse (DW) ou de Data Marts, deve-se levar em conta o porte da empresa, tempo, capacitação da equipe de desenvolvimento e recursos disponibilizados para os investimentos.
Sobre a arquitetura de um Data Warehouse e de Data Marts, analise os itens a seguir:
São classificadas como global, independente ou a combinada; e o tipo de implementação como top down, bottom up ou a integrada.
A arquitetura global pode ser fisicamente centralizada ou pode ser fisicamente distribuída nas instalações da empresa.
III. A arquitetura independente é considerada aquela que comporta as necessidades do DW organizacional com alto nível de acessos e utilização das informações geradas e disponibilizadas, a partir de ferramentas de apoio a decisão para todos os departamentos da empresa.
IV. A arquitetura independente mantém Data Marts stand-alone, onde têm-se dados específicos da necessidade da empresa, considerando que cada departamento tem sua informação sem a integração com outros departamentos.
V. A arquitetura integrada de Data Marts é implementada por Data Marts separadamente por grupos específicos ou departamentos, sendo integrados ou interconectados posteriormente, provendo uma visão organizacional maior dos dados e informações.
Estão corretos os itens:
Alternativas:
III – IV – V.
I – II – III – IV – V.
II – IV – V.CORRETO
II – III – IV – V.
I – II – III.
Código da questão: 42583
10)A modelagem multidimensional representa uma abstração dos dados armazenados, consistindo em um modelo composto por tabelas de Fatos e de Dimensões, que proporcionam uma visão multidimensional de grande quantidade de dados. Existem algumas abordagens específicas para modelagem multidimensional, derivadas da aparência do esquema traçado, a partir do Diagrama de Entidades e Relacionamentos (DER), sendo o ___________________ composto de uma tabela dominante no centro, chamada de Fatos, rodeada por tabelas auxiliares, chamadas de tabelas de Dimensões, o qual a tabela de Fatos conecta-se às tabelas de Dimensões por várias junções e cada tabela de Dimensão se conecta com apenas uma junção à tabela de Fatos. E uma variante deste esquema é denominado de ___________________.
Assinale a alternativa correta que indica os termos que preenchem as lacunas acima:
Alternativas:
Esquema Floco de Neve; Esquema Cubo.
Esquema Floco de Neve; Esquema Estrela.
Esquema Estrela; Esquema Cubo.
Esquema Estrela; Esquema Floco de Neve.CORRETO
Esquema MER; Esquema Cubo.
Código da questão: 42591

Continue navegando

Outros materiais