Buscar

Modelagem e arquitetura do DW (Data Warehouse) - Prova

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1)
Em um processo de tomada de decisões, a disponibilidade e o fácil acesso às informações organizacionais contribuem para uma decisão de sucesso. Assim, a extração eficaz de informações de um ambiente de Data Warehouse (DW) para gerar conhecimento é proporcionada por ferramentas que disponibilizam recursos avançados para suportar operações sobre o conjunto de dados multidimensional. Pela maior popularidade do uso das ferramentas de acesso a um DW, destaca-se as ferramentas __________________________.
Assinale a alternativa correta que indica o termo que preenche a lacuna acima:
Alternativas:
Business Inteligence (BI).
Staging Area.
Operational Data Store (ODS).
Online Transaction Processing (OLTP).
Online Analytical Processing (OLAP). CORRETO
Resolução comentada:
Machado (2013) descreve que as ferramentas OLAP surgiram com os sistemas de apoio à decisão para fazerem a consulta e análise dos dados dos DW, sendo às aplicações às quais os usuários têm acesso para extrair os dados de suas bases e construir os relatórios com recursos que atendem os gestores.
Código da questão: 42605
2)
Segundo Kimball (1998), o esquema de dados mais utilizado na especificação de um Data Warehouse é o Esquema Estrela (Star Schema) composto por tabelas de Fatos e de Dimensões que proporcionam uma visão multidimensional de grande volume de dados.
(KIMBALL, R. et al. The data warehouse lifecycle toolkit. New York: John Wiley & Sons, 1998).
Sobre as características das tabelas de Fatos e de Dimensões, julgue os itens a seguir:
O contexto das funcionalidades que determinam os processos de negócio de uma empresa é especificado em tabelas de Fatos.
A tabela de Fatos é a principal tabela de um esquema dimensional que geralmente contém vários fatos que indicam valores para análise dimensional.
A tabela de Fatos relaciona-se com as tabelas de Dimensões, que representam as entidades de negócio e constituem as estruturas de entrada que realizam os filtros de valores aplicados na manipulação dos fatos.
As tabelas de Dimensões contêm a descrição textual do negócio, representada pelos atributos e com a indicação da chave primária, que serve como base para manter a integridade referencial quando relacionada com a tabela de Fatos.
As tabelas de Dimensões representam as características numéricas e classificatórias que fornecem as perspectivas adicionais a um determinado fato por meio de seus atributos.
Estão corretos os itens:
Alternativas:
I – II – III.
II – IV – V.
I – II – III – IV – V.
I – II – III – IV. CORRETO
I – III – V.
Resolução comentada:
os itens corretos são I, II, III e IV. O item V está errado porque as tabelas de Dimensões representam as características descritivas/textuais que fornecem as perspectivas adicionais a um determinado fato por meio de seus atributos.
Código da questão: 42592
3)
Os ambientes de Data Warehouses (DW) integram sofisticadas ferramentas para análises complexas de dados históricos e descoberta de conhecimento, assegurando o suporte à tomada de decisão. Um ________________ organizacional pode manter um armazém central de dados da organização inteira, ou pode manter armazéns menores, descentralizados, denominados ________________.
Assinale a alternativa que completa adequadamente as lacunas acima:
Alternativas:
Data Mining; Data Marts.
Data Warehouse; Data Marts. CORRETO
Data Mining; Data Source.
Data Warehouse; Data Mining.
Data Mining; Data Warehouse.
Resolução comentada:
os ambientes de Data Warehouses (DW) integram sofisticadas ferramentas para análises complexas de dados históricos e descoberta de conhecimento, assegurando o suporte à tomada de decisão. Um Data Warehouse organizacional pode manter um armazém central de dados da organização inteira, ou pode manter armazéns menores, descentralizados, denominados Data Mart.
Código da questão: 42581
4)
O modelo multidimensional permite encontrar respostas de comportamento do desempenho dos negócios, por meio dos aspectos a seguir.
Realizar simulações de cenários.
Embasar análises estratégicas e alocar decisões.
Podem ser realizadas abstrações de localidade (onde).
Permite resumir a temporalidade (quando).
Não associa responsabilidades (quem) e classificações (o quê).
São verdadeiras:
Alternativas:
I – IV – V.
I – III, somente.
I – II – III.
I - II – III – IV. CORRETO
II – III – V.
Resolução comentada:
a abordagem do modelo multidimensional permite que respostas sobre o comportamento do desempenho do negócio sejam encontradas por meio de simulações de cenários para embasar as análises estratégicas e alocar decisões. Esta abordagem remete à necessidade de construir um modelo dimensional, em que são feitas perguntas sob abstrações de localidade (onde), temporalidade (quando), responsabilidade (quem) e classificação (o quê).
Código da questão: 42587
5)
A mineração de dados é comumente classificada pela sua capacidade em realizar tarefas para diferentes domínios. A literatura indica que não existe um consenso de denominação quanto à classificação, funcionalidades, tarefas, métodos ou técnicas de mineração de dados. Contudo, Fayyad et al. (1996) apresentam alguns métodos de mineração de dados que têm como objetivo a predição ou descrição dos resultados:
(FAYYAD, U.M. et al. Advances in knowledge discovery and data mining. California: AAAI Press, 1996).
Sobre as técnicas de Data Mining, julgue os itens a seguir, indicando “V” para o item verdadeiro e “F” para o item falso:
( ) Regressão: usa-se para associar ou classificar um item a uma ou a várias categorias pré-definidas, derivando uma regra que possa ser usada para classificar uma observação, referente a um conjunto de dados identificados que são categorizados por um assunto.
( ) Análise de Séries Temporais: refere-se a tarefa similar à classificação, porém é usada quando os dados são identificados por predição de valores numéricos, considerados variáveis independentes ou exploratórias, e não pela categorização dos itens analisados, sendo possível verificar o eventual relacionamento funcional que possa existir entre duas ou mais variáveis quantitativas.
( ) Agrupamentos (Clusters): refere-se à tarefa de segmentar um conjunto de dados em grupos diferentes, cujos itens são semelhantes, ou seja, subdivide o conjunto de dados em um conjunto menor, sendo similar no comportamento dos atributos de segmentação, descobrindo grupos diferentes entre o conjunto de dados selecionado.
( ) Sumarização: refere-se à tarefa de descrever padrões e tendências que são reveladas por subconjuntos de dados compactados, a partir de um subconjunto de dados com características similares, demostrando as relações funcionais entre as variáveis definidas para a análise exploratória do subconjunto de dados
( ) Análise de Séries Temporais: refere-se a tarefa similar à regra de associação com objetivo de aplicar algum tipo de padrão (tendências, variações sazonais, variações cíclicas e variações irregulares) no conjunto de dados, para determinar que tipos de sequências podem ocorrer em um determinado período.
Assinale a alternativa que indica a sequência correta:
Alternativas:
F – V – F – V – F.
F – F – V – V – V. CORRETO
V – V – F – V – F.
F – F – F – F – F.
V – V – V – V – V
Resolução comentada:
o Item 1 é falso, porque refere-se ao método classificação usado para associar ou classificar um item a uma ou a várias categorias pré-definidas, derivando uma regra que possa ser usada para classificar uma observação, referente a um conjunto de dados identificados que são categorizados por um assunto.
O item 2 é falso, porque descreve o método de Regressão que se refere a tarefa similar à classificação, porém é usada quando os dados são identificados por predição de valores numéricos, considerados variáveis independentes ou exploratórias, e não pela categorização dos itens analisados, sendo possível verificar o eventual relacionamento funcional que possa existir entre duas ou mais variáveis quantitativas.
Código da questão: 42615
6)
Para a definição da arquitetura de um ambiente de Data Warehouse (DW)ou de Data Marts, deve-se levar em conta o porte da empresa, tempo, capacitação da equipe de desenvolvimento e recursos disponibilizados para os investimentos.
Sobre a arquitetura de um Data Warehouse e de Data Marts, analise os itens a seguir:
São classificadas como global, independente ou a combinada; e o tipo de implementação como top down, bottom up ou a integrada.
A arquitetura global pode ser fisicamente centralizada ou pode ser fisicamente distribuída nas instalações da empresa.
III. A arquitetura independente é considerada aquela que comporta as necessidades do DW organizacional com alto nível de acessos e utilização das informações geradas e disponibilizadas, a partir de ferramentas de apoio a decisão para todos os departamentos da empresa.
IV. A arquitetura independente mantém Data Marts stand-alone, onde têm-se dados específicos da necessidade da empresa, considerando que cada departamento tem sua informação sem a integração com outros departamentos.
V. A arquitetura integrada de Data Marts é implementada por Data Marts separadamente por grupos específicos ou departamentos, sendo integrados ou interconectados posteriormente, provendo uma visão organizacional maior dos dados e informações.
Estão corretos os itens:
Alternativas:
III – IV – V.
II – III – IV – V.
II – IV – V. CORRETO
I – II – III – IV – V.
I – II – III.
Resolução comentada:
os itens I e III estão errados. O item I está errado porque a arquitetura é classificada como global, independente ou a integrada; e o tipo de implementação é do tipo top down, bottom up ou a combinada.
O item III está errado porque é a arquitetura global que mais independente, considerada a arquitetura que comporta as necessidades do DW organizacional com alto nível de acessos e utilização das informações geradas e disponibilizadas, a partir de ferramentas de apoio a decisão para todos os departamentos da empresa.
Código da questão: 42583
7)
A modelagem multidimensional representa uma abstração dos dados armazenados, consistindo em um modelo composto por tabelas de Fatos e de Dimensões, que proporcionam uma visão multidimensional de grande quantidade de dados. Existem algumas abordagens específicas para modelagem multidimensional, derivadas da aparência do esquema traçado, a partir do Diagrama de Entidades e Relacionamentos (DER), sendo o ___________________ composto de uma tabela dominante no centro, chamada de Fatos, rodeada por tabelas auxiliares, chamadas de tabelas de Dimensões, o qual a tabela de Fatos conecta-se às tabelas de Dimensões por várias junções e cada tabela de Dimensão se conecta com apenas uma junção à tabela de Fatos. E uma variante deste esquema é denominado de ___________________.
Assinale a alternativa correta que indica os termos que preenchem as lacunas acima:
Alternativas:
Esquema Estrela; Esquema Cubo.
Esquema Estrela; Esquema Floco de Neve. CORRETO
Esquema Floco de Neve; Esquema Estrela.
Esquema Floco de Neve; Esquema Cubo.
Esquema MER; Esquema Cubo.
Resolução comentada:
o Esquema Estrela (Star Schema) é a abordagem, proposta por Kimball (1998), que visa criar esquemas físicos mais simples e incremental. O nome estrela se dá devido à disposição em que se encontram as tabelas, sendo a tabela de Fatos, centralizada no esquema, e as tabelas de Dimensões são relacionandas nas pontas do esquema.
Elmasri e Navathe (2005) descrevem que o “esquema floco de neve é uma variação do esquema estrela em que as tabelas dimensões de um esquema estrela são organizadas em uma hierarquia ao normalizá-las” (ELMASRI; NAVATHE, 225, p. 725).
Código da questão: 42591
8)
Para implementar projetos de Data Warehouse, são necessárias algumas considerações conceituais que permitem manter o foco nas referências analíticas como finalidade. Nesse sentido, analise as afirmações a seguir.
I. DW é uma coleção orientada por assuntos, integrada, variante no tempo e não volátil.
II. Os resultados do DW servem para apoiar o processo de tomada de decisão das organizações.
III. DW é a cópia específica de tabelas do banco analítico para consultas e análises, criando visões funcionais.
IV. A construção de um DW depende fundamentalmente de arquitetura.
V. DW é uma arquitetura e não uma tecnologia.
São verdadeiras:
Alternativas:
I – IV – V.
I – IV.
I – II – IV – V. CORRETO
II – III – V.
I – II – III.
Resolução comentada:
na conceituação dada por Inmonn (2005), DW é uma coleção orientada por assuntos, integrada, variante no tempo e não volátil, para apoiar o processo de tomada de decisão das organizações.
Na definição de Kimball (2002), DW é a cópia específica de tabelas do banco transacional para consultas e análises, criando visões funcionais.
Um projeto de construção de um DW depende, fundamentalmente, de arquitetura. Por isso, Machado (2010) deixa claro que “DW é uma arquitetura e não uma tecnologia”. A tecnologia sim ajuda a construir, operar e monitorar um projeto DW implantado.
Código da questão: 42577
9)
A modelagem multidimensional representa uma abstração dos dados armazenados, permitindo a visualização de grande quantidade de dados, por meio de consultas dinâmicas de ferramentas Online Analytical Processing (OLAP – Processamento Analítico On-line) que exibem as informações no formato de um cubo.
Assinale a alternativa correta que indica os elementos básicos da modelagem multidimensional:
Alternativas:
Tabela de dados e tabelas de consultas.
Tabela de Fatos e tabelas de Dimensões.CORRETO
Tabelas normalizadas e tabelas não-normalizadas.
Tabela de Fatos e tabelas de consultas.
Tabela de dados e tabelas de Dimensões
Resolução comentada:
a modelagem multidimensional representa uma abstração dos dados armazenados, consistindo em um modelo composto por tabelas de Fatos e de Dimensões que proporcionam uma visão multidimensional de grande quantidade de dados.
Fatos: é uma coleção de itens de dados, composta de dados de medidas, representando uma transação ou um evento de negócio. Um fato é representado por valores numéricos em um esquema, e implementado em tabelas denominadas tabelas de Fatos.
Dimensões: são os elementos que participam de um fato, ou seja, são as possíveis formas de visualizar os dados de forma descritiva e classificatória, determinando o contexto de um assunto de negócio. Os elementos que representam uma dimensão são especificados em um esquema e implementados em tabelas denominadas de tabelas de Dimensões.
Código da questão: 42590
10)
A decisão de optar pelo Esquema Estrela ou pelo Esquema Floco de Neve deve ser tomada levando-se em consideração, principalmente, pela complexidade da solução e o volume de dados a ser manipulado.
Sobre as características dos Esquemas Estrela e Floco de Neve, julgue os itens a seguir:
O Esquema Estrela possui uma estrutura razoavelmente simples, com poucas tabelas e relacionamentos bem definidos, aproximando bastante do modelo de negócio.
O Esquema Floco de Neve é uma variação do Esquema Estrela, em que as tabelas dimensões de um Esquema Estrela são organizadas em uma hierarquia ao normalizá-las.
O Esquema Estrela é composto por uma tabela dominante no centro, chamada de Fatos, relacionada com tabelas auxiliares, chamadas de tabelas de Dimensões, sendo que a tabela de Fatos é relacionada com cada tabela de Dimensão em um relacionamento “muitos para um”.
O Esquema Floco de Neve separa as hierarquias das dimensões em tabelas normalizadas, aumentando consideravelmente o número de dimensões, consequentemente aumenta-se a performance das consultas dinâmicas.
Estão corretos os itens:
Alternativas:
II – III – IV.
I – II – III – IV.
II – III.
I – II.
I – II – III.CORRETO
Resolução comentada:
Os itens corretos são I, II e III. O item IV está errado, porque o Esquema Floco de Neve separa as hierarquias das dimensões em tabelas normalizadas, aumentando consideravelmente o número de dimensões, e diminuindo consequentemente a performance das consultas dinâmicas.
Código da questão: 42593

Mais conteúdos dessa disciplina