Buscar

Avaliação DW

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

13/09/2023, 14:46 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3036449/8184002 1/7
Modelagem e arquitetura do DW (Data Warehouse)
Professor(a): Anderson da Silva Marcolino (Doutorado)
1)
2)
Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A
Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final.
Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas.
Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir
o prazo estabelecido. Boa prova!
A modelagem multidimensional representa uma abstração dos dados armazenados,
consistindo em um modelo composto por tabelas de Fatos e de Dimensões, que
proporcionam uma visão multidimensional de grande quantidade de dados. Existem
algumas abordagens específicas para modelagem multidimensional, derivadas da
aparência do esquema traçado, a partir do Diagrama de Entidades e Relacionamentos
(DER), sendo o ___________________  composto de uma tabela dominante no centro, chamada
de Fatos, rodeada por tabelas auxiliares, chamadas de tabelas de Dimensões, o qual a
tabela de Fatos conecta-se às tabelas de Dimensões por várias junções e cada  tabela de
Dimensão se conecta com apenas uma junção à tabela de Fatos. E uma variante deste
esquema é denominado de ___________________.
Assinale a alternativa correta que indica os termos que preenchem as lacunas acima:
Alternativas:
Esquema Estrela; Esquema Cubo.
Esquema Floco de Neve; Esquema Estrela.
Esquema Floco de Neve; Esquema Cubo.
Esquema Estrela; Esquema Floco de Neve.  CORRETO
Esquema MER; Esquema Cubo.
Código da questão: 42591
Sobre a construção do DW, considere as seguintes afirmações:
( ) A construção de um DW inicia com a recuperação dos dados históricos da empresa.
( ) A construção pressupõe necessidades de informações especializadas, indicadores de
performance da organização.
( ) Uma base histórica auxilia na criação de comparações com dados atuais e tendências
futuras.
( ) Um banco de dados analítico é um sistema somente de leitura e escrita que armazena
dados.
( ) A construção não prevê também a utilização de ferramentas.
Assinale a alternativa que contenha a sequência correta:
Alternativas:
F – V – V – F – F.
V –V - V – V – F.
V – V – V – F – F.  CORRETO
F – V – F – V – F.
F - F - F – V – V.
Resolução comentada:
o Esquema Estrela (Star Schema) é a abordagem, proposta por Kimball (1998), que
visa criar esquemas físicos mais simples e incremental. O nome estrela se dá devido
à disposição em que se encontram as tabelas, sendo a tabela de Fatos, centralizada
no esquema, e as tabelas de Dimensões são relacionandas nas pontas do esquema.
Elmasri e Navathe (2005) descrevem que o “esquema floco de neve é uma variação
do esquema estrela em que as tabelas dimensões de um esquema estrela são
organizadas em uma hierarquia ao normalizá-las” (ELMASRI; NAVATHE, 225, p. 725).
Resolução comentada:
13/09/2023, 14:46 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3036449/8184002 2/7
3)
4)
Código da questão: 52076
Segundo Rob e Coronel (2011), a característica mais marcante das modernas ferramentas
OLAP é a capacidade de análise multidimensional. Os dados são processados e visualizados
em uma estrutura multidimensional, sendo especialmente atrativos para os tomadores de
decisões de negócios, sendo que, enquanto o DW mantém dados de suporte, a decisões
integrados, orientados por assunto, variáveis no tempo e não voláteis, o sistema OLAP
fornece o front end por meio do qual os usuários finais acessam e analisam esses dados.
(ROB, P.; CORONEL, C. Sistemas de banco de dados: projeto, implementação e
administração. 8. ed. São Paulo: Cengage Learning, 2011).
Sobre os critérios que uma ferramenta OLAP deve ter, julgue os itens a seguir:
I. Dimensionalidade genérica: a ferramenta deve proporcionar condições ao usuário
para executar manipulações ou cálculos entre as dimensões.
II. Manipulação de matriz esparsa dinâmica: para qualquer matriz esparsa de dados,
existe um e somente um esquema físico, o qual provê a máxima eficiência e
operacionalidade.
III. Flexibilidade nas consultas: a análise e a apresentação dos dados tornam-se mais
simples quando linhas, colunas e células, que vão ser comparadas visualmente, são
organizados por agrupamentos lógicos.
IV. Dimensões e níveis de agregação limitados: um modelo analítico comum deve conter
uma matriz com dimensões de dados definidas entre quatro a cinco dimensões.
Estão corretos os itens:
Alternativas:
I – II – III – IV.
I – II.
I – II – III.  CORRETO
III – IV.
II – III.
Código da questão: 42607
Um modelo é uma __________utilizada como técnica para refletir a realidade. Ao modelar
os dados de uma organização, sejam operacionais ou analíticos, busca-se o que se quer
realizar ou fazer com os dados. Armazenar dados em bancos relacionais para manter o
histórico não reflete a realidade da empresa. É necessário desenhar uma organização
desses dados e, para isso, um modelo _____________ funciona como uma ferramenta que
auxilia na análise dos requisitos e no desenho da estrutura dos dados relacionada a esse
negócio.
Assinale a alternativa que completa adequadamente a lacuna acima:
Alternativas:
Granular; Abstração.
A construção de um DW inicia com a recuperação dos dados históricos da empresa.
Isso significa realizar cópias da história da organização, de acordo com os dois anos
anteriores, como recomenda Machado (2010).
A construção pressupõe necessidades de informações especializadas, indicadores de
performance da organização. Uma base histórica auxilia na criação de comparações
com dados atuais e tendências futuras.
A construção prevê também a utilização de ferramentas de EIS e DSS. Essas
ferramentas são utilizadas em diferentes níveis de gestão das organizações, de
acordo com Turban (2007).
Resolução comentada:
o item IV está errado, porque as dimensões e níveis de agregação são ilimitados: um
modelo analítico comum pode conter de quinze a vinte dimensões de dados.
13/09/2023, 14:46 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3036449/8184002 3/7
5)
6)
Abstração; Transacional.
Abstração; Entidade relacionamento.  CORRETO
Entidade relacionamento; Dimensional.
Entidade; Sumarizado.
Código da questão: 42586
O banco de dados analítico é diferente do banco de dados operacional, transacional ou
OLTP (Online Transaction Processing), usado para processar as transações. Embora os
bancos de dados transacionais possam ser usados para suportar o armazenamento de
dados e as aplicações de BI, não se recomenda seu uso por questões de integridade e
escalabilidade.
I. O banco de dados convencional deve ser preservado, e o banco de dados analíticos deve
estar em outro schema.
PORQUE
II. Um banco de dados analítico tem uma estrutura baseada em coluna, tornando os
cálculos individuais muito rápidos. Já os bancos de dados transacionais dependem de
armazenamento de dados baseado em linha, impróprio para operar com grandes volumes
de dados.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
A primeira e a segunda asserções estão corretas, e a segunda complementa a primeira.
 CORRETO
A primeira e a segunda asserções estão corretas, mas a segunda não tem relação com a
primeira.
A primeira asserção está correta e a segunda está incorreta.
A primeira asserção está incorreta e a segunda está correta
A primeira e a segunda asserções estão incorretas.
Código da questão: 50534
Um modelo multidimensional é composto por três elementos básicos: fatos, dimensões
e métricas.
I. As dimensões são os elementos, dados, fórmulas, cálculos, processados, que participam
ou são chamadas por meio de chaves estrangeiras dentro de uma Fato.
PORQUE
II. Uma tabela Fato é composta de dados, medidas e contexto, provenientes de dimensões.
Assinale a alternativa acerca das asserções supracitadas, bem como arelação entre elas:
Resolução comentada:
O modelo entidade relacionamento é uma abstração, e tenta refletir o mundo real,
que vislumbra o que ser quer realizar ou fazer. Este modelo é uma ferramenta que
ajuda na análise de requisitos de negócio e no design da estrutura de dados
relacionada com esse negócio e sua base histórica. O modelo ER descreve as
operações relacionadas ao negócio e as ligações entre as entidades do modelo.
Resolução comentada:
Os bancos de dados transacionais são bancos baseados em armazenamento por
linha, o que impossibilita o desempenho quando submetido a cálculos em processos
analíticos. Isto deteriora o desempenho para a finalidade base ao qual foi projetado,
que é armazenar, acessar, incluir e excluir os registros ali depositados. Portanto, para
projetos que envolvam cálculos analíticos outro banco com processo de
armazenamento por coluna é mais eficiente, como os bancos de dados analíticos,
pois os registros ficam livres para serem submetidos aos cálculos volumétricos,
essenciais para BI e Big Data.
13/09/2023, 14:46 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3036449/8184002 4/7
7)
Alternativas:
As duas asserções estão corretas e a segunda justifica a primeira.  CORRETO
A primeira e a segunda asserções estão corretas, mas a segunda não justifica a primeira.
A primeira asserção está incorreta e a segunda está correta.
A primeira asserção está correta e a segunda está incorreta.
A primeira e a segunda asserções estão incorretas.
Código da questão: 42589
As organizações precisam responder de maneira ágil e eficiente às mudanças e
oportunidades de mercado. Muitas empresas iniciam o desenvolvimento de um Data
Warehouse (DW), contemplando conjuntos de dados mais gerenciáveis e categorizados por
assunto, para atenderem às necessidades de pequenos grupos de usuários ou níveis
funcionais da empresa, investindo, assim, na implementação de Data Marts.
Sobre Data Marts, assinale a alternativa correta:
Alternativas:
Um Data Mart é um ambiente intermediário de armazenamento e processamento dos
dados para o processo de extração, transformação e carga ETL (Extraction,
Transformation and Load).
Um Data Mart é um depósito de dados especializado, orientado por assunto, integrado,
volátil e variável no tempo, a partir de dados extraídos de um DW, com o objetivo
específico de dar suporte a rápido determinado grupo ou função de usuários. 
CORRETO
Um Data Mart refere-se ao processo de explorar grandes quantidades de informações, a
partir de um conjunto de ferramentas de mineração de dados que se utilizam de
algoritmos de aprendizagem baseados em redes neurais e estatísticas.
Um Data Mart são sistemas transacionais que registram todas as transações operacionais
das organizações, sendo utilizados no processamento dos dados que são gerados
diariamente por meio dos sistemas informacionais das empresas.
Um Data Mart é um ambiente de processamento analítico, caracterizado por consultas
complexas, estruturadas e frequentes, envolvendo agregação ou relacionamento de
dados para gerar informações que apoiam processos decisórios.
Código da questão: 42580
Resolução comentada:
Em um projeto de DW, o cubo multidimensional é formado por dimensões, fatos e
medidas ou métricas. Uma tabela fato é formado por ligações provenientes das
colunas das dimensões, essa ligação significa que a chave primária da dimensão é
chave estrangeira da tabela Fato. A tabela Fato pode ser um item, uma transação ou
um evento, que está relacionado ao negócio, tem valores numéricos, e contém
medidas que são representadas sumariamente.
Resolução comentada:
considerando as inúmeras definições de Data Marts, na concepção de Rob e Coronel
(2011), um Data Mart é um pequeno subconjunto de um DW, sobre um único
assunto, que fornece suporte às decisões de um pequeno grupo de pessoas, que
pode ser criado a partir de dados extraídos de um DW maior, com o objetivo
específico de dar suporte a acessos mais rápido para determinado grupo ou função.
A definição apresentada na alternativa a) refere-se ao conceito de Online Transaction
Processing (OLTP – Processamento de Transações em Tempo Real).
A definição apresentada na alternativa “Um Data Mart é um ambiente de
processamento analítico...” refere-se ao conceito de Online Analytical Pocessing
(OLAP – Processamento Analítico On-line.
A definição apresentada na alternativa “Um Data Mart refere-se ao processo de
explorar...” refere-se ao conceito de Data Mining.
A definição apresentada na alternativa e) refere-se a uma parte do processo de
funcionamento de um ambiente de Data Warehouse.
13/09/2023, 14:46 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3036449/8184002 5/7
8)
9)
A mineração de dados é comumente classificada pela sua capacidade em realizar tarefas
para diferentes domínios. A literatura indica que não existe um consenso de denominação
quanto à classificação, funcionalidades, tarefas, métodos ou técnicas de mineração de
dados. Contudo, Fayyad et al. (1996) apresentam alguns métodos de mineração de dados
que têm como objetivo a predição ou descrição dos resultados:
(FAYYAD, U.M. et al. Advances in knowledge discovery and data mining. California: AAAI
Press, 1996).
Sobre as técnicas de Data Mining, julgue os itens a seguir, indicando “V” para o item
verdadeiro e “F” para o item falso:
1. (   ) Regressão: usa-se para associar ou classificar um item a uma ou a várias
categorias pré-definidas, derivando uma regra que possa ser usada para classificar
uma observação, referente a um conjunto de dados identificados que são
categorizados por um assunto.
2. (   ) Análise de Séries Temporais: refere-se a tarefa similar à classificação, porém é
usada quando os dados são identificados por predição de valores numéricos,
considerados variáveis independentes ou exploratórias, e não pela categorização dos
itens analisados, sendo possível verificar o eventual relacionamento funcional que
possa existir entre duas ou mais variáveis quantitativas.
3. (   ) Agrupamentos (Clusters): refere-se à tarefa de segmentar um conjunto de dados
em grupos diferentes, cujos itens são semelhantes, ou seja, subdivide o conjunto de
dados em um conjunto menor, sendo similar no comportamento dos atributos de
segmentação, descobrindo grupos diferentes entre o conjunto de dados
selecionado.
4. (   ) Sumarização: refere-se à tarefa de descrever padrões e tendências que são
reveladas por subconjuntos de dados compactados, a partir de um subconjunto de
dados com características similares, demostrando as relações funcionais entre as
variáveis definidas para a análise exploratória do subconjunto de dados
5. (   ) Análise de Séries Temporais: refere-se a tarefa similar à regra de associação com
objetivo de aplicar algum tipo de padrão (tendências, variações sazonais, variações
cíclicas e variações irregulares) no conjunto de dados, para determinar que tipos de
sequências podem ocorrer em um determinado período.
Assinale a alternativa que indica a sequência correta:
Alternativas:
F – V – F – V – F.
V – V – V – V – V
F – F – F – F – F.
F – F – V – V – V.  CORRETO
V – V – F – V – F.
Código da questão: 42615
As ferramentas que apresentam características OLAP passaram a ser referenciadas como
ferramentas OLAP. As ferramentas OLAP podem ser classificadas de acordo com a
estratégia de armazenamento, sendo chamadas de OLAP Multidimensional (MOLAP), OLAP
Relacional (ROLAP), OLAP Híbrido e OLAP Web.
Assinale a alternativa correta que descreve as características das ferramentas do tipo
MOLAP.
Resolução comentada:
o Item 1 é falso, porque refere-se ao método classificação usado para associar ou
classificar um item a uma ou a várias categorias pré-definidas, derivando uma regra
que possa ser usada para classificar uma observação, referente a um conjunto de
dados identificados que são categorizados por um assunto.
O item 2 é falso, porque descreve o método de Regressão que se refere a tarefa
similar à classificação, porém é usada quando os dadossão identificados por
predição de valores numéricos, considerados variáveis independentes ou
exploratórias, e não pela categorização dos itens analisados, sendo possível verificar
o eventual relacionamento funcional que possa existir entre duas ou mais variáveis
quantitativas.
13/09/2023, 14:46 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3036449/8184002 6/7
10)
Alternativas:
O MOLAP refere-se à utilização da ferramenta OLAP em ambiente remoto, disparando
consultas via um navegador web para o servidor que, por sua vez, retorna o cubo
processado para análise do usuário.
O MOLAP refere-se à utilização de banco de dados com características
multidimensionais, permitindo operações que ocorrem quando o usuário navega pelas
informações contidas entre dimensões de esquemas diferentes, acessados remotamente.
O MOLAP refere-se à abordagem de uso combinado de um banco de dados relacional
com um banco de dados orientado a objetos, onde as estruturas relacionais são
utilizadas para os dados com maior granularidade e as estruturas orientadas a objetos
são utilizadas para dados com menor granularidade.
O MOLAP refere-se à utilização de banco de dados com características
multidimensionais, permitindo a navegação com níveis de detalhamento em tempo real,
a partir da combinação das dimensões do cubo, proporcionando análises sofisticadas
com ótimo desempenho.  CORRETO
O MOLAP refere-se à utilização de banco de dados relacional para implementar soluções
OLAP, permitindo análise multidimensional dos dados que estão armazenados em uma
base de dados relacional, sendo feito todo o processamento no servidor da base de
dados e depois gerados os comandos SQL e as tabelas temporárias.
Código da questão: 42604
Para a definição da arquitetura de um ambiente de Data Warehouse (DW) ou de Data
Marts, deve-se levar em conta o porte da empresa, tempo, capacitação da equipe de
desenvolvimento e recursos disponibilizados para os investimentos.
Sobre a arquitetura de um Data Warehouse e de Data Marts, analise os itens a seguir:
I. São classificadas como global, independente ou a combinada; e o tipo de
implementação como top down, bottom up ou a integrada.
II. A arquitetura global pode ser fisicamente centralizada ou pode ser fisicamente
distribuída nas instalações da empresa.
III. A arquitetura independente é considerada aquela que comporta as necessidades do DW
organizacional com alto nível de acessos e utilização das informações geradas e
disponibilizadas, a partir de ferramentas de apoio a decisão para todos os departamentos
da empresa.
IV. A arquitetura independente mantém Data Marts stand-alone, onde têm-se dados
específicos da necessidade da empresa, considerando que cada departamento tem sua
informação sem a integração com outros departamentos.
V. A arquitetura integrada de Data Marts é implementada por Data Marts separadamente
por grupos específicos ou departamentos, sendo integrados ou interconectados
posteriormente, provendo uma visão organizacional maior dos dados e informações.
Estão corretos os itens:
Alternativas:
II – IV – V.  CORRETO
III – IV – V.
II – III – IV – V.
I – II – III – IV – V.
I – II – III.
Resolução comentada:
O MOLAP refere-se à utilização de banco de dados com características
multidimensionais, permitindo a navegação com níveis de detalhamento em tempo
real, a partir da combinação das dimensões do cubo, proporcionando análises
sofisticadas com ótimo desempenho. Segundo Machado (2013), em um banco de
dados multidimensional, os cruzamentos de valores são realizados automaticamente,
agilizando a visualização multidimensional das informações sob o ponto de vista de
todas as dimensões. A forma de acesso e de agregação dos dados faz com que esta
ferramenta tenha um excelente desempenho.
13/09/2023, 14:46 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3036449/8184002 7/7
Código da questão: 42583
Resolução comentada:
os itens I e III estão errados. O item I está errado porque a arquitetura é classificada
como global, independente ou a integrada; e o tipo de implementação é do tipo top
down, bottom up ou a combinada.
O item III está errado porque é a arquitetura global que mais independente,
considerada a arquitetura que comporta as necessidades do DW organizacional com
alto nível de acessos e utilização das informações geradas e disponibilizadas, a partir
de ferramentas de apoio a decisão para todos os departamentos da empresa.
Arquivos e Links

Outros materiais