Buscar

Modelagem e arquitetura do DW (Data Warehouse)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 9 páginas

Prévia do material em texto

Modelagem e arquitetura do DW (Data Warehouse)
Professor(a): Marise de Barros Miranda Gomes (Doutorado)
Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta 
objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automati
corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabe
prova!
Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/inde...
1 of 9 19/10/2022 17:14
1)
2)
Uma característica importante que deve estar presente em ferramentas OLAP é a capacidade de efetuar operações s
conjunto de dados multidimensional que retorna uma apresentação ou sumarização diferente de informações. Existem d
operadores OLAP que permitem acessar os dados em esquemas multidimensionais. As principais operações são do tip
Down, Drill Up, Drill Across e Drill Throught) e as do tipo Slice and Dice.
Sobre os tipos de operações, julgue os itens a seguir, indicando “V” para o item verdadeiro e “F” para o item falso:
1. ( ) O tipo de operação Drill Down ocorre quando o usuário aumenta o nível de detalhe da informação, diminuindo
granularidade, ou seja, navega verticalmente, descendo a hierarquia no sentido mais específico.
2. ( ) O tipo de operação Drill Up ocorre quando o usuário aumenta o nível de granularidade, diminuindo o nível de
detalhamento da informação.
3. ( ) O tipo de operação Drill Across permite navegar transversalmente no eixo da árvore hierárquica, inserindo ou
posições da dimensão.
4. ( ) O tipo de operação Slice and Dice ocorre quando o usuário navega de uma informação contida em uma dime
uma outra dimensão.
5. ( ) O tipo de operação Drill Throught significa a redução do escopo dos dados em análise, além de mudar a orde
dimensões, mudando, assim, a orientação segundo a qual os dados são visualizados.
Assinale a alternativa correta
Alternativas:
F – F – F – V – V.
V – V – V – V – V.
F – F – F – F – F.
V – V – V – F – F.  CORRETO
V – F – V – F – V.
Código da questão: 42608
A modelagem multidimensional representa uma abstração dos dados armazenados, consistindo em um modelo comp
tabelas de Fatos e de Dimensões, que proporcionam uma visão multidimensional de grande quantidade de dados. Exist
algumas abordagens específicas para modelagem multidimensional, derivadas da aparência do esquema traçado, a par
Diagrama de Entidades e Relacionamentos (DER), sendo o ___________________ composto de uma tabela dominant
centro, chamada de Fatos, rodeada por tabelas auxiliares, chamadas de tabelas de Dimensões, o qual a tabela de Fato
se às tabelas de Dimensões por várias junções e cada tabela de Dimensão se conecta com apenas uma junção à tabe
Resolução comentada:
o item 4 é falso, porque o tipo de operação Slice and Dice que significa a redução do escopo dos dados em análise, 
de alterar a ordem das dimensões, altera, também, a orientação segundo a qual os dados são visualizados. Segundo
Machado (2013), Slice é a operação que corta o cubo, mas mantém a mesma perspectiva de visualização dos dados
por sua vez, é a mudança de perspectiva da visão, ou seja, é a extração de um subcubo ou a interseção de vários S
O item 5 é falso, porque o tipo de operação Drill Throught ocorre quando o usuário navega de uma informação contid
uma dimensão para uma outra dimensão. Por exemplo, quando o usuário está na dimensão de tempo e no próximo 
começa a analisar a informação por região.
Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/inde...
2 of 9 19/10/2022 17:14
3)
Fatos. E uma variante deste esquema é denominado de ___________________.
Assinale a alternativa correta que indica os termos que preenchem as lacunas acima:
Alternativas:
Esquema Floco de Neve; Esquema Cubo.
Esquema MER; Esquema Cubo.
Esquema Estrela; Esquema Floco de Neve.  CORRETO
Esquema Floco de Neve; Esquema Estrela.
Esquema Estrela; Esquema Cubo.
Código da questão: 42591
As ferramentas que apresentam características OLAP passaram a ser referenciadas como ferramentas OLAP. As ferr
OLAP podem ser classificadas de acordo com a estratégia de armazenamento, sendo chamadas de OLAP Multidimens
(MOLAP), OLAP Relacional (ROLAP), OLAP Híbrido e OLAP Web.
Assinale a alternativa correta que descreve as características das ferramentas do tipo MOLAP.
Alternativas:
O MOLAP refere-se à abordagem de uso combinado de um banco de dados relacional com um banco de dados orienta
objetos, onde as estruturas relacionais são utilizadas para os dados com maior granularidade e as estruturas orientadas
são utilizadas para dados com menor granularidade.
O MOLAP refere-se à utilização de banco de dados com características multidimensionais, permitindo a navegação com
detalhamento em tempo real, a partir da combinação das dimensões do cubo, proporcionando análises sofisticadas com
desempenho.  CORRETO
O MOLAP refere-se à utilização de banco de dados com características multidimensionais, permitindo operações que oc
quando o usuário navega pelas informações contidas entre dimensões de esquemas diferentes, acessados remotament
O MOLAP refere-se à utilização da ferramenta OLAP em ambiente remoto, disparando consultas via um navegador web
servidor que, por sua vez, retorna o cubo processado para análise do usuário.
O MOLAP refere-se à utilização de banco de dados relacional para implementar soluções OLAP, permitindo análise
multidimensional dos dados que estão armazenados em uma base de dados relacional, sendo feito todo o processamen
servidor da base de dados e depois gerados os comandos SQL e as tabelas temporárias.
Resolução comentada:
o Esquema Estrela (Star Schema) é a abordagem, proposta por Kimball (1998), que visa criar esquemas físicos mais
simples e incremental. O nome estrela se dá devido à disposição em que se encontram as tabelas, sendo a tabela de
Fatos, centralizada no esquema, e as tabelas de Dimensões são relacionandas nas pontas do esquema.
Elmasri e Navathe (2005) descrevem que o “esquema floco de neve é uma variação do esquema estrela em que as 
dimensões de um esquema estrela são organizadas em uma hierarquia ao normalizá-las” (ELMASRI; NAVATHE, 225
725).
Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/inde...
3 of 9 19/10/2022 17:14
4)
5)
Código da questão: 42604
A decisão de optar pelo Esquema Estrela ou pelo Esquema Floco de Neve deve ser tomada levando-se em considera
principalmente, pela complexidade da solução e o volume de dados a ser manipulado.
Sobre as características dos Esquemas Estrela e Floco de Neve, julgue os itens a seguir:
I. O Esquema Estrela possui uma estrutura razoavelmente simples, com poucas tabelas e relacionamentos bem de
aproximando bastante do modelo de negócio.
II. O Esquema Floco de Neve é uma variação do Esquema Estrela, em que as tabelas dimensões de um Esquema E
organizadas em uma hierarquia ao normalizá-las.
III. O Esquema Estrela é composto por uma tabela dominante no centro, chamada de Fatos, relacionada com tabelas
auxiliares, chamadas de tabelas de Dimensões, sendo que a tabela de Fatos é relacionada com cada tabela de D
em um relacionamento “muitos para um”.
IV. O Esquema Floco de Neve separa as hierarquias das dimensões em tabelas normalizadas, aumentando consider
o número de dimensões, consequentemente aumenta-se a performance das consultas dinâmicas.
Estão corretos os itens:
Alternativas:
II – III – IV.
I – II – III – IV.
I – II.
II – III.
I – II – III.  CORRETO
Código da questão: 42593
O modelo multidimensional permite encontrar respostas de comportamento do desempenho dos negócios, por meio d
Resolução comentada:
O MOLAP refere-se à utilização de banco de dados com características multidimensionais, permitindo a navegação c
níveis de detalhamento em tempo real, a partir da combinação das dimensões do cubo, proporcionando análises
sofisticadas com ótimo desempenho. SegundoMachado (2013), em um banco de dados multidimensional, os cruzam
de valores são realizados automaticamente, agilizando a visualização multidimensional das informações sob o ponto
vista de todas as dimensões. A forma de acesso e de agregação dos dados faz com que esta ferramenta tenha um
excelente desempenho.
Resolução comentada:
Os itens corretos são I, II e III. O item IV está errado, porque o Esquema Floco de Neve separa as hierarquias das
dimensões em tabelas normalizadas, aumentando consideravelmente o número de dimensões, e diminuindo
consequentemente a performance das consultas dinâmicas.
Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/inde...
4 of 9 19/10/2022 17:14
6)
aspectos a seguir.
I. Realizar simulações de cenários.
II. Embasar análises estratégicas e alocar decisões.
III. Podem ser realizadas abstrações de localidade (onde).
IV. Permite resumir a temporalidade (quando).
V. Não associa responsabilidades (quem) e classificações (o quê).
São verdadeiras:
Alternativas:
I – III, somente.
I – II – III.
I – IV – V.
I - II – III – IV.  CORRETO
II – III – V.
Código da questão: 42587
As organizações precisam responder de maneira ágil e eficiente às mudanças e oportunidades de mercado. Muitas e
iniciam o desenvolvimento de um Data Warehouse (DW), contemplando conjuntos de dados mais gerenciáveis e catego
por assunto, para atenderem às necessidades de pequenos grupos de usuários ou níveis funcionais da empresa, invest
assim, na implementação de Data Marts.
Sobre Data Marts, assinale a alternativa correta:
Alternativas:
Um Data Mart é um depósito de dados especializado, orientado por assunto, integrado, volátil e variável no tempo, a pa
dados extraídos de um DW, com o objetivo específico de dar suporte a rápido determinado grupo ou função de usuários
CORRETO
Um Data Mart refere-se ao processo de explorar grandes quantidades de informações, a partir de um conjunto de ferram
mineração de dados que se utilizam de algoritmos de aprendizagem baseados em redes neurais e estatísticas.
Um Data Mart são sistemas transacionais que registram todas as transações operacionais das organizações, sendo util
processamento dos dados que são gerados diariamente por meio dos sistemas informacionais das empresas.
Um Data Mart é um ambiente intermediário de armazenamento e processamento dos dados para o processo de extraçã
transformação e carga ETL (Extraction, Transformation and Load).
Resolução comentada:
a abordagem do modelo multidimensional permite que respostas sobre o comportamento do desempenho do negóci
encontradas por meio de simulações de cenários para embasar as análises estratégicas e alocar decisões. Esta abo
remete à necessidade de construir um modelo dimensional, em que são feitas perguntas sob abstrações de localidad
(onde), temporalidade (quando), responsabilidade (quem) e classificação (o quê).
Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/inde...
5 of 9 19/10/2022 17:14
7)
Um Data Mart é um ambiente de processamento analítico, caracterizado por consultas complexas, estruturadas e freque
envolvendo agregação ou relacionamento de dados para gerar informações que apoiam processos decisórios.
Código da questão: 42580
Ferramentas de mineração de dados (Data Mining) são integradas aos ambientes de Data Warehouse para gerarem
informações em conhecimento potencialmente útil. Sua função principal é a extração de grande volume de dados com o
de encontrarem padrões e correlações significativas, estimarem tendências e novas perspectivas que agreguem,
satisfatoriamente, com contexto do negócio explorado.
Sobre as técnicas de Data Mining, julgue os itens a seguir:
I. Árvores de Decisão (Decision Tree): caracterizam-se pelo método de classificação de dados, sendo conveniente adota
técnica quando o objetivo é gerar regras que possam ser entendidas, explicadas e traduzidas para a linguagem natural.
II. Redes Neurais Artificiais: caracterizam-se em resolver problemas complexos e construir representações internas de m
padrões detectados nos dados que envolvem o desenvolvimento de estruturas matemáticas com habilidade de aprendiz
meio de experiências de operações da própria máquina.
III. Predição com Séries Temporais: caracteriza-se em identificar a existência de diferentes grupos dentro de um conjunt
dados e, constatada está existência, agrupa-se os elementos estudados de acordo com suas similaridades, podendo re
definir a priorização entre eles.
IV. Análise de Regressão: utiliza-se algoritmos genéticos para encontrar soluções de problemas dinâmicos e complexos
envolvem centenas ou milhares de variáveis e/ou fórmulas para identificar as descobertas, gerando possíveis soluções
simultaneamente.
Estão corretos os itens:
Alternativas:
I – II.  CORRETO
I – II – III.
I – II – III – IV.
III – IV.
II – III.
Resolução comentada:
considerando as inúmeras definições de Data Marts, na concepção de Rob e Coronel (2011), um Data Mart é um peq
subconjunto de um DW, sobre um único assunto, que fornece suporte às decisões de um pequeno grupo de pessoas
pode ser criado a partir de dados extraídos de um DW maior, com o objetivo específico de dar suporte a acessos ma
rápido para determinado grupo ou função.
A definição apresentada na alternativa a) refere-se ao conceito de Online Transaction Processing (OLTP – Processam
de Transações em Tempo Real).
A definição apresentada na alternativa “Um Data Mart é um ambiente de processamento analítico...” refere-se ao con
de Online Analytical Pocessing (OLAP – Processamento Analítico On-line.
A definição apresentada na alternativa “Um Data Mart refere-se ao processo de explorar...” refere-se ao conceito de 
Mining.
A definição apresentada na alternativa e) refere-se a uma parte do processo de funcionamento de um ambiente de D
Warehouse.
Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/inde...
6 of 9 19/10/2022 17:14
8)
9)
Código da questão: 42614
Um modelo é uma __________utilizada como técnica para refletir a realidade. Ao modelar os dados de uma organiza
sejam operacionais ou analíticos, busca-se o que se quer realizar ou fazer com os dados. Armazenar dados em bancos
relacionais para manter o histórico não reflete a realidade da empresa. É necessário desenhar uma organização desses
para isso, um modelo _____________ funciona como uma ferramenta que auxilia na análise dos requisitos e no desenh
estrutura dos dados relacionada a esse negócio.
Assinale a alternativa que completa adequadamente a lacuna acima:
Alternativas:
Abstração; Entidade relacionamento.  CORRETO
Entidade; Sumarizado.
Granular; Abstração.
Abstração; Transacional.
Entidade relacionamento; Dimensional.
Código da questão: 42586
O banco de dados analítico é diferente do banco de dados operacional, transacional ou OLTP (Online Transaction Pro
usado para processar as transações. Embora os bancos de dados transacionais possam ser usados para suportar o
armazenamento de dados e as aplicações de BI, não se recomenda seu uso por questões de integridade e escalabilida
I. O banco de dados convencional deve ser preservado, e o banco de dados analíticos deve estar em outro schema.
PORQUE
II. Um banco de dados analítico tem uma estrutura baseada em coluna, tornando os cálculos individuais muito rápidos. J
bancos de dados transacionais dependem de armazenamento de dados baseado em linha, impróprio para operar com g
volumes de dados.
Resolução comentada:
o Item III está errado porque refere-se a técnica de Análise de Aglomerações (Cluster Analysis): caracteriza-se em
identificar a existência de diferentes grupos dentro de um conjunto de dados e, constatada esta existência, agrupa-se
elementos estudados de acordo com suas similaridades, podendo refiná-los e definir a priorização entre eles.
O item IV está errado, porque refere-se à técnica de Algoritmos Genéticos: utiliza-se algoritmos genéticos para encon
soluções de problemas dinâmicos e complexos que envolvemcentenas ou milhares de variáveis e/ou fórmulas para
identificar as descobertas, gerando possíveis soluções simultaneamente.
Resolução comentada:
O modelo entidade relacionamento é uma abstração, e tenta refletir o mundo real, que vislumbra o que ser quer reali
fazer. Este modelo é uma ferramenta que ajuda na análise de requisitos de negócio e no design da estrutura de dado
relacionada com esse negócio e sua base histórica. O modelo ER descreve as operações relacionadas ao negócio e
ligações entre as entidades do modelo.
Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/inde...
7 of 9 19/10/2022 17:14
10)
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
A primeira asserção está correta e a segunda está incorreta.
A primeira e a segunda asserções estão incorretas.
A primeira e a segunda asserções estão corretas, mas a segunda não tem relação com a primeira.
A primeira asserção está incorreta e a segunda está correta
A primeira e a segunda asserções estão corretas, e a segunda complementa a primeira.  CORRETO
Código da questão: 50534
Rob e Coronel (2011) enfatizam que a mineração de dados é proativa, ou seja, as ferramentas buscam automaticam
identificar anomalias e possíveis relacionamentos entre os dados, identificando problemas ainda não identificados pelos
estratégicos para, assim, prover o conhecimento e aplica-lo às necessidades dos negócios, sendo que a mineração de d
contempla quatro fases básicas.
(ROB, P.; CORONEL, C. Sistemas de banco de dados: projeto, implementação e administração. 8. ed. São Paulo: Ce
Learning, 2011).
Sobre as fases do processo de mineração de dados, julgue os itens a seguir:
I. A primeira fase, seleção dos dados, refere-se à seleção dos principais conjuntos de dados e do tratamento de lim
integração desses dados a serem utilizados pela operação de transformação de dados.
II. A segunda fase, análise e classificação dos dados, refere-se ao estudo dos dados para identificar características 
comuns com a aplicação de algoritmos para encontrar análises, vínculos ou dependências, padrões, tendências e
de dados.
III. A terceira fase, aquisição do conhecimento, refere-se à seleção dos algoritmos mais comuns de modelagem e aq
conhecimentos, baseados em redes neurais, lógica indutiva, árvores de decisão, classificação ou regressão, etc.,
definição desses algoritmos com possível interação dos usuários finais.
IV. A quarta fase, transformação dos dados, refere-se às descobertas de mineração de dados para garantirem o
comportamento futuro e adquirirem conhecimento, para os usuários estratégicos analisarem seus negócios, por e
provável lançamento de um produto novo ou de uma campanha de marketing.
Estão corretos os itens
Alternativas:
Resolução comentada:
Os bancos de dados transacionais são bancos baseados em armazenamento por linha, o que impossibilita o desemp
quando submetido a cálculos em processos analíticos. Isto deteriora o desempenho para a finalidade base ao qual fo
projetado, que é armazenar, acessar, incluir e excluir os registros ali depositados. Portanto, para projetos que envolv
cálculos analíticos outro banco com processo de armazenamento por coluna é mais eficiente, como os bancos de da
analíticos, pois os registros ficam livres para serem submetidos aos cálculos volumétricos, essenciais para BI e Big D
Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/inde...
8 of 9 19/10/2022 17:14
I – II – IV.
I – II – III.
I – II.
II – III.  CORRETO
III – IV.
Código da questão: 42613
Resolução comentada:
o item I está errado, porque a primeira fase é definida como preparação dos dados e refere-se à identificação dos pri
conjuntos de dados e do tratamento de limpeza e integração desses dados a serem utilizados pela operação de mine
dados.
O item IV está errado porque a quarta fase é definida como prognóstico e refere-se às descobertas de mineração de
preverem o comportamento futuro e projetarem resultados de negócios, como o provável lançamento de um produto
uma campanha de marketing.
Arquivos e Links
Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/inde...
9 of 9 19/10/2022 17:14

Continue navegando