Buscar

Modelagem e arquitetura do DW (Data Warehouse)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

22/11/2020 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2246876/2059360 1/6
Modelagem e arquitetura do DW (Data Warehouse)
Professor(a): Marise de Barros Miranda Gomes (Doutorado)
1)
2)
Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A
Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final.
Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas.
Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir
o prazo estabelecido. Boa prova!
O banco de dados analítico é diferente do banco de dados operacional, transacional ou
OLTP (Online Transaction Processing), usado para processar as transações. Embora os
bancos de dados transacionais possam ser usados para suportar o armazenamento de
dados e as aplicações de BI, não se recomenda seu uso por questões de integridade e
escalabilidade. 
I. O banco de dados convencional deve ser preservado, e o banco de dados analíticos deve
estar em outro schema. 
PORQUE 
II. Um banco de dados analítico tem uma estrutura baseada em coluna, tornando os
cálculos individuais muito rápidos. Já os bancos de dados transacionais dependem de
armazenamento de dados baseado em linha, impróprio para operar com grandes volumes
de dados. 
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
A primeira e a segunda asserções estão corretas, mas a segunda não tem relação com a
primeira.
A primeira asserção está correta e a segunda está incorreta.
A primeira asserção está incorreta e a segunda está correta
A primeira e a segunda asserções estão incorretas.
A primeira e a segunda asserções estão corretas, e a segunda complementa a primeira.
 CORRETO
Código da questão: 50534
O DW tem uma composição que separa a carga de trabalho para análise da carga de
trabalho para transações. No primeiro caso, permite a consolidação de diferentes fontes
nessa carga de trabalho analítica.
I. Um DW possui um conjunto característico personalizado, distintamente dos ambientes
convencionais das organizações.
PORQUE
II. Há como replicar um DW de uma empresa para outra. Cada projeto de DW não é único
em sua essência, mas no seu modo de operação e aplicação.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
A primeira asserção está incorreta e a segunda está correta.
A primeira asserção está correta e a segunda incorreta.  CORRETO
A primeira asserção está incorreta e a segunda justifica a primeira.
A primeira e a segunda asserções estão corretas, mas a segunda não justifica a primeira.
Resolução comentada:
Os bancos de dados transacionais são bancos baseados em armazenamento por
linha, o que impossibilita o desempenho quando submetido a cálculos em processos
analíticos. Isto deteriora o desempenho para a finalidade base ao qual foi projetado,
que é armazenar, acessar, incluir e excluir os registros ali depositados. Portanto, para
projetos que envolvam cálculos analíticos outro banco com processo de
armazenamento por coluna é mais eficiente, como os bancos de dados analíticos,
pois os registros ficam livres para serem submetidos aos cálculos volumétricos,
essenciais para BI e Big Data.
22/11/2020 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2246876/2059360 2/6
3)
4)
A primeira e a segunda asserções estão incorretas.
Código da questão: 42579
Segundo Rob e Coronel (2011), a característica mais marcante das modernas ferramentas
OLAP é a capacidade de análise multidimensional. Os dados são processados e visualizados
em uma estrutura multidimensional, sendo especialmente atrativos para os tomadores de
decisões de negócios, sendo que, enquanto o DW mantém dados de suporte, a decisões
integrados, orientados por assunto, variáveis no tempo e não voláteis, o sistema OLAP
fornece o front end por meio do qual os usuários finais acessam e analisam esses dados.
(ROB, P.; CORONEL, C. Sistemas de banco de dados: projeto, implementação e
administração. 8. ed. São Paulo: Cengage Learning, 2011).
Sobre os critérios que uma ferramenta OLAP deve ter, julgue os itens a seguir:
I. Dimensionalidade genérica: a ferramenta deve proporcionar condições ao usuário
para executar manipulações ou cálculos entre as dimensões.
II. Manipulação de matriz esparsa dinâmica: para qualquer matriz esparsa de dados,
existe um e somente um esquema físico, o qual provê a máxima eficiência e
operacionalidade.
III. Flexibilidade nas consultas: a análise e a apresentação dos dados tornam-se mais
simples quando linhas, colunas e células, que vão ser comparadas visualmente, são
organizados por agrupamentos lógicos.
IV. Dimensões e níveis de agregação limitados: um modelo analítico comum deve conter
uma matriz com dimensões de dados definidas entre quatro a cinco dimensões.
Estão corretos os itens:
Alternativas:
III – IV.
I – II – III – IV.
I – II – III.  CORRETO
II – III.
I – II.
Código da questão: 42607
A mineração de dados é comumente classificada pela sua capacidade em realizar tarefas
para diferentes domínios. A literatura indica que não existe um consenso de denominação
quanto à classificação, funcionalidades, tarefas, métodos ou técnicas de mineração de
dados. Contudo, Fayyad et al. (1996) apresentam alguns métodos de mineração de dados
que têm como objetivo a predição ou descrição dos resultados:
(FAYYAD, U.M. et al. Advances in knowledge discovery and data mining. California: AAAI
Press, 1996).
Sobre as técnicas de Data Mining, julgue os itens a seguir, indicando “V” para o item
verdadeiro e “F” para o item falso:
1. (   ) Regressão: usa-se para associar ou classificar um item a uma ou a várias
categorias pré-definidas, derivando uma regra que possa ser usada para classificar
Resolução comentada:
DW tem uma composição que separa a carga de trabalho para sua análise para
transações. No primeiro caso, permite a consolidação de diferentes fontes nessa
carga de trabalho analítica. 
Um DW possui um conjunto característico personalizado, distintamente dos
ambientes convencionais das organizações. Por este motivo, não há como replicar
um DW de uma empresa para outra. Cada projeto de DW não na essência mas no
seu modo de operação e aplicação.
Resolução comentada:
o item IV está errado, porque as dimensões e níveis de agregação são ilimitados: um
modelo analítico comum pode conter de quinze a vinte dimensões de dados.
22/11/2020 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2246876/2059360 3/6
5)
uma observação, referente a um conjunto de dados identificados que são
categorizados por um assunto.
2. (   ) Análise de Séries Temporais: refere-se a tarefa similar à classificação, porém é
usada quando os dados são identificados por predição de valores numéricos,
considerados variáveis independentes ou exploratórias, e não pela categorização dos
itens analisados, sendo possível verificar o eventual relacionamento funcional que
possa existir entre duas ou mais variáveis quantitativas.
3. (   ) Agrupamentos (Clusters): refere-se à tarefa de segmentar um conjunto de dados
em grupos diferentes, cujos itens são semelhantes, ou seja, subdivide o conjunto de
dados em um conjunto menor, sendo similar no comportamento dos atributos de
segmentação, descobrindo grupos diferentes entre o conjunto de dados
selecionado.
4. (   ) Sumarização: refere-se à tarefa de descrever padrões e tendências que são
reveladas por subconjuntos de dados compactados, a partir de um subconjunto de
dados com características similares, demostrando as relações funcionais entre as
variáveis definidas para a análise exploratória do subconjunto de dados
5. (   ) Análise de Séries Temporais: refere-se a tarefa similar à regra de associação com
objetivo de aplicar algum tipo de padrão (tendências, variações sazonais, variações
cíclicas e variações irregulares) no conjunto de dados, para determinar que tipos de
sequências podemocorrer em um determinado período.
Assinale a alternativa que indica a sequência correta:
Alternativas:
V – V – V – V – V
V – V – F – V – F.
F – V – F – V – F.
F – F – V – V – V.  CORRETO
F – F – F – F – F.
Código da questão: 42615
Sobre o Modelo Entidade Relacionamento (MER), considere as seguintes afirmações:
I. Dados como nome, endereço, produto são exemplos de entidade.
II. Cada entidade possui atributos.
III. A cardinalidade representa a métrica entre as entidades.
IV. A tabela de fatos central se conecta a várias tabelas dimensionais.
V. É o modelo mais amplamente utilizado em nível de abstração de projetos de banco de
dados, descriminando as características dos dados, chave primária e estrangeira.
São verdadeiras:
Alternativas:
I – IIII.
I – II – IV – V.  CORRETO
I – IV – V.
II – III – V.
I – II – III.
Resolução comentada:
o Item 1 é falso, porque refere-se ao método classificação usado para associar ou
classificar um item a uma ou a várias categorias pré-definidas, derivando uma regra
que possa ser usada para classificar uma observação, referente a um conjunto de
dados identificados que são categorizados por um assunto. 
O item 2 é falso, porque descreve o método de Regressão que se refere a tarefa
similar à classificação, porém é usada quando os dados são identificados por
predição de valores numéricos, considerados variáveis independentes ou
exploratórias, e não pela categorização dos itens analisados, sendo possível verificar
o eventual relacionamento funcional que possa existir entre duas ou mais variáveis
quantitativas.
22/11/2020 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2246876/2059360 4/6
6)
7)
Código da questão: 42572
Em um banco de dados relacional, a granularidade é baixa, mas é muito importante, o
que significa que ela é inversamente proporcional ao detalhe do dado armazenado lá. Para
se obter granularidade alta, a importância do detalhe não pode ser considerada. Marque a
alternativa que relaciona a granularidade em diferentes níveis e a disponibilidade de
detalhamento dos dados.
Alternativas:
Sumarização.  CORRETO
Tabela Fato.
 Entidade.
Relacionamento.
Dimensão.
Código da questão: 42585
Machado (2013) afirma que uma das principais vantagens de se implantar um Data Mart
em uma empresa, é a possibilidade de retorno rápido, garantindo um maior envolvimento
do usuário final, capaz de avaliar os benefícios extraídos de seu investimento.
(MACHADO, Felipe N. Tecnologia e projeto de data warehouse. 6. ed. São Paulo, SP:
Erica, 2013).
Sobre as características dos Data Marts, analise os itens a seguir:
I. São orientado por assunto, integrado, volátil e variável no tempo.
II. Fornecem suporte às decisões de um pequeno grupo de pessoas, departamentos ou
área específica do negócio.
III. Demandam menos investimento porque são mais baratos, em função de serem
implementados mais rápidos.
IV. Simulam o raciocínio e a capacidade de aprender de um ser humano, permitindo às
organizações administrarem melhor seus processos.
Estão corretos os itens:
Alternativas:
I – II – III.  CORRETO
I – II – III – IV.
II – III.
I – II.
III – IV.
Resolução comentada:
A afirmativa III está incorreta porque a cardinalidade representa o grau de
relacionamento entre as entidades no modelo ER.
As demais, estão corretas.
Resolução comentada:
um DW tem níveis de granularidade elevados por conta da necessidade de
sumarizações para refletir a realidade dos dados do negócio. As sumarizações são
necessárias, pois refletem medidas resumidas ou condessadas, com alguma
transformação dos dados originais. Sem essa técnica, seria impraticável obter
respostas que refletem o comportamento de um conjunto de dados. Sumarizações
podem ser somas, médias, medianas, quartis, etc.
Resolução comentada:
22/11/2020 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2246876/2059360 5/6
8)
9)
10)
Código da questão: 42582
Em um processo de tomada de decisões, a disponibilidade e o fácil acesso às
informações organizacionais contribuem para uma decisão de sucesso. Assim, a extração
eficaz de informações de um ambiente de Data Warehouse (DW) para gerar conhecimento
é proporcionada por ferramentas que disponibilizam recursos avançados para suportar
operações sobre o conjunto de dados multidimensional. Pela maior popularidade do uso
das ferramentas de acesso a um DW, destaca-se as ferramentas __________________________.
Assinale a alternativa correta que indica o termo que preenche a lacuna acima:
Alternativas:
Online Transaction Processing (OLTP).
Operational Data Store (ODS).
Online Analytical Processing (OLAP).  CORRETO
Business Inteligence (BI).
Staging Area.
Código da questão: 42605
Os ambientes de Data Warehouses (DW) integram sofisticadas ferramentas para análises
complexas de dados históricos e descoberta de conhecimento, assegurando o suporte à
tomada de decisão. Um ________________ organizacional pode manter um armazém central
de dados da organização inteira, ou pode manter armazéns menores, descentralizados,
denominados ________________.
Assinale a alternativa que completa adequadamente as lacunas acima:
Alternativas:
Data Mining; Data Source.
Data Warehouse; Data Mining.
Data Warehouse; Data Marts.  CORRETO
Data Mining; Data Warehouse.
Data Mining; Data Marts.
Código da questão: 42581
Para implementar projetos de Data Warehouse, são necessárias algumas considerações
conceituais que permitem manter o foco nas referências analíticas como finalidade. Nesse
sentido, analise as afirmações a seguir.
I. DW é uma coleção orientada por assuntos, integrada, variante no tempo e não volátil.
os itens I, II e III referem-se às características e/ou vantagens dos Data Marts. O item
IV é uma característica 
dos sistemas de inteligência artificial.
Resolução comentada:
Machado (2013) descreve que as ferramentas OLAP surgiram com os sistemas de
apoio à decisão para fazerem a consulta e análise dos dados dos DW, sendo às
aplicações às quais os usuários têm acesso para extrair os dados de suas bases e
construir os relatórios com recursos que atendem os gestores.
Resolução comentada:
os ambientes de Data Warehouses (DW) integram sofisticadas ferramentas para
análises complexas de dados históricos e descoberta de conhecimento, assegurando
o suporte à tomada de decisão. Um Data Warehouse organizacional pode manter
um armazém central de dados da organização inteira, ou pode manter armazéns
menores, descentralizados, denominados Data Mart.
22/11/2020 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2246876/2059360 6/6
II. Os resultados do DW servem para apoiar o processo de tomada de decisão das
organizações.
III. DW é a cópia específica de tabelas do banco analítico para consultas e análises, criando
visões funcionais.
IV. A construção de um DW depende fundamentalmente de arquitetura.
V. DW é uma arquitetura e não uma tecnologia.
São verdadeiras:
Alternativas:
I – II – III.
I – IV – V.
I – II – IV – V.  CORRETO
I – IV.
II – III – V.
Código da questão: 42577
Resolução comentada:
na conceituação dada por Inmonn (2005), DW é uma coleção orientada por
assuntos, integrada, variante no tempo e não volátil, para apoiar o processo de
tomada de decisão das organizações. 
Na definição de Kimball (2002), DW é a cópia específica de tabelas do banco
transacional para consultas e análises, criando visões funcionais. 
Um projeto de construção de um DW depende, fundamentalmente, de arquitetura.
Por isso, Machado (2010) deixa claro que “DW é uma arquitetura e não uma
tecnologia”. A tecnologia sim ajuda a construir, operar e monitorar um projeto DW
implantado.
Arquivos e Links

Outros materiais