Buscar

Modelagem e arquitetura do dw (data warehouse)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

Modelagem e arquitetura do dw (data warehouse)
Professor(a): Marise de Barros Miranda Gomes (Doutorado)
1)
2)
Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A
Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final.
Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas.
Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir
o prazo estabelecido. Boa prova!
O modelo de relacionamento entre _______________ captura as relações entre elas do
mundo real. É usado para projetar um _____________conceitual. Auxilia nas visões dos
relacionamentos entre as tabelas e também na construção de novas visões em um DW.
Assinale a alternativa que completa adequadamente as lacunas acima:
Alternativas:
Fontes de dados; Banco de dados.
Entidades; Banco de dados.  CORRETO
Fontes de dados; Atributos.
Entidades; SGBD.
Tabelas; SGBD.
Código da questão: 42571
Ferramentas de mineração de dados (Data Mining) são utilizadas nos diferentes
segmentos do mercado para sustentar e consolidar estratégias que auxiliem no processo
de tomada de decisão, a partir da geração das informações em conhecimento
potencialmente útil.
Sobre o conceito de Data Mining, assinale a alternativa correta
Alternativas:
Refere-se à utilização de banco de dados com características multidimensionais,
permitindo a navegação com níveis de detalhamento em tempo real, a partir da
combinação das dimensões do cubo, proporcionando análises sofisticadas com ótimo
desempenho.
Refere-se à descrição de padrões e tendências que são reveladas por subconjuntos de
dados compactados de diferentes bases de dados, a partir de um subconjunto de dados
com características idênticas, demostrando as relações funcionais entre as variáveis
definidas.
Refere-se a um pequeno subconjunto de um Data Warehouse, sobre um único assunto,
que fornece suporte às decisões para um grupo de pessoas, podendo ser criado a partir
de dados extraídos de um DW maior, com o objetivo específico de dar suporte a acessos
mais rápido para determinado grupo ou função.
Refere-se à abordagem de uso combinado de banco de dados relacional com banco de
dados orientado a objetos, onde as estruturas relacionais são utilizadas para os dados
com maior granularidade e as estruturas orientadas a objetos são utilizadas para dados
com menor granularidade.  INCORRETO
Refere-se às atividades que analisam grande volume de dados, descobrem problemas e
oportunidades ocultas em seus relacionamentos, formam modelos computacionais com
base nessas descobertas e, então, utilizam esses modelos para prever o comportamento
do negócio. CORRETO
Resolução comentada:
O modelo de relacionamento entre entidades, um modelo MER, captura as relações
entre essas entidades, refletindo o mundo real. O MER é usado para projetar um
banco de dados de maneira conceitual, o que contribui para as visões dos
relacionamentos entre as tabelas e também na construção de novas visões em um
DW.
Resolução comentada:
Avaliação enviada com sucessoc
h
e
c
k

Avaliação enviada com sucessoc
h
e
c
k

3)
4)
Código da questão: 42609
Rob e Coronel (2011) enfatizam que a mineração de dados é proativa, ou seja, as
ferramentas buscam automaticamente identificar anomalias e possíveis relacionamentos
entre os dados, identificando problemas ainda não identificados pelos usuários
estratégicos para, assim, prover o conhecimento e aplica-lo às necessidades dos negócios,
sendo que a mineração de dados contempla quatro fases básicas.
(ROB, P.; CORONEL, C. Sistemas de banco de dados: projeto, implementação e
administração. 8. ed. São Paulo: Cengage Learning, 2011).
Sobre as fases do processo de mineração de dados, julgue os itens a seguir:
I. A primeira fase, seleção dos dados, refere-se à seleção dos principais conjuntos de
dados e do tratamento de limpeza e integração desses dados a serem utilizados pela
operação de transformação de dados.
II. A segunda fase, análise e classificação dos dados, refere-se ao estudo dos dados para
identificar características e padrões comuns com a aplicação de algoritmos para
encontrar análises, vínculos ou dependências, padrões, tendências e desvios de
dados.
III. A terceira fase, aquisição do conhecimento, refere-se à seleção dos algoritmos mais
comuns de modelagem e aquisição de conhecimentos, baseados em redes neurais,
lógica indutiva, árvores de decisão, classificação ou regressão, etc., e a definição
desses algoritmos com possível interação dos usuários finais.
IV. A quarta fase, transformação dos dados, refere-se às descobertas de mineração de
dados para garantirem o comportamento futuro e adquirirem conhecimento, para os
usuários estratégicos analisarem seus negócios, por exemplo, o provável lançamento
de um produto novo ou de uma campanha de marketing.
Estão corretos os itens
Alternativas:
II – III.  CORRETO
III – IV.
I – II – III.
I – II – IV.
I – II.
Código da questão: 42613
Uma característica importante que deve estar presente em ferramentas OLAP é a
capacidade de efetuar operações sobre um conjunto de dados multidimensional que
retorna uma apresentação ou sumarização diferente de informações. Existem diversos
operadores OLAP que permitem acessar os dados em esquemas multidimensionais. As
principais operações são do tipo Drill (Drill Down, Drill Up, Drill Across e Drill Throught) e as
do tipo Slice and Dice.
Segundo Rob e Coronel (2011, p. 580), a mineração de dados refere-se às atividades
que analisam os dados, descobrem problemas e oportunidades ocultas em seus
relacionamentos, formam modelos computacionais com base nessas descobertas e,
então, utilizam esses modelos para prever o comportamento do negócio – exigindo
a mínima intervenção do usuário final.
Resolução comentada:
o item I está errado, porque a primeira fase é definida como preparação dos dados e
refere-se à identificação dos principais conjuntos de dados e do tratamento de
limpeza e integração desses dados a serem utilizados pela operação de mineração
de dados. 
O item IV está errado porque a quarta fase é definida como prognóstico e refere-se
às descobertas de mineração de dados para preverem o comportamento futuro e
projetarem resultados de negócios, como o provável lançamento de um produto
novo ou de uma campanha de marketing.
Avaliação enviada com sucessoc
h
e
c
k

Avaliação enviada com sucessoc
h
e
c
k

5)
Sobre os tipos de operações, julgue os itens a seguir, indicando “V” para o item verdadeiro
e “F” para o item falso:
1. (   ) O tipo de operação Drill Down ocorre quando o usuário aumenta o nível de
detalhe da informação, diminuindo a granularidade, ou seja, navega verticalmente,
descendo a hierarquia no sentido mais específico.
2. (   ) O tipo de operação Drill Up ocorre quando o usuário aumenta o nível de
granularidade, diminuindo o nível de detalhamento da informação.
3. (   ) O tipo de operação Drill Across permite navegar transversalmente no eixo da
árvore hierárquica, inserindo ou retirando posições da dimensão.
4. (   ) O tipo de operação Slice and Dice ocorre quando o usuário navega de uma
informação contida em uma dimensão para uma outra dimensão.
5. (   ) O tipo de operação Drill Throught significa a redução do escopo dos dados em
análise, além de mudar a ordem das dimensões, mudando, assim, a orientação
segundo a qual os dados são visualizados.
Assinale a alternativa correta
Alternativas:
V – V – V – V – V.
F – F – F – V – V.
V – F – V – F – V.
V – V – V – F – F.  CORRETO
F – F – F – F – F.
Código da questão: 42608
Para implementar projetos de Data Warehouse, são necessárias algumas considerações
conceituais que permitem manter o foco nas referências analíticas como finalidade. Nesse
sentido, analise as afirmações a seguir.
I. DW é uma coleção orientada por assuntos, integrada, variante no tempo e não volátil.
II. Os resultados do DW servem para apoiar o processo de tomada de decisão das
organizações.
III. DW é a cópia específicade tabelas do banco analítico para consultas e análises, criando
visões funcionais.
IV. A construção de um DW depende fundamentalmente de arquitetura.
V. DW é uma arquitetura e não uma tecnologia.
São verdadeiras:
Alternativas:
II – III – V.
I – II – III.
I – IV – V.
I – IV.
I – II – IV – V.  CORRETO
Resolução comentada:
o item 4 é falso, porque o tipo de operação Slice and Dice que significa a redução do
escopo dos dados em análise, além de alterar a ordem das dimensões, altera,
também, a orientação segundo a qual os dados são visualizados. Segundo Machado
(2013), Slice é a operação que corta o cubo, mas mantém a mesma perspectiva de
visualização dos dados. Dice, por sua vez, é a mudança de perspectiva da visão, ou
seja, é a extração de um subcubo ou a interseção de vários Slices. 
O item 5 é falso, porque o tipo de operação Drill Throught ocorre quando o usuário
navega de uma informação contida em uma dimensão para uma outra dimensão.
Por exemplo, quando o usuário está na dimensão de tempo e no próximo passo
começa a analisar a informação por região.
Avaliação enviada com sucessoc
h
e
c
k

Avaliação enviada com sucessoc
h
e
c
k

6)
7)
Código da questão: 42577
As informações assumem o papel do principal patrimônio ativo de uma organização.
Assim, tornar as informações corporativas acessíveis para entendimento e utilização das
áreas estratégicas das organizações é um fator fundamental para a tomada de decisão
assertiva. As ferramentas Online Analytical Processing (OLAP) surgiram com os sistemas de
apoio à decisão para viabilização e extração eficaz de informações de um ambiente de Data
Warehouse (DW).
Sobre as características das ferramentas OLAP, julgue os itens a seguir:
I. Os dados são processados e visualizados em uma estrutura multidimensional.
II. Estrutura logicamente dados multidimensionais na forma de um cubo.
III. Efetua operações de manipulação de dados individuais, por meio dos comandos de
inserção, atualização e exclusão.
IV. Proporciona respostas rápidas e consistentes às consultas interativas executadas
pelos usuários.
Estão corretos os itens:
Alternativas:
I – II – IV. CORRETO
I – II.
II – III.
III – IV.
I – II – III.  INCORRETO
Código da questão: 42606
Segundo Kimball (1998), o esquema de dados mais utilizado na especificação de um
Data Warehouse é o Esquema Estrela (Star Schema) composto por tabelas de Fatos e de
Dimensões que proporcionam uma visão multidimensional de grande volume de dados.
(KIMBALL, R. et al. The data warehouse lifecycle toolkit. New York: John Wiley & Sons,
1998).
Sobre as características das tabelas de Fatos e de Dimensões, julgue os itens a seguir:
I. O contexto das funcionalidades que determinam os processos de negócio de uma
empresa é especificado em tabelas de Fatos.
II. A tabela de Fatos é a principal tabela de um esquema dimensional que geralmente
contém vários fatos que indicam valores para análise dimensional.
III. A tabela de Fatos relaciona-se com as tabelas de Dimensões, que representam as
entidades de negócio e constituem as estruturas de entrada que realizam os filtros
de valores aplicados na manipulação dos fatos.
Resolução comentada:
na conceituação dada por Inmonn (2005), DW é uma coleção orientada por
assuntos, integrada, variante no tempo e não volátil, para apoiar o processo de
tomada de decisão das organizações. 
Na definição de Kimball (2002), DW é a cópia específica de tabelas do banco
transacional para consultas e análises, criando visões funcionais. 
Um projeto de construção de um DW depende, fundamentalmente, de arquitetura.
Por isso, Machado (2010) deixa claro que “DW é uma arquitetura e não uma
tecnologia”. A tecnologia sim ajuda a construir, operar e monitorar um projeto DW
implantado.
Resolução comentada:
o item III está errado, porque os sistemas transacionais, Online Transaction
Processing (OLTP – Processamento de Transações On-line, que efetuam operações
de manipulação de dados individuais, por meio dos comandos de inserção,
atualização e exclusão.
Avaliação enviada com sucessoc
h
e
c
k

Avaliação enviada com sucessoc
h
e
c
k

8)
9)
IV. As tabelas de Dimensões contêm a descrição textual do negócio, representada pelos
atributos e com a indicação da chave primária, que serve como base para manter a
integridade referencial quando relacionada com a tabela de Fatos.
V. As tabelas de Dimensões representam as características numéricas e classificatórias
que fornecem as perspectivas adicionais a um determinado fato por meio de seus
atributos.
Estão corretos os itens:
Alternativas:
I – II – III – IV.  CORRETO
I – II – III – IV – V.
I – II – III.
II – IV – V.
I – III – V.
Código da questão: 42592
A modelagem multidimensional representa uma abstração dos dados armazenados,
consistindo em um modelo composto por tabelas de Fatos e de Dimensões, que
proporcionam uma visão multidimensional de grande quantidade de dados. Existem
algumas abordagens específicas para modelagem multidimensional, derivadas da
aparência do esquema traçado, a partir do Diagrama de Entidades e Relacionamentos
(DER), sendo o ___________________  composto de uma tabela dominante no centro, chamada
de Fatos, rodeada por tabelas auxiliares, chamadas de tabelas de Dimensões, o qual a
tabela de Fatos conecta-se às tabelas de Dimensões por várias junções e cada  tabela de
Dimensão se conecta com apenas uma junção à tabela de Fatos. E uma variante deste
esquema é denominado de ___________________.
Assinale a alternativa correta que indica os termos que preenchem as lacunas acima:
Alternativas:
Esquema Floco de Neve; Esquema Cubo.
Esquema Floco de Neve; Esquema Estrela.
Esquema Estrela; Esquema Floco de Neve.  CORRETO
Esquema MER; Esquema Cubo.
Esquema Estrela; Esquema Cubo.
Código da questão: 42591
O banco de dados analítico é diferente do banco de dados operacional, transacional ou
OLTP (Online Transaction Processing), usado para processar as transações. Embora os
bancos de dados transacionais possam ser usados para suportar o armazenamento de
dados e as aplicações de BI, não se recomenda seu uso por questões de integridade e
escalabilidade. 
I. O banco de dados convencional deve ser preservado, e o banco de dados analíticos deve
Resolução comentada:
os itens corretos são I, II, III e IV. O item V está errado porque as tabelas de
Dimensões representam as características descritivas/textuais que fornecem as
perspectivas adicionais a um determinado fato por meio de seus atributos.
Resolução comentada:
o Esquema Estrela (Star Schema) é a abordagem, proposta por Kimball (1998), que
visa criar esquemas físicos mais simples e incremental. O nome estrela se dá devido
à disposição em que se encontram as tabelas, sendo a tabela de Fatos, centralizada
no esquema, e as tabelas de Dimensões são relacionandas nas pontas do esquema. 
Elmasri e Navathe (2005) descrevem que o “esquema floco de neve é uma variação
do esquema estrela em que as tabelas dimensões de um esquema estrela são
organizadas em uma hierarquia ao normalizá-las” (ELMASRI; NAVATHE, 225, p. 725).
Avaliação enviada com sucessoc
h
e
c
k

Avaliação enviada com sucessoc
h
e
c
k

10)
estar em outro schema. 
PORQUE 
II. Um banco de dados analítico tem uma estrutura baseada em coluna, tornando os
cálculos individuais muito rápidos. Já os bancos de dados transacionais dependem de
armazenamento de dados baseado em linha, impróprio para operar com grandes volumes
de dados. 
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
A primeira asserção está correta e a segunda está incorreta.
A primeira e a segunda asserções estão incorretas.
A primeira e a segunda asserções estão corretas, e a segunda complementa a primeira.
 CORRETO
A primeira e a segunda asserções estão corretas, mas a segunda não tem relação com a
primeira.
A primeira asserção está incorreta e a segunda está correta
Código da questão: 50534
Em um banco de dados relacional, a granularidade é baixa, mas é muito importante, o
que significaque ela é inversamente proporcional ao detalhe do dado armazenado lá. Para
se obter granularidade alta, a importância do detalhe não pode ser considerada. Marque a
alternativa que relaciona a granularidade em diferentes níveis e a disponibilidade de
detalhamento dos dados.
Alternativas:
Tabela Fato.
Dimensão.
Relacionamento.
 Entidade.
Sumarização.  CORRETO
Código da questão: 42585
Resolução comentada:
Os bancos de dados transacionais são bancos baseados em armazenamento por
linha, o que impossibilita o desempenho quando submetido a cálculos em processos
analíticos. Isto deteriora o desempenho para a finalidade base ao qual foi projetado,
que é armazenar, acessar, incluir e excluir os registros ali depositados. Portanto, para
projetos que envolvam cálculos analíticos outro banco com processo de
armazenamento por coluna é mais eficiente, como os bancos de dados analíticos,
pois os registros ficam livres para serem submetidos aos cálculos volumétricos,
essenciais para BI e Big Data.
Resolução comentada:
um DW tem níveis de granularidade elevados por conta da necessidade de
sumarizações para refletir a realidade dos dados do negócio. As sumarizações são
necessárias, pois refletem medidas resumidas ou condessadas, com alguma
transformação dos dados originais. Sem essa técnica, seria impraticável obter
respostas que refletem o comportamento de um conjunto de dados. Sumarizações
podem ser somas, médias, medianas, quartis, etc.
Arquivos e Links
Avaliação enviada com sucessoc
h
e
c
k

Avaliação enviada com sucessoc
h
e
c
k


Continue navegando