Buscar

Modelagem e arquitetura do DW (Data Warehouse)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 8 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

1)
As ferramentas que apresentam características OLAP passaram a ser referenciadas como
ferramentas OLAP. As ferramentas OLAP podem ser classificadas de acordo com a
estratégia de armazenamento, sendo chamadas de OLAP Multidimensional (MOLAP),
OLAP Relacional (ROLAP), OLAP Híbrido e OLAP Web.
Assinale a alternativa correta que descreve as características das ferramentas do tipo
MOLAP.
Alternativas:
● O MOLAP refere-se à utilização da ferramenta OLAP em ambiente remoto,
disparando consultas via um navegador web para o servidor que, por sua vez,
retorna o cubo processado para análise do usuário.
● O MOLAP refere-se à abordagem de uso combinado de um banco de dados
relacional com um banco de dados orientado a objetos, onde as estruturas
relacionais são utilizadas para os dados com maior granularidade e as estruturas
orientadas a objetos são utilizadas para dados com menor granularidade.
● O MOLAP refere-se à utilização de banco de dados com características
multidimensionais, permitindo operações que ocorrem quando o usuário navega
pelas informações contidas entre dimensões de esquemas diferentes, acessados
remotamente.
● O MOLAP refere-se à utilização de banco de dados relacional para implementar
soluções OLAP, permitindo análise multidimensional dos dados que estão
armazenados em uma base de dados relacional, sendo feito todo o processamento
no servidor da base de dados e depois gerados os comandos SQL e as tabelas
temporárias.
● O MOLAP refere-se à utilização de banco de dados com características
multidimensionais, permitindo a navegação com níveis de detalhamento em tempo
real, a partir da combinação das dimensões do cubo, proporcionando análises
sofisticadas com ótimo desempenho.checkCORRETO
Resolução comentada:
O MOLAP refere-se à utilização de banco de dados com características multidimensionais,
permitindo a navegação com níveis de detalhamento em tempo real, a partir da combinação
das dimensões do cubo, proporcionando análises sofisticadas com ótimo desempenho.
Segundo Machado (2013), em um banco de dados multidimensional, os cruzamentos de
valores são realizados automaticamente, agilizando a visualização multidimensional das
informações sob o ponto de vista de todas as dimensões. A forma de acesso e de
agregação dos dados faz com que esta ferramenta tenha um excelente desempenho.
Código da questão: 42604
2)
Rob e Coronel (2011) enfatizam que a mineração de dados é proativa, ou seja, as
ferramentas buscam automaticamente identificar anomalias e possíveis relacionamentos
entre os dados, identificando problemas ainda não identificados pelos usuários estratégicos
para, assim, prover o conhecimento e aplica-lo às necessidades dos negócios, sendo que a
mineração de dados contempla quatro fases básicas.
(ROB, P.; CORONEL, C. Sistemas de banco de dados: projeto, implementação e
administração. 8. ed. São Paulo: Cengage Learning, 2011).
Sobre as fases do processo de mineração de dados, julgue os itens a seguir:
1. A primeira fase, seleção dos dados, refere-se à seleção dos principais conjuntos de
dados e do tratamento de limpeza e integração desses dados a serem utilizados
pela operação de transformação de dados.
2. A segunda fase, análise e classificação dos dados, refere-se ao estudo dos dados
para identificar características e padrões comuns com a aplicação de algoritmos
para encontrar análises, vínculos ou dependências, padrões, tendências e desvios
de dados.
3. A terceira fase, aquisição do conhecimento, refere-se à seleção dos algoritmos mais
comuns de modelagem e aquisição de conhecimentos, baseados em redes neurais,
lógica indutiva, árvores de decisão, classificação ou regressão, etc., e a definição
desses algoritmos com possível interação dos usuários finais.
4. A quarta fase, transformação dos dados, refere-se às descobertas de mineração de
dados para garantirem o comportamento futuro e adquirirem conhecimento, para os
usuários estratégicos analisarem seus negócios, por exemplo, o provável
lançamento de um produto novo ou de uma campanha de marketing.
Estão corretos os itens
Alternativas:
● I – II – III.
● II – III.checkCORRETO
● III – IV.
● I – II – IV.
● I – II.
Resolução comentada:
o item I está errado, porque a primeira fase é definida como preparação dos dados e
refere-se à identificação dos principais conjuntos de dados e do tratamento de limpeza e
integração desses dados a serem utilizados pela operação de mineração de dados.
O item IV está errado porque a quarta fase é definida como prognóstico e refere-se às
descobertas de mineração de dados para preverem o comportamento futuro e projetarem
resultados de negócios, como o provável lançamento de um produto novo ou de uma
campanha de marketing.
Código da questão: 42613
3)
Na concepção de Poe, Klauer, Brobst (1998), o Esquema Estrela possui uma estrutura
simples com poucas tabelas e associações bem definidas, aproximando do contexto do
modelo de negócio e facilitando a geração de consultas complexas de forma intuitiva e
interativa, por meio dos vários parâmetros de consultas. Neste esquema, o assunto principal
fica ao centro do esquema, representada pela tabela de Fatos, e suas características, as
dimensões, representadas por tabelas de Dimensões, ficam posicionadas ao seu redor,
permitindo a leitura e compreensão até mesmo de usuários finais que não estão adaptados
com estruturas de banco de dados.
(POE V.; KLAUER P.; BROBST S. Building a data warehouse for decision support. New
Jersey: Prentice Hall PTR, 1998).
Sobre as principais vantagens do Esquema Estrela, julgue os itens a seguir, indicando “V”
para o item verdadeiro e “F” para o item falso:
1. ( ) A estrutura padronizada e regular do esquema é bastante simples, faciliatando a
apresentação, o desempenho das consultas geradas e a compreensão até mesmo de
usuários finais que não estão adaptados com estruturas de banco de dados.
2. ( ) As consultas ocorrem inicialmente nas tabelas de Dimensões e depois nas tabelas de
Fatos, assegurando a consistência dos dados por meio de uma estrutura de chaves que
garante o acesso aos dados com melhor desempenho.
3. ( ) A aplicação da técnica de normalização nas tabelas de Dimensões aumenta o número
de dimensões, consequentemente diminuindo a performance das consultas dinâmicas.
4. ( ) A facilidade e a flexibilidade da inclusão de novos elementos de dados, a partir do
relacionamento da tabela de Fatos com uma nova tabela de Dimensão, bem como o
acréscimo de novas colunas às mesmas tabelas de Dimensões.
5. O suporte para transformar e proceder à carga dos dados, para recuperar, analisar e
extrair os dados dos sistemas transacionais.
Assinale a alternativa correta:
Alternativas:
● F – V – F – V – F.
● V – V – F – V – F.checkCORRETO
● F – F – V – F – V.
● V – V – V – V – V.
● F – F – F – F – F.
Resolução comentada:
o item 3 é falso, porque é o Esquema Floco de Neve que separa as hierarquias das
dimensões em tabelas diferentes, especificando variantes da dimensão principal.
Considera-se que a aplicação da técnica de normalização nas tabelas de Dimensões
aumenta consideravelmente o número de dimensões e, consequentemente, diminuindo a
performance das consultas dinâmicas.
O item 5 é falso, porque o processo de transformar e proceder à carga dos dados, para
recuperar, analisar e extrair os dados dos sistemas transacionais refere-se a uma etapa do
processo de criação de um Data Warehouse, conhecido como ETL.
Código da questão: 42602
4)
O modelo de relacionamento entre _______________ captura as relações entre elas do
mundo real. É usado para projetar um _____________conceitual. Auxilia nas visões dos
relacionamentos entre as tabelas e também na construção de novas visões em um DW.
Assinale a alternativa que completa adequadamente as lacunas acima:
Alternativas:
● Fontes de dados; Atributos.
● Entidades; Banco de dados.checkCORRETO
● Tabelas; SGBD.
● Fontes de dados; Banco de dados.
● Entidades; SGBD.
Resolução comentada:
O modelo de relacionamento entre entidades, um modelo MER, captura as relações entreessas entidades, refletindo o mundo real. O MER é usado para projetar um banco de dados
de maneira conceitual, o que contribui para as visões dos relacionamentos entre as tabelas
e também na construção de novas visões em um DW.
Código da questão: 42571
5)
A abordagem analítica requer uma arquitetura de dados especializada, complemente a
sentença a seguir.
As necessidades analíticas sobre os dados provocaram mudanças na arquitetura da base
de dados. Os _____________________ são os dados brutos. Os dados resumidos,
agregados, sumarizados ou calculados são os dados ____________.
Assinale a alternativa que completa adequadamente as lacunas acima:
Alternativas:
● Segmentados; Transacionais
● Dados das operações; Derivados.checkCORRETO
● Segmentados; Matemáticos.
● Dados das operações; Segmentados.
● Dados das operações; Amostrados.
Resolução comentada:
Inmon (1997) destaca a mudança na abordagem em relação aos dados brutos, que no
início dos registros de dados não havia a experiência que pudesse prever arranjos
diferentes para suportar análises. O objetivo de arquiteturas básicas para banco de dados
eram armazenar os registros, sem a robustez necessária para suportar necessidades
futuras.
As necessidades analíticas sobre os dados provocaram mudanças na arquitetura, surgindo
demandas provenientes de dados derivados. Os dados do dia a dia, das operações, in
natura, são os dados brutos. Os dados resumidos, agregados, sumarizados ou calculados
são os dados derivados.
Código da questão: 42576
6)
Segundo Kimball (1998), o esquema de dados mais utilizado na especificação de um Data
Warehouse é o Esquema Estrela (Star Schema) composto por tabelas de Fatos e de
Dimensões que proporcionam uma visão multidimensional de grande volume de dados.
(KIMBALL, R. et al. The data warehouse lifecycle toolkit. New York: John Wiley & Sons,
1998).
Sobre as características das tabelas de Fatos e de Dimensões, julgue os itens a seguir:
1. O contexto das funcionalidades que determinam os processos de negócio de uma
empresa é especificado em tabelas de Fatos.
2. A tabela de Fatos é a principal tabela de um esquema dimensional que geralmente
contém vários fatos que indicam valores para análise dimensional.
3. A tabela de Fatos relaciona-se com as tabelas de Dimensões, que representam as
entidades de negócio e constituem as estruturas de entrada que realizam os filtros
de valores aplicados na manipulação dos fatos.
4. As tabelas de Dimensões contêm a descrição textual do negócio, representada
pelos atributos e com a indicação da chave primária, que serve como base para
manter a integridade referencial quando relacionada com a tabela de Fatos.
5. As tabelas de Dimensões representam as características numéricas e
classificatórias que fornecem as perspectivas adicionais a um determinado fato por
meio de seus atributos.
Estão corretos os itens:
Alternativas:
● II – IV – V.
● I – II – III – IV.checkCORRETO
● I – II – III – IV – V.
● I – II – III.
● I – III – V.
Resolução comentada:
os itens corretos são I, II, III e IV. O item V está errado porque as tabelas de Dimensões
representam as características descritivas/textuais que fornecem as perspectivas adicionais
a um determinado fato por meio de seus atributos.
Código da questão: 42592
7)
O modelo multidimensional permite encontrar respostas de comportamento do desempenho
dos negócios, por meio dos aspectos a seguir.
1. Realizar simulações de cenários.
2. Embasar análises estratégicas e alocar decisões.
3. Podem ser realizadas abstrações de localidade (onde).
4. Permite resumir a temporalidade (quando).
5. Não associa responsabilidades (quem) e classificações (o quê).
São verdadeiras:
Alternativas:
● I - II – III – IV.checkCORRETO
● I – II – III.
● I – IV – V.
● I – III, somente.
● II – III – V.
Resolução comentada:
a abordagem do modelo multidimensional permite que respostas sobre o comportamento do
desempenho do negócio sejam encontradas por meio de simulações de cenários para
embasar as análises estratégicas e alocar decisões. Esta abordagem remete à necessidade
de construir um modelo dimensional, em que são feitas perguntas sob abstrações de
localidade (onde), temporalidade (quando), responsabilidade (quem) e classificação (o quê).
Código da questão: 42587
8)
Em um banco de dados relacional, a granularidade é baixa, mas é muito importante, o que
significa que ela é inversamente proporcional ao detalhe do dado armazenado lá. Para se
obter granularidade alta, a importância do detalhe não pode ser considerada. Marque a
alternativa que relaciona a granularidade em diferentes níveis e a disponibilidade de
detalhamento dos dados.
Alternativas:
● Dimensão.
● Entidade.
● Sumarização.checkCORRETO
● Tabela Fato.
● Relacionamento.
Resolução comentada:
um DW tem níveis de granularidade elevados por conta da necessidade de sumarizações
para refletir a realidade dos dados do negócio. As sumarizações são necessárias, pois
refletem medidas resumidas ou condessadas, com alguma transformação dos dados
originais. Sem essa técnica, seria impraticável obter respostas que refletem o
comportamento de um conjunto de dados. Sumarizações podem ser somas, médias,
medianas, quartis, etc.
Código da questão: 42585
9)
A decisão de optar pelo Esquema Estrela ou pelo Esquema Floco de Neve deve ser tomada
levando-se em consideração, principalmente, pela complexidade da solução e o volume de
dados a ser manipulado.
Sobre as características dos Esquemas Estrela e Floco de Neve, julgue os itens a seguir:
1. O Esquema Estrela possui uma estrutura razoavelmente simples, com poucas
tabelas e relacionamentos bem definidos, aproximando bastante do modelo de
negócio.
2. O Esquema Floco de Neve é uma variação do Esquema Estrela, em que as tabelas
dimensões de um Esquema Estrela são organizadas em uma hierarquia ao
normalizá-las.
3. O Esquema Estrela é composto por uma tabela dominante no centro, chamada de
Fatos, relacionada com tabelas auxiliares, chamadas de tabelas de Dimensões,
sendo que a tabela de Fatos é relacionada com cada tabela de Dimensão em um
relacionamento “muitos para um”.
4. O Esquema Floco de Neve separa as hierarquias das dimensões em tabelas
normalizadas, aumentando consideravelmente o número de dimensões,
consequentemente aumenta-se a performance das consultas dinâmicas.
Estão corretos os itens:
Alternativas:
● II – III – IV.
● I – II.
● I – II – III.checkCORRETO
● I – II – III – IV.
● II – III.
Resolução comentada:
Os itens corretos são I, II e III. O item IV está errado, porque o Esquema Floco de Neve
separa as hierarquias das dimensões em tabelas normalizadas, aumentando
consideravelmente o número de dimensões, e diminuindo consequentemente a
performance das consultas dinâmicas.
Código da questão: 42593
10)
Ferramentas de mineração de dados (Data Mining) são utilizadas nos diferentes segmentos
do mercado para sustentar e consolidar estratégias que auxiliem no processo de tomada de
decisão, a partir da geração das informações em conhecimento potencialmente útil.
Sobre o conceito de Data Mining, assinale a alternativa correta
Alternativas:
● Refere-se à utilização de banco de dados com características multidimensionais,
permitindo a navegação com níveis de detalhamento em tempo real, a partir da
combinação das dimensões do cubo, proporcionando análises sofisticadas com
ótimo desempenho.
● Refere-se à abordagem de uso combinado de banco de dados relacional com banco
de dados orientado a objetos, onde as estruturas relacionais são utilizadas para os
dados com maior granularidade e as estruturas orientadas a objetos são utilizadas
para dados com menor granularidade.
● Refere-se à descrição de padrões e tendências que são reveladas por subconjuntos
de dados compactados de diferentes bases de dados, a partir de um subconjunto de
dados com características idênticas, demostrando as relações funcionais entre as
variáveis definidas.
● Refere-se a um pequeno subconjunto de um Data Warehouse, sobre um único
assunto, que fornece suporte às decisões paraum grupo de pessoas, podendo ser
criado a partir de dados extraídos de um DW maior, com o objetivo específico de dar
suporte a acessos mais rápido para determinado grupo ou função.
● Refere-se às atividades que analisam grande volume de dados, descobrem
problemas e oportunidades ocultas em seus relacionamentos, formam modelos
computacionais com base nessas descobertas e, então, utilizam esses modelos
para prever o comportamento do negócio.checkCORRETO
Resolução comentada:
Segundo Rob e Coronel (2011, p. 580), a mineração de dados refere-se às atividades que
analisam os dados, descobrem problemas e oportunidades ocultas em seus
relacionamentos, formam modelos computacionais com base nessas descobertas e, então,
utilizam esses modelos para prever o comportamento do negócio – exigindo a mínima
intervenção do usuário final.
Código da questão: 42609

Outros materiais