Buscar

Modelagem e arquitetura do DW

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 9 páginas

Prévia do material em texto

Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A 
Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da 
média final. Você tem até cinco tentativas para “Enviar” as questões, que são 
automaticamente corrigidas. Você pode responder as questões consultando o material 
de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! 
1) 
As informações assumem o papel do principal patrimônio ativo de uma organização. 
Assim, tornar as informações corporativas acessíveis para entendimento e utilização das 
áreas estratégicas das organizações é um fator fundamental para a tomada de decisão 
assertiva. As ferramentas Online Analytical Processing (OLAP) surgiram com os sistemas 
de apoio à decisão para viabilização e extração eficaz de informações de um ambiente 
de Data Warehouse (DW). 
Sobre as características das ferramentas OLAP, julgue os itens a seguir: 
I. Os dados são processados e visualizados em uma estrutura multidimensional. 
II. Estrutura logicamente dados multidimensionais na forma de um cubo. 
III. Efetua operações de manipulação de dados individuais, por meio dos 
comandos de inserção, atualização e exclusão. 
IV. Proporciona respostas rápidas e consistentes às consultas interativas executadas 
pelos usuários. 
Estão corretos os itens: 
 
Alternativas: 
• III – IV. 
• I – II – IV. CORRETO 
• I – II – III. 
• II – III. 
• I – II. 
Resolução comentada: 
o item III está errado, porque os sistemas transacionais, Online Transaction Processing 
(OLTP – Processamento de Transações On-line, que efetuam operações de 
manipulação de dados individuais, por meio dos comandos de inserção, atualização e 
exclusão. 
Código da questão: 42606 
2) 
Machado (2013) afirma que uma das principais vantagens de se implantar um Data 
Mart em uma empresa, é a possibilidade de retorno rápido, garantindo um maior 
envolvimento do usuário final, capaz de avaliar os benefícios extraídos de seu 
investimento. 
(MACHADO, Felipe N. Tecnologia e projeto de data warehouse. 6. ed. São Paulo, SP: 
Erica, 2013). 
Sobre as características dos Data Marts, analise os itens a seguir: 
I. São orientado por assunto, integrado, volátil e variável no tempo. 
II. Fornecem suporte às decisões de um pequeno grupo de pessoas, departamentos ou 
área específica do negócio. 
III. Demandam menos investimento porque são mais baratos, em função de serem 
implementados mais rápidos. 
IV. Simulam o raciocínio e a capacidade de aprender de um ser humano, permitindo às 
organizações administrarem melhor seus processos. 
Estão corretos os itens: 
 
Alternativas: 
• III – IV. 
• I – II – III. CORRETO 
• I – II – III – IV. 
• II – III. 
• I – II. 
Resolução comentada: 
os itens I, II e III referem-se às características e/ou vantagens dos Data Marts. O item IV 
é uma característica 
dos sistemas de inteligência artificial. 
Código da questão: 42582 
3) 
A abordagem analítica requer uma arquitetura de dados especializada, complemente a 
sentença a seguir. 
As necessidades analíticas sobre os dados provocaram mudanças na arquitetura da 
base de dados. Os _____________________ são os dados brutos. Os dados resumidos, 
agregados, sumarizados ou calculados são os dados ____________. 
Assinale a alternativa que completa adequadamente as lacunas acima: 
 
Alternativas: 
• Dados das operações; Amostrados. 
• Dados das operações; Derivados. CORRETO 
• Segmentados; Matemáticos. 
• Segmentados; Transacionais 
• Dados das operações; Segmentados. 
Resolução comentada: 
Inmon (1997) destaca a mudança na abordagem em relação aos dados brutos, que no 
início dos registros de dados não havia a experiência que pudesse prever arranjos 
diferentes para suportar análises. O objetivo de arquiteturas básicas para banco de 
dados eram armazenar os registros, sem a robustez necessária para suportar 
necessidades futuras. 
As necessidades analíticas sobre os dados provocaram mudanças na arquitetura, 
surgindo demandas provenientes de dados derivados. Os dados do dia a dia, das 
operações, in natura, são os dados brutos. Os dados resumidos, agregados, 
sumarizados ou calculados são os dados derivados. 
Código da questão: 42576 
4) 
As fontes de dados são armazenadas segundo um modelo de banco de dados, em 
geral organizados de acordo com uma estrutura lógica. Essas fontes de dados, além de 
serem mantidas em repositórios organizados, também incluem características 
determinantes quanto ao armazenamento e acesso. Aponte a alternativa que 
estabelece essas características. 
 
Alternativas: 
• Somente as restrições são associadas às fontes de dados. 
• As características associadas às fontes de dados são os relacionamentos, os 
tipos e as restrições desses dados. CORRETO 
• As fontes de dados podem ser armazenadas e acessadas sem a necessidade de 
caracterização quanto ao tipo de dados. 
• As características associadas às fontes de dados são os relacionamentos, os 
índices de armazenamento e as tabelas dos repositórios. 
• As características associadas às fontes de dados são somente os 
relacionamentos entre os dados. 
Resolução comentada: 
Toda fonte de dados que será armazenada e acessada em um banco de dados deve 
manter a integridade do conteúdo. A exemplo, como um dado de número de RG, deve 
estar relacionado à pessoa a qual pertence esse documento, o dado precisa ter 
consistência quanto ao tipo, se numérico ou texto, para viabilizar cálculos ou buscas, e 
as restrições, dado em determinado campo não pode ser nulo. 
Código da questão: 42570 
5) 
A mineração de dados é comumente classificada pela sua capacidade em realizar 
tarefas para diferentes domínios. A literatura indica que não existe um consenso de 
denominação quanto à classificação, funcionalidades, tarefas, métodos ou técnicas de 
mineração de dados. Contudo, Fayyad et al. (1996) apresentam alguns métodos de 
mineração de dados que têm como objetivo a predição ou descrição dos resultados: 
(FAYYAD, U.M. et al. Advances in knowledge discovery and data mining. California: 
AAAI Press, 1996). 
Sobre as técnicas de Data Mining, julgue os itens a seguir, indicando “V” para o item 
verdadeiro e “F” para o item falso: 
1. ( ) Regressão: usa-se para associar ou classificar um item a uma ou a várias 
categorias pré-definidas, derivando uma regra que possa ser usada para 
classificar uma observação, referente a um conjunto de dados identificados que 
são categorizados por um assunto. 
2. ( ) Análise de Séries Temporais: refere-se a tarefa similar à classificação, porém 
é usada quando os dados são identificados por predição de valores numéricos, 
considerados variáveis independentes ou exploratórias, e não pela 
categorização dos itens analisados, sendo possível verificar o eventual 
relacionamento funcional que possa existir entre duas ou mais variáveis 
quantitativas. 
3. ( ) Agrupamentos (Clusters): refere-se à tarefa de segmentar um conjunto de 
dados em grupos diferentes, cujos itens são semelhantes, ou seja, subdivide o 
conjunto de dados em um conjunto menor, sendo similar no comportamento 
dos atributos de segmentação, descobrindo grupos diferentes entre o conjunto 
de dados selecionado. 
4. ( ) Sumarização: refere-se à tarefa de descrever padrões e tendências que são 
reveladas por subconjuntos de dados compactados, a partir de um subconjunto 
de dados com características similares, demostrando as relações funcionais 
entre as variáveis definidas para a análise exploratória do subconjunto de dados 
5. ( ) Análise de Séries Temporais: refere-se a tarefa similar à regra de associação 
com objetivo de aplicar algum tipo de padrão (tendências, variações sazonais, 
variações cíclicas e variações irregulares) no conjunto de dados, para determinar 
que tipos de sequências podem ocorrer em um determinado período. 
Assinale a alternativa que indica a sequência correta: 
 
Alternativas: 
• V – V – F– V – F. 
• V – V – V – V – V 
• F – F – F – F – F. 
• F – F – V – V – V. CORRETO 
• F – V – F – V – F. 
Resolução comentada: 
o Item 1 é falso, porque refere-se ao método classificação usado para associar ou 
classificar um item a uma ou a várias categorias pré-definidas, derivando uma regra 
que possa ser usada para classificar uma observação, referente a um conjunto de dados 
identificados que são categorizados por um assunto. 
O item 2 é falso, porque descreve o método de Regressão que se refere a tarefa similar 
à classificação, porém é usada quando os dados são identificados por predição de 
valores numéricos, considerados variáveis independentes ou exploratórias, e não pela 
categorização dos itens analisados, sendo possível verificar o eventual relacionamento 
funcional que possa existir entre duas ou mais variáveis quantitativas. 
Código da questão: 42615 
6) 
Um modelo é uma __________utilizada como técnica para refletir a realidade. Ao modelar 
os dados de uma organização, sejam operacionais ou analíticos, busca-se o que se 
quer realizar ou fazer com os dados. Armazenar dados em bancos relacionais para 
manter o histórico não reflete a realidade da empresa. É necessário desenhar uma 
organização desses dados e, para isso, um modelo _____________ funciona como uma 
ferramenta que auxilia na análise dos requisitos e no desenho da estrutura dos dados 
relacionada a esse negócio. 
Assinale a alternativa que completa adequadamente a lacuna acima: 
 
Alternativas: 
• Entidade relacionamento; Dimensional. 
• Granular; Abstração. 
• Abstração; Transacional. 
• Entidade; Sumarizado. 
• Abstração; Entidade relacionamento. CORRETO 
Resolução comentada: 
O modelo entidade relacionamento é uma abstração, e tenta refletir o mundo real, que 
vislumbra o que ser quer realizar ou fazer. Este modelo é uma ferramenta que ajuda na 
análise de requisitos de negócio e no design da estrutura de dados relacionada com 
esse negócio e sua base histórica. O modelo ER descreve as operações relacionadas ao 
negócio e as ligações entre as entidades do modelo. 
Código da questão: 42586 
7) 
A modelagem multidimensional representa uma abstração dos dados armazenados, 
permitindo a visualização de grande quantidade de dados, por meio de consultas 
dinâmicas de ferramentas Online Analytical Processing (OLAP – Processamento 
Analítico On-line) que exibem as informações no formato de um cubo. 
Assinale a alternativa correta que indica os elementos básicos da modelagem 
multidimensional: 
 
Alternativas: 
• Tabela de dados e tabelas de Dimensões 
• Tabela de Fatos e tabelas de consultas. 
• Tabela de Fatos e tabelas de Dimensões. CORRETO 
• Tabela de dados e tabelas de consultas. 
• Tabelas normalizadas e tabelas não-normalizadas. 
Resolução comentada: 
a modelagem multidimensional representa uma abstração dos dados armazenados, 
consistindo em um modelo composto por tabelas de Fatos e de Dimensões que 
proporcionam uma visão multidimensional de grande quantidade de dados. 
Fatos: é uma coleção de itens de dados, composta de dados de medidas, 
representando uma transação ou um evento de negócio. Um fato é representado por 
valores numéricos em um esquema, e implementado em tabelas denominadas tabelas 
de Fatos. 
Dimensões: são os elementos que participam de um fato, ou seja, são as possíveis 
formas de visualizar os dados de forma descritiva e classificatória, determinando o 
contexto de um assunto de negócio. Os elementos que representam uma dimensão 
são especificados em um esquema e implementados em tabelas denominadas de 
tabelas de Dimensões. 
Código da questão: 42590 
8) 
Na concepção de Poe, Klauer, Brobst (1998), o Esquema Estrela possui uma estrutura 
simples com poucas tabelas e associações bem definidas, aproximando do contexto do 
modelo de negócio e facilitando a geração de consultas complexas de forma intuitiva e 
interativa, por meio dos vários parâmetros de consultas. Neste esquema, o assunto 
principal fica ao centro do esquema, representada pela tabela de Fatos, e suas 
características, as dimensões, representadas por tabelas de Dimensões, ficam 
posicionadas ao seu redor, permitindo a leitura e compreensão até mesmo de usuários 
finais que não estão adaptados com estruturas de banco de dados. 
(POE V.; KLAUER P.; BROBST S. Building a data warehouse for decision support. New 
Jersey: Prentice Hall PTR, 1998). 
Sobre as principais vantagens do Esquema Estrela, julgue os itens a seguir, indicando 
“V” para o item verdadeiro e “F” para o item falso: 
1. ( ) A estrutura padronizada e regular do esquema é bastante simples, faciliatando a 
apresentação, o desempenho das consultas geradas e a compreensão até mesmo de 
usuários finais que não estão adaptados com estruturas de banco de dados. 
2. ( ) As consultas ocorrem inicialmente nas tabelas de Dimensões e depois nas tabelas 
de Fatos, assegurando a consistência dos dados por meio de uma estrutura de chaves 
que garante o acesso aos dados com melhor desempenho. 
3. ( ) A aplicação da técnica de normalização nas tabelas de Dimensões aumenta o 
número de dimensões, consequentemente diminuindo a performance das consultas 
dinâmicas. 
4. ( ) A facilidade e a flexibilidade da inclusão de novos elementos de dados, a partir do 
relacionamento da tabela de Fatos com uma nova tabela de Dimensão, bem como o 
acréscimo de novas colunas às mesmas tabelas de Dimensões. 
5. O suporte para transformar e proceder à carga dos dados, para recuperar, analisar e 
extrair os dados dos sistemas transacionais. 
Assinale a alternativa correta: 
 
Alternativas: 
• V – V – F – V – F. CORRETO 
• F – F – V – F – V. 
• V – V – V – V – V. 
• F – V – F – V – F. 
• F – F – F – F – F. 
Resolução comentada: 
o item 3 é falso, porque é o Esquema Floco de Neve que separa as hierarquias das 
dimensões em tabelas diferentes, especificando variantes da dimensão principal. 
Considera-se que a aplicação da técnica de normalização nas tabelas de Dimensões 
aumenta consideravelmente o número de dimensões e, consequentemente, 
diminuindo a performance das consultas dinâmicas. 
O item 5 é falso, porque o processo de transformar e proceder à carga dos dados, para 
recuperar, analisar e extrair os dados dos sistemas transacionais refere-se a uma etapa 
do processo de criação de um Data Warehouse, conhecido como ETL. 
Código da questão: 42602 
9) 
Para a definição da arquitetura de um ambiente de Data Warehouse (DW) ou de Data 
Marts, deve-se levar em conta o porte da empresa, tempo, capacitação da equipe de 
desenvolvimento e recursos disponibilizados para os investimentos. 
Sobre a arquitetura de um Data Warehouse e de Data Marts, analise os itens a seguir: 
I. São classificadas como global, independente ou a combinada; e o tipo de 
implementação como top down, bottom up ou a integrada. 
II. A arquitetura global pode ser fisicamente centralizada ou pode ser fisicamente 
distribuída nas instalações da empresa. 
III. A arquitetura independente é considerada aquela que comporta as necessidades do 
DW organizacional com alto nível de acessos e utilização das informações geradas e 
disponibilizadas, a partir de ferramentas de apoio a decisão para todos os 
departamentos da empresa. 
IV. A arquitetura independente mantém Data Marts stand-alone, onde têm-se dados 
específicos da necessidade da empresa, considerando que cada departamento tem sua 
informação sem a integração com outros departamentos. 
V. A arquitetura integrada de Data Marts é implementada por Data 
Marts separadamente por grupos específicos ou departamentos, sendo integrados ou 
interconectados posteriormente, provendo uma visão organizacional maior dos dados 
e informações. 
Estão corretos os itens: 
 
Alternativas: 
• II – IV – V. CORRETO 
• I – II – III. 
• I – II – III – IV – V. 
• II – III – IV – V. 
• III – IV – V. 
Resolução comentada: 
os itens I e III estão errados. O item I está errado porquea arquitetura é classificada 
como global, independente ou a integrada; e o tipo de implementação é do tipo top 
down, bottom up ou a combinada. 
O item III está errado porque é a arquitetura global que mais independente, 
considerada a arquitetura que comporta as necessidades do DW organizacional com 
alto nível de acessos e utilização das informações geradas e disponibilizadas, a partir de 
ferramentas de apoio a decisão para todos os departamentos da empresa. 
Código da questão: 42583 
10) 
Os ambientes de Data Warehouses (DW) integram sofisticadas ferramentas para 
análises complexas de dados históricos e descoberta de conhecimento, assegurando o 
suporte à tomada de decisão. Um ________________ organizacional pode manter um 
armazém central de dados da organização inteira, ou pode manter armazéns menores, 
descentralizados, denominados ________________. 
Assinale a alternativa que completa adequadamente as lacunas acima: 
 
Alternativas: 
• Data Mining; Data Warehouse. 
• Data Mining; Data Marts. 
• Data Mining; Data Source. 
• Data Warehouse; Data Mining. 
• Data Warehouse; Data Marts. CORRETO 
Resolução comentada: 
os ambientes de Data Warehouses (DW) integram sofisticadas ferramentas para 
análises complexas de dados históricos e descoberta de conhecimento, assegurando o 
suporte à tomada de decisão. Um Data Warehouse organizacional pode manter um 
armazém central de dados da organização inteira, ou pode manter armazéns menores, 
descentralizados, denominados Data Mart. 
Código da questão: 42581

Continue navegando