Buscar

Modelagem e arquitetura do DW (Data Warehouse)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 9 páginas

Prévia do material em texto

Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova!
Parte superior do formulário
1)
As ferramentas que apresentam características OLAP passaram a ser referenciadas como ferramentas OLAP. As ferramentas OLAP podem ser classificadas de acordo com a estratégia de armazenamento, sendo chamadas de OLAP Multidimensional (MOLAP), OLAP Relacional (ROLAP), OLAP Híbrido e OLAP Web.
Assinale a alternativa correta que descreve as características das ferramentas do tipo MOLAP.
Alternativas:
· O MOLAP refere-se à utilização de banco de dados relacional para implementar soluções OLAP, permitindo análise multidimensional dos dados que estão armazenados em uma base de dados relacional, sendo feito todo o processamento no servidor da base de dados e depois gerados os comandos SQL e as tabelas temporárias.
· O MOLAP refere-se à utilização da ferramenta OLAP em ambiente remoto, disparando consultas via um navegador web para o servidor que, por sua vez, retorna o cubo processado para análise do usuário.
· O MOLAP refere-se à abordagem de uso combinado de um banco de dados relacional com um banco de dados orientado a objetos, onde as estruturas relacionais são utilizadas para os dados com maior granularidade e as estruturas orientadas a objetos são utilizadas para dados com menor granularidade.
· O MOLAP refere-se à utilização de banco de dados com características multidimensionais, permitindo operações que ocorrem quando o usuário navega pelas informações contidas entre dimensões de esquemas diferentes, acessados remotamente.
· O MOLAP refere-se à utilização de banco de dados com características multidimensionais, permitindo a navegação com níveis de detalhamento em tempo real, a partir da combinação das dimensões do cubo, proporcionando análises sofisticadas com ótimo desempenho.
checkCORRETO
Resolução comentada:
O MOLAP refere-se à utilização de banco de dados com características multidimensionais, permitindo a navegação com níveis de detalhamento em tempo real, a partir da combinação das dimensões do cubo, proporcionando análises sofisticadas com ótimo desempenho. Segundo Machado (2013), em um banco de dados multidimensional, os cruzamentos de valores são realizados automaticamente, agilizando a visualização multidimensional das informações sob o ponto de vista de todas as dimensões. A forma de acesso e de agregação dos dados faz com que esta ferramenta tenha um excelente desempenho.
Código da questão: 42604
2)
Em um banco de dados relacional, a granularidade é baixa, mas é muito importante, o que significa que ela é inversamente proporcional ao detalhe do dado armazenado lá. Para se obter granularidade alta, a importância do detalhe não pode ser considerada. Marque a alternativa que relaciona a granularidade em diferentes níveis e a disponibilidade de detalhamento dos dados.
Alternativas:
·  Entidade.
· Tabela Fato.
· Sumarização.
checkCORRETO
· Dimensão.
· Relacionamento.
Resolução comentada:
um DW tem níveis de granularidade elevados por conta da necessidade de sumarizações para refletir a realidade dos dados do negócio. As sumarizações são necessárias, pois refletem medidas resumidas ou condessadas, com alguma transformação dos dados originais. Sem essa técnica, seria impraticável obter respostas que refletem o comportamento de um conjunto de dados. Sumarizações podem ser somas, médias, medianas, quartis, etc.
Código da questão: 42585
3)
Na concepção de Poe, Klauer, Brobst (1998), o Esquema Estrela possui uma estrutura simples com poucas tabelas e associações bem definidas, aproximando do contexto do modelo de negócio e facilitando a geração de consultas complexas de forma intuitiva e interativa, por meio dos vários parâmetros de consultas. Neste esquema, o assunto principal fica ao centro do esquema, representada pela tabela de Fatos, e suas características, as dimensões, representadas por tabelas de Dimensões, ficam posicionadas ao seu redor, permitindo a leitura e compreensão até mesmo de usuários finais que não estão adaptados com estruturas de banco de dados.
(POE V.; KLAUER P.; BROBST S. Building a data warehouse for decision support. New Jersey: Prentice Hall PTR, 1998).
Sobre as principais vantagens do Esquema Estrela, julgue os itens a seguir, indicando “V” para o item verdadeiro e “F” para o item falso:
1. ( ) A estrutura padronizada e regular do esquema é bastante simples, faciliatando a apresentação, o desempenho das consultas geradas e a compreensão até mesmo de usuários finais que não estão adaptados com estruturas de banco de dados.
2. ( ) As consultas ocorrem inicialmente nas tabelas de Dimensões e depois nas tabelas de Fatos, assegurando a consistência dos dados por meio de uma estrutura de chaves que garante o acesso aos dados com melhor desempenho.
3. ( ) A aplicação da técnica de normalização nas tabelas de Dimensões aumenta o número de dimensões, consequentemente diminuindo a performance das consultas dinâmicas.
4. ( ) A facilidade e a flexibilidade da inclusão de novos elementos de dados, a partir do relacionamento da tabela de Fatos com uma nova tabela de Dimensão, bem como o acréscimo de novas colunas às mesmas tabelas de Dimensões.
5. O suporte para transformar e proceder à carga dos dados, para recuperar, analisar e extrair os dados dos sistemas transacionais.
Assinale a alternativa correta:
Alternativas:
· F – F – F – F – F.
· F – V – F – V – F.
· V – V – V – V – V.
· V – V – F – V – F.
checkCORRETO
· F – F – V – F – V.
Resolução comentada:
o item 3 é falso, porque é o Esquema Floco de Neve que separa as hierarquias das dimensões em tabelas diferentes, especificando variantes da dimensão principal. Considera-se que a aplicação da técnica de normalização nas tabelas de Dimensões aumenta consideravelmente o número de dimensões e, consequentemente, diminuindo a performance das consultas dinâmicas.
O item 5 é falso, porque o processo de transformar e proceder à carga dos dados, para recuperar, analisar e extrair os dados dos sistemas transacionais refere-se a uma etapa do processo de criação de um Data Warehouse, conhecido como ETL.
Código da questão: 42602
4)
Os ambientes de Data Warehouses (DW) integram sofisticadas ferramentas para análises complexas de dados históricos e descoberta de conhecimento, assegurando o suporte à tomada de decisão. Um ________________ organizacional pode manter um armazém central de dados da organização inteira, ou pode manter armazéns menores, descentralizados, denominados ________________.
Assinale a alternativa que completa adequadamente as lacunas acima:
Alternativas:
· Data Mining; Data Warehouse.
· Data Warehouse; Data Marts. 
checkCORRETO
· Data Mining; Data Marts.
· Data Mining; Data Source.
· Data Warehouse; Data Mining.
Resolução comentada:
os ambientes de Data Warehouses (DW) integram sofisticadas ferramentas para análises complexas de dados históricos e descoberta de conhecimento, assegurando o suporte à tomada de decisão. Um Data Warehouse organizacional pode manter um armazém central de dados da organização inteira, ou pode manter armazéns menores, descentralizados, denominados Data Mart.
Código da questão: 42581
5)
As fontes de dados são armazenadas segundo um modelo de banco de dados, em geral organizados de acordo com uma estrutura lógica. Essas fontes de dados, além de serem mantidas em repositórios organizados, também incluem características determinantes quanto ao armazenamento e acesso. Aponte a alternativa que estabelece essas características.
Alternativas:
· Somente as restrições são associadas às fontes de dados.
· As características associadas às fontes de dados são somente os relacionamentos entre os dados.
· As fontes de dados podem ser armazenadas e acessadas sem a necessidade de caracterizaçãoquanto ao tipo de dados.
· As características associadas às fontes de dados são os relacionamentos, os tipos e as restrições desses dados.
checkCORRETO
· As características associadas às fontes de dados são os relacionamentos, os índices de armazenamento e as tabelas dos repositórios.
Resolução comentada:
Toda fonte de dados que será armazenada e acessada em um banco de dados deve manter a integridade do conteúdo. A exemplo, como um dado de número de RG, deve estar relacionado à pessoa a qual pertence esse documento, o dado precisa ter consistência quanto ao tipo, se numérico ou texto, para viabilizar cálculos ou buscas, e as restrições, dado em determinado campo não pode ser nulo.
Código da questão: 42570
6)
Rob e Coronel (2011) enfatizam que a mineração de dados é proativa, ou seja, as ferramentas buscam automaticamente identificar anomalias e possíveis relacionamentos entre os dados, identificando problemas ainda não identificados pelos usuários estratégicos para, assim, prover o conhecimento e aplica-lo às necessidades dos negócios, sendo que a mineração de dados contempla quatro fases básicas.
(ROB, P.; CORONEL, C. Sistemas de banco de dados: projeto, implementação e administração. 8. ed. São Paulo: Cengage Learning, 2011).
Sobre as fases do processo de mineração de dados, julgue os itens a seguir:
I. A primeira fase, seleção dos dados, refere-se à seleção dos principais conjuntos de dados e do tratamento de limpeza e integração desses dados a serem utilizados pela operação de transformação de dados.
II. A segunda fase, análise e classificação dos dados, refere-se ao estudo dos dados para identificar características e padrões comuns com a aplicação de algoritmos para encontrar análises, vínculos ou dependências, padrões, tendências e desvios de dados.
III. A terceira fase, aquisição do conhecimento, refere-se à seleção dos algoritmos mais comuns de modelagem e aquisição de conhecimentos, baseados em redes neurais, lógica indutiva, árvores de decisão, classificação ou regressão, etc., e a definição desses algoritmos com possível interação dos usuários finais.
IV. A quarta fase, transformação dos dados, refere-se às descobertas de mineração de dados para garantirem o comportamento futuro e adquirirem conhecimento, para os usuários estratégicos analisarem seus negócios, por exemplo, o provável lançamento de um produto novo ou de uma campanha de marketing.
Estão corretos os itens
Alternativas:
· I – II.
· I – II – IV.
· I – II – III.
· III – IV.
· II – III.
checkCORRETO
Resolução comentada:
o item I está errado, porque a primeira fase é definida como preparação dos dados e refere-se à identificação dos principais conjuntos de dados e do tratamento de limpeza e integração desses dados a serem utilizados pela operação de mineração de dados.
O item IV está errado porque a quarta fase é definida como prognóstico e refere-se às descobertas de mineração de dados para preverem o comportamento futuro e projetarem resultados de negócios, como o provável lançamento de um produto novo ou de uma campanha de marketing.
Código da questão: 42613
7)
Sobre o Modelo Entidade Relacionamento (MER), considere as seguintes afirmações:
I. Dados como nome, endereço, produto são exemplos de entidade.
II. Cada entidade possui atributos.
III. A cardinalidade representa a métrica entre as entidades.
IV. A tabela de fatos central se conecta a várias tabelas dimensionais.
V. É o modelo mais amplamente utilizado em nível de abstração de projetos de banco de dados, descriminando as características dos dados, chave primária e estrangeira.
São verdadeiras:
Alternativas:
· I – IV – V.
· I – II – IV – V.
checkCORRETO
· II – III – V.
· I – II – III.
· I – IIII.
Resolução comentada:
A afirmativa III está incorreta porque a cardinalidade representa o grau de relacionamento entre as entidades no modelo ER.
As demais, estão corretas.
Código da questão: 42572
8)
As organizações precisam responder de maneira ágil e eficiente às mudanças e oportunidades de mercado. Muitas empresas iniciam o desenvolvimento de um Data Warehouse (DW), contemplando conjuntos de dados mais gerenciáveis e categorizados por assunto, para atenderem às necessidades de pequenos grupos de usuários ou níveis funcionais da empresa, investindo, assim, na implementação de Data Marts.
Sobre Data Marts, assinale a alternativa correta:
Alternativas:
· Um Data Mart é um ambiente de processamento analítico, caracterizado por consultas complexas, estruturadas e frequentes, envolvendo agregação ou relacionamento de dados para gerar informações que apoiam processos decisórios.
· Um Data Mart é um depósito de dados especializado, orientado por assunto, integrado, volátil e variável no tempo, a partir de dados extraídos de um DW, com o objetivo específico de dar suporte a rápido determinado grupo ou função de usuários.
checkCORRETO
· Um Data Mart são sistemas transacionais que registram todas as transações operacionais das organizações, sendo utilizados no processamento dos dados que são gerados diariamente por meio dos sistemas informacionais das empresas.
· Um Data Mart refere-se ao processo de explorar grandes quantidades de informações, a partir de um conjunto de ferramentas de mineração de dados que se utilizam de algoritmos de aprendizagem baseados em redes neurais e estatísticas.
· Um Data Mart é um ambiente intermediário de armazenamento e processamento dos dados para o processo de extração, transformação e carga ETL (Extraction, Transformation and Load).
Resolução comentada:
considerando as inúmeras definições de Data Marts, na concepção de Rob e Coronel (2011), um Data Mart é um pequeno subconjunto de um DW, sobre um único assunto, que fornece suporte às decisões de um pequeno grupo de pessoas, que pode ser criado a partir de dados extraídos de um DW maior, com o objetivo específico de dar suporte a acessos mais rápido para determinado grupo ou função.
A definição apresentada na alternativa a) refere-se ao conceito de Online Transaction Processing (OLTP – Processamento de Transações em Tempo Real).
A definição apresentada na alternativa “Um Data Mart é um ambiente de processamento analítico...” refere-se ao conceito de Online Analytical Pocessing (OLAP – Processamento Analítico On-line.
A definição apresentada na alternativa “Um Data Mart refere-se ao processo de explorar...” refere-se ao conceito de Data Mining.
A definição apresentada na alternativa e) refere-se a uma parte do processo de funcionamento de um ambiente de Data Warehouse.
Código da questão: 42580
9)
Segundo Kimball (1998), o esquema de dados mais utilizado na especificação de um Data Warehouse é o Esquema Estrela (Star Schema) composto por tabelas de Fatos e de Dimensões que proporcionam uma visão multidimensional de grande volume de dados.
(KIMBALL, R. et al. The data warehouse lifecycle toolkit. New York: John Wiley & Sons, 1998).
Sobre as características das tabelas de Fatos e de Dimensões, julgue os itens a seguir:
I. O contexto das funcionalidades que determinam os processos de negócio de uma empresa é especificado em tabelas de Fatos.
II. A tabela de Fatos é a principal tabela de um esquema dimensional que geralmente contém vários fatos que indicam valores para análise dimensional.
III. A tabela de Fatos relaciona-se com as tabelas de Dimensões, que representam as entidades de negócio e constituem as estruturas de entrada que realizam os filtros de valores aplicados na manipulação dos fatos.
IV. As tabelas de Dimensões contêm a descrição textual do negócio, representada pelos atributos e com a indicação da chave primária, que serve como base para manter a integridade referencial quando relacionada com a tabela de Fatos.
V. As tabelas de Dimensões representam as características numéricas e classificatórias que fornecem as perspectivas adicionais a um determinado fato por meio de seus atributos.
Estão corretos os itens:
Alternativas:
· I – II – III – IV.
checkCORRETO
· I – II – III.
· I – II – III – IV – V.
· I – III – V.
· II – IV – V.
Resolução comentada:
os itens corretos são I, II, III eIV. O item V está errado porque as tabelas de Dimensões representam as características descritivas/textuais que fornecem as perspectivas adicionais a um determinado fato por meio de seus atributos.
Código da questão: 42592
10)
As informações assumem o papel do principal patrimônio ativo de uma organização. Assim, tornar as informações corporativas acessíveis para entendimento e utilização das áreas estratégicas das organizações é um fator fundamental para a tomada de decisão assertiva. As ferramentas Online Analytical Processing (OLAP) surgiram com os sistemas de apoio à decisão para viabilização e extração eficaz de informações de um ambiente de Data Warehouse (DW).
Sobre as características das ferramentas OLAP, julgue os itens a seguir:
I. Os dados são processados e visualizados em uma estrutura multidimensional.
II. Estrutura logicamente dados multidimensionais na forma de um cubo.
III. Efetua operações de manipulação de dados individuais, por meio dos comandos de inserção, atualização e exclusão.
IV. Proporciona respostas rápidas e consistentes às consultas interativas executadas pelos usuários.
Estão corretos os itens:
Alternativas:
· I – II – IV.
checkCORRETO
· I – II – III.
· III – IV.
· II – III.
· I – II.
Resolução comentada:
o item III está errado, porque os sistemas transacionais, Online Transaction Processing (OLTP – Processamento de Transações On-line, que efetuam operações de manipulação de dados individuais, por meio dos comandos de inserção, atualização e exclusão.
Código da questão: 42606
Parte inferior do formulário

Continue navegando