Buscar

Modelagem e arquitetura do DW (Data Warehouse)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Cosmos • AVA Business intelligence, big data e analytics - ciência de dados  
Modelagem e arquitetura do DW (Data Warehouse)
Professor(a): Marise de Barros Miranda Gomes (Doutorado)

1)
2)
3)
4)
5)
6)
7)
8)
9)
10)
Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para
“Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova!
Sobre o Modelo Entidade Relacionamento (MER), considere as seguintes afirmações:
I. Dados como nome, endereço, produto são exemplos de entidade.
II. Cada entidade possui atributos.
III. A cardinalidade representa a métrica entre as entidades.
IV. A tabela de fatos central se conecta a várias tabelas dimensionais.
V. É o modelo mais amplamente utilizado em nível de abstração de projetos de banco de dados, descriminando as características dos dados, chave primária e estrangeira.
São verdadeiras:
Alternativas:
Código da questão: 42572
O banco de dados analítico é diferente do banco de dados operacional, transacional ou OLTP (Online Transaction Processing), usado para processar as transações. Embora os bancos de dados transacionais possam
ser usados para suportar o armazenamento de dados e as aplicações de BI, não se recomenda seu uso por questões de integridade e escalabilidade.
I. O banco de dados convencional deve ser preservado, e o banco de dados analíticos deve estar em outro schema.
PORQUE
II. Um banco de dados analítico tem uma estrutura baseada em coluna, tornando os cálculos individuais muito rápidos. Já os bancos de dados transacionais dependem de armazenamento de dados baseado em linha,
impróprio para operar com grandes volumes de dados.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
Código da questão: 50534
Na concepção de Poe, Klauer, Brobst (1998), o Esquema Estrela possui uma estrutura simples com poucas tabelas e associações bem definidas, aproximando do contexto do modelo de negócio e facilitando a
geração de consultas complexas de forma intuitiva e interativa, por meio dos vários parâmetros de consultas. Neste esquema, o assunto principal fica ao centro do esquema, representada pela tabela de Fatos, e suas
características, as dimensões, representadas por tabelas de Dimensões, ficam posicionadas ao seu redor, permitindo a leitura e compreensão até mesmo de usuários finais que não estão adaptados com estruturas de
banco de dados.
(POE V.; KLAUER P.; BROBST S. Building a data warehouse for decision support. New Jersey: Prentice Hall PTR, 1998).
Sobre as principais vantagens do Esquema Estrela, julgue os itens a seguir, indicando “V” para o item verdadeiro e “F” para o item falso:
1. ( ) A estrutura padronizada e regular do esquema é bastante simples, faciliatando a apresentação, o desempenho das consultas geradas e a compreensão até mesmo de usuários finais que não estão adaptados com
estruturas de banco de dados.
2. ( ) As consultas ocorrem inicialmente nas tabelas de Dimensões e depois nas tabelas de Fatos, assegurando a consistência dos dados por meio de uma estrutura de chaves que garante o acesso aos dados com
melhor desempenho.
3. ( ) A aplicação da técnica de normalização nas tabelas de Dimensões aumenta o número de dimensões, consequentemente diminuindo a performance das consultas dinâmicas.
4. ( ) A facilidade e a flexibilidade da inclusão de novos elementos de dados, a partir do relacionamento da tabela de Fatos com uma nova tabela de Dimensão, bem como o acréscimo de novas colunas às mesmas
tabelas de Dimensões.
5. O suporte para transformar e proceder à carga dos dados, para recuperar, analisar e extrair os dados dos sistemas transacionais.
Assinale a alternativa correta:
Alternativas:
Código da questão: 42602
Rob e Coronel (2011) enfatizam que a mineração de dados é proativa, ou seja, as ferramentas buscam automaticamente identificar anomalias e possíveis relacionamentos entre os dados, identificando problemas
ainda não identificados pelos usuários estratégicos para, assim, prover o conhecimento e aplica-lo às necessidades dos negócios, sendo que a mineração de dados contempla quatro fases básicas.
(ROB, P.; CORONEL, C. Sistemas de banco de dados: projeto, implementação e administração. 8. ed. São Paulo: Cengage Learning, 2011).
Sobre as fases do processo de mineração de dados, julgue os itens a seguir:
I. A primeira fase, seleção dos dados, refere-se à seleção dos principais conjuntos de dados e do tratamento de limpeza e integração desses dados a serem utilizados pela operação de transformação de dados.
II. A segunda fase, análise e classificação dos dados, refere-se ao estudo dos dados para identificar características e padrões comuns com a aplicação de algoritmos para encontrar análises, vínculos ou
dependências, padrões, tendências e desvios de dados.
III. A terceira fase, aquisição do conhecimento, refere-se à seleção dos algoritmos mais comuns de modelagem e aquisição de conhecimentos, baseados em redes neurais, lógica indutiva, árvores de decisão,
classificação ou regressão, etc., e a definição desses algoritmos com possível interação dos usuários finais.
IV. A quarta fase, transformação dos dados, refere-se às descobertas de mineração de dados para garantirem o comportamento futuro e adquirirem conhecimento, para os usuários estratégicos analisarem seus
negócios, por exemplo, o provável lançamento de um produto novo ou de uma campanha de marketing.
Estão corretos os itens
Alternativas:
Código da questão: 42613
A mineração de dados é comumente classificada pela sua capacidade em realizar tarefas para diferentes domínios. A literatura indica que não existe um consenso de denominação quanto à classificação,
funcionalidades, tarefas, métodos ou técnicas de mineração de dados. Contudo, Fayyad et al. (1996) apresentam alguns métodos de mineração de dados que têm como objetivo a predição ou descrição dos resultados:
(FAYYAD, U.M. et al. Advances in knowledge discovery and data mining. California: AAAI Press, 1996).
Sobre as técnicas de Data Mining, julgue os itens a seguir, indicando “V” para o item verdadeiro e “F” para o item falso:
1. (   ) Regressão: usa-se para associar ou classificar um item a uma ou a várias categorias pré-definidas, derivando uma regra que possa ser usada para classificar uma observação, referente a um conjunto de dados
identificados que são categorizados por um assunto.
2. (   ) Análise de Séries Temporais: refere-se a tarefa similar à classificação, porém é usada quando os dados são identificados por predição de valores numéricos, considerados variáveis independentes ou
exploratórias, e não pela categorização dos itens analisados, sendo possível verificar o eventual relacionamento funcional que possa existir entre duas ou mais variáveis quantitativas.
3. (   ) Agrupamentos (Clusters): refere-se à tarefa de segmentar um conjunto de dados em grupos diferentes, cujos itens são semelhantes, ou seja, subdivide o conjunto de dados em um conjunto menor, sendo
similar no comportamento dos atributos de segmentação, descobrindo grupos diferentes entre o conjunto de dados selecionado.
4. (   ) Sumarização: refere-se à tarefa de descrever padrões e tendências que são reveladas por subconjuntos de dados compactados, a partir de um subconjunto de dados com características similares,
demostrando as relações funcionais entre as variáveis definidas para a análise exploratória do subconjunto de dados
5. (   ) Análise de Séries Temporais: refere-se a tarefa similar à regra de associação com objetivo de aplicar algum tipo de padrão (tendências, variações sazonais, variações cíclicas e variações irregulares) no conjunto
de dados, para determinar que tipos de sequências podem ocorrer em um determinado período.
Assinale a alternativa que indica a sequência correta:Alternativas:
Código da questão: 42615
As organizações precisam responder de maneira ágil e eficiente às mudanças e oportunidades de mercado. Muitas empresas iniciam o desenvolvimento de um Data Warehouse (DW), contemplando conjuntos de
dados mais gerenciáveis e categorizados por assunto, para atenderem às necessidades de pequenos grupos de usuários ou níveis funcionais da empresa, investindo, assim, na implementação de Data Marts.
Sobre Data Marts, assinale a alternativa correta:
Alternativas:
Código da questão: 42580
Em um processo de tomada de decisões, a disponibilidade e o fácil acesso às informações organizacionais contribuem para uma decisão de sucesso. Assim, a extração eficaz de informações de um ambiente de Data
Warehouse (DW) para gerar conhecimento é proporcionada por ferramentas que disponibilizam recursos avançados para suportar operações sobre o conjunto de dados multidimensional. Pela maior popularidade do
uso das ferramentas de acesso a um DW, destaca-se as ferramentas __________________________.
Assinale a alternativa correta que indica o termo que preenche a lacuna acima:
Alternativas:
Código da questão: 42605
O DW tem uma composição que separa a carga de trabalho para análise da carga de trabalho para transações. No primeiro caso, permite a consolidação de diferentes fontes nessa carga de trabalho analítica.
I. Um DW possui um conjunto característico personalizado, distintamente dos ambientes convencionais das organizações.
PORQUE
II. Há como replicar um DW de uma empresa para outra. Cada projeto de DW não é único em sua essência, mas no seu modo de operação e aplicação.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
Código da questão: 42579
Segundo Rob e Coronel (2011), a característica mais marcante das modernas ferramentas OLAP é a capacidade de análise multidimensional. Os dados são processados e visualizados em uma estrutura
multidimensional, sendo especialmente atrativos para os tomadores de decisões de negócios, sendo que, enquanto o DW mantém dados de suporte, a decisões integrados, orientados por assunto, variáveis no tempo
e não voláteis, o sistema OLAP fornece o front end por meio do qual os usuários finais acessam e analisam esses dados.
(ROB, P.; CORONEL, C. Sistemas de banco de dados: projeto, implementação e administração. 8. ed. São Paulo: Cengage Learning, 2011).
Sobre os critérios que uma ferramenta OLAP deve ter, julgue os itens a seguir:
I. Dimensionalidade genérica: a ferramenta deve proporcionar condições ao usuário para executar manipulações ou cálculos entre as dimensões.
II. Manipulação de matriz esparsa dinâmica: para qualquer matriz esparsa de dados, existe um e somente um esquema físico, o qual provê a máxima eficiência e operacionalidade.
III. Flexibilidade nas consultas: a análise e a apresentação dos dados tornam-se mais simples quando linhas, colunas e células, que vão ser comparadas visualmente, são organizados por agrupamentos lógicos.
IV. Dimensões e níveis de agregação limitados: um modelo analítico comum deve conter uma matriz com dimensões de dados definidas entre quatro a cinco dimensões.
Estão corretos os itens:
Alternativas:
Código da questão: 42607
As informações assumem o papel do principal patrimônio ativo de uma organização. Assim, tornar as informações corporativas acessíveis para entendimento e utilização das áreas estratégicas das organizações é
um fator fundamental para a tomada de decisão assertiva. As ferramentas Online Analytical Processing (OLAP) surgiram com os sistemas de apoio à decisão para viabilização e extração eficaz de informações de um
ambiente de Data Warehouse (DW).
Sobre as características das ferramentas OLAP, julgue os itens a seguir:
I. Os dados são processados e visualizados em uma estrutura multidimensional.
II. Estrutura logicamente dados multidimensionais na forma de um cubo.
III. Efetua operações de manipulação de dados individuais, por meio dos comandos de inserção, atualização e exclusão.
IV. Proporciona respostas rápidas e consistentes às consultas interativas executadas pelos usuários.
Estão corretos os itens:
Alternativas:
Código da questão: 42606
Enviar (Restam 4 tentativas)
II – III – V.
I – II – III.
I – IV – V.
I – IIII.
I – II – IV – V. CORRETO
A primeira e a segunda asserções estão incorretas.
A primeira e a segunda asserções estão corretas, e a segunda complementa a primeira. CORRETO
A primeira asserção está incorreta e a segunda está correta
A primeira e a segunda asserções estão corretas, mas a segunda não tem relação com a primeira.
A primeira asserção está correta e a segunda está incorreta.
F – V – F – V – F.
V – V – V – V – V.
V – V – F – V – F. CORRETO
F – F – F – F – F.
F – F – V – F – V.
II – III.
III – IV.
I – II – IV.
I – II.
I – II – III. INCORRETO
F – F – V – V – V. CORRETO
F – F – F – F – F.
V – V – V – V – V
V – V – F – V – F.
F – V – F – V – F.
Um Data Mart refere-se ao processo de explorar grandes quantidades de informações, a partir de um conjunto de ferramentas de mineração de dados que se utilizam de algoritmos de aprendizagem
baseados em redes neurais e estatísticas.
Um Data Mart é um ambiente intermediário de armazenamento e processamento dos dados para o processo de extração, transformação e carga ETL (Extraction, Transformation and Load).
Um Data Mart é um depósito de dados especializado, orientado por assunto, integrado, volátil e variável no tempo, a partir de dados extraídos de um DW, com o objetivo específico de dar suporte a rápido
determinado grupo ou função de usuários. CORRETO
Um Data Mart são sistemas transacionais que registram todas as transações operacionais das organizações, sendo utilizados no processamento dos dados que são gerados diariamente por meio dos sistemas
informacionais das empresas.
Um Data Mart é um ambiente de processamento analítico, caracterizado por consultas complexas, estruturadas e frequentes, envolvendo agregação ou relacionamento de dados para gerar informações que
apoiam processos decisórios.
Online Analytical Processing (OLAP). CORRETO
Business Inteligence (BI).
Operational Data Store (ODS).
Online Transaction Processing (OLTP).
Staging Area.
A primeira asserção está incorreta e a segunda justifica a primeira.
A primeira asserção está incorreta e a segunda está correta.
A primeira asserção está correta e a segunda incorreta. CORRETO
A primeira e a segunda asserções estão corretas, mas a segunda não justifica a primeira.
A primeira e a segunda asserções estão incorretas.
III – IV.
I – II – III. CORRETO
II – III.
I – II – III – IV.
I – II.
II – III.
I – II – IV.
I – II – III. INCORRETO
III – IV.
I – II.
Arquivos e Links




https://kroton.platosedu.io/lms/m/
https://kroton.platosedu.io/lms/m/
http://www.biblioteca-virtual.com/
https://kroton.platosedu.io/lms/m/mensagem/index

Outros materiais