Buscar

Questões - Modelagem e arquitetura do DW (Data Warehouse)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 9 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 9 páginas

Prévia do material em texto

1)
O DW tem uma composição que separa a carga de trabalho para análise da carga de trabalho para transações. No primeiro caso, permite a consolidação de diferentes fontes nessa carga de trabalho analítica.
I. Um DW possui um conjunto característico personalizado, distintamente dos ambientes convencionais das organizações.
PORQUE
II. Há como replicar um DW de uma empresa para outra. Cada projeto de DW não é único em sua essência, mas no seu modo de operação e aplicação.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
· A primeira asserção está incorreta e a segunda está correta.
· A primeira asserção está incorreta e a segunda justifica a primeira.
· A primeira e a segunda asserções estão incorretas.
· A primeira asserção está correta e a segunda incorreta. checkCORRETO
· A primeira e a segunda asserções estão corretas, mas a segunda não justifica a primeira.
Resolução comentada:
DW tem uma composição que separa a carga de trabalho para sua análise para transações. No primeiro caso, permite a consolidação de diferentes fontes nessa carga de trabalho analítica.
Um DW possui um conjunto característico personalizado, distintamente dos ambientes convencionais das organizações. Por este motivo, não há como replicar um DW de uma empresa para outra. Cada projeto de DW não na essência mas no seu modo de operação e aplicação.
Código da questão: 42579
2)
Os ambientes de Data Warehouses (DW) integram sofisticadas ferramentas para análises complexas de dados históricos e descoberta de conhecimento, assegurando o suporte à tomada de decisão. Um ________________ organizacional pode manter um armazém central de dados da organização inteira, ou pode manter armazéns menores, descentralizados, denominados ________________.
Assinale a alternativa que completa adequadamente as lacunas acima:
Alternativas:
· Data Mining; Data Marts.
· Data Mining; Data Warehouse.
· Data Warehouse; Data Mining.
· Data Mining; Data Source.
· Data Warehouse; Data Marts.  checkCORRETO
Resolução comentada:
os ambientes de Data Warehouses (DW) integram sofisticadas ferramentas para análises complexas de dados históricos e descoberta de conhecimento, assegurando o suporte à tomada de decisão. Um Data Warehouse organizacional pode manter um armazém central de dados da organização inteira, ou pode manter armazéns menores, descentralizados, denominados Data Mart.
Código da questão: 42581
3)
A abordagem analítica requer uma arquitetura de dados especializada, complemente a sentença a seguir.
As necessidades analíticas sobre os dados provocaram mudanças na arquitetura da base de dados. Os _____________________ são os dados brutos. Os dados resumidos, agregados, sumarizados ou calculados são os dados ____________.
Assinale a alternativa que completa adequadamente as lacunas acima:
Alternativas:
· Segmentados; Matemáticos.
· Dados das operações; Amostrados.
· Dados das operações; Segmentados.
· Segmentados; Transacionais
· Dados das operações; Derivados. checkCORRETO
Resolução comentada:
Inmon (1997) destaca a mudança na abordagem em relação aos dados brutos, que no início dos registros de dados não havia a experiência que pudesse prever arranjos diferentes para suportar análises. O objetivo de arquiteturas básicas para banco de dados eram armazenar os registros, sem a robustez necessária para suportar necessidades futuras.
As necessidades analíticas sobre os dados provocaram mudanças na arquitetura, surgindo demandas provenientes de dados derivados. Os dados do dia a dia, das operações, in natura, são os dados brutos. Os dados resumidos, agregados, sumarizados ou calculados são os dados derivados.
Código da questão: 42576
4)
Um modelo é uma __________utilizada como técnica para refletir a realidade. Ao modelar os dados de uma organização, sejam operacionais ou analíticos, busca-se o que se quer realizar ou fazer com os dados. Armazenar dados em bancos relacionais para manter o histórico não reflete a realidade da empresa. É necessário desenhar uma organização desses dados e, para isso, um modelo _____________ funciona como uma ferramenta que auxilia na análise dos requisitos e no desenho da estrutura dos dados relacionada a esse negócio.
Assinale a alternativa que completa adequadamente a lacuna acima:
Alternativas:
· Entidade relacionamento; Dimensional.
· Abstração; Transacional.
· Abstração; Entidade relacionamento. checkCORRETO
· Entidade; Sumarizado.
· Granular; Abstração.
Resolução comentada:
O modelo entidade relacionamento é uma abstração, e tenta refletir o mundo real, que vislumbra o que ser quer realizar ou fazer. Este modelo é uma ferramenta que ajuda na análise de requisitos de negócio e no design da estrutura de dados relacionada com esse negócio e sua base histórica. O modelo ER descreve as operações relacionadas ao negócio e as ligações entre as entidades do modelo.
Código da questão: 42586
5)
Considerando a temporalidade, conforme referido no material didático, a informação é a combinação de dados e o tratamento inserido nela. Esse tratamento é uma sentença associada, gerando um conceito, um conhecimento, uma afirmação sobre os dados armazenados. Cada sentença permite a criação das bases de informação para realizar as análises. Considerando uma empresa de atacado, em que um DW possibilita a realização de análises, aponte a alternativa que exemplifica pelo menos três tipos de análises geradas.
Alternativas:
· Vendas dos produtos, quantidades do estoque, segmentação de clientes.
· Segmentação de clientes, indicadores da campanha de marketing, performance das vendas.
checkCORRETO
· Indicadores climáticos, contratos de qualquer natureza, vendas de produtos.
· Contratos de qualquer natureza, contas a pagar, performance de vendas.
· Listagem de matéria-prima, relação de clientes, endereço dos clientes.
Resolução comentada:
na alternativa a), a viabilização de um DW pode-se encontrar o detalhamento de um repositório ou armazém de dados deve possuir um DW em que se realizem análises como os exemplos a seguir:
Segmentação de clientes.
Indicadores da campanha de marketing.
Performance das vendas.
Análise da fidelização dos clientes.
Mensuração do atendimento ao cliente.
Status da lucratividade.
Comportamento das oscilações dos negócios.
Código da questão: 42575
6)
Ferramentas de mineração de dados (Data Mining) são integradas aos ambientes de Data Warehouse para gerarem informações em conhecimento potencialmente útil. Sua função principal é a extração de grande volume de dados com o objetivo de encontrarem padrões e correlações significativas, estimarem tendências e novas perspectivas que agreguem, satisfatoriamente, com contexto do negócio explorado.
Sobre as técnicas de Data Mining, julgue os itens a seguir:
I. Árvores de Decisão (Decision Tree): caracterizam-se pelo método de classificação de dados, sendo conveniente adotar essa técnica quando o objetivo é gerar regras que possam ser entendidas, explicadas e traduzidas para a linguagem natural.
II. Redes Neurais Artificiais: caracterizam-se em resolver problemas complexos e construir representações internas de modelos ou padrões detectados nos dados que envolvem o desenvolvimento de estruturas matemáticas com habilidade de aprendizado, por meio de experiências de operações da própria máquina.
III. Predição com Séries Temporais: caracteriza-se em identificar a existência de diferentes grupos dentro de um conjunto de dados e, constatada está existência, agrupa-se os elementos estudados de acordo com suas similaridades, podendo refiná-los e definir a priorização entre eles.
IV. Análise de Regressão: utiliza-se algoritmos genéticos para encontrar soluções de problemas dinâmicos e complexos que envolvem centenas ou milhares de variáveis e/ou fórmulas para identificar as descobertas, gerando possíveis soluções simultaneamente.
Estão corretos os itens:
Alternativas:
· I – II – III.
· I – II. checkCORRETO
· I – II – III – IV.
· III – IV.
· II – III.
Resolução comentada:
o Item III está errado porque refere-se a técnica de Análise deAglomerações (Cluster Analysis): caracteriza-se em identificar a existência de diferentes grupos dentro de um conjunto de dados e, constatada esta existência, agrupa-se os elementos estudados de acordo com suas similaridades, podendo refiná-los e definir a priorização entre eles.
O item IV está errado, porque refere-se à técnica de Algoritmos Genéticos: utiliza-se algoritmos genéticos para encontrar soluções de problemas dinâmicos e complexos que envolvem centenas ou milhares de variáveis e/ou fórmulas para identificar as descobertas, gerando possíveis soluções simultaneamente.
Código da questão: 42614
7)
Na concepção de Poe, Klauer, Brobst (1998), o Esquema Estrela possui uma estrutura simples com poucas tabelas e associações bem definidas, aproximando do contexto do modelo de negócio e facilitando a geração de consultas complexas de forma intuitiva e interativa, por meio dos vários parâmetros de consultas. Neste esquema, o assunto principal fica ao centro do esquema, representada pela tabela de Fatos, e suas características, as dimensões, representadas por tabelas de Dimensões, ficam posicionadas ao seu redor, permitindo a leitura e compreensão até mesmo de usuários finais que não estão adaptados com estruturas de banco de dados.
(POE V.; KLAUER P.; BROBST S. Building a data warehouse for decision support. New Jersey: Prentice Hall PTR, 1998).
Sobre as principais vantagens do Esquema Estrela, julgue os itens a seguir, indicando “V” para o item verdadeiro e “F” para o item falso:
1. ( ) A estrutura padronizada e regular do esquema é bastante simples, faciliatando a apresentação, o desempenho das consultas geradas e a compreensão até mesmo de usuários finais que não estão adaptados com estruturas de banco de dados.
2. ( ) As consultas ocorrem inicialmente nas tabelas de Dimensões e depois nas tabelas de Fatos, assegurando a consistência dos dados por meio de uma estrutura de chaves que garante o acesso aos dados com melhor desempenho.
3. ( ) A aplicação da técnica de normalização nas tabelas de Dimensões aumenta o número de dimensões, consequentemente diminuindo a performance das consultas dinâmicas.
4. ( ) A facilidade e a flexibilidade da inclusão de novos elementos de dados, a partir do relacionamento da tabela de Fatos com uma nova tabela de Dimensão, bem como o acréscimo de novas colunas às mesmas tabelas de Dimensões.
5. O suporte para transformar e proceder à carga dos dados, para recuperar, analisar e extrair os dados dos sistemas transacionais.
Assinale a alternativa correta:
Alternativas:
· F – F – V – F – V.
· F – F – F – F – F.
· V – V – F – V – F. checkCORRETO
· V – V – V – V – V.
· F – V – F – V – F.
Resolução comentada:
o item 3 é falso, porque é o Esquema Floco de Neve que separa as hierarquias das dimensões em tabelas diferentes, especificando variantes da dimensão principal. Considera-se que a aplicação da técnica de normalização nas tabelas de Dimensões aumenta consideravelmente o número de dimensões e, consequentemente, diminuindo a performance das consultas dinâmicas.
O item 5 é falso, porque o processo de transformar e proceder à carga dos dados, para recuperar, analisar e extrair os dados dos sistemas transacionais refere-se a uma etapa do processo de criação de um Data Warehouse, conhecido como ETL.
Código da questão: 42602
8)
O banco de dados analítico é diferente do banco de dados operacional, transacional ou OLTP (Online Transaction Processing), usado para processar as transações. Embora os bancos de dados transacionais possam ser usados para suportar o armazenamento de dados e as aplicações de BI, não se recomenda seu uso por questões de integridade e escalabilidade.
I. O banco de dados convencional deve ser preservado, e o banco de dados analíticos deve estar em outro schema.
PORQUE
II. Um banco de dados analítico tem uma estrutura baseada em coluna, tornando os cálculos individuais muito rápidos. Já os bancos de dados transacionais dependem de armazenamento de dados baseado em linha, impróprio para operar com grandes volumes de dados.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
· A primeira asserção está incorreta e a segunda está correta
· A primeira e a segunda asserções estão corretas, mas a segunda não tem relação com a primeira.
· A primeira e a segunda asserções estão incorretas.
· A primeira asserção está correta e a segunda está incorreta.
· A primeira e a segunda asserções estão corretas, e a segunda complementa a primeira. checkCORRETO
Resolução comentada:
Os bancos de dados transacionais são bancos baseados em armazenamento por linha, o que impossibilita o desempenho quando submetido a cálculos em processos analíticos. Isto deteriora o desempenho para a finalidade base ao qual foi projetado, que é armazenar, acessar, incluir e excluir os registros ali depositados. Portanto, para projetos que envolvam cálculos analíticos outro banco com processo de armazenamento por coluna é mais eficiente, como os bancos de dados analíticos, pois os registros ficam livres para serem submetidos aos cálculos volumétricos, essenciais para BI e Big Data.
Código da questão: 50534
9)
A mineração de dados é comumente classificada pela sua capacidade em realizar tarefas para diferentes domínios. A literatura indica que não existe um consenso de denominação quanto à classificação, funcionalidades, tarefas, métodos ou técnicas de mineração de dados. Contudo, Fayyad et al. (1996) apresentam alguns métodos de mineração de dados que têm como objetivo a predição ou descrição dos resultados:
(FAYYAD, U.M. et al. Advances in knowledge discovery and data mining. California: AAAI Press, 1996).
Sobre as técnicas de Data Mining, julgue os itens a seguir, indicando “V” para o item verdadeiro e “F” para o item falso:
1. (   ) Regressão: usa-se para associar ou classificar um item a uma ou a várias categorias pré-definidas, derivando uma regra que possa ser usada para classificar uma observação, referente a um conjunto de dados identificados que são categorizados por um assunto.
2. (   ) Análise de Séries Temporais: refere-se a tarefa similar à classificação, porém é usada quando os dados são identificados por predição de valores numéricos, considerados variáveis independentes ou exploratórias, e não pela categorização dos itens analisados, sendo possível verificar o eventual relacionamento funcional que possa existir entre duas ou mais variáveis quantitativas.
3. (   ) Agrupamentos (Clusters): refere-se à tarefa de segmentar um conjunto de dados em grupos diferentes, cujos itens são semelhantes, ou seja, subdivide o conjunto de dados em um conjunto menor, sendo similar no comportamento dos atributos de segmentação, descobrindo grupos diferentes entre o conjunto de dados selecionado.
4. (   ) Sumarização: refere-se à tarefa de descrever padrões e tendências que são reveladas por subconjuntos de dados compactados, a partir de um subconjunto de dados com características similares, demostrando as relações funcionais entre as variáveis definidas para a análise exploratória do subconjunto de dados
5. (   ) Análise de Séries Temporais: refere-se a tarefa similar à regra de associação com objetivo de aplicar algum tipo de padrão (tendências, variações sazonais, variações cíclicas e variações irregulares) no conjunto de dados, para determinar que tipos de sequências podem ocorrer em um determinado período.
Assinale a alternativa que indica a sequência correta:
Alternativas:
· F – V – F – V – F.
· F – F – F – F – F.
· F – F – V – V – V. checkCORRETO
· V – V – F – V – F.
· V – V – V – V – V
Resolução comentada:
o Item 1 é falso, porque refere-se ao método classificação usado para associar ou classificar um item a uma ou a várias categorias pré-definidas, derivando uma regra que possa ser usada para classificar uma observação, referente a um conjunto de dados identificados que são categorizados por um assunto.
O item 2 é falso, porque descreve o método de Regressão que se refere a tarefa similar à classificação, porém é usada quando os dados sãoidentificados por predição de valores numéricos, considerados variáveis independentes ou exploratórias, e não pela categorização dos itens analisados, sendo possível verificar o eventual relacionamento funcional que possa existir entre duas ou mais variáveis quantitativas.
Código da questão: 42615
10)
Rob e Coronel (2011) enfatizam que a mineração de dados é proativa, ou seja, as ferramentas buscam automaticamente identificar anomalias e possíveis relacionamentos entre os dados, identificando problemas ainda não identificados pelos usuários estratégicos para, assim, prover o conhecimento e aplica-lo às necessidades dos negócios, sendo que a mineração de dados contempla quatro fases básicas.
(ROB, P.; CORONEL, C. Sistemas de banco de dados: projeto, implementação e administração. 8. ed. São Paulo: Cengage Learning, 2011).
Sobre as fases do processo de mineração de dados, julgue os itens a seguir:
I. A primeira fase, seleção dos dados, refere-se à seleção dos principais conjuntos de dados e do tratamento de limpeza e integração desses dados a serem utilizados pela operação de transformação de dados.
II. A segunda fase, análise e classificação dos dados, refere-se ao estudo dos dados para identificar características e padrões comuns com a aplicação de algoritmos para encontrar análises, vínculos ou dependências, padrões, tendências e desvios de dados.
III. A terceira fase, aquisição do conhecimento, refere-se à seleção dos algoritmos mais comuns de modelagem e aquisição de conhecimentos, baseados em redes neurais, lógica indutiva, árvores de decisão, classificação ou regressão, etc., e a definição desses algoritmos com possível interação dos usuários finais.
IV. A quarta fase, transformação dos dados, refere-se às descobertas de mineração de dados para garantirem o comportamento futuro e adquirirem conhecimento, para os usuários estratégicos analisarem seus negócios, por exemplo, o provável lançamento de um produto novo ou de uma campanha de marketing.
Estão corretos os itens
Alternativas:
· I – II – IV.
· I – II.
· III – IV.
· II – III.checkCORRETO
· I – II – III.
Resolução comentada:
o item I está errado, porque a primeira fase é definida como preparação dos dados e refere-se à identificação dos principais conjuntos de dados e do tratamento de limpeza e integração desses dados a serem utilizados pela operação de mineração de dados.
O item IV está errado porque a quarta fase é definida como prognóstico e refere-se às descobertas de mineração de dados para preverem o comportamento futuro e projetarem resultados de negócios, como o provável lançamento de um produto novo ou de uma campanha de marketing.
Código da questão: 42613

Continue navegando

Outros materiais