Baixe o app para aproveitar ainda mais
Prévia do material em texto
Modelagem e arquitetura do DW (Data Warehouse) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! 1) As fontes de dados são armazenadas segundo um modelo de banco de dados, em geral organizados de acordo com uma estrutura lógica. Essas fontes de dados, além de serem mantidas em repositórios organizados, também incluem características determinantes quanto ao armazenamento e acesso. Aponte a alternativa que estabelece essas características. Alternativas: As fontes de dados podem ser armazenadas e acessadas sem a necessidade de caracterização quanto ao tipo de dados. As características associadas às fontes de dados são os relacionamentos, os índices de armazenamento e as tabelas dos repositórios. Somente as restrições são associadas às fontes de dados. As características associadas às fontes de dados são somente os relacionamentos entre os dados. As características associadas às fontes de dados são os relacionamentos, os tipos e as restrições desses dados. CORRETO Resolução comentada: Toda fonte de dados que será armazenada e acessada em um banco de dados deve manter a integridade do conteúdo. A exemplo, como um dado de número de RG, deve estar relacionado à pessoa a qual pertence esse documento, o dado precisa ter consistência quanto ao tipo, se numérico ou texto, para viabilizar cálculos ou buscas, e as restrições, dado em determinado campo não pode ser nulo. Código da questão: 42570 2) O modelo multidimensional permite encontrar respostas de comportamento do desempenho dos negócios, por meio dos aspectos a seguir. I. Realizar simulações de cenários. II. Embasar análises estratégicas e alocar decisões. III. Podem ser realizadas abstrações de localidade (onde). IV. Permite resumir a temporalidade (quando). V. Não associa responsabilidades (quem) e classificações (o quê). São verdadeiras: Alternativas: I - II – III – IV. CORRETO II – III – V. I – II – III. I – III, somente. I – IV – V. Resolução comentada: a abordagem do modelo multidimensional permite que respostas sobre o comportamento do desempenho do negócio sejam encontradas por meio de simulações de cenários para embasar as análises estratégicas e alocar decisões. Esta abordagem remete à necessidade de construir um modelo dimensional, em que são feitas perguntas sob abstrações de localidade (onde), temporalidade (quando), responsabilidade (quem) e classificação (o quê). Código da questão: 42587 3) A abordagem analítica requer uma arquitetura de dados especializada, complemente a sentença a seguir. As necessidades analíticas sobre os dados provocaram mudanças na arquitetura da base de dados. Os _____________________ são os dados brutos. Os dados resumidos, agregados, sumarizados ou calculados são os dados ____________. Assinale a alternativa que completa adequadamente as lacunas acima: Alternativas: Dados das operações; Amostrados. Segmentados; Transacionais Dados das operações; Segmentados. Dados das operações; Derivados. CORRETO Segmentados; Matemáticos. Resolução comentada: Inmon (1997) destaca a mudança na abordagem em relação aos dados brutos, que no início dos registros de dados não havia a experiência que pudesse prever arranjos diferentes para suportar análises. O objetivo de arquiteturas básicas para banco de dados eram armazenar os registros, sem a robustez necessária para suportar necessidades futuras. As necessidades analíticas sobre os dados provocaram mudanças na arquitetura, surgindo demandas provenientes de dados derivados. Os dados do dia a dia, das operações, in natura, são os dados brutos. Os dados resumidos, agregados, sumarizados ou calculados são os dados derivados. Código da questão: 42576 4) Sobre a construção do DW, considere as seguintes afirmações: ( ) A construção de um DW inicia com a recuperação dos dados históricos da empresa. ( ) A construção pressupõe necessidades de informações especializadas, indicadores de performance da organização. ( ) Uma base histórica auxilia na criação de comparações com dados atuais e tendências futuras. ( ) Um banco de dados analítico é um sistema somente de leitura e escrita que armazena dados. ( ) A construção não prevê também a utilização de ferramentas. Assinale a alternativa que contenha a sequência correta: Alternativas: V –V - V – V – F. V – V – V – F – F. CORRETO F – V – F – V – F. F - F - F – V – V. F – V – V – F – F. Resolução comentada: A construção de um DW inicia com a recuperação dos dados históricos da empresa. Isso significa realizar cópias da história da organização, de acordo com os dois anos anteriores, como recomenda Machado (2010). A construção pressupõe necessidades de informações especializadas, indicadores de performance da organização. Uma base histórica auxilia na criação de comparações com dados atuais e tendências futuras. A construção prevê também a utilização de ferramentas de EIS e DSS. Essas ferramentas são utilizadas em diferentes níveis de gestão das organizações, de acordo com Turban (2007). Código da questão: 52076 5) A decisão de optar pelo Esquema Estrela ou pelo Esquema Floco de Neve deve ser tomada levando-se em consideração, principalmente, pela complexidade da solução e o volume de dados a ser manipulado. Sobre as características dos Esquemas Estrela e Floco de Neve, julgue os itens a seguir: I. O Esquema Estrela possui uma estrutura razoavelmente simples, com poucas tabelas e relacionamentos bem definidos, aproximando bastante do modelo de negócio. II. O Esquema Floco de Neve é uma variação do Esquema Estrela, em que as tabelas dimensões de um Esquema Estrela são organizadas em uma hierarquia ao normalizá-las. III. O Esquema Estrela é composto por uma tabela dominante no centro, chamada de Fatos, relacionada com tabelas auxiliares, chamadas de tabelas de Dimensões, sendo que a tabela de Fatos é relacionada com cada tabela de Dimensão em um relacionamento “muitos para um”. IV. O Esquema Floco de Neve separa as hierarquias das dimensões em tabelas normalizadas, aumentando consideravelmente o número de dimensões, consequentemente aumenta-se a performance das consultas dinâmicas. Estão corretos os itens: Alternativas: II – III. I – II. II – III – IV. I – II – III – IV. I – II – III. CORRETO Resolução comentada: Os itens corretos são I, II e III. O item IV está errado, porque o Esquema Floco de Neve separa as hierarquias das dimensões em tabelas normalizadas, aumentando consideravelmente o número de dimensões, e diminuindo consequentemente a performance das consultas dinâmicas. Código da questão: 42593 6) A mineração de dados é comumente classificada pela sua capacidade em realizar tarefas para diferentes domínios. A literatura indica que não existe um consenso de denominação quanto à classificação, funcionalidades, tarefas, métodos ou técnicas de mineração de dados. Contudo, Fayyad et al. (1996) apresentam alguns métodos de mineração de dados que têm como objetivo a predição ou descrição dos resultados: (FAYYAD, U.M. et al. Advances in knowledge discovery and data mining. California: AAAI Press, 1996). Sobre as técnicas de Data Mining, julgue os itens a seguir, indicando “V” para o item verdadeiro e “F” para o item falso: 1. ( ) Regressão: usa-se para associar ou classificar um item a uma ou a várias categorias pré-definidas, derivando uma regra que possa ser usada para classificar uma observação, referente a um conjunto de dados identificados quesão categorizados por um assunto. 2. ( ) Análise de Séries Temporais: refere-se a tarefa similar à classificação, porém é usada quando os dados são identificados por predição de valores numéricos, considerados variáveis independentes ou exploratórias, e não pela categorização dos itens analisados, sendo possível verificar o eventual relacionamento funcional que possa existir entre duas ou mais variáveis quantitativas. 3. ( ) Agrupamentos (Clusters): refere-se à tarefa de segmentar um conjunto de dados em grupos diferentes, cujos itens são semelhantes, ou seja, subdivide o conjunto de dados em um conjunto menor, sendo similar no comportamento dos atributos de segmentação, descobrindo grupos diferentes entre o conjunto de dados selecionado. 4. ( ) Sumarização: refere-se à tarefa de descrever padrões e tendências que são reveladas por subconjuntos de dados compactados, a partir de um subconjunto de dados com características similares, demostrando as relações funcionais entre as variáveis definidas para a análise exploratória do subconjunto de dados 5. ( ) Análise de Séries Temporais: refere-se a tarefa similar à regra de associação com objetivo de aplicar algum tipo de padrão (tendências, variações sazonais, variações cíclicas e variações irregulares) no conjunto de dados, para determinar que tipos de sequências podem ocorrer em um determinado período. Assinale a alternativa que indica a sequência correta: Alternativas: F – V – F – V – F. F – F – F – F – F. V – V – F – V – F. F – F – V – V – V. CORRETO V – V – V – V – V Resolução comentada: o Item 1 é falso, porque refere-se ao método classificação usado para associar ou classificar um item a uma ou a várias categorias pré-definidas, derivando uma regra que possa ser usada para classificar uma observação, referente a um conjunto de dados identificados que são categorizados por um assunto. O item 2 é falso, porque descreve o método de Regressão que se refere a tarefa similar à classificação, porém é usada quando os dados são identificados por predição de valores numéricos, considerados variáveis independentes ou exploratórias, e não pela categorização dos itens analisados, sendo possível verificar o eventual relacionamento funcional que possa existir entre duas ou mais variáveis quantitativas. Código da questão: 42615 7) Segundo Kimball (1998), o esquema de dados mais utilizado na especificação de um Data Warehouse é o Esquema Estrela (Star Schema) composto por tabelas de Fatos e de Dimensões que proporcionam uma visão multidimensional de grande volume de dados. (KIMBALL, R. et al. The data warehouse lifecycle toolkit. New York: John Wiley & Sons, 1998). Sobre as características das tabelas de Fatos e de Dimensões, julgue os itens a seguir: I. O contexto das funcionalidades que determinam os processos de negócio de uma empresa é especificado em tabelas de Fatos. II. A tabela de Fatos é a principal tabela de um esquema dimensional que geralmente contém vários fatos que indicam valores para análise dimensional. III. A tabela de Fatos relaciona-se com as tabelas de Dimensões, que representam as entidades de negócio e constituem as estruturas de entrada que realizam os filtros de valores aplicados na manipulação dos fatos. IV. As tabelas de Dimensões contêm a descrição textual do negócio, representada pelos atributos e com a indicação da chave primária, que serve como base para manter a integridade referencial quando relacionada com a tabela de Fatos. V. As tabelas de Dimensões representam as características numéricas e classificatórias que fornecem as perspectivas adicionais a um determinado fato por meio de seus atributos. Estão corretos os itens: Alternativas: I – II – III. II – IV – V. I – III – V. I – II – III – IV – V. I – II – III – IV. CORRETO Resolução comentada: os itens corretos são I, II, III e IV. O item V está errado porque as tabelas de Dimensões representam as características descritivas/textuais que fornecem as perspectivas adicionais a um determinado fato por meio de seus atributos. Código da questão: 42592 8) Os ambientes de Data Warehouses (DW) integram sofisticadas ferramentas para análises complexas de dados históricos e descoberta de conhecimento, assegurando o suporte à tomada de decisão. Um ________________ organizacional pode manter um armazém central de dados da organização inteira, ou pode manter armazéns menores, descentralizados, denominados ________________. Assinale a alternativa que completa adequadamente as lacunas acima: Alternativas: Data Mining; Data Warehouse. Data Warehouse; Data Mining. Data Mining; Data Source. Data Warehouse; Data Marts. CORRETO Data Mining; Data Marts. Resolução comentada: os ambientes de Data Warehouses (DW) integram sofisticadas ferramentas para análises complexas de dados históricos e descoberta de conhecimento, assegurando o suporte à tomada de decisão. Um Data Warehouse organizacional pode manter um armazém central de dados da organização inteira, ou pode manter armazéns menores, descentralizados, denominados Data Mart. Código da questão: 42581 9) Considerando a temporalidade, conforme referido no material didático, a informação é a combinação de dados e o tratamento inserido nela. Esse tratamento é uma sentença associada, gerando um conceito, um conhecimento, uma afirmação sobre os dados armazenados. Cada sentença permite a criação das bases de informação para realizar as análises. Considerando uma empresa de atacado, em que um DW possibilita a realização de análises, aponte a alternativa que exemplifica pelo menos três tipos de análises geradas. Alternativas: Contratos de qualquer natureza, contas a pagar, performance de vendas. Listagem de matéria-prima, relação de clientes, endereço dos clientes. Vendas dos produtos, quantidades do estoque, segmentação de clientes. Indicadores climáticos, contratos de qualquer natureza, vendas de produtos. Segmentação de clientes, indicadores da campanha de marketing, performance das vendas. CORRETO Resolução comentada: na alternativa a), a viabilização de um DW pode-se encontrar o detalhamento de um repositório ou armazém de dados deve possuir um DW em que se realizem análises como os exemplos a seguir: Segmentação de clientes. Indicadores da campanha de marketing. Performance das vendas. Análise da fidelização dos clientes. Mensuração do atendimento ao cliente. Status da lucratividade. Comportamento das oscilações dos negócios. Código da questão: 42575 10) Em um banco de dados relacional, a granularidade é baixa, mas é muito importante, o que significa que ela é inversamente proporcional ao detalhe do dado armazenado lá. Para se obter granularidade alta, a importância do detalhe não pode ser considerada. Marque a alternativa que relaciona a granularidade em diferentes níveis e a disponibilidade de detalhamento dos dados. Alternativas: Tabela Fato. Sumarização. CORRETO Entidade. Dimensão. Relacionamento. Resolução comentada: um DW tem níveis de granularidade elevados por conta da necessidade de sumarizações para refletir a realidade dos dados do negócio. As sumarizações são necessárias, pois refletem medidas resumidas ou condessadas, com alguma transformação dos dados originais. Sem essa técnica, seria impraticável obter respostas que refletem o comportamento de um conjunto de dados. Sumarizações podem ser somas, médias, medianas, quartis, etc. Código da questão: 42585
Compartilhar