Prévia do material em texto
1) Em um processo de tomada de decisões, a disponibilidade e o fácil acesso às informações organizacionais contribuem para uma decisão de sucesso. Assim, a extração eficaz de informações de um ambiente de Data Warehouse (DW) para gerar conhecimento é proporcionada por ferramentas que disponibilizam recursos avançados para suportar operações sobre o conjunto de dados multidimensional. Pela maior popularidade do uso das ferramentas de acesso a um DW, destaca-se as ferramentas __________________________. Assinale a alternativa correta que indica o termo que preenche a lacuna acima: Alternativas: Business Inteligence (BI). Staging Area. Operational Data Store (ODS). Online Transaction Processing (OLTP). Online Analytical Processing (OLAP). CORRETO Resolução comentada: Machado (2013) descreve que as ferramentas OLAP surgiram com os sistemas de apoio à decisão para fazerem a consulta e análise dos dados dos DW, sendo às aplicações às quais os usuários têm acesso para extrair os dados de suas bases e construir os relatórios com recursos que atendem os gestores. Código da questão: 42605 2) Segundo Kimball (1998), o esquema de dados mais utilizado na especificação de um Data Warehouse é o Esquema Estrela (Star Schema) composto por tabelas de Fatos e de Dimensões que proporcionam uma visão multidimensional de grande volume de dados. (KIMBALL, R. et al. The data warehouse lifecycle toolkit. New York: John Wiley & Sons, 1998). Sobre as características das tabelas de Fatos e de Dimensões, julgue os itens a seguir: O contexto das funcionalidades que determinam os processos de negócio de uma empresa é especificado em tabelas de Fatos. A tabela de Fatos é a principal tabela de um esquema dimensional que geralmente contém vários fatos que indicam valores para análise dimensional. A tabela de Fatos relaciona-se com as tabelas de Dimensões, que representam as entidades de negócio e constituem as estruturas de entrada que realizam os filtros de valores aplicados na manipulação dos fatos. As tabelas de Dimensões contêm a descrição textual do negócio, representada pelos atributos e com a indicação da chave primária, que serve como base para manter a integridade referencial quando relacionada com a tabela de Fatos. As tabelas de Dimensões representam as características numéricas e classificatórias que fornecem as perspectivas adicionais a um determinado fato por meio de seus atributos. Estão corretos os itens: Alternativas: I – II – III. II – IV – V. I – II – III – IV – V. I – II – III – IV. CORRETO I – III – V. Resolução comentada: os itens corretos são I, II, III e IV. O item V está errado porque as tabelas de Dimensões representam as características descritivas/textuais que fornecem as perspectivas adicionais a um determinado fato por meio de seus atributos. Código da questão: 42592 3) Os ambientes de Data Warehouses (DW) integram sofisticadas ferramentas para análises complexas de dados históricos e descoberta de conhecimento, assegurando o suporte à tomada de decisão. Um ________________ organizacional pode manter um armazém central de dados da organização inteira, ou pode manter armazéns menores, descentralizados, denominados ________________. Assinale a alternativa que completa adequadamente as lacunas acima: Alternativas: Data Mining; Data Marts. Data Warehouse; Data Marts. CORRETO Data Mining; Data Source. Data Warehouse; Data Mining. Data Mining; Data Warehouse. Resolução comentada: os ambientes de Data Warehouses (DW) integram sofisticadas ferramentas para análises complexas de dados históricos e descoberta de conhecimento, assegurando o suporte à tomada de decisão. Um Data Warehouse organizacional pode manter um armazém central de dados da organização inteira, ou pode manter armazéns menores, descentralizados, denominados Data Mart. Código da questão: 42581 4) O modelo multidimensional permite encontrar respostas de comportamento do desempenho dos negócios, por meio dos aspectos a seguir. Realizar simulações de cenários. Embasar análises estratégicas e alocar decisões. Podem ser realizadas abstrações de localidade (onde). Permite resumir a temporalidade (quando). Não associa responsabilidades (quem) e classificações (o quê). São verdadeiras: Alternativas: I – IV – V. I – III, somente. I – II – III. I - II – III – IV. CORRETO II – III – V. Resolução comentada: a abordagem do modelo multidimensional permite que respostas sobre o comportamento do desempenho do negócio sejam encontradas por meio de simulações de cenários para embasar as análises estratégicas e alocar decisões. Esta abordagem remete à necessidade de construir um modelo dimensional, em que são feitas perguntas sob abstrações de localidade (onde), temporalidade (quando), responsabilidade (quem) e classificação (o quê). Código da questão: 42587 5) A mineração de dados é comumente classificada pela sua capacidade em realizar tarefas para diferentes domínios. A literatura indica que não existe um consenso de denominação quanto à classificação, funcionalidades, tarefas, métodos ou técnicas de mineração de dados. Contudo, Fayyad et al. (1996) apresentam alguns métodos de mineração de dados que têm como objetivo a predição ou descrição dos resultados: (FAYYAD, U.M. et al. Advances in knowledge discovery and data mining. California: AAAI Press, 1996). Sobre as técnicas de Data Mining, julgue os itens a seguir, indicando “V” para o item verdadeiro e “F” para o item falso: ( ) Regressão: usa-se para associar ou classificar um item a uma ou a várias categorias pré-definidas, derivando uma regra que possa ser usada para classificar uma observação, referente a um conjunto de dados identificados que são categorizados por um assunto. ( ) Análise de Séries Temporais: refere-se a tarefa similar à classificação, porém é usada quando os dados são identificados por predição de valores numéricos, considerados variáveis independentes ou exploratórias, e não pela categorização dos itens analisados, sendo possível verificar o eventual relacionamento funcional que possa existir entre duas ou mais variáveis quantitativas. ( ) Agrupamentos (Clusters): refere-se à tarefa de segmentar um conjunto de dados em grupos diferentes, cujos itens são semelhantes, ou seja, subdivide o conjunto de dados em um conjunto menor, sendo similar no comportamento dos atributos de segmentação, descobrindo grupos diferentes entre o conjunto de dados selecionado. ( ) Sumarização: refere-se à tarefa de descrever padrões e tendências que são reveladas por subconjuntos de dados compactados, a partir de um subconjunto de dados com características similares, demostrando as relações funcionais entre as variáveis definidas para a análise exploratória do subconjunto de dados ( ) Análise de Séries Temporais: refere-se a tarefa similar à regra de associação com objetivo de aplicar algum tipo de padrão (tendências, variações sazonais, variações cíclicas e variações irregulares) no conjunto de dados, para determinar que tipos de sequências podem ocorrer em um determinado período. Assinale a alternativa que indica a sequência correta: Alternativas: F – V – F – V – F. F – F – V – V – V. CORRETO V – V – F – V – F. F – F – F – F – F. V – V – V – V – V Resolução comentada: o Item 1 é falso, porque refere-se ao método classificação usado para associar ou classificar um item a uma ou a várias categorias pré-definidas, derivando uma regra que possa ser usada para classificar uma observação, referente a um conjunto de dados identificados que são categorizados por um assunto. O item 2 é falso, porque descreve o método de Regressão que se refere a tarefa similar à classificação, porém é usada quando os dados são identificados por predição de valores numéricos, considerados variáveis independentes ou exploratórias, e não pela categorização dos itens analisados, sendo possível verificar o eventual relacionamento funcional que possa existir entre duas ou mais variáveis quantitativas. Código da questão: 42615 6) Para a definição da arquitetura de um ambiente de Data Warehouse (DW)ou de Data Marts, deve-se levar em conta o porte da empresa, tempo, capacitação da equipe de desenvolvimento e recursos disponibilizados para os investimentos. Sobre a arquitetura de um Data Warehouse e de Data Marts, analise os itens a seguir: São classificadas como global, independente ou a combinada; e o tipo de implementação como top down, bottom up ou a integrada. A arquitetura global pode ser fisicamente centralizada ou pode ser fisicamente distribuída nas instalações da empresa. III. A arquitetura independente é considerada aquela que comporta as necessidades do DW organizacional com alto nível de acessos e utilização das informações geradas e disponibilizadas, a partir de ferramentas de apoio a decisão para todos os departamentos da empresa. IV. A arquitetura independente mantém Data Marts stand-alone, onde têm-se dados específicos da necessidade da empresa, considerando que cada departamento tem sua informação sem a integração com outros departamentos. V. A arquitetura integrada de Data Marts é implementada por Data Marts separadamente por grupos específicos ou departamentos, sendo integrados ou interconectados posteriormente, provendo uma visão organizacional maior dos dados e informações. Estão corretos os itens: Alternativas: III – IV – V. II – III – IV – V. II – IV – V. CORRETO I – II – III – IV – V. I – II – III. Resolução comentada: os itens I e III estão errados. O item I está errado porque a arquitetura é classificada como global, independente ou a integrada; e o tipo de implementação é do tipo top down, bottom up ou a combinada. O item III está errado porque é a arquitetura global que mais independente, considerada a arquitetura que comporta as necessidades do DW organizacional com alto nível de acessos e utilização das informações geradas e disponibilizadas, a partir de ferramentas de apoio a decisão para todos os departamentos da empresa. Código da questão: 42583 7) A modelagem multidimensional representa uma abstração dos dados armazenados, consistindo em um modelo composto por tabelas de Fatos e de Dimensões, que proporcionam uma visão multidimensional de grande quantidade de dados. Existem algumas abordagens específicas para modelagem multidimensional, derivadas da aparência do esquema traçado, a partir do Diagrama de Entidades e Relacionamentos (DER), sendo o ___________________ composto de uma tabela dominante no centro, chamada de Fatos, rodeada por tabelas auxiliares, chamadas de tabelas de Dimensões, o qual a tabela de Fatos conecta-se às tabelas de Dimensões por várias junções e cada tabela de Dimensão se conecta com apenas uma junção à tabela de Fatos. E uma variante deste esquema é denominado de ___________________. Assinale a alternativa correta que indica os termos que preenchem as lacunas acima: Alternativas: Esquema Estrela; Esquema Cubo. Esquema Estrela; Esquema Floco de Neve. CORRETO Esquema Floco de Neve; Esquema Estrela. Esquema Floco de Neve; Esquema Cubo. Esquema MER; Esquema Cubo. Resolução comentada: o Esquema Estrela (Star Schema) é a abordagem, proposta por Kimball (1998), que visa criar esquemas físicos mais simples e incremental. O nome estrela se dá devido à disposição em que se encontram as tabelas, sendo a tabela de Fatos, centralizada no esquema, e as tabelas de Dimensões são relacionandas nas pontas do esquema. Elmasri e Navathe (2005) descrevem que o “esquema floco de neve é uma variação do esquema estrela em que as tabelas dimensões de um esquema estrela são organizadas em uma hierarquia ao normalizá-las” (ELMASRI; NAVATHE, 225, p. 725). Código da questão: 42591 8) Para implementar projetos de Data Warehouse, são necessárias algumas considerações conceituais que permitem manter o foco nas referências analíticas como finalidade. Nesse sentido, analise as afirmações a seguir. I. DW é uma coleção orientada por assuntos, integrada, variante no tempo e não volátil. II. Os resultados do DW servem para apoiar o processo de tomada de decisão das organizações. III. DW é a cópia específica de tabelas do banco analítico para consultas e análises, criando visões funcionais. IV. A construção de um DW depende fundamentalmente de arquitetura. V. DW é uma arquitetura e não uma tecnologia. São verdadeiras: Alternativas: I – IV – V. I – IV. I – II – IV – V. CORRETO II – III – V. I – II – III. Resolução comentada: na conceituação dada por Inmonn (2005), DW é uma coleção orientada por assuntos, integrada, variante no tempo e não volátil, para apoiar o processo de tomada de decisão das organizações. Na definição de Kimball (2002), DW é a cópia específica de tabelas do banco transacional para consultas e análises, criando visões funcionais. Um projeto de construção de um DW depende, fundamentalmente, de arquitetura. Por isso, Machado (2010) deixa claro que “DW é uma arquitetura e não uma tecnologia”. A tecnologia sim ajuda a construir, operar e monitorar um projeto DW implantado. Código da questão: 42577 9) A modelagem multidimensional representa uma abstração dos dados armazenados, permitindo a visualização de grande quantidade de dados, por meio de consultas dinâmicas de ferramentas Online Analytical Processing (OLAP – Processamento Analítico On-line) que exibem as informações no formato de um cubo. Assinale a alternativa correta que indica os elementos básicos da modelagem multidimensional: Alternativas: Tabela de dados e tabelas de consultas. Tabela de Fatos e tabelas de Dimensões.CORRETO Tabelas normalizadas e tabelas não-normalizadas. Tabela de Fatos e tabelas de consultas. Tabela de dados e tabelas de Dimensões Resolução comentada: a modelagem multidimensional representa uma abstração dos dados armazenados, consistindo em um modelo composto por tabelas de Fatos e de Dimensões que proporcionam uma visão multidimensional de grande quantidade de dados. Fatos: é uma coleção de itens de dados, composta de dados de medidas, representando uma transação ou um evento de negócio. Um fato é representado por valores numéricos em um esquema, e implementado em tabelas denominadas tabelas de Fatos. Dimensões: são os elementos que participam de um fato, ou seja, são as possíveis formas de visualizar os dados de forma descritiva e classificatória, determinando o contexto de um assunto de negócio. Os elementos que representam uma dimensão são especificados em um esquema e implementados em tabelas denominadas de tabelas de Dimensões. Código da questão: 42590 10) A decisão de optar pelo Esquema Estrela ou pelo Esquema Floco de Neve deve ser tomada levando-se em consideração, principalmente, pela complexidade da solução e o volume de dados a ser manipulado. Sobre as características dos Esquemas Estrela e Floco de Neve, julgue os itens a seguir: O Esquema Estrela possui uma estrutura razoavelmente simples, com poucas tabelas e relacionamentos bem definidos, aproximando bastante do modelo de negócio. O Esquema Floco de Neve é uma variação do Esquema Estrela, em que as tabelas dimensões de um Esquema Estrela são organizadas em uma hierarquia ao normalizá-las. O Esquema Estrela é composto por uma tabela dominante no centro, chamada de Fatos, relacionada com tabelas auxiliares, chamadas de tabelas de Dimensões, sendo que a tabela de Fatos é relacionada com cada tabela de Dimensão em um relacionamento “muitos para um”. O Esquema Floco de Neve separa as hierarquias das dimensões em tabelas normalizadas, aumentando consideravelmente o número de dimensões, consequentemente aumenta-se a performance das consultas dinâmicas. Estão corretos os itens: Alternativas: II – III – IV. I – II – III – IV. II – III. I – II. I – II – III.CORRETO Resolução comentada: Os itens corretos são I, II e III. O item IV está errado, porque o Esquema Floco de Neve separa as hierarquias das dimensões em tabelas normalizadas, aumentando consideravelmente o número de dimensões, e diminuindo consequentemente a performance das consultas dinâmicas. Código da questão: 42593