Baixe o app para aproveitar ainda mais
Prévia do material em texto
Modelagem e arquitetura do dw (data warehouse) Professor(a): Marise de Barros Miranda Gomes (Doutorado) 1) 2) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! O modelo de relacionamento entre _______________ captura as relações entre elas do mundo real. É usado para projetar um _____________conceitual. Auxilia nas visões dos relacionamentos entre as tabelas e também na construção de novas visões em um DW. Assinale a alternativa que completa adequadamente as lacunas acima: Alternativas: Fontes de dados; Banco de dados. Entidades; Banco de dados. CORRETO Fontes de dados; Atributos. Entidades; SGBD. Tabelas; SGBD. Código da questão: 42571 Ferramentas de mineração de dados (Data Mining) são utilizadas nos diferentes segmentos do mercado para sustentar e consolidar estratégias que auxiliem no processo de tomada de decisão, a partir da geração das informações em conhecimento potencialmente útil. Sobre o conceito de Data Mining, assinale a alternativa correta Alternativas: Refere-se à utilização de banco de dados com características multidimensionais, permitindo a navegação com níveis de detalhamento em tempo real, a partir da combinação das dimensões do cubo, proporcionando análises sofisticadas com ótimo desempenho. Refere-se à descrição de padrões e tendências que são reveladas por subconjuntos de dados compactados de diferentes bases de dados, a partir de um subconjunto de dados com características idênticas, demostrando as relações funcionais entre as variáveis definidas. Refere-se a um pequeno subconjunto de um Data Warehouse, sobre um único assunto, que fornece suporte às decisões para um grupo de pessoas, podendo ser criado a partir de dados extraídos de um DW maior, com o objetivo específico de dar suporte a acessos mais rápido para determinado grupo ou função. Refere-se à abordagem de uso combinado de banco de dados relacional com banco de dados orientado a objetos, onde as estruturas relacionais são utilizadas para os dados com maior granularidade e as estruturas orientadas a objetos são utilizadas para dados com menor granularidade. INCORRETO Refere-se às atividades que analisam grande volume de dados, descobrem problemas e oportunidades ocultas em seus relacionamentos, formam modelos computacionais com base nessas descobertas e, então, utilizam esses modelos para prever o comportamento do negócio. CORRETO Resolução comentada: O modelo de relacionamento entre entidades, um modelo MER, captura as relações entre essas entidades, refletindo o mundo real. O MER é usado para projetar um banco de dados de maneira conceitual, o que contribui para as visões dos relacionamentos entre as tabelas e também na construção de novas visões em um DW. Resolução comentada: Avaliação enviada com sucessoc h e c k Avaliação enviada com sucessoc h e c k 3) 4) Código da questão: 42609 Rob e Coronel (2011) enfatizam que a mineração de dados é proativa, ou seja, as ferramentas buscam automaticamente identificar anomalias e possíveis relacionamentos entre os dados, identificando problemas ainda não identificados pelos usuários estratégicos para, assim, prover o conhecimento e aplica-lo às necessidades dos negócios, sendo que a mineração de dados contempla quatro fases básicas. (ROB, P.; CORONEL, C. Sistemas de banco de dados: projeto, implementação e administração. 8. ed. São Paulo: Cengage Learning, 2011). Sobre as fases do processo de mineração de dados, julgue os itens a seguir: I. A primeira fase, seleção dos dados, refere-se à seleção dos principais conjuntos de dados e do tratamento de limpeza e integração desses dados a serem utilizados pela operação de transformação de dados. II. A segunda fase, análise e classificação dos dados, refere-se ao estudo dos dados para identificar características e padrões comuns com a aplicação de algoritmos para encontrar análises, vínculos ou dependências, padrões, tendências e desvios de dados. III. A terceira fase, aquisição do conhecimento, refere-se à seleção dos algoritmos mais comuns de modelagem e aquisição de conhecimentos, baseados em redes neurais, lógica indutiva, árvores de decisão, classificação ou regressão, etc., e a definição desses algoritmos com possível interação dos usuários finais. IV. A quarta fase, transformação dos dados, refere-se às descobertas de mineração de dados para garantirem o comportamento futuro e adquirirem conhecimento, para os usuários estratégicos analisarem seus negócios, por exemplo, o provável lançamento de um produto novo ou de uma campanha de marketing. Estão corretos os itens Alternativas: II – III. CORRETO III – IV. I – II – III. I – II – IV. I – II. Código da questão: 42613 Uma característica importante que deve estar presente em ferramentas OLAP é a capacidade de efetuar operações sobre um conjunto de dados multidimensional que retorna uma apresentação ou sumarização diferente de informações. Existem diversos operadores OLAP que permitem acessar os dados em esquemas multidimensionais. As principais operações são do tipo Drill (Drill Down, Drill Up, Drill Across e Drill Throught) e as do tipo Slice and Dice. Segundo Rob e Coronel (2011, p. 580), a mineração de dados refere-se às atividades que analisam os dados, descobrem problemas e oportunidades ocultas em seus relacionamentos, formam modelos computacionais com base nessas descobertas e, então, utilizam esses modelos para prever o comportamento do negócio – exigindo a mínima intervenção do usuário final. Resolução comentada: o item I está errado, porque a primeira fase é definida como preparação dos dados e refere-se à identificação dos principais conjuntos de dados e do tratamento de limpeza e integração desses dados a serem utilizados pela operação de mineração de dados. O item IV está errado porque a quarta fase é definida como prognóstico e refere-se às descobertas de mineração de dados para preverem o comportamento futuro e projetarem resultados de negócios, como o provável lançamento de um produto novo ou de uma campanha de marketing. Avaliação enviada com sucessoc h e c k Avaliação enviada com sucessoc h e c k 5) Sobre os tipos de operações, julgue os itens a seguir, indicando “V” para o item verdadeiro e “F” para o item falso: 1. ( ) O tipo de operação Drill Down ocorre quando o usuário aumenta o nível de detalhe da informação, diminuindo a granularidade, ou seja, navega verticalmente, descendo a hierarquia no sentido mais específico. 2. ( ) O tipo de operação Drill Up ocorre quando o usuário aumenta o nível de granularidade, diminuindo o nível de detalhamento da informação. 3. ( ) O tipo de operação Drill Across permite navegar transversalmente no eixo da árvore hierárquica, inserindo ou retirando posições da dimensão. 4. ( ) O tipo de operação Slice and Dice ocorre quando o usuário navega de uma informação contida em uma dimensão para uma outra dimensão. 5. ( ) O tipo de operação Drill Throught significa a redução do escopo dos dados em análise, além de mudar a ordem das dimensões, mudando, assim, a orientação segundo a qual os dados são visualizados. Assinale a alternativa correta Alternativas: V – V – V – V – V. F – F – F – V – V. V – F – V – F – V. V – V – V – F – F. CORRETO F – F – F – F – F. Código da questão: 42608 Para implementar projetos de Data Warehouse, são necessárias algumas considerações conceituais que permitem manter o foco nas referências analíticas como finalidade. Nesse sentido, analise as afirmações a seguir. I. DW é uma coleção orientada por assuntos, integrada, variante no tempo e não volátil. II. Os resultados do DW servem para apoiar o processo de tomada de decisão das organizações. III. DW é a cópia específicade tabelas do banco analítico para consultas e análises, criando visões funcionais. IV. A construção de um DW depende fundamentalmente de arquitetura. V. DW é uma arquitetura e não uma tecnologia. São verdadeiras: Alternativas: II – III – V. I – II – III. I – IV – V. I – IV. I – II – IV – V. CORRETO Resolução comentada: o item 4 é falso, porque o tipo de operação Slice and Dice que significa a redução do escopo dos dados em análise, além de alterar a ordem das dimensões, altera, também, a orientação segundo a qual os dados são visualizados. Segundo Machado (2013), Slice é a operação que corta o cubo, mas mantém a mesma perspectiva de visualização dos dados. Dice, por sua vez, é a mudança de perspectiva da visão, ou seja, é a extração de um subcubo ou a interseção de vários Slices. O item 5 é falso, porque o tipo de operação Drill Throught ocorre quando o usuário navega de uma informação contida em uma dimensão para uma outra dimensão. Por exemplo, quando o usuário está na dimensão de tempo e no próximo passo começa a analisar a informação por região. Avaliação enviada com sucessoc h e c k Avaliação enviada com sucessoc h e c k 6) 7) Código da questão: 42577 As informações assumem o papel do principal patrimônio ativo de uma organização. Assim, tornar as informações corporativas acessíveis para entendimento e utilização das áreas estratégicas das organizações é um fator fundamental para a tomada de decisão assertiva. As ferramentas Online Analytical Processing (OLAP) surgiram com os sistemas de apoio à decisão para viabilização e extração eficaz de informações de um ambiente de Data Warehouse (DW). Sobre as características das ferramentas OLAP, julgue os itens a seguir: I. Os dados são processados e visualizados em uma estrutura multidimensional. II. Estrutura logicamente dados multidimensionais na forma de um cubo. III. Efetua operações de manipulação de dados individuais, por meio dos comandos de inserção, atualização e exclusão. IV. Proporciona respostas rápidas e consistentes às consultas interativas executadas pelos usuários. Estão corretos os itens: Alternativas: I – II – IV. CORRETO I – II. II – III. III – IV. I – II – III. INCORRETO Código da questão: 42606 Segundo Kimball (1998), o esquema de dados mais utilizado na especificação de um Data Warehouse é o Esquema Estrela (Star Schema) composto por tabelas de Fatos e de Dimensões que proporcionam uma visão multidimensional de grande volume de dados. (KIMBALL, R. et al. The data warehouse lifecycle toolkit. New York: John Wiley & Sons, 1998). Sobre as características das tabelas de Fatos e de Dimensões, julgue os itens a seguir: I. O contexto das funcionalidades que determinam os processos de negócio de uma empresa é especificado em tabelas de Fatos. II. A tabela de Fatos é a principal tabela de um esquema dimensional que geralmente contém vários fatos que indicam valores para análise dimensional. III. A tabela de Fatos relaciona-se com as tabelas de Dimensões, que representam as entidades de negócio e constituem as estruturas de entrada que realizam os filtros de valores aplicados na manipulação dos fatos. Resolução comentada: na conceituação dada por Inmonn (2005), DW é uma coleção orientada por assuntos, integrada, variante no tempo e não volátil, para apoiar o processo de tomada de decisão das organizações. Na definição de Kimball (2002), DW é a cópia específica de tabelas do banco transacional para consultas e análises, criando visões funcionais. Um projeto de construção de um DW depende, fundamentalmente, de arquitetura. Por isso, Machado (2010) deixa claro que “DW é uma arquitetura e não uma tecnologia”. A tecnologia sim ajuda a construir, operar e monitorar um projeto DW implantado. Resolução comentada: o item III está errado, porque os sistemas transacionais, Online Transaction Processing (OLTP – Processamento de Transações On-line, que efetuam operações de manipulação de dados individuais, por meio dos comandos de inserção, atualização e exclusão. Avaliação enviada com sucessoc h e c k Avaliação enviada com sucessoc h e c k 8) 9) IV. As tabelas de Dimensões contêm a descrição textual do negócio, representada pelos atributos e com a indicação da chave primária, que serve como base para manter a integridade referencial quando relacionada com a tabela de Fatos. V. As tabelas de Dimensões representam as características numéricas e classificatórias que fornecem as perspectivas adicionais a um determinado fato por meio de seus atributos. Estão corretos os itens: Alternativas: I – II – III – IV. CORRETO I – II – III – IV – V. I – II – III. II – IV – V. I – III – V. Código da questão: 42592 A modelagem multidimensional representa uma abstração dos dados armazenados, consistindo em um modelo composto por tabelas de Fatos e de Dimensões, que proporcionam uma visão multidimensional de grande quantidade de dados. Existem algumas abordagens específicas para modelagem multidimensional, derivadas da aparência do esquema traçado, a partir do Diagrama de Entidades e Relacionamentos (DER), sendo o ___________________ composto de uma tabela dominante no centro, chamada de Fatos, rodeada por tabelas auxiliares, chamadas de tabelas de Dimensões, o qual a tabela de Fatos conecta-se às tabelas de Dimensões por várias junções e cada tabela de Dimensão se conecta com apenas uma junção à tabela de Fatos. E uma variante deste esquema é denominado de ___________________. Assinale a alternativa correta que indica os termos que preenchem as lacunas acima: Alternativas: Esquema Floco de Neve; Esquema Cubo. Esquema Floco de Neve; Esquema Estrela. Esquema Estrela; Esquema Floco de Neve. CORRETO Esquema MER; Esquema Cubo. Esquema Estrela; Esquema Cubo. Código da questão: 42591 O banco de dados analítico é diferente do banco de dados operacional, transacional ou OLTP (Online Transaction Processing), usado para processar as transações. Embora os bancos de dados transacionais possam ser usados para suportar o armazenamento de dados e as aplicações de BI, não se recomenda seu uso por questões de integridade e escalabilidade. I. O banco de dados convencional deve ser preservado, e o banco de dados analíticos deve Resolução comentada: os itens corretos são I, II, III e IV. O item V está errado porque as tabelas de Dimensões representam as características descritivas/textuais que fornecem as perspectivas adicionais a um determinado fato por meio de seus atributos. Resolução comentada: o Esquema Estrela (Star Schema) é a abordagem, proposta por Kimball (1998), que visa criar esquemas físicos mais simples e incremental. O nome estrela se dá devido à disposição em que se encontram as tabelas, sendo a tabela de Fatos, centralizada no esquema, e as tabelas de Dimensões são relacionandas nas pontas do esquema. Elmasri e Navathe (2005) descrevem que o “esquema floco de neve é uma variação do esquema estrela em que as tabelas dimensões de um esquema estrela são organizadas em uma hierarquia ao normalizá-las” (ELMASRI; NAVATHE, 225, p. 725). Avaliação enviada com sucessoc h e c k Avaliação enviada com sucessoc h e c k 10) estar em outro schema. PORQUE II. Um banco de dados analítico tem uma estrutura baseada em coluna, tornando os cálculos individuais muito rápidos. Já os bancos de dados transacionais dependem de armazenamento de dados baseado em linha, impróprio para operar com grandes volumes de dados. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: A primeira asserção está correta e a segunda está incorreta. A primeira e a segunda asserções estão incorretas. A primeira e a segunda asserções estão corretas, e a segunda complementa a primeira. CORRETO A primeira e a segunda asserções estão corretas, mas a segunda não tem relação com a primeira. A primeira asserção está incorreta e a segunda está correta Código da questão: 50534 Em um banco de dados relacional, a granularidade é baixa, mas é muito importante, o que significaque ela é inversamente proporcional ao detalhe do dado armazenado lá. Para se obter granularidade alta, a importância do detalhe não pode ser considerada. Marque a alternativa que relaciona a granularidade em diferentes níveis e a disponibilidade de detalhamento dos dados. Alternativas: Tabela Fato. Dimensão. Relacionamento. Entidade. Sumarização. CORRETO Código da questão: 42585 Resolução comentada: Os bancos de dados transacionais são bancos baseados em armazenamento por linha, o que impossibilita o desempenho quando submetido a cálculos em processos analíticos. Isto deteriora o desempenho para a finalidade base ao qual foi projetado, que é armazenar, acessar, incluir e excluir os registros ali depositados. Portanto, para projetos que envolvam cálculos analíticos outro banco com processo de armazenamento por coluna é mais eficiente, como os bancos de dados analíticos, pois os registros ficam livres para serem submetidos aos cálculos volumétricos, essenciais para BI e Big Data. Resolução comentada: um DW tem níveis de granularidade elevados por conta da necessidade de sumarizações para refletir a realidade dos dados do negócio. As sumarizações são necessárias, pois refletem medidas resumidas ou condessadas, com alguma transformação dos dados originais. Sem essa técnica, seria impraticável obter respostas que refletem o comportamento de um conjunto de dados. Sumarizações podem ser somas, médias, medianas, quartis, etc. Arquivos e Links Avaliação enviada com sucessoc h e c k Avaliação enviada com sucessoc h e c k
Compartilhar