Baixe o app para aproveitar ainda mais
Prévia do material em texto
Modelagem e arquitetura do DW (Data Warehouse) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! 1) As ferramentas que apresentam características OLAP passaram a ser referenciadas como ferramentas OLAP. As ferramentas OLAP podem ser classificadas de acordo com a estratégia de armazenamento, sendo chamadas de OLAP Multidimensional (MOLAP), OLAP Relacional (ROLAP), OLAP Híbrido e OLAP Web. Assinale a alternativa correta que descreve as características das ferramentas do tipo MOLAP. Alternativas: O MOLAP refere-se à abordagem de uso combinado de um banco de dados relacional com um banco de dados orientado a objetos, onde as estruturas relacionais são utilizadas para os dados com maior granularidade e as estruturas orientadas a objetos são utilizadas para dados com menor granularidade. O MOLAP refere-se à utilização de banco de dados com características multidimensionais, permitindo a navegação com níveis de detalhamento em tempo real, a partir da combinação das dimensões do cubo, proporcionando análises sofisticadas com ótimo desempenho. CORRETO O MOLAP refere-se à utilização de banco de dados relacional para implementar soluções OLAP, permitindo análise multidimensional dos dados que estão armazenados em uma base de dados relacional, sendo feito todo o processamento no servidor da base de dados e depois gerados os comandos SQL e as tabelas temporárias. O MOLAP refere-se à utilização de banco de dados com características multidimensionais, permitindo operações que ocorrem quando o usuário navega pelas informações contidas entre dimensões de esquemas diferentes, acessados remotamente. O MOLAP refere-se à utilização da ferramenta OLAP em ambiente remoto, disparando consultas via um navegador web para o servidor que, por sua vez, retorna o cubo processado para análise do usuário. Resolução comentada: O MOLAP refere-se à utilização de banco de dados com características multidimensionais, permitindo a navegação com níveis de detalhamento em tempo real, a partir da combinação das dimensões do cubo, proporcionando análises sofisticadas com ótimo desempenho. Segundo Machado (2013), em um banco de dados multidimensional, os cruzamentos de valores são realizados automaticamente, agilizando a visualização multidimensional das informações sob o ponto de vista de todas as dimensões. A forma de acesso e de agregação dos dados faz com que esta ferramenta tenha um excelente desempenho. Código da questão: 42604 2) Para implementar projetos de Data Warehouse, são necessárias algumas considerações conceituais que permitem manter o foco nas referências analíticas como finalidade. Nesse sentido, analise as afirmações a seguir. I. DW é uma coleção orientada por assuntos, integrada, variante no tempo e não volátil. II. Os resultados do DW servem para apoiar o processo de tomada de decisão das organizações. III. DW é a cópia específica de tabelas do banco analítico para consultas e análises, criando visões funcionais. IV. A construção de um DW depende fundamentalmente de arquitetura. V. DW é uma arquitetura e não uma tecnologia. São verdadeiras: Alternativas: II – III – V. I – II – IV – V. CORRETO I – II – III. I – IV – V. I – IV. Resolução comentada: na conceituação dada por Inmonn (2005), DW é uma coleção orientada por assuntos, integrada, variante no tempo e não volátil, para apoiar o processo de tomada de decisão das organizações. Na definição de Kimball (2002), DW é a cópia específica de tabelas do banco transacional para consultas e análises, criando visões funcionais. Um projeto de construção de um DW depende, fundamentalmente, de arquitetura. Por isso, Machado (2010) deixa claro que “DW é uma arquitetura e não uma tecnologia”. A tecnologia sim ajuda a construir, operar e monitorar um projeto DW implantado. Código da questão: 42577 3) Uma característica importante que deve estar presente em ferramentas OLAP é a capacidade de efetuar operações sobre um conjunto de dados multidimensional que retorna uma apresentação ou sumarização diferente de informações. Existem diversos operadores OLAP que permitem acessar os dados em esquemas multidimensionais. As principais operações são do tipo Drill (Drill Down, Drill Up, Drill Across e Drill Throught) e as do tipo Slice and Dice. Sobre os tipos de operações, julgue os itens a seguir, indicando “V” para o item verdadeiro e “F” para o item falso: 1. ( ) O tipo de operação Drill Down ocorre quando o usuário aumenta o nível de detalhe da informação, diminuindo a granularidade, ou seja, navega verticalmente, descendo a hierarquia no sentido mais específico. 2. ( ) O tipo de operação Drill Up ocorre quando o usuário aumenta o nível de granularidade, diminuindo o nível de detalhamento da informação. 3. ( ) O tipo de operação Drill Across permite navegar transversalmente no eixo da árvore hierárquica, inserindo ou retirando posições da dimensão. 4. ( ) O tipo de operação Slice and Dice ocorre quando o usuário navega de uma informação contida em uma dimensão para uma outra dimensão. 5. ( ) O tipo de operação Drill Throught significa a redução do escopo dos dados em análise, além de mudar a ordem das dimensões, mudando, assim, a orientação segundo a qual os dados são visualizados. Assinale a alternativa correta Alternativas: F – F – F – F – F. V – V – V – V – V. F – F – F – V – V. V – V – V – F – F. CORRETO V – F – V – F – V. Resolução comentada: o item 4 é falso, porque o tipo de operação Slice and Dice que significa a redução do escopo dos dados em análise, além de alterar a ordem das dimensões, altera, também, a orientação segundo a qual os dados são visualizados. Segundo Machado (2013), Slice é a operação que corta o cubo, mas mantém a mesma perspectiva de visualização dos dados. Dice, por sua vez, é a mudança de perspectiva da visão, ou seja, é a extração de um subcubo ou a interseção de vários Slices. O item 5 é falso, porque o tipo de operação Drill Throught ocorre quando o usuário navega de uma informação contida em uma dimensão para uma outra dimensão. Por exemplo, quando o usuário está na dimensão de tempo e no próximo passo começa a analisar a informação por região. Código da questão: 42608 4) Os ambientes de Data Warehouses (DW) integram sofisticadas ferramentas para análises complexas de dados históricos e descoberta de conhecimento, assegurando o suporte à tomada de decisão. Um ________________ organizacional pode manter um armazém central de dados da organização inteira, ou pode manter armazéns menores, descentralizados, denominados ________________. Assinale a alternativa que completa adequadamente as lacunas acima: Alternativas: Data Mining; Data Warehouse. Data Mining; Data Source. Data Warehouse; Data Marts. CORRETO Data Mining; Data Marts. Data Warehouse; Data Mining. Resolução comentada: os ambientes de Data Warehouses (DW) integram sofisticadas ferramentas para análises complexas de dados históricos e descoberta de conhecimento, assegurando o suporte à tomada de decisão. Um Data Warehouse organizacional pode manter um armazém central de dados da organização inteira, ou pode manter armazéns menores, descentralizados, denominados Data Mart. Código da questão: 42581 5) Considerando a temporalidade, conforme referido no material didático, a informação é a combinação de dados e o tratamento inserido nela. Esse tratamento é uma sentença associada, gerando um conceito, um conhecimento, uma afirmaçãosobre os dados armazenados. Cada sentença permite a criação das bases de informação para realizar as análises. Considerando uma empresa de atacado, em que um DW possibilita a realização de análises, aponte a alternativa que exemplifica pelo menos três tipos de análises geradas. Alternativas: Segmentação de clientes, indicadores da campanha de marketing, performance das vendas. CORRETO Vendas dos produtos, quantidades do estoque, segmentação de clientes. Listagem de matéria-prima, relação de clientes, endereço dos clientes. Indicadores climáticos, contratos de qualquer natureza, vendas de produtos. Contratos de qualquer natureza, contas a pagar, performance de vendas. Resolução comentada: na alternativa a), a viabilização de um DW pode-se encontrar o detalhamento de um repositório ou armazém de dados deve possuir um DW em que se realizem análises como os exemplos a seguir: Segmentação de clientes. Indicadores da campanha de marketing. Performance das vendas. Análise da fidelização dos clientes. Mensuração do atendimento ao cliente. Status da lucratividade. Comportamento das oscilações dos negócios. Código da questão: 42575 6) Em um banco de dados relacional, a granularidade é baixa, mas é muito importante, o que significa que ela é inversamente proporcional ao detalhe do dado armazenado lá. Para se obter granularidade alta, a importância do detalhe não pode ser considerada. Marque a alternativa que relaciona a granularidade em diferentes níveis e a disponibilidade de detalhamento dos dados. Alternativas: Entidade. Sumarização. CORRETO Relacionamento. Tabela Fato. Dimensão. Resolução comentada: um DW tem níveis de granularidade elevados por conta da necessidade de sumarizações para refletir a realidade dos dados do negócio. As sumarizações são necessárias, pois refletem medidas resumidas ou condessadas, com alguma transformação dos dados originais. Sem essa técnica, seria impraticável obter respostas que refletem o comportamento de um conjunto de dados. Sumarizações podem ser somas, médias, medianas, quartis, etc. Código da questão: 42585 7) Rob e Coronel (2011) enfatizam que a mineração de dados é proativa, ou seja, as ferramentas buscam automaticamente identificar anomalias e possíveis relacionamentos entre os dados, identificando problemas ainda não identificados pelos usuários estratégicos para, assim, prover o conhecimento e aplica-lo às necessidades dos negócios, sendo que a mineração de dados contempla quatro fases básicas. (ROB, P.; CORONEL, C. Sistemas de banco de dados: projeto, implementação e administração. 8. ed. São Paulo: Cengage Learning, 2011). Sobre as fases do processo de mineração de dados, julgue os itens a seguir: I. A primeira fase, seleção dos dados, refere-se à seleção dos principais conjuntos de dados e do tratamento de limpeza e integração desses dados a serem utilizados pela operação de transformação de dados. II. A segunda fase, análise e classificação dos dados, refere-se ao estudo dos dados para identificar características e padrões comuns com a aplicação de algoritmos para encontrar análises, vínculos ou dependências, padrões, tendências e desvios de dados. III. A terceira fase, aquisição do conhecimento, refere-se à seleção dos algoritmos mais comuns de modelagem e aquisição de conhecimentos, baseados em redes neurais, lógica indutiva, árvores de decisão, classificação ou regressão, etc., e a definição desses algoritmos com possível interação dos usuários finais. IV. A quarta fase, transformação dos dados, refere-se às descobertas de mineração de dados para garantirem o comportamento futuro e adquirirem conhecimento, para os usuários estratégicos analisarem seus negócios, por exemplo, o provável lançamento de um produto novo ou de uma campanha de marketing. Estão corretos os itens Alternativas: I – II – IV. III – IV. I – II – III. I – II. II – III. CORRETO Resolução comentada: o item I está errado, porque a primeira fase é definida como preparação dos dados e refere-se à identificação dos principais conjuntos de dados e do tratamento de limpeza e integração desses dados a serem utilizados pela operação de mineração de dados. O item IV está errado porque a quarta fase é definida como prognóstico e refere-se às descobertas de mineração de dados para preverem o comportamento futuro e projetarem resultados de negócios, como o provável lançamento de um produto novo ou de uma campanha de marketing. Código da questão: 42613 8) O DW tem uma composição que separa a carga de trabalho para análise da carga de trabalho para transações. No primeiro caso, permite a consolidação de diferentes fontes nessa carga de trabalho analítica. I. Um DW possui um conjunto característico personalizado, distintamente dos ambientes convencionais das organizações. PORQUE II. Há como replicar um DW de uma empresa para outra. Cada projeto de DW não é único em sua essência, mas no seu modo de operação e aplicação. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: A primeira e a segunda asserções estão incorretas. A primeira asserção está incorreta e a segunda está correta. A primeira asserção está correta e a segunda incorreta. CORRETO A primeira asserção está incorreta e a segunda justifica a primeira. A primeira e a segunda asserções estão corretas, mas a segunda não justifica a primeira. Resolução comentada: DW tem uma composição que separa a carga de trabalho para sua análise para transações. No primeiro caso, permite a consolidação de diferentes fontes nessa carga de trabalho analítica. Um DW possui um conjunto característico personalizado, distintamente dos ambientes convencionais das organizações. Por este motivo, não há como replicar um DW de uma empresa para outra. Cada projeto de DW não na essência mas no seu modo de operação e aplicação. Código da questão: 42579 9) As fontes de dados são armazenadas segundo um modelo de banco de dados, em geral organizados de acordo com uma estrutura lógica. Essas fontes de dados, além de serem mantidas em repositórios organizados, também incluem características determinantes quanto ao armazenamento e acesso. Aponte a alternativa que estabelece essas características. Alternativas: As características associadas às fontes de dados são somente os relacionamentos entre os dados. As características associadas às fontes de dados são os relacionamentos, os tipos e as restrições desses dados. CORRETO As características associadas às fontes de dados são os relacionamentos, os índices de armazenamento e as tabelas dos repositórios. Somente as restrições são associadas às fontes de dados. As fontes de dados podem ser armazenadas e acessadas sem a necessidade de caracterização quanto ao tipo de dados. Resolução comentada: Toda fonte de dados que será armazenada e acessada em um banco de dados deve manter a integridade do conteúdo. A exemplo, como um dado de número de RG, deve estar relacionado à pessoa a qual pertence esse documento, o dado precisa ter consistência quanto ao tipo, se numérico ou texto, para viabilizar cálculos ou buscas, e as restrições, dado em determinado campo não pode ser nulo. Código da questão: 42570 10) O banco de dados analítico é diferente do banco de dados operacional, transacional ou OLTP (Online Transaction Processing), usado para processar as transações. Embora os bancos de dados transacionais possam ser usados para suportar o armazenamento de dados e as aplicações de BI, não se recomenda seu uso por questões de integridade e escalabilidade. I. O banco de dados convencional deve ser preservado, e o banco de dados analíticos deve estar em outro schema. PORQUE II. Um banco de dados analítico tem uma estrutura baseada em coluna, tornandoos cálculos individuais muito rápidos. Já os bancos de dados transacionais dependem de armazenamento de dados baseado em linha, impróprio para operar com grandes volumes de dados. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: A primeira asserção está correta e a segunda está incorreta. A primeira e a segunda asserções estão corretas, e a segunda complementa a primeira. CORRETO A primeira asserção está incorreta e a segunda está correta A primeira e a segunda asserções estão incorretas. A primeira e a segunda asserções estão corretas, mas a segunda não tem relação com a primeira. Resolução comentada: Os bancos de dados transacionais são bancos baseados em armazenamento por linha, o que impossibilita o desempenho quando submetido a cálculos em processos analíticos. Isto deteriora o desempenho para a finalidade base ao qual foi projetado, que é armazenar, acessar, incluir e excluir os registros ali depositados. Portanto, para projetos que envolvam cálculos analíticos outro banco com processo de armazenamento por coluna é mais eficiente, como os bancos de dados analíticos, pois os registros ficam livres para serem submetidos aos cálculos volumétricos, essenciais para BI e Big Data. Código da questão: 50534
Compartilhar