Baixe o app para aproveitar ainda mais
Prévia do material em texto
01/12/2020 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2322484/2343524 1/8 Modelagem e arquitetura do DW (Data Warehouse) Professor(a): Marise de Barros Miranda Gomes (Doutorado) 1) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! A mineração de dados é comumente classificada pela sua capacidade em realizar tarefas para diferentes domínios. A literatura indica que não existe um consenso de denominação quanto à classificação, funcionalidades, tarefas, métodos ou técnicas de mineração de dados. Contudo, Fayyad et al. (1996) apresentam alguns métodos de mineração de dados que têm como objetivo a predição ou descrição dos resultados: (FAYYAD, U.M. et al. Advances in knowledge discovery and data mining. California: AAAI Press, 1996). Sobre as técnicas de Data Mining, julgue os itens a seguir, indicando “V” para o item verdadeiro e “F” para o item falso: 1. ( ) Regressão: usa-se para associar ou classificar um item a uma ou a várias categorias pré-definidas, derivando uma regra que possa ser usada para classificar uma observação, referente a um conjunto de dados identificados que são categorizados por um assunto. 2. ( ) Análise de Séries Temporais: refere-se a tarefa similar à classificação, porém é usada quando os dados são identificados por predição de valores numéricos, considerados variáveis independentes ou exploratórias, e não pela categorização dos itens analisados, sendo possível verificar o eventual relacionamento funcional que possa existir entre duas ou mais variáveis quantitativas. 3. ( ) Agrupamentos (Clusters): refere-se à tarefa de segmentar um conjunto de dados em grupos diferentes, cujos itens são semelhantes, ou seja, subdivide o conjunto de dados em um conjunto menor, sendo similar no comportamento dos atributos de segmentação, descobrindo grupos diferentes entre o conjunto de dados selecionado. 4. ( ) Sumarização: refere-se à tarefa de descrever padrões e tendências que são reveladas por subconjuntos de dados compactados, a partir de um subconjunto de dados com características similares, demostrando as relações funcionais entre as variáveis definidas para a análise exploratória do subconjunto de dados 5. ( ) Análise de Séries Temporais: refere-se a tarefa similar à regra de associação com objetivo de aplicar algum tipo de padrão (tendências, variações sazonais, variações cíclicas e variações irregulares) no conjunto de dados, para determinar que tipos de sequências podem ocorrer em um determinado período. Assinale a alternativa que indica a sequência correta: 01/12/2020 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2322484/2343524 2/8 2) Alternativas: F – F – V – V – V. CORRETO F – V – F – V – F. V – V – V – V – V V – V – F – V – F. F – F – F – F – F. Código da questão: 42615 Um modelo é uma __________utilizada como técnica para refletir a realidade. Ao modelar os dados de uma organização, sejam operacionais ou analíticos, busca-se o que se quer realizar ou fazer com os dados. Armazenar dados em bancos relacionais para manter o histórico não reflete a realidade da empresa. É necessário desenhar uma organização desses dados e, para isso, um modelo _____________ funciona como uma ferramenta que auxilia na análise dos requisitos e no desenho da estrutura dos dados relacionada a esse negócio. Assinale a alternativa que completa adequadamente a lacuna acima: Alternativas: Granular; Abstração. Abstração; Transacional. Abstração; Entidade relacionamento. CORRETO Entidade relacionamento; Dimensional. Entidade; Sumarizado. Resolução comentada: o Item 1 é falso, porque refere-se ao método classificação usado para associar ou classificar um item a uma ou a várias categorias pré-definidas, derivando uma regra que possa ser usada para classificar uma observação, referente a um conjunto de dados identificados que são categorizados por um assunto. O item 2 é falso, porque descreve o método de Regressão que se refere a tarefa similar à classificação, porém é usada quando os dados são identificados por predição de valores numéricos, considerados variáveis independentes ou exploratórias, e não pela categorização dos itens analisados, sendo possível verificar o eventual relacionamento funcional que possa existir entre duas ou mais variáveis quantitativas. Resolução comentada: O modelo entidade relacionamento é uma abstração, e tenta refletir o mundo real, que vislumbra o que ser quer realizar ou fazer. Este modelo é uma ferramenta que ajuda na análise de requisitos de negócio e no design da estrutura de dados 01/12/2020 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2322484/2343524 3/8 3) 4) Código da questão: 42586 Considerando a temporalidade, conforme referido no material didático, a informação é a combinação de dados e o tratamento inserido nela. Esse tratamento é uma sentença associada, gerando um conceito, um conhecimento, uma afirmação sobre os dados armazenados. Cada sentença permite a criação das bases de informação para realizar as análises. Considerando uma empresa de atacado, em que um DW possibilita a realização de análises, aponte a alternativa que exemplifica pelo menos três tipos de análises geradas. Alternativas: Segmentação de clientes, indicadores da campanha de marketing, performance das vendas. CORRETO Contratos de qualquer natureza, contas a pagar, performance de vendas. Listagem de matéria-prima, relação de clientes, endereço dos clientes. Vendas dos produtos, quantidades do estoque, segmentação de clientes. Indicadores climáticos, contratos de qualquer natureza, vendas de produtos. Código da questão: 42575 Ferramentas de mineração de dados (Data Mining) são utilizadas nos diferentes segmentos do mercado para sustentar e consolidar estratégias que auxiliem no processo de tomada de decisão, a partir da geração das informações em conhecimento potencialmente útil. Sobre o conceito de Data Mining, assinale a alternativa correta relacionada com esse negócio e sua base histórica. O modelo ER descreve as operações relacionadas ao negócio e as ligações entre as entidades do modelo. Resolução comentada: na alternativa a), a viabilização de um DW pode-se encontrar o detalhamento de um repositório ou armazém de dados deve possuir um DW em que se realizem análises como os exemplos a seguir: Segmentação de clientes. Indicadores da campanha de marketing. Performance das vendas. Análise da fidelização dos clientes. Mensuração do atendimento ao cliente. Status da lucratividade. Comportamento das oscilações dos negócios. 01/12/2020 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2322484/2343524 4/8 5) Alternativas: Refere-se à utilização de banco de dados com características multidimensionais, permitindo a navegação com níveis de detalhamento em tempo real, a partir da combinação das dimensões do cubo, proporcionando análises sofisticadas com ótimo desempenho. Refere-se às atividades que analisam grande volume de dados, descobrem problemas e oportunidades ocultas em seus relacionamentos, formam modelos computacionais com base nessas descobertas e, então, utilizam esses modelos para prever o comportamento do negócio. CORRETO Refere-se à descrição de padrões e tendências que são reveladas por subconjuntos de dados compactados de diferentes bases de dados, a partir de um subconjunto de dados com características idênticas, demostrando as relações funcionais entre as variáveis definidas. Refere-se a um pequeno subconjunto de um Data Warehouse, sobre um único assunto, que fornece suporte às decisões para um grupo de pessoas, podendo ser criado a partir de dados extraídosde um DW maior, com o objetivo específico de dar suporte a acessos mais rápido para determinado grupo ou função. Refere-se à abordagem de uso combinado de banco de dados relacional com banco de dados orientado a objetos, onde as estruturas relacionais são utilizadas para os dados com maior granularidade e as estruturas orientadas a objetos são utilizadas para dados com menor granularidade. Código da questão: 42609 Em um banco de dados relacional, a granularidade é baixa, mas é muito importante, o que significa que ela é inversamente proporcional ao detalhe do dado armazenado lá. Para se obter granularidade alta, a importância do detalhe não pode ser considerada. Marque a alternativa que relaciona a granularidade em diferentes níveis e a disponibilidade de detalhamento dos dados. Alternativas: Dimensão. Sumarização. CORRETO Tabela Fato. Relacionamento. Entidade. Resolução comentada: Segundo Rob e Coronel (2011, p. 580), a mineração de dados refere-se às atividades que analisam os dados, descobrem problemas e oportunidades ocultas em seus relacionamentos, formam modelos computacionais com base nessas descobertas e, então, utilizam esses modelos para prever o comportamento do negócio – exigindo a mínima intervenção do usuário final. 01/12/2020 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2322484/2343524 5/8 6) 7) Código da questão: 42585 Sobre o Modelo Entidade Relacionamento (MER), considere as seguintes afirmações: I. Dados como nome, endereço, produto são exemplos de entidade. II. Cada entidade possui atributos. III. A cardinalidade representa a métrica entre as entidades. IV. A tabela de fatos central se conecta a várias tabelas dimensionais. V. É o modelo mais amplamente utilizado em nível de abstração de projetos de banco de dados, descriminando as características dos dados, chave primária e estrangeira. São verdadeiras: Alternativas: I – II – IV – V. CORRETO II – III – V. I – IV – V. I – II – III. I – IIII. Código da questão: 42572 As ferramentas que apresentam características OLAP passaram a ser referenciadas como ferramentas OLAP. As ferramentas OLAP podem ser classificadas de acordo com a estratégia de armazenamento, sendo chamadas de OLAP Multidimensional (MOLAP), OLAP Relacional (ROLAP), OLAP Híbrido e OLAP Web. Resolução comentada: um DW tem níveis de granularidade elevados por conta da necessidade de sumarizações para refletir a realidade dos dados do negócio. As sumarizações são necessárias, pois refletem medidas resumidas ou condessadas, com alguma transformação dos dados originais. Sem essa técnica, seria impraticável obter respostas que refletem o comportamento de um conjunto de dados. Sumarizações podem ser somas, médias, medianas, quartis, etc. Resolução comentada: A afirmativa III está incorreta porque a cardinalidade representa o grau de relacionamento entre as entidades no modelo ER. As demais, estão corretas. 01/12/2020 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2322484/2343524 6/8 8) Assinale a alternativa correta que descreve as características das ferramentas do tipo MOLAP. Alternativas: O MOLAP refere-se à utilização de banco de dados com características multidimensionais, permitindo a navegação com níveis de detalhamento em tempo real, a partir da combinação das dimensões do cubo, proporcionando análises sofisticadas com ótimo desempenho. CORRETO O MOLAP refere-se à utilização de banco de dados relacional para implementar soluções OLAP, permitindo análise multidimensional dos dados que estão armazenados em uma base de dados relacional, sendo feito todo o processamento no servidor da base de dados e depois gerados os comandos SQL e as tabelas temporárias. O MOLAP refere-se à utilização de banco de dados com características multidimensionais, permitindo operações que ocorrem quando o usuário navega pelas informações contidas entre dimensões de esquemas diferentes, acessados remotamente. O MOLAP refere-se à abordagem de uso combinado de um banco de dados relacional com um banco de dados orientado a objetos, onde as estruturas relacionais são utilizadas para os dados com maior granularidade e as estruturas orientadas a objetos são utilizadas para dados com menor granularidade. O MOLAP refere-se à utilização da ferramenta OLAP em ambiente remoto, disparando consultas via um navegador web para o servidor que, por sua vez, retorna o cubo processado para análise do usuário. Código da questão: 42604 O modelo de relacionamento entre _______________ captura as relações entre elas do mundo real. É usado para projetar um _____________conceitual. Auxilia nas visões dos relacionamentos entre as tabelas e também na construção de novas visões em um DW. Assinale a alternativa que completa adequadamente as lacunas acima: Alternativas: Resolução comentada: O MOLAP refere-se à utilização de banco de dados com características multidimensionais, permitindo a navegação com níveis de detalhamento em tempo real, a partir da combinação das dimensões do cubo, proporcionando análises sofisticadas com ótimo desempenho. Segundo Machado (2013), em um banco de dados multidimensional, os cruzamentos de valores são realizados automaticamente, agilizando a visualização multidimensional das informações sob o ponto de vista de todas as dimensões. A forma de acesso e de agregação dos dados faz com que esta ferramenta tenha um excelente desempenho. 01/12/2020 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2322484/2343524 7/8 9) 10) Fontes de dados; Banco de dados. Entidades; SGBD. Tabelas; SGBD. Entidades; Banco de dados. CORRETO Fontes de dados; Atributos. Código da questão: 42571 Em um processo de tomada de decisões, a disponibilidade e o fácil acesso às informações organizacionais contribuem para uma decisão de sucesso. Assim, a extração eficaz de informações de um ambiente de Data Warehouse (DW) para gerar conhecimento é proporcionada por ferramentas que disponibilizam recursos avançados para suportar operações sobre o conjunto de dados multidimensional. Pela maior popularidade do uso das ferramentas de acesso a um DW, destaca-se as ferramentas __________________________. Assinale a alternativa correta que indica o termo que preenche a lacuna acima: Alternativas: Staging Area. Operational Data Store (ODS). Online Analytical Processing (OLAP). CORRETO Online Transaction Processing (OLTP). Business Inteligence (BI). Código da questão: 42605 Segundo Kimball (1998), o esquema de dados mais utilizado na especificação de um Data Warehouse é o Esquema Estrela (Star Schema) composto por tabelas de Fatos e de Dimensões que proporcionam uma Resolução comentada: O modelo de relacionamento entre entidades, um modelo MER, captura as relações entre essas entidades, refletindo o mundo real. O MER é usado para projetar um banco de dados de maneira conceitual, o que contribui para as visões dos relacionamentos entre as tabelas e também na construção de novas visões em um DW. Resolução comentada: Machado (2013) descreve que as ferramentas OLAP surgiram com os sistemas de apoio à decisão para fazerem a consulta e análise dos dados dos DW, sendo às aplicações às quais os usuários têm acesso para extrair os dados de suas bases e construir os relatórios com recursos que atendem os gestores. 01/12/2020 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2322484/2343524 8/8 visão multidimensional de grande volume de dados. (KIMBALL, R. et al. The data warehouse lifecycle toolkit. New York: John Wiley & Sons, 1998). Sobre as características das tabelas de Fatos e de Dimensões, julgue os itens a seguir: I. O contexto das funcionalidades que determinam os processos de negócio de uma empresa é especificado em tabelas de Fatos. II. A tabela de Fatos é a principal tabela de um esquema dimensional que geralmente contém vários fatos que indicam valores para análise dimensional. III. A tabela de Fatos relaciona-se com as tabelas de Dimensões,que representam as entidades de negócio e constituem as estruturas de entrada que realizam os filtros de valores aplicados na manipulação dos fatos. IV. As tabelas de Dimensões contêm a descrição textual do negócio, representada pelos atributos e com a indicação da chave primária, que serve como base para manter a integridade referencial quando relacionada com a tabela de Fatos. V. As tabelas de Dimensões representam as características numéricas e classificatórias que fornecem as perspectivas adicionais a um determinado fato por meio de seus atributos. Estão corretos os itens: Alternativas: I – II – III – IV. CORRETO I – II – III. I – II – III – IV – V. II – IV – V. I – III – V. Código da questão: 42592 Resolução comentada: os itens corretos são I, II, III e IV. O item V está errado porque as tabelas de Dimensões representam as características descritivas/textuais que fornecem as perspectivas adicionais a um determinado fato por meio de seus atributos. Arquivos e Links
Compartilhar