Baixe o app para aproveitar ainda mais
Prévia do material em texto
Cosmos • AVA Business intelligence, big data e analytics - ciência de dados Modelagem e arquitetura do DW (Data Warehouse) Professor(a): Marise de Barros Miranda Gomes (Doutorado) 1) 2) 3) 4) 5) 6) 7) 8) 9) 10) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! Sobre o Modelo Entidade Relacionamento (MER), considere as seguintes afirmações: I. Dados como nome, endereço, produto são exemplos de entidade. II. Cada entidade possui atributos. III. A cardinalidade representa a métrica entre as entidades. IV. A tabela de fatos central se conecta a várias tabelas dimensionais. V. É o modelo mais amplamente utilizado em nível de abstração de projetos de banco de dados, descriminando as características dos dados, chave primária e estrangeira. São verdadeiras: Alternativas: Código da questão: 42572 O banco de dados analítico é diferente do banco de dados operacional, transacional ou OLTP (Online Transaction Processing), usado para processar as transações. Embora os bancos de dados transacionais possam ser usados para suportar o armazenamento de dados e as aplicações de BI, não se recomenda seu uso por questões de integridade e escalabilidade. I. O banco de dados convencional deve ser preservado, e o banco de dados analíticos deve estar em outro schema. PORQUE II. Um banco de dados analítico tem uma estrutura baseada em coluna, tornando os cálculos individuais muito rápidos. Já os bancos de dados transacionais dependem de armazenamento de dados baseado em linha, impróprio para operar com grandes volumes de dados. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: Código da questão: 50534 Na concepção de Poe, Klauer, Brobst (1998), o Esquema Estrela possui uma estrutura simples com poucas tabelas e associações bem definidas, aproximando do contexto do modelo de negócio e facilitando a geração de consultas complexas de forma intuitiva e interativa, por meio dos vários parâmetros de consultas. Neste esquema, o assunto principal fica ao centro do esquema, representada pela tabela de Fatos, e suas características, as dimensões, representadas por tabelas de Dimensões, ficam posicionadas ao seu redor, permitindo a leitura e compreensão até mesmo de usuários finais que não estão adaptados com estruturas de banco de dados. (POE V.; KLAUER P.; BROBST S. Building a data warehouse for decision support. New Jersey: Prentice Hall PTR, 1998). Sobre as principais vantagens do Esquema Estrela, julgue os itens a seguir, indicando “V” para o item verdadeiro e “F” para o item falso: 1. ( ) A estrutura padronizada e regular do esquema é bastante simples, faciliatando a apresentação, o desempenho das consultas geradas e a compreensão até mesmo de usuários finais que não estão adaptados com estruturas de banco de dados. 2. ( ) As consultas ocorrem inicialmente nas tabelas de Dimensões e depois nas tabelas de Fatos, assegurando a consistência dos dados por meio de uma estrutura de chaves que garante o acesso aos dados com melhor desempenho. 3. ( ) A aplicação da técnica de normalização nas tabelas de Dimensões aumenta o número de dimensões, consequentemente diminuindo a performance das consultas dinâmicas. 4. ( ) A facilidade e a flexibilidade da inclusão de novos elementos de dados, a partir do relacionamento da tabela de Fatos com uma nova tabela de Dimensão, bem como o acréscimo de novas colunas às mesmas tabelas de Dimensões. 5. O suporte para transformar e proceder à carga dos dados, para recuperar, analisar e extrair os dados dos sistemas transacionais. Assinale a alternativa correta: Alternativas: Código da questão: 42602 Rob e Coronel (2011) enfatizam que a mineração de dados é proativa, ou seja, as ferramentas buscam automaticamente identificar anomalias e possíveis relacionamentos entre os dados, identificando problemas ainda não identificados pelos usuários estratégicos para, assim, prover o conhecimento e aplica-lo às necessidades dos negócios, sendo que a mineração de dados contempla quatro fases básicas. (ROB, P.; CORONEL, C. Sistemas de banco de dados: projeto, implementação e administração. 8. ed. São Paulo: Cengage Learning, 2011). Sobre as fases do processo de mineração de dados, julgue os itens a seguir: I. A primeira fase, seleção dos dados, refere-se à seleção dos principais conjuntos de dados e do tratamento de limpeza e integração desses dados a serem utilizados pela operação de transformação de dados. II. A segunda fase, análise e classificação dos dados, refere-se ao estudo dos dados para identificar características e padrões comuns com a aplicação de algoritmos para encontrar análises, vínculos ou dependências, padrões, tendências e desvios de dados. III. A terceira fase, aquisição do conhecimento, refere-se à seleção dos algoritmos mais comuns de modelagem e aquisição de conhecimentos, baseados em redes neurais, lógica indutiva, árvores de decisão, classificação ou regressão, etc., e a definição desses algoritmos com possível interação dos usuários finais. IV. A quarta fase, transformação dos dados, refere-se às descobertas de mineração de dados para garantirem o comportamento futuro e adquirirem conhecimento, para os usuários estratégicos analisarem seus negócios, por exemplo, o provável lançamento de um produto novo ou de uma campanha de marketing. Estão corretos os itens Alternativas: Código da questão: 42613 A mineração de dados é comumente classificada pela sua capacidade em realizar tarefas para diferentes domínios. A literatura indica que não existe um consenso de denominação quanto à classificação, funcionalidades, tarefas, métodos ou técnicas de mineração de dados. Contudo, Fayyad et al. (1996) apresentam alguns métodos de mineração de dados que têm como objetivo a predição ou descrição dos resultados: (FAYYAD, U.M. et al. Advances in knowledge discovery and data mining. California: AAAI Press, 1996). Sobre as técnicas de Data Mining, julgue os itens a seguir, indicando “V” para o item verdadeiro e “F” para o item falso: 1. ( ) Regressão: usa-se para associar ou classificar um item a uma ou a várias categorias pré-definidas, derivando uma regra que possa ser usada para classificar uma observação, referente a um conjunto de dados identificados que são categorizados por um assunto. 2. ( ) Análise de Séries Temporais: refere-se a tarefa similar à classificação, porém é usada quando os dados são identificados por predição de valores numéricos, considerados variáveis independentes ou exploratórias, e não pela categorização dos itens analisados, sendo possível verificar o eventual relacionamento funcional que possa existir entre duas ou mais variáveis quantitativas. 3. ( ) Agrupamentos (Clusters): refere-se à tarefa de segmentar um conjunto de dados em grupos diferentes, cujos itens são semelhantes, ou seja, subdivide o conjunto de dados em um conjunto menor, sendo similar no comportamento dos atributos de segmentação, descobrindo grupos diferentes entre o conjunto de dados selecionado. 4. ( ) Sumarização: refere-se à tarefa de descrever padrões e tendências que são reveladas por subconjuntos de dados compactados, a partir de um subconjunto de dados com características similares, demostrando as relações funcionais entre as variáveis definidas para a análise exploratória do subconjunto de dados 5. ( ) Análise de Séries Temporais: refere-se a tarefa similar à regra de associação com objetivo de aplicar algum tipo de padrão (tendências, variações sazonais, variações cíclicas e variações irregulares) no conjunto de dados, para determinar que tipos de sequências podem ocorrer em um determinado período. Assinale a alternativa que indica a sequência correta:Alternativas: Código da questão: 42615 As organizações precisam responder de maneira ágil e eficiente às mudanças e oportunidades de mercado. Muitas empresas iniciam o desenvolvimento de um Data Warehouse (DW), contemplando conjuntos de dados mais gerenciáveis e categorizados por assunto, para atenderem às necessidades de pequenos grupos de usuários ou níveis funcionais da empresa, investindo, assim, na implementação de Data Marts. Sobre Data Marts, assinale a alternativa correta: Alternativas: Código da questão: 42580 Em um processo de tomada de decisões, a disponibilidade e o fácil acesso às informações organizacionais contribuem para uma decisão de sucesso. Assim, a extração eficaz de informações de um ambiente de Data Warehouse (DW) para gerar conhecimento é proporcionada por ferramentas que disponibilizam recursos avançados para suportar operações sobre o conjunto de dados multidimensional. Pela maior popularidade do uso das ferramentas de acesso a um DW, destaca-se as ferramentas __________________________. Assinale a alternativa correta que indica o termo que preenche a lacuna acima: Alternativas: Código da questão: 42605 O DW tem uma composição que separa a carga de trabalho para análise da carga de trabalho para transações. No primeiro caso, permite a consolidação de diferentes fontes nessa carga de trabalho analítica. I. Um DW possui um conjunto característico personalizado, distintamente dos ambientes convencionais das organizações. PORQUE II. Há como replicar um DW de uma empresa para outra. Cada projeto de DW não é único em sua essência, mas no seu modo de operação e aplicação. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: Código da questão: 42579 Segundo Rob e Coronel (2011), a característica mais marcante das modernas ferramentas OLAP é a capacidade de análise multidimensional. Os dados são processados e visualizados em uma estrutura multidimensional, sendo especialmente atrativos para os tomadores de decisões de negócios, sendo que, enquanto o DW mantém dados de suporte, a decisões integrados, orientados por assunto, variáveis no tempo e não voláteis, o sistema OLAP fornece o front end por meio do qual os usuários finais acessam e analisam esses dados. (ROB, P.; CORONEL, C. Sistemas de banco de dados: projeto, implementação e administração. 8. ed. São Paulo: Cengage Learning, 2011). Sobre os critérios que uma ferramenta OLAP deve ter, julgue os itens a seguir: I. Dimensionalidade genérica: a ferramenta deve proporcionar condições ao usuário para executar manipulações ou cálculos entre as dimensões. II. Manipulação de matriz esparsa dinâmica: para qualquer matriz esparsa de dados, existe um e somente um esquema físico, o qual provê a máxima eficiência e operacionalidade. III. Flexibilidade nas consultas: a análise e a apresentação dos dados tornam-se mais simples quando linhas, colunas e células, que vão ser comparadas visualmente, são organizados por agrupamentos lógicos. IV. Dimensões e níveis de agregação limitados: um modelo analítico comum deve conter uma matriz com dimensões de dados definidas entre quatro a cinco dimensões. Estão corretos os itens: Alternativas: Código da questão: 42607 As informações assumem o papel do principal patrimônio ativo de uma organização. Assim, tornar as informações corporativas acessíveis para entendimento e utilização das áreas estratégicas das organizações é um fator fundamental para a tomada de decisão assertiva. As ferramentas Online Analytical Processing (OLAP) surgiram com os sistemas de apoio à decisão para viabilização e extração eficaz de informações de um ambiente de Data Warehouse (DW). Sobre as características das ferramentas OLAP, julgue os itens a seguir: I. Os dados são processados e visualizados em uma estrutura multidimensional. II. Estrutura logicamente dados multidimensionais na forma de um cubo. III. Efetua operações de manipulação de dados individuais, por meio dos comandos de inserção, atualização e exclusão. IV. Proporciona respostas rápidas e consistentes às consultas interativas executadas pelos usuários. Estão corretos os itens: Alternativas: Código da questão: 42606 Enviar (Restam 4 tentativas) II – III – V. I – II – III. I – IV – V. I – IIII. I – II – IV – V. CORRETO A primeira e a segunda asserções estão incorretas. A primeira e a segunda asserções estão corretas, e a segunda complementa a primeira. CORRETO A primeira asserção está incorreta e a segunda está correta A primeira e a segunda asserções estão corretas, mas a segunda não tem relação com a primeira. A primeira asserção está correta e a segunda está incorreta. F – V – F – V – F. V – V – V – V – V. V – V – F – V – F. CORRETO F – F – F – F – F. F – F – V – F – V. II – III. III – IV. I – II – IV. I – II. I – II – III. INCORRETO F – F – V – V – V. CORRETO F – F – F – F – F. V – V – V – V – V V – V – F – V – F. F – V – F – V – F. Um Data Mart refere-se ao processo de explorar grandes quantidades de informações, a partir de um conjunto de ferramentas de mineração de dados que se utilizam de algoritmos de aprendizagem baseados em redes neurais e estatísticas. Um Data Mart é um ambiente intermediário de armazenamento e processamento dos dados para o processo de extração, transformação e carga ETL (Extraction, Transformation and Load). Um Data Mart é um depósito de dados especializado, orientado por assunto, integrado, volátil e variável no tempo, a partir de dados extraídos de um DW, com o objetivo específico de dar suporte a rápido determinado grupo ou função de usuários. CORRETO Um Data Mart são sistemas transacionais que registram todas as transações operacionais das organizações, sendo utilizados no processamento dos dados que são gerados diariamente por meio dos sistemas informacionais das empresas. Um Data Mart é um ambiente de processamento analítico, caracterizado por consultas complexas, estruturadas e frequentes, envolvendo agregação ou relacionamento de dados para gerar informações que apoiam processos decisórios. Online Analytical Processing (OLAP). CORRETO Business Inteligence (BI). Operational Data Store (ODS). Online Transaction Processing (OLTP). Staging Area. A primeira asserção está incorreta e a segunda justifica a primeira. A primeira asserção está incorreta e a segunda está correta. A primeira asserção está correta e a segunda incorreta. CORRETO A primeira e a segunda asserções estão corretas, mas a segunda não justifica a primeira. A primeira e a segunda asserções estão incorretas. III – IV. I – II – III. CORRETO II – III. I – II – III – IV. I – II. II – III. I – II – IV. I – II – III. INCORRETO III – IV. I – II. Arquivos e Links https://kroton.platosedu.io/lms/m/ https://kroton.platosedu.io/lms/m/ http://www.biblioteca-virtual.com/ https://kroton.platosedu.io/lms/m/mensagem/index
Compartilhar