Baixe o app para aproveitar ainda mais
Prévia do material em texto
Integração e fluxo de dados (ETL) Professor(a): Washington Henrique Carvalho Almeida (Mestrado acadêmico) 1) 2) 3) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! São subcategorias de classificação de ferramentas ETL: I. Ferramentas ETL Pura II. Ferramenta Base de dados integrada III. Ferramenta Business Intelligence Integrada IV. Ferramenta de Produto de Nicho V. ETL automatizada São verdadeiras: Alternativas: I, II, III e IV CORRETO I, II, III e V I, III e V I, III, IV e V I, II, IV e V Código da questão: 42827 De acordo com Kimbal e Caserta (2009), a conformação ou integração de dados diz respeito a criação de dimensões e instâncias de fatos configuradas, combinando as melhores informações de várias fontes de dados em uma visão mais abrangente. Dentre um dos problemas para conformação, estão dados duplicados e vários atributos podendo ser obtidos a partir de um outro atributo ou conjunto de valores. Assinale a alternativa que apresente, corretamente, qual o problema descrito acima: Alternativas: Redundância. CORRETO Unidades diferentes. Identificação de Entidades. Valores que os campos podem assumir. Conflito de Valores. Código da questão: 42844 A transformação de dados consiste em transformar ou consolidar os dados em um formato mais adequado para o data warehouse. São considerados tipos de transformação: ( ) Suavização. ( ) Agregação. ( ) Generalização. Resolução comentada: Apenas a V é incorreta. São subcategorias de classificação de ferramentas ETL as ferramentas ETL Puras, ferramenta ETL base de dados integrada, ferramenta ETL Business Intelligence integrada e ferramenta ETL produto de nicho. Resolução comentada: A redundância é um dos problemas que trata dados duplicados e vários atributos, podendo ser obtidos a partir de outro atributo ou conjunto de valores. 4) 5) ( ) Normalização. ( ) Redundância. Assinale a alternativa que contenha a sequência correta: Alternativas: V – V – V – F – F V – V – F – V – V V – V – V – V – V V – V – F – V – F V – V – V – V – F CORRETO Código da questão: 42847 I. Na arquitetura de duas camadas há uma economia em relação a arquitetura de três camadas PORQUE II. Na arquitetura de duas camadas o servidor de aplicação e banco de dados é executado fisicamente na mesma plataforma de hardware que o data warehouse. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: A primeira asserção está incorreta e a segunda está incorreta A primeira asserção está incorreta e a segunda está correta. A primeira asserção está correta e a segunda está incorreta. As duas asserções estão corretas e a segunda justifica a primeira CORRETO As duas asserções estão corretas e a segunda não justifica a primeira. Código da questão: 42822 "Nessa atividade são identificadas as prováveis fontes de dados que acredite apoiar as decisões necessárias, verificando nessas fontes de dados elementos que sejam úteis para os dados do usuário final, sendo esses elementos de dados a entrada para a criação do perfil de dados”. Assinale a alternativa que apresente, corretamente, a atividade descrita: Alternativas: Receber instruções para linhagem dos dados e regras de negócios. Analisar sistemas de origem com ferramenta de criação de perfil de dados. Criar um plano. Validar cálculos e fórmulas. Identificar fonte de dados candidatas. CORRETO Resolução comentada: São técnicas para transformação de dados a suavização, agregação, generalização e normalização. A redundância é um tipo de problema relacionado à conformação de dados. Resolução comentada: As duas asserções estão corretas e a segunda justifica a primeira. Na arquitetura de duas camadas há uma economia em relação a arquitetura de três camadas porque na arquitetura de duas camadas o servidor de aplicação e banco de dados é executado fisicamente na mesma plataforma de hardware que o data warehouse. Resolução comentada: A identificação de fonte de dados candidatas visa avaliar as prováveis fontes de dados que se acredita serem úteis no processo de tomada de decisões. 6) 7) 8) Código da questão: 42834 O Capture, Transform e Flow (CTF) é uma categoria relativamente nova de ferramentas de integração de dados, projetada para simplificar o movimento de dados em tempo real por meio de tecnologias de bancos de dados heterogêneos. Porque A camada de aplicativo dos aplicativos transacionais é ignorada e, em vez disso, as trocas diretas do banco de dados com o banco de dados são executadas. Alternativas: As duas asserções estão corretas e a segunda não justifica a primeira. CORRETO A primeira asserção está correta e a segunda está incorreta. As duas asserções estão corretas e a segunda justifica a primeira. A primeira asserção está incorreta e a segunda está correta. A primeira asserção está incorreta e a segunda está incorreta. Código da questão: 42858 A ________________ de dados é a ________________ de dados de ______________ fontes em uma _________________única e coerente Assinale a alternativa que completa adequadamente as lacunas acima: Alternativas: conformação – combinação – semelhantes – base de dados. conformação – limpeza – diferentes – base de dados. conformação – transformação – diferentes – base de dados. combinação – conformação – diferentes – base de dados. conformação – combinação – diferentes – base de dados. CORRETO Código da questão: 42845 São atividades de integração de dados: ( ) Identificar os sistemas de origem; ( ) Compreender os sistemas de origem; ( ) Criar e registrar a lógica de correspondência; ( ) Realizar a limpeza dos dados; ( ) Carregar a dimensão conformada. Assinale a alternativa que contenha a sequência correta: Alternativas: V – V – V – F – V CORRETO V – V – V – V – V V – V – V – V – F Resolução comentada: O Capture, Transform e Flow (CTF) é uma categoria relativamente nova de ferramentas de integração de dados projetada para simplificar o movimento de dados em tempo real por meio de tecnologias de bancos de dados heterogêneos. A camada de aplicativo dos aplicativos transacionais é ignorada e, em vez disso, as trocas diretas do banco de dados com o banco de dados são executadas. A segunda afirmação é a consequência do uso da arquitetura, sendo determinada no projeto do CTF. Resolução comentada: A conformação de dados é utilizada para combinar de dados de diferentes fontes em uma base de dados única e coerente. 9) 10) V – V – F – V – F V – V – V – F – F Código da questão: 42837 O componente final de todas as _______________, além da _________________ e da ____________________ é o conjunto de _____________________. Assinale a alternativa que completa adequadamente as lacunas acima: Alternativas: dimensões – chave substituta – chave natural – atributos descritivos. dimensões – chave primária – chave estrangeira – atributos descritivos. dimensões – chave primária – chave substituta – atributos descritivos.. dimensões – chave primária – chave natural – atributos descritivos. CORRETO dimensões – chave estrangeira – chave natural – atributos descritivos. Código da questão: 42850 Existem vários métodos para identificar os candidatos de registro alterados para carga de ETL do microbatch no data warehouse em tempo real: ( ) Timestamps. ( ) Tabelas de log ETL. ( ) Log dos SGBD. ( ) Incompatibilidade de dados. ( ) Monitores de Rede. Assinale a alternativa que contenha a sequência correta: Alternativas: V – V – V – F – F. V – V – V – F – V. CORRETO V – V – F – V – F. V – V – F – V – V. V – V – V – V – V. Código da questão: 42857 Resolução comentada: São atividades de integração de dados identificar o sistema de origem, compreender osistema de origem, criar e registrar a lógica de correspondência, estabelecer as regras de negócio de atributos não chave e carregar dimensão conformada. Resolução comentada: As palavras que completam as lacunas são: “dimensões – chave primária – chave natural – atributos descritivos”. Um conjunto de atributos descritivos, assim como a chave primária e a chave natural, são considerados componentes finais de todas as dimensões. Resolução comentada: Os vários métodos para identificar os candidatos de registro alterados para carga de ETL do microbatch no data warehouse em tempo real são: Timestamps (método que permite gravações frequentes de registros de data e hora nos sistemas para as alterações e leituras frequentes), tabelas de log ETL (tabelas que contém o identificados do registro novo ou alterado), Log dos SGBD (usados para identificar novas transações e transações alteradas) e Monitores de Rede (utilitários que monitoram algum conjunto de tráfego em um rede, filtrando e registrando o tráfego). Arquivos e Links
Compartilhar