Baixe o app para aproveitar ainda mais
Prévia do material em texto
22/11/2020 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2246876/2059361 1/5 Integração e fluxo de dados (ETL) Professor(a): Thiago Salhab Alves (Mestrado acadêmico) 1) 2) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! Existem vários métodos para identificar os candidatos de registro alterados para carga de ETL do microbatch no data warehouse em tempo real: ( ) Timestamps. ( ) Tabelas de log ETL. ( ) Log dos SGBD. ( ) Incompatibilidade de dados. ( ) Monitores de Rede. Assinale a alternativa que contenha a sequência correta: Alternativas: V – V – V – F – F. V – V – F – V – F. V – V – F – V – V. V – V – V – V – V. V – V – V – F – V. CORRETO Código da questão: 42857 São atividades de integração de dados: ( ) Identificar os sistemas de origem; ( ) Compreender os sistemas de origem; ( ) Criar e registrar a lógica de correspondência; ( ) Realizar a limpeza dos dados; ( ) Carregar a dimensão conformada. Assinale a alternativa que contenha a sequência correta: Alternativas: V – V – V – V – V V – V – V – F – F V – V – V – F – V CORRETO V – V – F – V – F V – V – V – V – F Código da questão: 42837 Resolução comentada: Os vários métodos para identificar os candidatos de registro alterados para carga de ETL do microbatch no data warehouse em tempo real são: Timestamps (método que permite gravações frequentes de registros de data e hora nos sistemas para as alterações e leituras frequentes), tabelas de log ETL (tabelas que contém o identificados do registro novo ou alterado), Log dos SGBD (usados para identificar novas transações e transações alteradas) e Monitores de Rede (utilitários que monitoram algum conjunto de tráfego em um rede, filtrando e registrando o tráfego). Resolução comentada: São atividades de integração de dados identificar o sistema de origem, compreender o sistema de origem, criar e registrar a lógica de correspondência, estabelecer as regras de negócio de atributos não chave e carregar dimensão conformada. 22/11/2020 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2246876/2059361 2/5 3) 4) 5) O uso de banco de dados é essencial para o processo de manipulação de dados, porém para fins analíticos é de difícil uso, sendo indicado o uso de um data warehouse. Assinale a alternativa que apresenta, corretamente, o principal objetivo de um data warehouse: Alternativas: Recuperação de dados Auxiliar à tomada de decisões CORRETO Alteração de dados Armazenamento de dados Transformação de dados Código da questão: 42817 As ferramentas ___________________ fornecem características de __________________, suportam vários arquivos de _______________ de entrada ou saída, funções de _________________ e banco de dados ________________. Assinale a alternativa que completa adequadamente as lacunas acima: Alternativas: ETL baseado em ferramenta – análise – banco de dados – transformação - nativo ETL codificado manualmente – transformação – banco de dados – transformação - nativo. ETL baseado em ferramenta – transformação – banco de dados – transformação - nativo. CORRETO ETL codificado manualmente– implementação – banco de dados – transformação - nativo. ETL codificado manualmente– análise – banco de dados – transformação - nativo. Código da questão: 42826 I. Na arquitetura de duas camadas há uma economia em relação a arquitetura de três camadas PORQUE II. Na arquitetura de duas camadas o servidor de aplicação e banco de dados é executado fisicamente na mesma plataforma de hardware que o data warehouse. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: A primeira asserção está incorreta e a segunda está incorreta A primeira asserção está correta e a segunda está incorreta. A primeira asserção está incorreta e a segunda está correta. As duas asserções estão corretas e a segunda não justifica a primeira. As duas asserções estão corretas e a segunda justifica a primeira CORRETO Resolução comentada: O principal objetivo de um data warehouse é auxiliar as organizações na tomada de decisões, pois fornece dados que podem ser utilizados para fins analíticos. Resolução comentada: São características das ferramentas ETL baseadas em ferramenta o processo de transformação de dados, com suporte a vários arquivos de banco de dados, de entrada ou saída, com funções de transformação e suporte a banco de dados nativo. Resolução comentada: As duas asserções estão corretas e a segunda justifica a primeira. Na arquitetura de duas camadas há uma economia em relação a arquitetura de três camadas porque na arquitetura de duas camadas o servidor de aplicação e banco de dados é 22/11/2020 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2246876/2059361 3/5 6) 7) 8) Código da questão: 42822 Dados dimensionais para dimensões grandes e complexas como cliente, fornecedor ou produto são frequentemente extraídos de várias fontes em diferentes momentos. Isso requer atenção especial ao reconhecimento da mesma entidade dimensional em vários sistemas de origem. Assinale a alternativa que apresente, corretamente, um conflito que pode ocorrer. Alternativas: Conflito com dimensões grandes. Conflito de data e hora Conflito em descrições sobrepostas. CORRETO Conflito de extração de dados. Conflito de chaves. Código da questão: 42853 O Capture, Transform e Flow (CTF) é uma categoria relativamente nova de ferramentas de integração de dados, projetada para simplificar o movimento de dados em tempo real por meio de tecnologias de bancos de dados heterogêneos. Porque A camada de aplicativo dos aplicativos transacionais é ignorada e, em vez disso, as trocas diretas do banco de dados com o banco de dados são executadas. Alternativas: A primeira asserção está incorreta e a segunda está correta. As duas asserções estão corretas e a segunda não justifica a primeira. CORRETO A primeira asserção está incorreta e a segunda está incorreta. As duas asserções estão corretas e a segunda justifica a primeira. A primeira asserção está correta e a segunda está incorreta. Código da questão: 42858 São subcategorias de classificação de ferramentas ETL: I. Ferramentas ETL Pura II. Ferramenta Base de dados integrada III. Ferramenta Business Intelligence Integrada IV. Ferramenta de Produto de Nicho V. ETL automatizada São verdadeiras: executado fisicamente na mesma plataforma de hardware que o data warehouse. Resolução comentada: Ao se utilizar dados dimensionais para dimensões grandes e complexas, é necessário uma atenção especial para reconhecer da mesma entidade dimensional em vários sistemas de origem um conflito em descrições sobrepostas. Resolução comentada: O Capture, Transform e Flow (CTF) é uma categoria relativamente nova de ferramentas de integração de dados projetada para simplificar o movimento de dados em tempo real por meio de tecnologias de bancos de dados heterogêneos. A camada de aplicativo dos aplicativos transacionais é ignorada e, em vez disso, as trocas diretas do banco de dados com o banco de dados são executadas. A segunda afirmação é a consequência do uso da arquitetura, sendo determinada no projeto do CTF. 22/11/2020 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2246876/2059361 4/5 9) 10) Alternativas: I, II, IV e V I, II, III e V I, II, III e IV CORRETO I, III, IV e V I, III e V Código da questão: 42827 I. O Data Flow é uma tarefa do fluxo de controle usada quando se necessita realizar a transferência de dados PORQUE II. O Data Flow é utilizado para importar, exportar e transformar dados, tendo como componentes Data Flow Sources, Data FlowTransformations e Data Flow Destinations. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: A primeira asserção está incorreta e a segunda está correta. A primeira asserção está incorreta e a segunda está incorreta As duas asserções estão corretas e a segunda justifica a primeira As duas asserções estão corretas e a segunda não justifica a primeira. CORRETO A primeira asserção está correta e a segunda está incorreta. Código da questão: 42829 Sobre as ferramentas ETL Puras: ( ) são produtos independentes da base de dados e ferramenta de BI ( ) são produtos dependentes da base de dados e ferramenta de BI ( ) permitem a migração para diferentes base de dados sem mudar o processo de integração ( ) permitem a migração para diferentes base de dados mudando o processo de integração ( ) as empresas não precisam depender de nenhum outro produto para a funcionalidade oferecida Assinale a alternativa que contenha a sequência correta: Alternativas: V – V – V – F – F V – V – F – V – F V – V – V – F – V V – V – V – V – V V – F – V – F – V CORRETO Resolução comentada: Apenas a V é incorreta. São subcategorias de classificação de ferramentas ETL as ferramentas ETL Puras, ferramenta ETL base de dados integrada, ferramenta ETL Business Intelligence integrada e ferramenta ETL produto de nicho. Resolução comentada: As duas asserções estão corretas e a segunda não justifica a primeira. O Data Flow é uma tarefa do fluxo de controle usada quando se necessita realizar a transferência de dados. A segunda asserção explica para que o Data Flow é usado e quais seus componentes. . Resolução comentada: As afirmativas 2 e 4 são falsas. As ferramentas de ETL Pura são produtos independentes da base de dados e ferramenta ETL de Business Intelligence que se pretende usar. As empresas não precisam depender de nenhum outro produto para a funcionalidade oferecida e permitem a migração para diferentes bases de dados sem mudar o processo de integração. 22/11/2020 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2246876/2059361 5/5 Código da questão: 42828 Arquivos e Links
Compartilhar