Prévia do material em texto
Integração e fluxo de dados (ETL) Professor(a): Washington Henrique Carvalho Almeida (Mestrado acadêmico) 1) 2) 3) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! São características fundamentais dos data warehouse em relação aos dados: I. Orientado por assunto II. Integrado III. Com apenas dados históricos. IV. Variável no tempo. V. Volátil. São verdadeiras: Alternativas: I, II e IV CORRETO I, II, IV e V I, II, III e IV I, III e V I, II, III, IV e V Código da questão: 42820 O uso de banco de dados é essencial para o processo de manipulação de dados, porém para fins analíticos é de difícil uso, sendo indicado o uso de um data warehouse. Assinale a alternativa que apresenta, corretamente, o principal objetivo de um data warehouse: Alternativas: Armazenamento de dados Recuperação de dados Alteração de dados Auxiliar à tomada de decisões CORRETO Transformação de dados Código da questão: 42817 O Capture, Transform e Flow (CTF) é uma categoria relativamente nova de ferramentas de integração de dados, projetada para simplificar o movimento de dados em tempo real por meio de tecnologias de bancos de dados heterogêneos. Porque A camada de aplicativo dos aplicativos transacionais é ignorada e, em vez disso, as trocas diretas do banco de dados com o banco de dados são executadas. Alternativas: A primeira asserção está incorreta e a segunda está correta. As duas asserções estão corretas e a segunda não justifica a primeira. CORRETO As duas asserções estão corretas e a segunda justifica a primeira. A primeira asserção está correta e a segunda está incorreta. Resolução comentada: As afirmativas III e V estão incorretas. Os data warehouse apresentam como características fundamentais dados que devem ser orientados por assunto, integrados e variáveis no tempo. Os data warehouse devem possuir dados atuais e dados históricos e devem ser não voláteis. . Resolução comentada: O principal objetivo de um data warehouse é auxiliar as organizações na tomada de decisões, pois fornece dados que podem ser utilizados para fins analíticos. 26/04/2024, 15:27 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3111263/8977766 1/4 4) 5) 6) A primeira asserção está incorreta e a segunda está incorreta. Código da questão: 42858 Um ________________ é um conjunto de dados utilizado no suporte ________________, sendo um repositório de dados _________________, orientado por assunto, _____________, variável no ______________ e _______________. Assinale a alternativa que completa adequadamente as lacunas acima: Alternativas: data warehouse - à tomada de decisões – atuais e históricos – integrado - tempo – não volátil. CORRETO data warehouse - à tomada de decisões – atuais e históricos – integrado - espaço – não volátil. data warehouse - à tomada de decisões – históricos – integrado - tempo – não volátil. data warehouse - à tomada de decisões – atuais e históricos – integrado - tempo – volátil. sistema BI - à tomada de decisões – atuais e históricos – integrado - tempo – não volátil. Código da questão: 42818 Sobre o processo de ETL, considere as seguintes afirmações: ( ) É realizado o processo de extração dos dados ( ) É realizado o processo de transformação dos dados ( ) É realizado o processo de carga dos dados ( ) É realizado o processo de extração de apenas uma fonte de dados ( ) É realizado o processo apenas de forma tradicional e sem ferramentas de transformação de dados Assinale a alternativa que contenha a sequência correta: Alternativas: V – V – V – F – F CORRETO V – V – V – V – F V – V – V – F – V V – V – V – V – V V – V – F – V – F Código da questão: 42821 Um ___________ é uma variação ou ____________ aleatório observado em uma ______________ medida, podendo introduzir erros nos ____________. Assinale a alternativa que completa adequadamente as lacunas acima: Alternativas: desvio – erro – variável - resultados. Resolução comentada: O Capture, Transform e Flow (CTF) é uma categoria relativamente nova de ferramentas de integração de dados projetada para simplificar o movimento de dados em tempo real por meio de tecnologias de bancos de dados heterogêneos. A camada de aplicativo dos aplicativos transacionais é ignorada e, em vez disso, as trocas diretas do banco de dados com o banco de dados são executadas. A segunda afirmação é a consequência do uso da arquitetura, sendo determinada no projeto do CTF. Resolução comentada: As palavras que completam as lacunas são “data warehouse - à tomada de decisões – atuais e históricos – integrado - tempo – não volátil”. O data warehouse é um conjunto de dados que passaram por um processo de extração de várias fontes de dados, limpeza, transformação e carregamento, utilizado para a tomada de decisões, contando como um repositório de dados atuais e com dados históricos, orientados por assunto, integrado, variável no tempo e não-volátil. Resolução comentada: O processo de ETL (Extract Transform Load) consiste em um processo de extração dos dados de várias fontes de dados, limpeza, transformação e carregamento dos dados para o data warehouse. 26/04/2024, 15:27 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3111263/8977766 2/4 7) 8) 9) ruído – erro – variável - ruídos. ruído – mudança – variável - resultados. ruído – erro – variável - resultados. CORRETO ruído – erro – análise - resultados. Código da questão: 42840 Existem vários métodos para identificar os candidatos de registro alterados para carga de ETL do microbatch no data warehouse em tempo real: ( ) Timestamps. ( ) Tabelas de log ETL. ( ) Log dos SGBD. ( ) Incompatibilidade de dados. ( ) Monitores de Rede. Assinale a alternativa que contenha a sequência correta: Alternativas: V – V – F – V – F. V – V – F – V – V. V – V – V – V – V. V – V – V – F – F. V – V – V – F – V. CORRETO Código da questão: 42857 É muito semelhante ao ETL convencional, exceto pelo fato de que a frequência de lotes é aumentada, talvez com a mesma frequência que de hora em hora. Assinale a alternativa que apresente, corretamente, essa abordagem ETL de tempo real. Alternativas: Capturar, Transformar e Fluxo. Online Transaction Processing. Armazenamento de Dados Operacionais. Microbatch ETL. CORRETO Integração de Aplicativos Corporativos. Código da questão: 42854 O subsistema de limpeza de dados necessita ser minucioso em sua detecção, correção e documentação da qualidade das informações que publica. Os usuários finais querem utilizar o data warehouse como uma fonte de dados confiável, uma base sobre a qual pode construir suas métricas, estratégias e políticas de gerenciamento. Assinale a alternativa que apresente, corretamente, o objetivo de qualidade de dados descrito acima: Resolução comentada: O ruído se mostra como uma variação ou erro que se observa em uma variável que está sendo medida, podendo assim, apresentar erros nos resultados. Resolução comentada: Os vários métodos para identificar os candidatos de registro alterados para carga de ETL do microbatch no data warehouse em tempo real são: Timestamps (método que permite gravações frequentes de registros de data e hora nos sistemas para as alterações e leituras frequentes), tabelas de log ETL (tabelas que contém o identificados do registro novo ou alterado), Log dos SGBD (usados para identificar novas transações e transações alteradas) e Monitores de Rede (utilitários que monitoram algum conjunto de tráfego em um rede, filtrando e registrando o tráfego). Resolução comentada: Microbatch ETL é muito semelhante ao ETL convencional, exceto pelo fato de que a frequência de lotes é aumentada, talvez com a mesma frequência que de horaem hora. 26/04/2024, 15:27 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3111263/8977766 3/4 10) Alternativas: Validade. Correção. Completude. CORRETO Transparência. Rapidez. Código da questão: 42839 Sobre as ferramentas ETL Puras: ( ) são produtos independentes da base de dados e ferramenta de BI ( ) são produtos dependentes da base de dados e ferramenta de BI ( ) permitem a migração para diferentes base de dados sem mudar o processo de integração ( ) permitem a migração para diferentes base de dados mudando o processo de integração ( ) as empresas não precisam depender de nenhum outro produto para a funcionalidade oferecida Assinale a alternativa que contenha a sequência correta: Alternativas: V – V – V – V – V V – V – F – V – F V – F – V – F – V CORRETO V – V – V – F – V V – V – V – F – F Código da questão: 42828 Resolução comentada: Ser completo (completude) tem como característica ser minucioso em sua detecção, correção e documentação da qualidade das informações que publica. Os usuários finais querem utilizar o data warehouse como uma fonte de dados confiável, uma base sobre a qual pode construir suas métricas, estratégias e políticas de gerenciamento. Resolução comentada: As afirmativas 2 e 4 são falsas. As ferramentas de ETL Pura são produtos independentes da base de dados e ferramenta ETL de Business Intelligence que se pretende usar. As empresas não precisam depender de nenhum outro produto para a funcionalidade oferecida e permitem a migração para diferentes bases de dados sem mudar o processo de integração. Arquivos e Links 26/04/2024, 15:27 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3111263/8977766 4/4