Baixe o app para aproveitar ainda mais
Prévia do material em texto
Integração e fluxo de dados (ETL) Professor(a): Washington Henrique Carvalho Almeida (Mestrado acadêmico) 1) 2) 3) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! De acordo com Kimbal e Caserta (2009), a conformação ou integração de dados diz respeito a criação de dimensões e instâncias de fatos configuradas, combinando as melhores informações de várias fontes de dados em uma visão mais abrangente. Dentre um dos problemas para conformação, estão dados duplicados e vários atributos podendo ser obtidos a partir de um outro atributo ou conjunto de valores. Assinale a alternativa que apresente, corretamente, qual o problema descrito acima: Alternativas: Conflito de Valores. Valores que os campos podem assumir. Redundância. CORRETO Identificação de Entidades. Unidades diferentes. Código da questão: 42844 O agrupamento (clustering) é utilizado para eliminar outliers. Porque Os dados são automaticamente divididos em grupos (clusters) e pontos que não pertencem a um dado grupo são eliminados. Alternativas: A primeira asserção está incorreta e a segunda está incorreta A primeira asserção está correta e a segunda está incorreta. A primeira asserção está incorreta e a segunda está correta. As duas asserções estão corretas e a segunda não justifica a primeira. As duas asserções estão corretas e a segunda justifica a primeira CORRETO Código da questão: 42843 A ________________ de dados é a ________________ de dados de ______________ fontes em uma _________________única e coerente Assinale a alternativa que completa adequadamente as lacunas acima: Alternativas: conformação – transformação – diferentes – base de dados. combinação – conformação – diferentes – base de dados. conformação – limpeza – diferentes – base de dados. conformação – combinação – semelhantes – base de dados. conformação – combinação – diferentes – base de dados. CORRETO Resolução comentada: A redundância é um dos problemas que trata dados duplicados e vários atributos, podendo ser obtidos a partir de outro atributo ou conjunto de valores. Resolução comentada: As duas asserções estão corretas e a segunda justifica a primeira. O agrupamento (clustering) se utiliza para que sejam eliminados os outliers, porque dessa forma, os dados se dividem em grupos (clusters) e alguns pontos não pertencentes a um dado grupo são eliminados. Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2451770/3285651 1 of 4 26/10/2021 17:59 4) 5) 6) Código da questão: 42845 Sobre o processo de ETL, considere as seguintes afirmações: ( ) É realizado o processo de extração dos dados ( ) É realizado o processo de transformação dos dados ( ) É realizado o processo de carga dos dados ( ) É realizado o processo de extração de apenas uma fonte de dados ( ) É realizado o processo apenas de forma tradicional e sem ferramentas de transformação de dados Assinale a alternativa que contenha a sequência correta: Alternativas: V – V – F – V – F V – V – V – F – V V – V – V – V – F V – V – V – F – F CORRETO V – V – V – V – V Código da questão: 42821 O subsistema de limpeza de dados necessita ser minucioso em sua detecção, correção e documentação da qualidade das informações que publica. Os usuários finais querem utilizar o data warehouse como uma fonte de dados confiável, uma base sobre a qual pode construir suas métricas, estratégias e políticas de gerenciamento. Assinale a alternativa que apresente, corretamente, o objetivo de qualidade de dados descrito acima: Alternativas: Completude. CORRETO Transparência. Correção. Rapidez. Validade. Código da questão: 42839 As ferramentas ___________________ fornecem características de __________________, suportam vários arquivos de _______________ de entrada ou saída, funções de _________________ e banco de dados ________________. Assinale a alternativa que completa adequadamente as lacunas acima: Alternativas: ETL baseado em ferramenta – análise – banco de dados – transformação - nativo ETL codificado manualmente– implementação – banco de dados – transformação - nativo. Resolução comentada: A conformação de dados é utilizada para combinar de dados de diferentes fontes em uma base de dados única e coerente. Resolução comentada: O processo de ETL (Extract Transform Load) consiste em um processo de extração dos dados de várias fontes de dados, limpeza, transformação e carregamento dos dados para o data warehouse. Resolução comentada: Ser completo (completude) tem como característica ser minucioso em sua detecção, correção e documentação da qualidade das informações que publica. Os usuários finais querem utilizar o data warehouse como uma fonte de dados confiável, uma base sobre a qual pode construir suas métricas, estratégias e políticas de gerenciamento. Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2451770/3285651 2 of 4 26/10/2021 17:59 7) 8) ETL codificado manualmente– análise – banco de dados – transformação - nativo. ETL baseado em ferramenta – transformação – banco de dados – transformação - nativo. CORRETO ETL codificado manualmente – transformação – banco de dados – transformação - nativo. Código da questão: 42826 O Capture, Transform e Flow (CTF) é uma categoria relativamente nova de ferramentas de integração de dados, projetada para simplificar o movimento de dados em tempo real por meio de tecnologias de bancos de dados heterogêneos. Porque A camada de aplicativo dos aplicativos transacionais é ignorada e, em vez disso, as trocas diretas do banco de dados com o banco de dados são executadas. Alternativas: A primeira asserção está incorreta e a segunda está incorreta. As duas asserções estão corretas e a segunda não justifica a primeira. CORRETO As duas asserções estão corretas e a segunda justifica a primeira. A primeira asserção está incorreta e a segunda está correta. A primeira asserção está correta e a segunda está incorreta. Código da questão: 42858 São algumas das técnicas de preenchimento de dados aplicadas a valores faltantes: I. Descartar toda a tupla; II. Preencher o valor faltante manualmente; III. Descartar todos os dados; IV. Usar constante global para preencher o valor faltante; V. Preencher os dados faltantes com null. São verdadeiras: Alternativas: I, III e V I, II e IV CORRETO I, II, III e IV I, II, III e V I, II e III Código da questão: 42841 Resolução comentada: São características das ferramentas ETL baseadas em ferramenta o processo de transformação de dados, com suporte a vários arquivos de banco de dados, de entrada ou saída, com funções de transformação e suporte a banco de dados nativo. Resolução comentada: O Capture, Transform e Flow (CTF) é uma categoria relativamente nova de ferramentas de integração de dados projetada para simplificar o movimento de dados em tempo real por meio de tecnologias de bancos de dados heterogêneos. A camada de aplicativo dos aplicativos transacionais é ignorada e, em vez disso, as trocas diretas do banco de dados com o banco de dados são executadas. A segunda afirmação é a consequência do uso da arquitetura, sendo determinada no projeto do CTF. Resolução comentada: As afirmativas III e V estão incorretas. São algumas das técnicas de preenchimento de dados aplicados a valores faltantes o descarte de toda a tupla, preencher o valor faltante manualmente e utilizar uma constante global para preencher o valor faltante. A afirmativa III está incorreta pois descartar todos os dados não é uma técnica de preenchimento, e deixará o usuário sem dados para trabalhar. A afirmativa V está incorreta porque null não é um dado. Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2451770/32856513 of 4 26/10/2021 17:59 9) 10) A transformação de dados consiste em transformar ou consolidar os dados em um formato mais adequado para o data warehouse. São considerados tipos de transformação: ( ) Suavização. ( ) Agregação. ( ) Generalização. ( ) Normalização. ( ) Redundância. Assinale a alternativa que contenha a sequência correta: Alternativas: V – V – V – V – F CORRETO V – V – V – F – F V – V – F – V – V V – V – F – V – F V – V – V – V – V Código da questão: 42847 São subcategorias de classificação de ferramentas ETL: I. Ferramentas ETL Pura II. Ferramenta Base de dados integrada III. Ferramenta Business Intelligence Integrada IV. Ferramenta de Produto de Nicho V. ETL automatizada São verdadeiras: Alternativas: I, II, III e IV CORRETO I, III e V I, II, IV e V I, III, IV e V I, II, III e V Código da questão: 42827 Resolução comentada: São técnicas para transformação de dados a suavização, agregação, generalização e normalização. A redundância é um tipo de problema relacionado à conformação de dados. Resolução comentada: Apenas a V é incorreta. São subcategorias de classificação de ferramentas ETL as ferramentas ETL Puras, ferramenta ETL base de dados integrada, ferramenta ETL Business Intelligence integrada e ferramenta ETL produto de nicho. Arquivos e Links Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2451770/3285651 4 of 4 26/10/2021 17:59
Compartilhar