Baixe o app para aproveitar ainda mais
Prévia do material em texto
29/07/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2353654/2563001 1/4 Integração e fluxo de dados (ETL) Professor(a): Thiago Salhab Alves (Mestrado acadêmico) 1) 2) 3) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! A conformação de dados é a combinação de dados de diferentes fontes em uma base de dados única e coerente. São alguns problemas relacionados à conformação de dados: I. Identificação de Entidades. II. Redundância. III. Conflito de Valores. IV. Suavização. V. Agregação. São verdadeiras: Alternativas: I, II, III e V. I, II, III e IV. I, II e III. CORRETO I, III e V. I, II e IV. Código da questão: 42846 Um ___________ é uma variação ou ____________ aleatório observado em uma ______________ medida, podendo introduzir erros nos ____________. Assinale a alternativa que completa adequadamente as lacunas acima: Alternativas: ruído – erro – análise - resultados. ruído – erro – variável - resultados. CORRETO ruído – erro – variável - ruídos. desvio – erro – variável - resultados. ruído – mudança – variável - resultados. Código da questão: 42840 I. O Data Flow é uma tarefa do fluxo de controle usada quando se necessita realizar a transferência de dados PORQUE II. O Data Flow é utilizado para importar, exportar e transformar dados, tendo como componentes Data Flow Sources, Data Flow Transformations e Data Flow Destinations. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: A primeira asserção está correta e a segunda está incorreta. Resolução comentada: As afirmações IV e V são falsas. São alguns dos problemas relacionas à conformação de dados, a identificação de entidades, a redundância e o conflito de valores. Resolução comentada: O ruído se mostra como uma variação ou erro que se observa em uma variável que está sendo medida, podendo assim, apresentar erros nos resultados. 29/07/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2353654/2563001 2/4 4) 5) As duas asserções estão corretas e a segunda não justifica a primeira. CORRETO As duas asserções estão corretas e a segunda justifica a primeira A primeira asserção está incorreta e a segunda está correta. A primeira asserção está incorreta e a segunda está incorreta Código da questão: 42829 O Capture, Transform e Flow (CTF) é uma categoria relativamente nova de ferramentas de integração de dados, projetada para simplificar o movimento de dados em tempo real por meio de tecnologias de bancos de dados heterogêneos. Porque A camada de aplicativo dos aplicativos transacionais é ignorada e, em vez disso, as trocas diretas do banco de dados com o banco de dados são executadas. Alternativas: As duas asserções estão corretas e a segunda não justifica a primeira. CORRETO A primeira asserção está incorreta e a segunda está incorreta. A primeira asserção está correta e a segunda está incorreta. A primeira asserção está incorreta e a segunda está correta. As duas asserções estão corretas e a segunda justifica a primeira. Código da questão: 42858 A transformação de dados consiste em transformar ou consolidar os dados em um formato mais adequado para o data warehouse. São considerados tipos de transformação: ( ) Suavização. ( ) Agregação. ( ) Generalização. ( ) Normalização. ( ) Redundância. Assinale a alternativa que contenha a sequência correta: Alternativas: V – V – V – V – V V – V – V – F – F V – V – F – V – F V – V – V – V – F CORRETO V – V – F – V – V Resolução comentada: As duas asserções estão corretas e a segunda não justifica a primeira. O Data Flow é uma tarefa do fluxo de controle usada quando se necessita realizar a transferência de dados. A segunda asserção explica para que o Data Flow é usado e quais seus componentes. . Resolução comentada: O Capture, Transform e Flow (CTF) é uma categoria relativamente nova de ferramentas de integração de dados projetada para simplificar o movimento de dados em tempo real por meio de tecnologias de bancos de dados heterogêneos. A camada de aplicativo dos aplicativos transacionais é ignorada e, em vez disso, as trocas diretas do banco de dados com o banco de dados são executadas. A segunda afirmação é a consequência do uso da arquitetura, sendo determinada no projeto do CTF. Resolução comentada: São técnicas para transformação de dados a suavização, agregação, generalização e normalização. A redundância é um tipo de problema relacionado à conformação de dados. 29/07/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2353654/2563001 3/4 6) 7) 8) Código da questão: 42847 Indique corretamente em qual etapa do processo ETL são preparadas as estruturas de tabelas dimensionais de forma mais restrita: Alternativas: Extração Entrega CORRETO Conformação Limpeza Transformação Código da questão: 42852 O uso de banco de dados é essencial para o processo de manipulação de dados, porém para fins analíticos é de difícil uso, sendo indicado o uso de um data warehouse. Assinale a alternativa que apresenta, corretamente, o principal objetivo de um data warehouse: Alternativas: Transformação de dados Auxiliar à tomada de decisões CORRETO Armazenamento de dados Recuperação de dados Alteração de dados Código da questão: 42817 I. Na fase de descoberta de dados, a equipe de ETL deve aprofundar mais na descoberta dos dados para determinar cada sistema, tabela e atributo de origem necessário para carregar o data warehouse. PORQUE II. Deve-se determinar a fonte adequada para cada elemento, em que, uma boa análise, evita atrasos causados pelo uso de uma fonte errada. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas Alternativas: As duas asserções estão corretas e a segunda não justifica a primeira. As duas asserções estão corretas e a segunda justifica a primeira CORRETO A primeira asserção está correta e a segunda está incorreta. A primeira asserção está incorreta e a segunda está correta. A primeira asserção está incorreta e a segunda está incorreta Resolução comentada: Na etapa de entrega de dados são preparadas as estruturas de tabelas dimensionais de forma mais restrita. Resolução comentada: O principal objetivo de um data warehouse é auxiliar as organizações na tomada de decisões, pois fornece dados que podem ser utilizados para fins analíticos. Resolução comentada: As duas asserções estão corretas e a segunda justifica a primeira. Na fase de descoberta de dados, a equipe de ETL deve aprofundar mais na descoberta dos dados para determinar cada sistema, tabela e atributo de origem necessário para 29/07/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2353654/2563001 4/4 9) 10) Código da questão: 42838 De acordo com Kimbal e Caserta (2009), a conformação ou integração de dados diz respeito a criação de dimensões e instâncias de fatos configuradas, combinando as melhores informações de várias fontes de dados em uma visão mais abrangente. Dentre um dos problemas para conformação, estão dados duplicados e vários atributos podendo ser obtidos a partir de um outro atributo ou conjunto de valores. Assinale a alternativa que apresente, corretamente, qual o problema descrito acima: Alternativas: Redundância. CORRETO Unidades diferentes. Valores que os campos podem assumir. Conflito de Valores. Identificação de Entidades. Código da questão: 42844 "Nessa atividade são identificadas as prováveis fontes de dados que acredite apoiar as decisões necessárias, verificando nessas fontes de dados elementos que sejam úteis para os dados do usuário final, sendo esses elementos de dadosa entrada para a criação do perfil de dados”. Assinale a alternativa que apresente, corretamente, a atividade descrita: Alternativas: Receber instruções para linhagem dos dados e regras de negócios. Identificar fonte de dados candidatas. CORRETO Analisar sistemas de origem com ferramenta de criação de perfil de dados. Criar um plano. Validar cálculos e fórmulas. Código da questão: 42834 carregar o data warehouse porque deve-se determinar a fonte adequada para cada elemento, em que, uma boa análise, evita atrasos causados pelo uso de uma fonte errada. Resolução comentada: A redundância é um dos problemas que trata dados duplicados e vários atributos, podendo ser obtidos a partir de outro atributo ou conjunto de valores. Resolução comentada: A identificação de fonte de dados candidatas visa avaliar as prováveis fontes de dados que se acredita serem úteis no processo de tomada de decisões. Arquivos e Links
Compartilhar