Baixe o app para aproveitar ainda mais
Prévia do material em texto
27/08/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2347443/2506861 1/4 Integração e fluxo de dados (ETL) Professor(a): Thiago Salhab Alves (Mestrado acadêmico) 1) 2) 3) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! O uso de banco de dados é essencial para o processo de manipulação de dados, porém para fins analíticos é de difícil uso, sendo indicado o uso de um data warehouse. Assinale a alternativa que apresenta, corretamente, o principal objetivo de um data warehouse: Alternativas: Armazenamento de dados Alteração de dados Auxiliar à tomada de decisões CORRETO Transformação de dados Recuperação de dados Código da questão: 42817 "Nessa atividade são identificadas as prováveis fontes de dados que acredite apoiar as decisões necessárias, verificando nessas fontes de dados elementos que sejam úteis para os dados do usuário final, sendo esses elementos de dados a entrada para a criação do perfil de dados”. Assinale a alternativa que apresente, corretamente, a atividade descrita: Alternativas: Analisar sistemas de origem com ferramenta de criação de perfil de dados. Receber instruções para linhagem dos dados e regras de negócios. Validar cálculos e fórmulas. Criar um plano. Identificar fonte de dados candidatas. CORRETO Código da questão: 42834 I. Na arquitetura de duas camadas há uma economia em relação a arquitetura de três camadas PORQUE II. Na arquitetura de duas camadas o servidor de aplicação e banco de dados é executado fisicamente na mesma plataforma de hardware que o data warehouse. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: As duas asserções estão corretas e a segunda não justifica a primeira. As duas asserções estão corretas e a segunda justifica a primeira CORRETO A primeira asserção está incorreta e a segunda está correta. A primeira asserção está incorreta e a segunda está incorreta A primeira asserção está correta e a segunda está incorreta. Resolução comentada: O principal objetivo de um data warehouse é auxiliar as organizações na tomada de decisões, pois fornece dados que podem ser utilizados para fins analíticos. Resolução comentada: A identificação de fonte de dados candidatas visa avaliar as prováveis fontes de dados que se acredita serem úteis no processo de tomada de decisões. 27/08/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2347443/2506861 2/4 4) 5) 6) Código da questão: 42822 I. O Data Flow é uma tarefa do fluxo de controle usada quando se necessita realizar a transferência de dados PORQUE II. O Data Flow é utilizado para importar, exportar e transformar dados, tendo como componentes Data Flow Sources, Data Flow Transformations e Data Flow Destinations. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: A primeira asserção está incorreta e a segunda está correta. A primeira asserção está correta e a segunda está incorreta. A primeira asserção está incorreta e a segunda está incorreta As duas asserções estão corretas e a segunda justifica a primeira As duas asserções estão corretas e a segunda não justifica a primeira. CORRETO Código da questão: 42829 Segundo Kimball e Caserta (2009), a chave primária fica armazenada em um único campo contendo um valor inteiro único chamado valor substituto. Assinale a alternativa que apresente, corretamente, a forma de relação que deve ser realizada com essas chaves. Alternativas: Criar e inserir chaves primárias e substitutas. Criar e inserir chaves primárias. INCORRETO Criar e inserir chaves. Criar e inserir dados. Criar e inserir chaves substitutas. CORRETO Código da questão: 42849 Dados dimensionais para dimensões grandes e complexas como cliente, fornecedor ou produto são frequentemente extraídos de várias fontes em diferentes momentos. Isso requer atenção especial ao reconhecimento da mesma entidade dimensional em vários sistemas de origem. Assinale a alternativa que apresente, corretamente, um conflito que pode ocorrer. Alternativas: Resolução comentada: As duas asserções estão corretas e a segunda justifica a primeira. Na arquitetura de duas camadas há uma economia em relação a arquitetura de três camadas porque na arquitetura de duas camadas o servidor de aplicação e banco de dados é executado fisicamente na mesma plataforma de hardware que o data warehouse. Resolução comentada: As duas asserções estão corretas e a segunda não justifica a primeira. O Data Flow é uma tarefa do fluxo de controle usada quando se necessita realizar a transferência de dados. A segunda asserção explica para que o Data Flow é usado e quais seus componentes. . Resolução comentada: A chave primária fica armazenada em um único campo contendo um valor inteiro único chamado valor substituto. O processo de ETL do data warehouse deve sempre criar e inserir as chaves substitutas, isto é, o data warehouse possui essas chaves e nunca permite que outra entidade as atribua. 27/08/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2347443/2506861 3/4 7) 8) Conflito de chaves. Conflito com dimensões grandes. Conflito de data e hora Conflito em descrições sobrepostas. CORRETO Conflito de extração de dados. INCORRETO Código da questão: 42853 São produtos fornecidos como opção ao comprar software de banco de dados e algumas funcionalidades são incorporadas ao banco de dados e não estão disponíveis separadamente na própria ferramenta ETL. Assinale a alternativa que apresenta, corretamente, a categoria de ferramenta de ETL descrita: Alternativas: Ferramenta ETL Business Intelligence Integrada Ferramenta ETL Produto de Nicho Ferramenta ETL Pura Ferramenta de ETL codificada manualmente Ferramenta ETL Base de dados integrada CORRETO Código da questão: 42825 São técnicas para suavização de ruídos: ( ) Compartimentalização (binning) ( ) Regressão Linear ( ) Mineração de Dados ( ) Agrupamento (clustering) ( ) Regressão Não-Linear Assinale a alternativa que contenha a sequência correta: Alternativas: V – V – V – F – F V – V – F – V – V CORRETO V – V – V – V – V V – V – F – V – F INCORRETO V – V – V – F – V Código da questão: 42842 Resolução comentada: Ao se utilizar dados dimensionais para dimensões grandes e complexas, é necessário uma atenção especial para reconhecer da mesma entidade dimensional em vários sistemas de origem um conflito em descrições sobrepostas. Resolução comentada: A Ferramenta ETL Base de dados integrada é um produto fornecido como opção ao comprar software de banco de dados e algumas funcionalidades são incorporadas ao banco de dados e não estão disponíveis separadamente na própria ferramenta ETL . Resolução comentada: São técnicas para suavização de ruídos a compartimentalização (binning), a regressão linear, o agrupamento (clustering) e a regressão não-linear. Mineração de dados não é um método de suavização de ruídos porque é o exame de dados já coletados, resultando em informações. 27/08/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2347443/2506861 4/4 9) 10) Indique corretamente em qual etapa do processo ETL são preparadas as estruturas de tabelas dimensionais de forma mais restrita: Alternativas: Entrega CORRETO Conformação Extração Transformação Limpeza Código da questão: 42852 São elementos do mapeamento de dados lógico: I. Nome da tabela de destino; II. Nome da coluna de destino; III. Nome do SGBD de origem; IV. Banco de dados de origem; V. Banco de dados de destino. São verdadeiras: Alternativas: I, II, III e IV. I, III e V.I, II, III, IV e V. INCORRETO I, II, IV e V. I, II e IV. CORRETO Código da questão: 42836 Resolução comentada: Na etapa de entrega de dados são preparadas as estruturas de tabelas dimensionais de forma mais restrita. Resolução comentada: As afirmativas III e V estão incorretas. Os elementos do mapeamento de dados lógico apresentados corretamente são o nome da tabela de destino, nome da coluna de destino e banco de dados de origem. Arquivos e Links
Compartilhar