Baixe o app para aproveitar ainda mais
Prévia do material em texto
Integração e fluxo de dados (ETL) Anhanguera 1) Sobre as ferramentas ETL Puras: ( ) são produtos independentes da base de dados e ferramenta de BI ( ) são produtos dependentes da base de dados e ferramenta de BI ( ) permitem a migração para diferentes base de dados sem mudar o processo de integração ( ) permitem a migração para diferentes base de dados mudando o processo de integração ( ) as empresas não precisam depender de nenhum outro produto para a funcionalidade oferecida Assinale a alternativa que contenha a sequência correta: Alternativas: · V – V – V – F – V · V – V – V – V – V · V – V – V – F – F · V – V – F – V – F · V – F – V – F – V CORRETO Resolução comentada: As afirmativas 2 e 4 são falsas. As ferramentas de ETL Pura são produtos independentes da base de dados e ferramenta ETL de Business Intelligence que se pretende usar. As empresas não precisam depender de nenhum outro produto para a funcionalidade oferecida e permitem a migração para diferentes bases de dados sem mudar o processo de integração. Código da questão: 42828 2) São subcategorias de classificação de ferramentas ETL: I. Ferramentas ETL Pura II. Ferramenta Base de dados integrada III. Ferramenta Business Intelligence Integrada IV. Ferramenta de Produto de Nicho V. ETL automatizada São verdadeiras: Alternativas: · I, II, III e IV CORRETO · I, III e V · I, II, III e V · I, III, IV e V · I, II, IV e V Resolução comentada: Apenas a V é incorreta. São subcategorias de classificação de ferramentas ETL as ferramentas ETL Puras, ferramenta ETL base de dados integrada, ferramenta ETL Business Intelligence integrada e ferramenta ETL produto de nicho. Código da questão: 42827 3) I. Na arquitetura de duas camadas há uma economia em relação a arquitetura de três camadas PORQUE II. Na arquitetura de duas camadas o servidor de aplicação e banco de dados é executado fisicamente na mesma plataforma de hardware que o data warehouse. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: · As duas asserções estão corretas e a segunda justifica a primeira CORRETO · A primeira asserção está correta e a segunda está incorreta. · A primeira asserção está incorreta e a segunda está correta. · As duas asserções estão corretas e a segunda não justifica a primeira. · A primeira asserção está incorreta e a segunda está incorreta Resolução comentada: As duas asserções estão corretas e a segunda justifica a primeira. Na arquitetura de duas camadas há uma economia em relação a arquitetura de três camadas porque na arquitetura de duas camadas o servidor de aplicação e banco de dados é executado fisicamente na mesma plataforma de hardware que o data warehouse. Código da questão: 42822 4) Dados dimensionais para dimensões grandes e complexas como cliente, fornecedor ou produto são frequentemente extraídos de várias fontes em diferentes momentos. Isso requer atenção especial ao reconhecimento da mesma entidade dimensional em vários sistemas de origem. Assinale a alternativa que apresente, corretamente, um conflito que pode ocorrer. Alternativas: · Conflito em descrições sobrepostas. CORRETO · Conflito de data e hora · Conflito de extração de dados. · Conflito de chaves. · Conflito com dimensões grandes. Resolução comentada: Ao se utilizar dados dimensionais para dimensões grandes e complexas, é necessário uma atenção especial para reconhecer da mesma entidade dimensional em vários sistemas de origem um conflito em descrições sobrepostas. Código da questão: 42853 5) São técnicas para suavização de ruídos: ( ) Compartimentalização (binning) ( ) Regressão Linear ( ) Mineração de Dados ( ) Agrupamento (clustering) ( ) Regressão Não-Linear Assinale a alternativa que contenha a sequência correta: Alternativas: · V – V – V – F – V · V – V – F – V – F · V – V – V – V – V · V – V – V – F – F · V – V – F – V – V CORRETO Resolução comentada: São técnicas para suavização de ruídos a compartimentalização (binning), a regressão linear, o agrupamento (clustering) e a regressão não-linear. Mineração de dados não é um método de suavização de ruídos porque é o exame de dados já coletados, resultando em informações. Código da questão: 42842 6) A transformação de dados consiste em transformar ou consolidar os dados em um formato mais adequado para o data warehouse. São considerados tipos de transformação: ( ) Suavização. ( ) Agregação. ( ) Generalização. ( ) Normalização. ( ) Redundância. Assinale a alternativa que contenha a sequência correta: Alternativas: · V – V – V – F – F · V – V – V – V – F CORRETO · V – V – V – V – V · V – V – F – V – V · V – V – F – V – F Resolução comentada: São técnicas para transformação de dados a suavização, agregação, generalização e normalização. A redundância é um tipo de problema relacionado à conformação de dados. Código da questão: 42847 7) As ferramentas ___________________ fornecem características de __________________, suportam vários arquivos de _______________ de entrada ou saída, funções de _________________ e banco de dados ________________. Assinale a alternativa que completa adequadamente as lacunas acima: Alternativas: · ETL codificado manualmente– implementação – banco de dados – transformação - nativo. · ETL codificado manualmente – transformação – banco de dados – transformação - nativo. · ETL codificado manualmente– análise – banco de dados – transformação - nativo. · ETL baseado em ferramenta – análise – banco de dados – transformação - nativo · ETL baseado em ferramenta – transformação – banco de dados – transformação - nativo. CORRETO Resolução comentada: São características das ferramentas ETL baseadas em ferramenta o processo de transformação de dados, com suporte a vários arquivos de banco de dados, de entrada ou saída, com funções de transformação e suporte a banco de dados nativo. Código da questão: 42826 8) São elementos do mapeamento de dados lógico: I. Nome da tabela de destino; II. Nome da coluna de destino; III. Nome do SGBD de origem; IV. Banco de dados de origem; V. Banco de dados de destino. São verdadeiras: Alternativas: · I, II, III, IV e V. · I, III e V. · I, II, III e IV. · I, II, IV e V. · I, II e IV. CORRETO Resolução comentada: As afirmativas III e V estão incorretas. Os elementos do mapeamento de dados lógico apresentados corretamente são o nome da tabela de destino, nome da coluna de destino e banco de dados de origem. Código da questão: 42836 9) Indique corretamente em qual etapa do processo ETL são preparadas as estruturas de tabelas dimensionais de forma mais restrita: Alternativas: · Entrega CORRETO · Conformação · Transformação · Limpeza · Extração Resolução comentada: Na etapa de entrega de dados são preparadas as estruturas de tabelas dimensionais de forma mais restrita. Código da questão: 42852 10) De acordo com Kimbal e Caserta (2009), a conformação ou integração de dados diz respeito a criação de dimensões e instâncias de fatos configuradas, combinando as melhores informações de várias fontes de dados em uma visão mais abrangente. Dentre um dos problemas para conformação, estão dados duplicados e vários atributos podendo ser obtidos a partir de um outro atributo ou conjunto de valores. Assinale a alternativa que apresente, corretamente, qual o problema descrito acima: Alternativas: · Conflito de Valores. · Valores que os campos podem assumir. · Identificação de Entidades. · Redundância. CORRETO · Unidades diferentes. Resolução comentada: A redundância é um dos problemas que trata dados duplicados e vários atributos, podendo ser obtidos a partir de outro atributo ou conjunto de valores. Código da questão: 42844
Compartilhar