Baixe o app para aproveitar ainda mais
Prévia do material em texto
Integração e fluxo de dados (ETL) Professor(a): Washington Henrique Carvalho Almeida (Mestrado acadêmico) 1) 2) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! São características fundamentais dos data warehouse em relação aos dados: I. Orientado por assunto II. Integrado III. Com apenas dados históricos. IV. Variável no tempo. V. Volátil. São verdadeiras: Alternativas: I, III e V I, II, IV e V I, II, III e IV I, II, III, IV e V I, II e IV CORRETO Código da questão: 42820 Sobre as ferramentas ETL Puras: ( ) são produtos independentes da base de dados e ferramenta de BI ( ) são produtos dependentes da base de dados e ferramenta de BI ( ) permitem a migração para diferentes base de dados sem mudar o processo de integração ( ) permitem a migração para diferentes base de dados mudando o processo de integração ( ) as empresas não precisam depender de nenhum outro produto para a funcionalidade oferecida Assinale a alternativa que contenha a sequência correta: Alternativas: V – V – V – F – V V – V – V – F – F V – V – V – V – V V – V – F – V – F V – F – V – F – V CORRETO Código da questão: 42828 Resolução comentada: As afirmativas III e V estão incorretas. Os data warehouse apresentam como características fundamentais dados que devem ser orientados por assunto, integrados e variáveis no tempo. Os data warehouse devem possuir dados atuais e dados históricos e devem ser não voláteis. . Resolução comentada: As afirmativas 2 e 4 são falsas. As ferramentas de ETL Pura são produtos independentes da base de dados e ferramenta ETL de Business Intelligence que se pretende usar. As empresas não precisam depender de nenhum outro produto para a funcionalidade oferecida e permitem a migração para diferentes bases de dados sem mudar o processo de integração. 3) 4) 5) A transformação de dados consiste em transformar ou consolidar os dados em um formato mais adequado para o data warehouse. São considerados tipos de transformação: ( ) Suavização. ( ) Agregação. ( ) Generalização. ( ) Normalização. ( ) Redundância. Assinale a alternativa que contenha a sequência correta: Alternativas: V – V – F – V – V V – V – F – V – F V – V – V – V – F CORRETO V – V – V – F – F V – V – V – V – V Código da questão: 42847 São elementos do mapeamento de dados lógico: I. Nome da tabela de destino; II. Nome da coluna de destino; III. Nome do SGBD de origem; IV. Banco de dados de origem; V. Banco de dados de destino. São verdadeiras: Alternativas: I, II, III e IV. I, III e V. I, II, III, IV e V. I, II e IV. CORRETO I, II, IV e V. Código da questão: 42836 I. Na fase de descoberta de dados, a equipe de ETL deve aprofundar mais na descoberta dos dados para determinar cada sistema, tabela e atributo de origem necessário para carregar o data warehouse. PORQUE II. Deve-se determinar a fonte adequada para cada elemento, em que, uma boa análise, evita atrasos causados pelo uso de uma fonte errada. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas Alternativas: A primeira asserção está correta e a segunda está incorreta. As duas asserções estão corretas e a segunda não justifica a primeira. A primeira asserção está incorreta e a segunda está correta. Resolução comentada: São técnicas para transformação de dados a suavização, agregação, generalização e normalização. A redundância é um tipo de problema relacionado à conformação de dados. Resolução comentada: As afirmativas III e V estão incorretas. Os elementos do mapeamento de dados lógico apresentados corretamente são o nome da tabela de destino, nome da coluna de destino e banco de dados de origem. 6) 7) 8) As duas asserções estão corretas e a segunda justifica a primeira CORRETO A primeira asserção está incorreta e a segunda está incorreta Código da questão: 42838 O subsistema de limpeza de dados necessita ser minucioso em sua detecção, correção e documentação da qualidade das informações que publica. Os usuários finais querem utilizar o data warehouse como uma fonte de dados confiável, uma base sobre a qual pode construir suas métricas, estratégias e políticas de gerenciamento. Assinale a alternativa que apresente, corretamente, o objetivo de qualidade de dados descrito acima: Alternativas: Correção. Validade. Completude. CORRETO Rapidez. Transparência. Código da questão: 42839 Segundo Kimball e Caserta (2009), a chave primária fica armazenada em um único campo contendo um valor inteiro único chamado valor substituto. Assinale a alternativa que apresente, corretamente, a forma de relação que deve ser realizada com essas chaves. Alternativas: Criar e inserir chaves substitutas. CORRETO Criar e inserir chaves primárias. Criar e inserir dados. Criar e inserir chaves primárias e substitutas. Criar e inserir chaves. Código da questão: 42849 A ________________ de dados é a ________________ de dados de ______________ fontes em uma _________________única e coerente Assinale a alternativa que completa adequadamente as lacunas acima: Resolução comentada: As duas asserções estão corretas e a segunda justifica a primeira. Na fase de descoberta de dados, a equipe de ETL deve aprofundar mais na descoberta dos dados para determinar cada sistema, tabela e atributo de origem necessário para carregar o data warehouse porque deve-se determinar a fonte adequada para cada elemento, em que, uma boa análise, evita atrasos causados pelo uso de uma fonte errada. Resolução comentada: Ser completo (completude) tem como característica ser minucioso em sua detecção, correção e documentação da qualidade das informações que publica. Os usuários finais querem utilizar o data warehouse como uma fonte de dados confiável, uma base sobre a qual pode construir suas métricas, estratégias e políticas de gerenciamento. Resolução comentada: A chave primária fica armazenada em um único campo contendo um valor inteiro único chamado valor substituto. O processo de ETL do data warehouse deve sempre criar e inserir as chaves substitutas, isto é, o data warehouse possui essas chaves e nunca permite que outra entidade as atribua. 9) 10) Alternativas: combinação – conformação – diferentes – base de dados. conformação – combinação – semelhantes – base de dados. conformação – limpeza – diferentes – base de dados. conformação – transformação – diferentes – base de dados. conformação – combinação – diferentes – base de dados. CORRETO Código da questão: 42845 "Nessa atividade são identificadas as prováveis fontes de dados que acredite apoiar as decisões necessárias, verificando nessas fontes de dados elementos que sejam úteis para os dados do usuário final, sendo esses elementos de dados a entrada para a criação do perfil de dados”. Assinale a alternativa que apresente, corretamente, a atividade descrita: Alternativas: Receber instruções para linhagem dos dados e regras de negócios. Analisar sistemas de origem com ferramenta de criação de perfil de dados. Identificar fonte de dados candidatas. CORRETO Criar um plano. Validar cálculos e fórmulas. Código da questão: 42834 São técnicas para suavização de ruídos: ( ) Compartimentalização (binning) ( ) Regressão Linear ( ) Mineração de Dados ( ) Agrupamento (clustering) ( ) Regressão Não-Linear Assinale a alternativa que contenha a sequência correta: Alternativas: V – V – F – V – F V – V – V – F – V V – V – F – V – V CORRETO V – V – V – V – V V – V – V – F – F Código da questão: 42842 Resolução comentada: A conformação de dados é utilizada para combinar de dados de diferentes fontes em uma base de dados única e coerente. Resolução comentada: A identificação de fonte de dados candidatas visa avaliar as prováveisfontes de dados que se acredita serem úteis no processo de tomada de decisões. Resolução comentada: São técnicas para suavização de ruídos a compartimentalização (binning), a regressão linear, o agrupamento (clustering) e a regressão não-linear. Mineração de dados não é um método de suavização de ruídos porque é o exame de dados já coletados, resultando em informações. Arquivos e Links
Compartilhar