Baixe o app para aproveitar ainda mais
Prévia do material em texto
27/09/22, 09:14 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2700656/5123801 1/4 Integração e fluxo de dados (ETL) Professor(a): Washington Henrique Carvalho Almeida (Mestrado acadêmico) 1) 2) 3) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! São elementos do mapeamento de dados lógico: I. Nome da tabela de destino; II. Nome da coluna de destino; III. Nome do SGBD de origem; IV. Banco de dados de origem; V. Banco de dados de destino. São verdadeiras: Alternativas: I, II, IV e V. I, II e IV. CORRETO I, II, III e IV. I, III e V. I, II, III, IV e V. Código da questão: 42836 O subsistema de limpeza de dados necessita ser minucioso em sua detecção, correção e documentação da qualidade das informações que publica. Os usuários finais querem utilizar o data warehouse como uma fonte de dados confiável, uma base sobre a qual pode construir suas métricas, estratégias e políticas de gerenciamento. Assinale a alternativa que apresente, corretamente, o objetivo de qualidade de dados descrito acima: Alternativas: Rapidez. Correção. Completude. CORRETO Validade. Transparência. Código da questão: 42839 São atividades de integração de dados: ( ) Identificar os sistemas de origem; ( ) Compreender os sistemas de origem; ( ) Criar e registrar a lógica de correspondência; Resolução comentada: As afirmativas III e V estão incorretas. Os elementos do mapeamento de dados lógico apresentados corretamente são o nome da tabela de destino, nome da coluna de destino e banco de dados de origem. Resolução comentada: Ser completo (completude) tem como característica ser minucioso em sua detecção, correção e documentação da qualidade das informações que publica. Os usuários finais querem utilizar o data warehouse como uma fonte de dados confiável, uma base sobre a qual pode construir suas métricas, estratégias e políticas de gerenciamento. 27/09/22, 09:14 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2700656/5123801 2/4 4) 5) ( ) Realizar a limpeza dos dados; ( ) Carregar a dimensão conformada. Assinale a alternativa que contenha a sequência correta: Alternativas: V – V – F – V – F V – V – V – F – F V – V – V – V – V V – V – V – F – V CORRETO V – V – V – V – F Código da questão: 42837 O agrupamento (clustering) é utilizado para eliminar outliers. Porque Os dados são automaticamente divididos em grupos (clusters) e pontos que não pertencem a um dado grupo são eliminados. Alternativas: A primeira asserção está incorreta e a segunda está incorreta As duas asserções estão corretas e a segunda não justifica a primeira. A primeira asserção está correta e a segunda está incorreta. A primeira asserção está incorreta e a segunda está correta. As duas asserções estão corretas e a segunda justifica a primeira CORRETO Código da questão: 42843 As ferramentas ___________________ fornecem características de __________________, suportam vários arquivos de _______________ de entrada ou saída, funções de _________________ e banco de dados ________________. Assinale a alternativa que completa adequadamente as lacunas acima: Alternativas: ETL codificado manualmente– implementação – banco de dados – transformação - nativo. ETL baseado em ferramenta – análise – banco de dados – transformação - nativo ETL baseado em ferramenta – transformação – banco de dados – transformação - nativo. CORRETO ETL codificado manualmente– análise – banco de dados – transformação - nativo. ETL codificado manualmente – transformação – banco de dados – transformação - nativo. Resolução comentada: São atividades de integração de dados identificar o sistema de origem, compreender o sistema de origem, criar e registrar a lógica de correspondência, estabelecer as regras de negócio de atributos não chave e carregar dimensão conformada. Resolução comentada: As duas asserções estão corretas e a segunda justifica a primeira. O agrupamento (clustering) se utiliza para que sejam eliminados os outliers, porque dessa forma, os dados se dividem em grupos (clusters) e alguns pontos não pertencentes a um dado grupo são eliminados. Resolução comentada: São características das ferramentas ETL baseadas em ferramenta o processo de transformação de dados, com suporte a vários arquivos de banco de dados, de entrada ou saída, com funções de transformação e suporte a banco de dados nativo. 27/09/22, 09:14 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2700656/5123801 3/4 6) 7) 8) Código da questão: 42826 Um ________________ é um conjunto de dados utilizado no suporte ________________, sendo um repositório de dados _________________, orientado por assunto, _____________, variável no ______________ e _______________. Assinale a alternativa que completa adequadamente as lacunas acima: Alternativas: sistema BI - à tomada de decisões – atuais e históricos – integrado - tempo – não volátil. data warehouse - à tomada de decisões – atuais e históricos – integrado - espaço – não volátil. data warehouse - à tomada de decisões – históricos – integrado - tempo – não volátil. data warehouse - à tomada de decisões – atuais e históricos – integrado - tempo – volátil. data warehouse - à tomada de decisões – atuais e históricos – integrado - tempo – não volátil. CORRETO Código da questão: 42818 Antes de se construir um sistema de ______________, é necessário criar um mapa ________________, que documente a relação entre ________________ e ________________ da tabela. Assinale a alternativa que completa adequadamente as lacunas acima: Alternativas: sistema de limpeza – de dados lógico – campos de origem – campos de destino. sistema de transformação – de dados lógico – campos de origem – campos de destino. sistema de carregamento – de dados lógico – campos de origem – campos de destino. sistema de conformação – de dados lógico – campos de origem – campos de destino. sistema de extração – de dados lógico – campos de origem – campos de destino. CORRETO Código da questão: 42835 São subcategorias de classificação de ferramentas ETL: I. Ferramentas ETL Pura II. Ferramenta Base de dados integrada III. Ferramenta Business Intelligence Integrada IV. Ferramenta de Produto de Nicho V. ETL automatizada São verdadeiras: Resolução comentada: As palavras que completam as lacunas são “data warehouse - à tomada de decisões – atuais e históricos – integrado - tempo – não volátil”. O data warehouse é um conjunto de dados que passaram por um processo de extração de várias fontes de dados, limpeza, transformação e carregamento, utilizado para a tomada de decisões, contando como um repositório de dados atuais e com dados históricos, orientados por assunto, integrado, variável no tempo e não-volátil. Resolução comentada: As palavras que completam as lacunas são “sistema de extração – de dados lógico – campos de origem – campos de destino”. Para se criar um sistema de extração é necessário criar um mapa de dados lógico que tem por objetivo documentar a relação existente entre os campos de origem e os campos de destino da tabela. 27/09/22, 09:14 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2700656/5123801 4/4 9) 10) Alternativas: I, III, IV e V I, III e V I, II, III e IV CORRETO I, II, III e V I, II, IV e V Código da questão: 42827 De acordo com Kimbal e Caserta (2009), a conformação ou integração de dados diz respeito a criação de dimensões e instâncias de fatos configuradas, combinando as melhores informações de várias fontes de dados em uma visão mais abrangente. Dentre um dos problemas para conformação, estão dados duplicados e vários atributos podendo ser obtidosa partir de um outro atributo ou conjunto de valores. Assinale a alternativa que apresente, corretamente, qual o problema descrito acima: Alternativas: Valores que os campos podem assumir. Unidades diferentes. Conflito de Valores. Redundância. CORRETO Identificação de Entidades. Código da questão: 42844 A ________________ de dados é a ________________ de dados de ______________ fontes em uma _________________única e coerente Assinale a alternativa que completa adequadamente as lacunas acima: Alternativas: conformação – combinação – semelhantes – base de dados. conformação – limpeza – diferentes – base de dados. conformação – transformação – diferentes – base de dados. combinação – conformação – diferentes – base de dados. conformação – combinação – diferentes – base de dados. CORRETO Código da questão: 42845 Resolução comentada: Apenas a V é incorreta. São subcategorias de classificação de ferramentas ETL as ferramentas ETL Puras, ferramenta ETL base de dados integrada, ferramenta ETL Business Intelligence integrada e ferramenta ETL produto de nicho. Resolução comentada: A redundância é um dos problemas que trata dados duplicados e vários atributos, podendo ser obtidos a partir de outro atributo ou conjunto de valores. Resolução comentada: A conformação de dados é utilizada para combinar de dados de diferentes fontes em uma base de dados única e coerente. Arquivos e Links
Compartilhar