Baixe o app para aproveitar ainda mais
Prévia do material em texto
20/08/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2333346/2401067 1/4 Integração e fluxo de dados (ETL) Professor(a): Thiago Salhab Alves (Mestrado acadêmico) 1) 2) 3) Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! Antes de se construir um sistema de ______________, é necessário criar um mapa ________________, que documente a relação entre ________________ e ________________ da tabela. Assinale a alternativa que completa adequadamente as lacunas acima: Alternativas: sistema de limpeza – de dados lógico – campos de origem – campos de destino. sistema de conformação – de dados lógico – campos de origem – campos de destino. sistema de carregamento – de dados lógico – campos de origem – campos de destino. sistema de extração – de dados lógico – campos de origem – campos de destino. CORRETO sistema de transformação – de dados lógico – campos de origem – campos de destino. Código da questão: 42835 São características fundamentais dos data warehouse em relação aos dados: I. Orientado por assunto II. Integrado III. Com apenas dados históricos. IV. Variável no tempo. V. Volátil. São verdadeiras: Alternativas: I, II, III e IV I, II e IV CORRETO I, II, IV e V I, II, III, IV e V I, III e V Código da questão: 42820 Dados dimensionais para dimensões grandes e complexas como cliente, fornecedor ou produto são frequentemente extraídos de várias fontes em diferentes momentos. Isso requer atenção especial ao reconhecimento da mesma entidade dimensional em vários sistemas de origem. Assinale a alternativa que apresente, corretamente, um conflito que pode ocorrer. Resolução comentada: As palavras que completam as lacunas são “sistema de extração – de dados lógico – campos de origem – campos de destino”. Para se criar um sistema de extração é necessário criar um mapa de dados lógico que tem por objetivo documentar a relação existente entre os campos de origem e os campos de destino da tabela. Resolução comentada: As afirmativas III e V estão incorretas. Os data warehouse apresentam como características fundamentais dados que devem ser orientados por assunto, integrados e variáveis no tempo. Os data warehouse devem possuir dados atuais e dados históricos e devem ser não voláteis. . 20/08/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2333346/2401067 2/4 4) 5) Alternativas: Conflito de data e hora Conflito com dimensões grandes. Conflito de extração de dados. Conflito de chaves. Conflito em descrições sobrepostas. CORRETO Código da questão: 42853 Sobre o processo de ETL, considere as seguintes afirmações: ( ) É realizado o processo de extração dos dados ( ) É realizado o processo de transformação dos dados ( ) É realizado o processo de carga dos dados ( ) É realizado o processo de extração de apenas uma fonte de dados ( ) É realizado o processo apenas de forma tradicional e sem ferramentas de transformação de dados Assinale a alternativa que contenha a sequência correta: Alternativas: V – V – V – F – V V – V – V – V – V V – V – V – F – F CORRETO V – V – V – V – F V – V – F – V – F Código da questão: 42821 São elementos do mapeamento de dados lógico: I. Nome da tabela de destino; II. Nome da coluna de destino; III. Nome do SGBD de origem; IV. Banco de dados de origem; V. Banco de dados de destino. São verdadeiras: Alternativas: I, II, III, IV e V. I, III e V. I, II, IV e V. I, II, III e IV. I, II e IV. CORRETO Código da questão: 42836 Resolução comentada: Ao se utilizar dados dimensionais para dimensões grandes e complexas, é necessário uma atenção especial para reconhecer da mesma entidade dimensional em vários sistemas de origem um conflito em descrições sobrepostas. Resolução comentada: O processo de ETL (Extract Transform Load) consiste em um processo de extração dos dados de várias fontes de dados, limpeza, transformação e carregamento dos dados para o data warehouse. Resolução comentada: As afirmativas III e V estão incorretas. Os elementos do mapeamento de dados lógico apresentados corretamente são o nome da tabela de destino, nome da coluna de destino e banco de dados de origem. 20/08/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2333346/2401067 3/4 6) 7) 8) O agrupamento (clustering) é utilizado para eliminar outliers. Porque Os dados são automaticamente divididos em grupos (clusters) e pontos que não pertencem a um dado grupo são eliminados. Alternativas: A primeira asserção está correta e a segunda está incorreta. As duas asserções estão corretas e a segunda não justifica a primeira. A primeira asserção está incorreta e a segunda está incorreta As duas asserções estão corretas e a segunda justifica a primeira CORRETO A primeira asserção está incorreta e a segunda está correta. Código da questão: 42843 I. O Data Flow é uma tarefa do fluxo de controle usada quando se necessita realizar a transferência de dados PORQUE II. O Data Flow é utilizado para importar, exportar e transformar dados, tendo como componentes Data Flow Sources, Data Flow Transformations e Data Flow Destinations. Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas: Alternativas: As duas asserções estão corretas e a segunda não justifica a primeira. CORRETO A primeira asserção está incorreta e a segunda está incorreta As duas asserções estão corretas e a segunda justifica a primeira A primeira asserção está correta e a segunda está incorreta. A primeira asserção está incorreta e a segunda está correta. Código da questão: 42829 Um ________________ é um conjunto de dados utilizado no suporte ________________, sendo um repositório de dados _________________, orientado por assunto, _____________, variável no ______________ e _______________. Assinale a alternativa que completa adequadamente as lacunas acima: Alternativas: data warehouse - à tomada de decisões – atuais e históricos – integrado - espaço – não volátil. data warehouse - à tomada de decisões – atuais e históricos – integrado - tempo – volátil. data warehouse - à tomada de decisões – históricos – integrado - tempo – não volátil. data warehouse - à tomada de decisões – atuais e históricos – integrado - tempo – não volátil. CORRETO sistema BI - à tomada de decisões – atuais e históricos – integrado - tempo – não volátil. Resolução comentada: As duas asserções estão corretas e a segunda justifica a primeira. O agrupamento (clustering) se utiliza para que sejam eliminados os outliers, porque dessa forma, os dados se dividem em grupos (clusters) e alguns pontos não pertencentes a um dado grupo são eliminados. Resolução comentada: As duas asserções estão corretas e a segunda não justifica a primeira. O Data Flow é uma tarefa do fluxo de controle usada quando se necessita realizar a transferência de dados. A segunda asserção explica para que o Data Flow é usado e quais seus componentes. . 20/08/2021 Cosmos · Cosmos https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2333346/2401067 4/4 9) 10) Código da questão: 42818 São subcategorias de classificação de ferramentas ETL: I. Ferramentas ETL Pura II. Ferramenta Base de dados integrada III. Ferramenta Business Intelligence Integrada IV. Ferramenta de Produto de Nicho V. ETL automatizada São verdadeiras: Alternativas: I, II, III e IV CORRETO I, II, III e V I, III e V I, III, IV e V I, II, IV e V Código da questão: 42827 O componente final de todas as _______________, além da _________________ e da ____________________ é o conjunto de _____________________. Assinale a alternativa que completa adequadamente as lacunasacima: Alternativas: dimensões – chave estrangeira – chave natural – atributos descritivos. dimensões – chave primária – chave substituta – atributos descritivos.. dimensões – chave primária – chave estrangeira – atributos descritivos. dimensões – chave substituta – chave natural – atributos descritivos. dimensões – chave primária – chave natural – atributos descritivos. CORRETO Código da questão: 42850 Resolução comentada: As palavras que completam as lacunas são “data warehouse - à tomada de decisões – atuais e históricos – integrado - tempo – não volátil”. O data warehouse é um conjunto de dados que passaram por um processo de extração de várias fontes de dados, limpeza, transformação e carregamento, utilizado para a tomada de decisões, contando como um repositório de dados atuais e com dados históricos, orientados por assunto, integrado, variável no tempo e não-volátil. Resolução comentada: Apenas a V é incorreta. São subcategorias de classificação de ferramentas ETL as ferramentas ETL Puras, ferramenta ETL base de dados integrada, ferramenta ETL Business Intelligence integrada e ferramenta ETL produto de nicho. Resolução comentada: As palavras que completam as lacunas são: “dimensões – chave primária – chave natural – atributos descritivos”. Um conjunto de atributos descritivos, assim como a chave primária e a chave natural, são considerados componentes finais de todas as dimensões. Arquivos e Links
Compartilhar