Buscar

Integração e fluxo de dados (ETL)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

20/08/2021 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2333346/2401067 1/4
Integração e fluxo de dados (ETL)
Professor(a): Thiago Salhab Alves (Mestrado acadêmico)
1)
2)
3)
Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A
Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final.
Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas.
Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir
o prazo estabelecido. Boa prova!
Antes de se construir um sistema de ______________, é necessário criar um mapa
________________, que documente a relação entre ________________ e ________________ da tabela. 
Assinale a alternativa que completa adequadamente as lacunas acima:
Alternativas:
sistema de limpeza – de dados lógico – campos de origem – campos de destino.
sistema de conformação – de dados lógico – campos de origem – campos de destino.
sistema de carregamento – de dados lógico – campos de origem – campos de destino.
sistema de extração – de dados lógico – campos de origem – campos de destino. 
CORRETO
sistema de transformação – de dados lógico – campos de origem – campos de destino.
Código da questão: 42835
São características fundamentais dos data warehouse em relação aos dados: 
I. Orientado por assunto
II. Integrado 
III. Com apenas dados históricos. 
IV. Variável no tempo. 
V. Volátil. 
São verdadeiras:
Alternativas:
I, II, III e IV
I, II e IV  CORRETO
I, II, IV e V
I, II, III, IV e V
I, III e V
Código da questão: 42820
Dados dimensionais para dimensões grandes e complexas como cliente, fornecedor ou
produto são frequentemente extraídos de várias fontes em diferentes momentos. Isso
requer atenção especial ao reconhecimento da mesma entidade dimensional em vários
sistemas de origem. Assinale a alternativa que apresente, corretamente, um conflito que
pode ocorrer.
Resolução comentada:
As palavras que completam as lacunas são “sistema de extração – de dados lógico –
campos de origem – campos de destino”. Para se criar um sistema de extração é
necessário criar um mapa de dados lógico que tem por objetivo documentar a
relação existente entre os campos de origem e os campos de destino da tabela.
Resolução comentada:
As afirmativas III e V estão incorretas. Os data warehouse apresentam como
características fundamentais dados que devem ser orientados por assunto,
integrados e variáveis no tempo. Os data warehouse devem possuir dados atuais e
dados históricos e devem ser não voláteis. .
20/08/2021 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2333346/2401067 2/4
4)
5)
Alternativas:
Conflito de data e hora
Conflito com dimensões grandes.
Conflito de extração de dados.
Conflito de chaves.
Conflito em descrições sobrepostas.  CORRETO
Código da questão: 42853
Sobre o processo de ETL, considere as seguintes afirmações: 
( ) É realizado o processo de extração dos dados 
( ) É realizado o processo de transformação dos dados 
( ) É realizado o processo de carga dos dados 
( ) É realizado o processo de extração de apenas uma fonte de dados 
( ) É realizado o processo apenas de forma tradicional e sem ferramentas de transformação
de dados 
Assinale a alternativa que contenha a sequência correta:
Alternativas:
V – V – V – F – V
V – V – V – V – V
V – V – V – F – F  CORRETO
V – V – V – V – F
V – V – F – V – F
Código da questão: 42821
São elementos do mapeamento de dados lógico: 
I. Nome da tabela de destino; 
II. Nome da coluna de destino; 
III. Nome do SGBD de origem; 
IV. Banco de dados de origem; 
V. Banco de dados de destino. 
São verdadeiras:
Alternativas:
I, II, III, IV e V.
I, III e V.
I, II, IV e V.
I, II, III e IV.
I, II e IV.  CORRETO
Código da questão: 42836
Resolução comentada:
Ao se utilizar dados dimensionais para dimensões grandes e complexas, é necessário
uma atenção especial para reconhecer da mesma entidade dimensional em vários
sistemas de origem um conflito em descrições sobrepostas.
Resolução comentada:
O processo de ETL (Extract Transform Load) consiste em um processo de extração
dos dados de várias fontes de dados, limpeza, transformação e carregamento dos
dados para o data warehouse.
Resolução comentada:
As afirmativas III e V estão incorretas. Os elementos do mapeamento de dados
lógico apresentados corretamente são o nome da tabela de destino, nome da coluna
de destino e banco de dados de origem.
20/08/2021 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2333346/2401067 3/4
6)
7)
8)
O agrupamento (clustering) é utilizado para eliminar outliers. 
Porque 
Os dados são automaticamente divididos em grupos (clusters) e pontos que não
pertencem a um dado grupo são eliminados.
Alternativas:
A primeira asserção está correta e a segunda está incorreta.
As duas asserções estão corretas e a segunda não justifica a primeira.
A primeira asserção está incorreta e a segunda está incorreta
As duas asserções estão corretas e a segunda justifica a primeira  CORRETO
A primeira asserção está incorreta e a segunda está correta.
Código da questão: 42843
I. O Data Flow é uma tarefa do fluxo de controle usada quando se necessita realizar a
transferência de dados 
PORQUE 
II. O Data Flow é utilizado para importar, exportar e transformar dados, tendo como
componentes Data Flow Sources, Data Flow Transformations e Data Flow Destinations.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
As duas asserções estão corretas e a segunda não justifica a primeira.  CORRETO
A primeira asserção está incorreta e a segunda está incorreta
As duas asserções estão corretas e a segunda justifica a primeira
A primeira asserção está correta e a segunda está incorreta.
A primeira asserção está incorreta e a segunda está correta.
Código da questão: 42829
Um ________________ é um conjunto de dados utilizado no suporte ________________, sendo
um repositório de dados _________________, orientado por assunto, _____________, variável no
______________ e _______________. 
Assinale a alternativa que completa adequadamente as lacunas acima:
Alternativas:
data warehouse - à tomada de decisões – atuais e históricos – integrado - espaço – não
volátil.
data warehouse - à tomada de decisões – atuais e históricos – integrado - tempo –
volátil.
data warehouse - à tomada de decisões – históricos – integrado - tempo – não volátil.
data warehouse - à tomada de decisões – atuais e históricos – integrado - tempo – não
volátil.  CORRETO
sistema BI - à tomada de decisões – atuais e históricos – integrado - tempo – não volátil.
Resolução comentada:
As duas asserções estão corretas e a segunda justifica a primeira. O agrupamento
(clustering) se utiliza para que sejam eliminados os outliers, porque dessa forma, os
dados se dividem em grupos (clusters) e alguns pontos não pertencentes a um dado
grupo são eliminados.
Resolução comentada:
As duas asserções estão corretas e a segunda não justifica a primeira. O Data Flow é
uma tarefa do fluxo de controle usada quando se necessita realizar a transferência
de dados. A segunda asserção explica para que o Data Flow é usado e quais seus
componentes. .
20/08/2021 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2333346/2401067 4/4
9)
10)
Código da questão: 42818
São subcategorias de classificação de ferramentas ETL: 
I. Ferramentas ETL Pura 
II. Ferramenta Base de dados integrada 
III. Ferramenta Business Intelligence Integrada 
IV. Ferramenta de Produto de Nicho 
V. ETL automatizada 
São verdadeiras:
Alternativas:
I, II, III e IV  CORRETO
I, II, III e V
I, III e V
I, III, IV e V
I, II, IV e V
Código da questão: 42827
O componente final de todas as _______________, além da _________________ e da
____________________ é o conjunto de _____________________. 
Assinale a alternativa que completa adequadamente as lacunasacima:
Alternativas:
dimensões – chave estrangeira – chave natural – atributos descritivos.
dimensões – chave primária – chave substituta – atributos descritivos..
dimensões – chave primária – chave estrangeira – atributos descritivos.
dimensões – chave substituta – chave natural – atributos descritivos.
dimensões – chave primária – chave natural – atributos descritivos.  CORRETO
Código da questão: 42850
Resolução comentada:
As palavras que completam as lacunas são “data warehouse - à tomada de decisões
– atuais e históricos – integrado - tempo – não volátil”. O data warehouse é um
conjunto de dados que passaram por um processo de extração de várias fontes de
dados, limpeza, transformação e carregamento, utilizado para a tomada de decisões,
contando como um repositório de dados atuais e com dados históricos, orientados
por assunto, integrado, variável no tempo e não-volátil.
Resolução comentada:
Apenas a V é incorreta. São subcategorias de classificação de ferramentas ETL as
ferramentas ETL Puras, ferramenta ETL base de dados integrada, ferramenta ETL
Business Intelligence integrada e ferramenta ETL produto de nicho.
Resolução comentada:
As palavras que completam as lacunas são: “dimensões – chave primária – chave
natural – atributos descritivos”. Um conjunto de atributos descritivos, assim como a
chave primária e a chave natural, são considerados componentes finais de todas as
dimensões.
Arquivos e Links

Continue navegando