Buscar

Integração e fluxo de dados (ETL)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

22/11/2020 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2246876/2059361 1/5
Integração e fluxo de dados (ETL)
Professor(a): Thiago Salhab Alves (Mestrado acadêmico)
1)
2)
Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A
Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final.
Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas.
Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir
o prazo estabelecido. Boa prova!
Existem vários métodos para identificar os candidatos de registro alterados para carga
de ETL do microbatch no data warehouse em tempo real: 
( ) Timestamps. 
( ) Tabelas de log ETL. 
( ) Log dos SGBD. 
( ) Incompatibilidade de dados. 
( ) Monitores de Rede. 
Assinale a alternativa que contenha a sequência correta:
Alternativas:
V – V – V – F – F.
V – V – F – V – F.
V – V – F – V – V.
V – V – V – V – V.
V – V – V – F – V.  CORRETO
Código da questão: 42857
São atividades de integração de dados: 
( ) Identificar os sistemas de origem; 
( ) Compreender os sistemas de origem; 
( ) Criar e registrar a lógica de correspondência; 
( ) Realizar a limpeza dos dados; 
( ) Carregar a dimensão conformada. 
Assinale a alternativa que contenha a sequência correta:
Alternativas:
V – V – V – V – V
V – V – V – F – F
V – V – V – F – V  CORRETO
V – V – F – V – F
V – V – V – V – F
Código da questão: 42837
Resolução comentada:
Os vários métodos para identificar os candidatos de registro alterados para carga de
ETL do microbatch no data warehouse em tempo real são: Timestamps (método que
permite gravações frequentes de registros de data e hora nos sistemas para as
alterações e leituras frequentes), tabelas de log ETL (tabelas que contém o
identificados do registro novo ou alterado), Log dos SGBD (usados para identificar
novas transações e transações alteradas) e Monitores de Rede (utilitários que
monitoram algum conjunto de tráfego em um rede, filtrando e registrando o
tráfego).
Resolução comentada:
São atividades de integração de dados identificar o sistema de origem, compreender
o sistema de origem, criar e registrar a lógica de correspondência, estabelecer as
regras de negócio de atributos não chave e carregar dimensão conformada.
22/11/2020 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2246876/2059361 2/5
3)
4)
5)
O uso de banco de dados é essencial para o processo de manipulação de dados, porém
para fins analíticos é de difícil uso, sendo indicado o uso de um data warehouse. Assinale a
alternativa que apresenta, corretamente, o principal objetivo de um data warehouse:
Alternativas:
Recuperação de dados
Auxiliar à tomada de decisões  CORRETO
Alteração de dados
Armazenamento de dados
Transformação de dados
Código da questão: 42817
As ferramentas ___________________ fornecem características de __________________,
suportam vários arquivos de _______________ de entrada ou saída, funções de
_________________ e banco de dados ________________. 
Assinale a alternativa que completa adequadamente as lacunas acima:
Alternativas:
ETL baseado em ferramenta – análise – banco de dados – transformação - nativo
ETL codificado manualmente – transformação – banco de dados – transformação -
nativo.
ETL baseado em ferramenta – transformação – banco de dados – transformação - nativo.
 CORRETO
ETL codificado manualmente– implementação – banco de dados – transformação -
nativo.
ETL codificado manualmente– análise – banco de dados – transformação - nativo.
Código da questão: 42826
I. Na arquitetura de duas camadas há uma economia em relação a arquitetura de três
camadas 
PORQUE 
II. Na arquitetura de duas camadas o servidor de aplicação e banco de dados é executado
fisicamente na mesma plataforma de hardware que o data warehouse. 
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
A primeira asserção está incorreta e a segunda está incorreta
A primeira asserção está correta e a segunda está incorreta.
A primeira asserção está incorreta e a segunda está correta.
As duas asserções estão corretas e a segunda não justifica a primeira.
As duas asserções estão corretas e a segunda justifica a primeira  CORRETO
Resolução comentada:
O principal objetivo de um data warehouse é auxiliar as organizações na tomada de
decisões, pois fornece dados que podem ser utilizados para fins analíticos.
Resolução comentada:
São características das ferramentas ETL baseadas em ferramenta o processo de
transformação de dados, com suporte a vários arquivos de banco de dados, de
entrada ou saída, com funções de transformação e suporte a banco de dados nativo.
Resolução comentada:
As duas asserções estão corretas e a segunda justifica a primeira. Na arquitetura de
duas camadas há uma economia em relação a arquitetura de três camadas porque
na arquitetura de duas camadas o servidor de aplicação e banco de dados é
22/11/2020 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2246876/2059361 3/5
6)
7)
8)
Código da questão: 42822
Dados dimensionais para dimensões grandes e complexas como cliente, fornecedor ou
produto são frequentemente extraídos de várias fontes em diferentes momentos. Isso
requer atenção especial ao reconhecimento da mesma entidade dimensional em vários
sistemas de origem. Assinale a alternativa que apresente, corretamente, um conflito que
pode ocorrer.
Alternativas:
Conflito com dimensões grandes.
Conflito de data e hora
Conflito em descrições sobrepostas.  CORRETO
Conflito de extração de dados.
Conflito de chaves.
Código da questão: 42853
O Capture, Transform e Flow (CTF) é uma categoria relativamente nova de ferramentas
de integração de dados, projetada para simplificar o movimento de dados em tempo real
por meio de tecnologias de bancos de dados heterogêneos. 
Porque 
A camada de aplicativo dos aplicativos transacionais é ignorada e, em vez disso, as trocas
diretas do banco de dados com o banco de dados são executadas.
Alternativas:
A primeira asserção está incorreta e a segunda está correta.
As duas asserções estão corretas e a segunda não justifica a primeira.  CORRETO
A primeira asserção está incorreta e a segunda está incorreta.
As duas asserções estão corretas e a segunda justifica a primeira.
A primeira asserção está correta e a segunda está incorreta.
Código da questão: 42858
São subcategorias de classificação de ferramentas ETL: 
I. Ferramentas ETL Pura 
II. Ferramenta Base de dados integrada 
III. Ferramenta Business Intelligence Integrada 
IV. Ferramenta de Produto de Nicho 
V. ETL automatizada 
São verdadeiras:
executado fisicamente na mesma plataforma de hardware que o data warehouse.
Resolução comentada:
Ao se utilizar dados dimensionais para dimensões grandes e complexas, é necessário
uma atenção especial para reconhecer da mesma entidade dimensional em vários
sistemas de origem um conflito em descrições sobrepostas.
Resolução comentada:
O Capture, Transform e Flow (CTF) é uma categoria relativamente nova de
ferramentas de integração de dados projetada para simplificar o movimento de
dados em tempo real por meio de tecnologias de bancos de dados heterogêneos. A
camada de aplicativo dos aplicativos transacionais é ignorada e, em vez disso, as
trocas diretas do banco de dados com o banco de dados são executadas. A segunda
afirmação é a consequência do uso da arquitetura, sendo determinada no projeto do
CTF.
22/11/2020 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2246876/2059361 4/5
9)
10)
Alternativas:
I, II, IV e V
I, II, III e V
I, II, III e IV  CORRETO
I, III, IV e V
I, III e V
Código da questão: 42827
I. O Data Flow é uma tarefa do fluxo de controle usada quando se necessita realizar a
transferência de dados 
PORQUE 
II. O Data Flow é utilizado para importar, exportar e transformar dados, tendo como
componentes Data Flow Sources, Data FlowTransformations e Data Flow Destinations. 
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
A primeira asserção está incorreta e a segunda está correta.
A primeira asserção está incorreta e a segunda está incorreta
As duas asserções estão corretas e a segunda justifica a primeira
As duas asserções estão corretas e a segunda não justifica a primeira.  CORRETO
A primeira asserção está correta e a segunda está incorreta.
Código da questão: 42829
Sobre as ferramentas ETL Puras: 
( ) são produtos independentes da base de dados e ferramenta de BI 
( ) são produtos dependentes da base de dados e ferramenta de BI 
( ) permitem a migração para diferentes base de dados sem mudar o processo de
integração 
( ) permitem a migração para diferentes base de dados mudando o processo de integração 
( ) as empresas não precisam depender de nenhum outro produto para a funcionalidade
oferecida 
Assinale a alternativa que contenha a sequência correta:
Alternativas:
V – V – V – F – F
V – V – F – V – F
V – V – V – F – V
V – V – V – V – V
V – F – V – F – V  CORRETO
Resolução comentada:
Apenas a V é incorreta. São subcategorias de classificação de ferramentas ETL as
ferramentas ETL Puras, ferramenta ETL base de dados integrada, ferramenta ETL
Business Intelligence integrada e ferramenta ETL produto de nicho.
Resolução comentada:
As duas asserções estão corretas e a segunda não justifica a primeira. O Data Flow é
uma tarefa do fluxo de controle usada quando se necessita realizar a transferência
de dados. A segunda asserção explica para que o Data Flow é usado e quais seus
componentes. .
Resolução comentada:
As afirmativas 2 e 4 são falsas. As ferramentas de ETL Pura são produtos
independentes da base de dados e ferramenta ETL de Business Intelligence que se
pretende usar. As empresas não precisam depender de nenhum outro produto para
a funcionalidade oferecida e permitem a migração para diferentes bases de dados
sem mudar o processo de integração.
22/11/2020 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2246876/2059361 5/5
Código da questão: 42828
Arquivos e Links

Continue navegando