Buscar

Prova de Integração e fluxo de dados (ETL)


Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Integração e fluxo de dados (ETL)
Professor(a): Washington Henrique Carvalho Almeida (Mestrado acadêmico)
1)
2)
3)
Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e
corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode
responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova!
São características fundamentais dos data warehouse em relação aos dados:
I. Orientado por assunto
II. Integrado
III. Com apenas dados históricos.
IV. Variável no tempo.
V. Volátil.
São verdadeiras:
Alternativas:
I, II e IV  CORRETO
I, II, IV e V
I, II, III e IV
I, III e V
I, II, III, IV e V
Código da questão: 42820
O uso de banco de dados é essencial para o processo de manipulação de dados, porém para fins analíticos é de difícil uso, sendo indicado
o uso de um data warehouse. Assinale a alternativa que apresenta, corretamente, o principal objetivo de um data warehouse:
Alternativas:
Armazenamento de dados
Recuperação de dados
Alteração de dados
Auxiliar à tomada de decisões  CORRETO
Transformação de dados
Código da questão: 42817
O Capture, Transform e Flow (CTF) é uma categoria relativamente nova de ferramentas de integração de dados, projetada para simplificar o
movimento de dados em tempo real por meio de tecnologias de bancos de dados heterogêneos.
Porque
A camada de aplicativo dos aplicativos transacionais é ignorada e, em vez disso, as trocas diretas do banco de dados com o banco de dados
são executadas.
Alternativas:
A primeira asserção está incorreta e a segunda está correta.
As duas asserções estão corretas e a segunda não justifica a primeira.  CORRETO
As duas asserções estão corretas e a segunda justifica a primeira.
A primeira asserção está correta e a segunda está incorreta.
Resolução comentada:
As afirmativas III e V estão incorretas. Os data warehouse apresentam como características fundamentais dados que devem ser
orientados por assunto, integrados e variáveis no tempo. Os data warehouse devem possuir dados atuais e dados históricos e devem
ser não voláteis. .
Resolução comentada:
O principal objetivo de um data warehouse é auxiliar as organizações na tomada de decisões, pois fornece dados que podem ser
utilizados para fins analíticos.
26/04/2024, 15:27 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3111263/8977766 1/4
4)
5)
6)
A primeira asserção está incorreta e a segunda está incorreta.
Código da questão: 42858
Um ________________ é um conjunto de dados utilizado no suporte ________________, sendo um repositório de dados _________________,
orientado por assunto, _____________, variável no ______________ e _______________.
Assinale a alternativa que completa adequadamente as lacunas acima:
Alternativas:
data warehouse - à tomada de decisões – atuais e históricos – integrado - tempo – não volátil.  CORRETO
data warehouse - à tomada de decisões – atuais e históricos – integrado - espaço – não volátil.
data warehouse - à tomada de decisões – históricos – integrado - tempo – não volátil.
data warehouse - à tomada de decisões – atuais e históricos – integrado - tempo – volátil.
sistema BI - à tomada de decisões – atuais e históricos – integrado - tempo – não volátil.
Código da questão: 42818
Sobre o processo de ETL, considere as seguintes afirmações:
( ) É realizado o processo de extração dos dados
( ) É realizado o processo de transformação dos dados
( ) É realizado o processo de carga dos dados
( ) É realizado o processo de extração de apenas uma fonte de dados
( ) É realizado o processo apenas de forma tradicional e sem ferramentas de transformação de dados
Assinale a alternativa que contenha a sequência correta:
Alternativas:
V – V – V – F – F  CORRETO
V – V – V – V – F
V – V – V – F – V
V – V – V – V – V
V – V – F – V – F
Código da questão: 42821
Um ___________ é uma variação ou ____________ aleatório observado em uma ______________ medida, podendo introduzir erros nos ____________.
Assinale a alternativa que completa adequadamente as lacunas acima:
Alternativas:
desvio – erro – variável - resultados.
Resolução comentada:
O Capture, Transform e Flow (CTF) é uma categoria relativamente nova de ferramentas de integração de dados projetada para
simplificar o movimento de dados em tempo real por meio de tecnologias de bancos de dados heterogêneos. A camada de aplicativo
dos aplicativos transacionais é ignorada e, em vez disso, as trocas diretas do banco de dados com o banco de dados são executadas. A
segunda afirmação é a consequência do uso da arquitetura, sendo determinada no projeto do CTF.
Resolução comentada:
As palavras que completam as lacunas são “data warehouse - à tomada de decisões – atuais e históricos – integrado - tempo – não
volátil”. O data warehouse é um conjunto de dados que passaram por um processo de extração de várias fontes de dados, limpeza,
transformação e carregamento, utilizado para a tomada de decisões, contando como um repositório de dados atuais e com dados
históricos, orientados por assunto, integrado, variável no tempo e não-volátil.
Resolução comentada:
O processo de ETL (Extract Transform Load) consiste em um processo de extração dos dados de várias fontes de dados, limpeza,
transformação e carregamento dos dados para o data warehouse.
26/04/2024, 15:27 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3111263/8977766 2/4
7)
8)
9)
ruído – erro – variável - ruídos.
ruído – mudança – variável - resultados.
ruído – erro – variável - resultados.  CORRETO
ruído – erro – análise - resultados.
Código da questão: 42840
Existem vários métodos para identificar os candidatos de registro alterados para carga de ETL do microbatch no data warehouse em tempo
real:
( ) Timestamps.
( ) Tabelas de log ETL.
( ) Log dos SGBD.
( ) Incompatibilidade de dados.
( ) Monitores de Rede.
Assinale a alternativa que contenha a sequência correta:
Alternativas:
V – V – F – V – F.
V – V – F – V – V.
V – V – V – V – V.
V – V – V – F – F.
V – V – V – F – V.  CORRETO
Código da questão: 42857
É muito semelhante ao ETL convencional, exceto pelo fato de que a frequência de lotes é aumentada, talvez com a mesma frequência que
de hora em hora. Assinale a alternativa que apresente, corretamente, essa abordagem ETL de tempo real.
Alternativas:
Capturar, Transformar e Fluxo.
Online Transaction Processing.
Armazenamento de Dados Operacionais.
Microbatch ETL.  CORRETO
Integração de Aplicativos Corporativos.
Código da questão: 42854
O subsistema de limpeza de dados necessita ser minucioso em sua detecção, correção e documentação da qualidade das informações que
publica. Os usuários finais querem utilizar o data warehouse como uma fonte de dados confiável, uma base sobre a qual pode construir suas
métricas, estratégias e políticas de gerenciamento. Assinale a alternativa que apresente, corretamente, o objetivo de qualidade de dados
descrito acima:
Resolução comentada:
O ruído se mostra como uma variação ou erro que se observa em uma variável que está sendo medida, podendo assim, apresentar
erros nos resultados.
Resolução comentada:
Os vários métodos para identificar os candidatos de registro alterados para carga de ETL do microbatch no data warehouse em tempo
real são: Timestamps (método que permite gravações frequentes de registros de data e hora nos sistemas para as alterações e leituras
frequentes), tabelas de log ETL (tabelas que contém o identificados do registro novo ou alterado), Log dos SGBD (usados para
identificar novas transações e transações alteradas) e Monitores de Rede (utilitários que monitoram algum conjunto de tráfego em um
rede, filtrando e registrando o tráfego).
Resolução comentada:
Microbatch ETL é muito semelhante ao ETL convencional, exceto pelo fato de que a frequência de lotes é aumentada, talvez com a
mesma frequência que de horaem hora.
26/04/2024, 15:27 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3111263/8977766 3/4
10)
Alternativas:
Validade.
Correção.
Completude.  CORRETO
Transparência.
Rapidez.
Código da questão: 42839
Sobre as ferramentas ETL Puras:
( ) são produtos independentes da base de dados e ferramenta de BI
( ) são produtos dependentes da base de dados e ferramenta de BI
( ) permitem a migração para diferentes base de dados sem mudar o processo de integração
( ) permitem a migração para diferentes base de dados mudando o processo de integração
( ) as empresas não precisam depender de nenhum outro produto para a funcionalidade oferecida
Assinale a alternativa que contenha a sequência correta:
Alternativas:
V – V – V – V – V
V – V – F – V – F
V – F – V – F – V  CORRETO
V – V – V – F – V
V – V – V – F – F
Código da questão: 42828
Resolução comentada:
Ser completo (completude) tem como característica ser minucioso em sua detecção, correção e documentação da qualidade das
informações que publica. Os usuários finais querem utilizar o data warehouse como uma fonte de dados confiável, uma base sobre a
qual pode construir suas métricas, estratégias e políticas de gerenciamento.
Resolução comentada:
As afirmativas 2 e 4 são falsas. As ferramentas de ETL Pura são produtos independentes da base de dados e ferramenta ETL de Business
Intelligence que se pretende usar. As empresas não precisam depender de nenhum outro produto para a funcionalidade oferecida e
permitem a migração para diferentes bases de dados sem mudar o processo de integração.
Arquivos e Links
26/04/2024, 15:27 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/3111263/8977766 4/4