Buscar

Prova Integração e fluxo de dados (ETL)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

27/09/22, 09:14 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2700656/5123801 1/4
Integração e fluxo de dados (ETL)
Professor(a): Washington Henrique Carvalho Almeida (Mestrado acadêmico)
1)
2)
3)
Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A
Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final.
Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas.
Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir
o prazo estabelecido. Boa prova!
São elementos do mapeamento de dados lógico: 
I. Nome da tabela de destino; 
II. Nome da coluna de destino; 
III. Nome do SGBD de origem; 
IV. Banco de dados de origem; 
V. Banco de dados de destino. 
São verdadeiras:
Alternativas:
I, II, IV e V.
I, II e IV.  CORRETO
I, II, III e IV.
I, III e V.
I, II, III, IV e V.
Código da questão: 42836
O subsistema de limpeza de dados necessita ser minucioso em sua detecção, correção e
documentação da qualidade das informações que publica. Os usuários finais querem
utilizar o data warehouse como uma fonte de dados confiável, uma base sobre a qual pode
construir suas métricas, estratégias e políticas de gerenciamento. Assinale a alternativa que
apresente, corretamente, o objetivo de qualidade de dados descrito acima:
Alternativas:
Rapidez.
Correção.
Completude.  CORRETO
Validade.
Transparência.
Código da questão: 42839
São atividades de integração de dados: 
( ) Identificar os sistemas de origem; 
( ) Compreender os sistemas de origem; 
( ) Criar e registrar a lógica de correspondência; 
Resolução comentada:
As afirmativas III e V estão incorretas. Os elementos do mapeamento de dados
lógico apresentados corretamente são o nome da tabela de destino, nome da coluna
de destino e banco de dados de origem.
Resolução comentada:
Ser completo (completude) tem como característica ser minucioso em sua detecção,
correção e documentação da qualidade das informações que publica. Os usuários
finais querem utilizar o data warehouse como uma fonte de dados confiável, uma
base sobre a qual pode construir suas métricas, estratégias e políticas de
gerenciamento.
27/09/22, 09:14 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2700656/5123801 2/4
4)
5)
( ) Realizar a limpeza dos dados; 
( ) Carregar a dimensão conformada. 
Assinale a alternativa que contenha a sequência correta:
Alternativas:
V – V – F – V – F
V – V – V – F – F
V – V – V – V – V
V – V – V – F – V  CORRETO
V – V – V – V – F
Código da questão: 42837
O agrupamento (clustering) é utilizado para eliminar outliers. 
Porque 
Os dados são automaticamente divididos em grupos (clusters) e pontos que não
pertencem a um dado grupo são eliminados.
Alternativas:
A primeira asserção está incorreta e a segunda está incorreta
As duas asserções estão corretas e a segunda não justifica a primeira.
A primeira asserção está correta e a segunda está incorreta.
A primeira asserção está incorreta e a segunda está correta.
As duas asserções estão corretas e a segunda justifica a primeira  CORRETO
Código da questão: 42843
As ferramentas ___________________ fornecem características de __________________,
suportam vários arquivos de _______________ de entrada ou saída, funções de
_________________ e banco de dados ________________. 
Assinale a alternativa que completa adequadamente as lacunas acima:
Alternativas:
ETL codificado manualmente– implementação – banco de dados – transformação -
nativo.
ETL baseado em ferramenta – análise – banco de dados – transformação - nativo
ETL baseado em ferramenta – transformação – banco de dados – transformação - nativo.
 CORRETO
ETL codificado manualmente– análise – banco de dados – transformação - nativo.
ETL codificado manualmente – transformação – banco de dados – transformação -
nativo.
Resolução comentada:
São atividades de integração de dados identificar o sistema de origem, compreender
o sistema de origem, criar e registrar a lógica de correspondência, estabelecer as
regras de negócio de atributos não chave e carregar dimensão conformada.
Resolução comentada:
As duas asserções estão corretas e a segunda justifica a primeira. O agrupamento
(clustering) se utiliza para que sejam eliminados os outliers, porque dessa forma, os
dados se dividem em grupos (clusters) e alguns pontos não pertencentes a um dado
grupo são eliminados.
Resolução comentada:
São características das ferramentas ETL baseadas em ferramenta o processo de
transformação de dados, com suporte a vários arquivos de banco de dados, de
entrada ou saída, com funções de transformação e suporte a banco de dados nativo.
27/09/22, 09:14 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2700656/5123801 3/4
6)
7)
8)
Código da questão: 42826
Um ________________ é um conjunto de dados utilizado no suporte ________________, sendo
um repositório de dados _________________, orientado por assunto, _____________, variável no
______________ e _______________. 
Assinale a alternativa que completa adequadamente as lacunas acima:
Alternativas:
sistema BI - à tomada de decisões – atuais e históricos – integrado - tempo – não volátil.
data warehouse - à tomada de decisões – atuais e históricos – integrado - espaço – não
volátil.
data warehouse - à tomada de decisões – históricos – integrado - tempo – não volátil.
data warehouse - à tomada de decisões – atuais e históricos – integrado - tempo –
volátil.
data warehouse - à tomada de decisões – atuais e históricos – integrado - tempo – não
volátil.  CORRETO
Código da questão: 42818
Antes de se construir um sistema de ______________, é necessário criar um mapa
________________, que documente a relação entre ________________ e ________________ da tabela. 
Assinale a alternativa que completa adequadamente as lacunas acima:
Alternativas:
sistema de limpeza – de dados lógico – campos de origem – campos de destino.
sistema de transformação – de dados lógico – campos de origem – campos de destino.
sistema de carregamento – de dados lógico – campos de origem – campos de destino.
sistema de conformação – de dados lógico – campos de origem – campos de destino.
sistema de extração – de dados lógico – campos de origem – campos de destino. 
CORRETO
Código da questão: 42835
São subcategorias de classificação de ferramentas ETL: 
I. Ferramentas ETL Pura 
II. Ferramenta Base de dados integrada 
III. Ferramenta Business Intelligence Integrada 
IV. Ferramenta de Produto de Nicho 
V. ETL automatizada 
São verdadeiras:
Resolução comentada:
As palavras que completam as lacunas são “data warehouse - à tomada de decisões
– atuais e históricos – integrado - tempo – não volátil”. O data warehouse é um
conjunto de dados que passaram por um processo de extração de várias fontes de
dados, limpeza, transformação e carregamento, utilizado para a tomada de decisões,
contando como um repositório de dados atuais e com dados históricos, orientados
por assunto, integrado, variável no tempo e não-volátil.
Resolução comentada:
As palavras que completam as lacunas são “sistema de extração – de dados lógico –
campos de origem – campos de destino”. Para se criar um sistema de extração é
necessário criar um mapa de dados lógico que tem por objetivo documentar a
relação existente entre os campos de origem e os campos de destino da tabela.
27/09/22, 09:14 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2700656/5123801 4/4
9)
10)
Alternativas:
I, III, IV e V
I, III e V
I, II, III e IV  CORRETO
I, II, III e V
I, II, IV e V
Código da questão: 42827
De acordo com Kimbal e Caserta (2009), a conformação ou integração de dados diz
respeito a criação de dimensões e instâncias de fatos configuradas, combinando as
melhores informações de várias fontes de dados em uma visão mais abrangente. Dentre
um dos problemas para conformação, estão dados duplicados e vários atributos podendo
ser obtidosa partir de um outro atributo ou conjunto de valores. Assinale a alternativa que
apresente, corretamente, qual o problema descrito acima:
Alternativas:
Valores que os campos podem assumir.
Unidades diferentes.
Conflito de Valores.
Redundância.  CORRETO
Identificação de Entidades.
Código da questão: 42844
A ________________ de dados é a ________________ de dados de ______________ fontes em
uma _________________única e coerente 
Assinale a alternativa que completa adequadamente as lacunas acima:
Alternativas:
conformação – combinação – semelhantes – base de dados.
conformação – limpeza – diferentes – base de dados.
conformação – transformação – diferentes – base de dados.
combinação – conformação – diferentes – base de dados.
conformação – combinação – diferentes – base de dados.  CORRETO
Código da questão: 42845
Resolução comentada:
Apenas a V é incorreta. São subcategorias de classificação de ferramentas ETL as
ferramentas ETL Puras, ferramenta ETL base de dados integrada, ferramenta ETL
Business Intelligence integrada e ferramenta ETL produto de nicho.
Resolução comentada:
A redundância é um dos problemas que trata dados duplicados e vários atributos,
podendo ser obtidos a partir de outro atributo ou conjunto de valores.
Resolução comentada:
A conformação de dados é utilizada para combinar de dados de diferentes fontes
em uma base de dados única e coerente.
Arquivos e Links

Continue navegando