Buscar

AVALIAÇÃO_Integração e fluxo de dados (ETL)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Integração e fluxo de dados (ETL)
Professor(a): Washington Henrique Carvalho Almeida (Mestrado acadêmico)
1)
2)
3)
Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A
Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final.
Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas.
Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir
o prazo estabelecido. Boa prova!
São subcategorias de classificação de ferramentas ETL:
I. Ferramentas ETL Pura
II. Ferramenta Base de dados integrada
III. Ferramenta Business Intelligence Integrada
IV. Ferramenta de Produto de Nicho
V. ETL automatizada
São verdadeiras:
Alternativas:
I, II, III e IV  CORRETO
I, II, III e V
I, III e V
I, III, IV e V
I, II, IV e V
Código da questão: 42827
De acordo com Kimbal e Caserta (2009), a conformação ou integração de dados diz
respeito a criação de dimensões e instâncias de fatos configuradas, combinando as
melhores informações de várias fontes de dados em uma visão mais abrangente. Dentre
um dos problemas para conformação, estão dados duplicados e vários atributos podendo
ser obtidos a partir de um outro atributo ou conjunto de valores. Assinale a alternativa que
apresente, corretamente, qual o problema descrito acima:
Alternativas:
Redundância.  CORRETO
Unidades diferentes.
Identificação de Entidades.
Valores que os campos podem assumir.
Conflito de Valores.
Código da questão: 42844
A transformação de dados consiste em transformar ou consolidar os dados em um
formato mais adequado para o data warehouse. São considerados tipos de transformação:
( ) Suavização.
( ) Agregação.
( ) Generalização.
Resolução comentada:
Apenas a V é incorreta. São subcategorias de classificação de ferramentas ETL as
ferramentas ETL Puras, ferramenta ETL base de dados integrada, ferramenta ETL
Business Intelligence integrada e ferramenta ETL produto de nicho.
Resolução comentada:
A redundância é um dos problemas que trata dados duplicados e vários atributos,
podendo ser obtidos a partir de outro atributo ou conjunto de valores.
4)
5)
( ) Normalização.
( ) Redundância.
Assinale a alternativa que contenha a sequência correta:
Alternativas:
V – V – V – F – F
V – V – F – V – V
V – V – V – V – V
V – V – F – V – F
V – V – V – V – F  CORRETO
Código da questão: 42847
I. Na arquitetura de duas camadas há uma economia em relação a arquitetura de três
camadas
PORQUE
II. Na arquitetura de duas camadas o servidor de aplicação e banco de dados é executado
fisicamente na mesma plataforma de hardware que o data warehouse.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
A primeira asserção está incorreta e a segunda está incorreta
A primeira asserção está incorreta e a segunda está correta.
A primeira asserção está correta e a segunda está incorreta.
As duas asserções estão corretas e a segunda justifica a primeira  CORRETO
As duas asserções estão corretas e a segunda não justifica a primeira.
Código da questão: 42822
"Nessa atividade são identificadas as prováveis fontes de dados que acredite apoiar as
decisões necessárias, verificando nessas fontes de dados elementos que sejam úteis para os
dados do usuário final, sendo esses elementos de dados a entrada para a criação do perfil
de dados”. Assinale a alternativa que apresente, corretamente, a atividade descrita:
Alternativas:
Receber instruções para linhagem dos dados e regras de negócios.
Analisar sistemas de origem com ferramenta de criação de perfil de dados.
Criar um plano.
Validar cálculos e fórmulas.
Identificar fonte de dados candidatas.  CORRETO
Resolução comentada:
São técnicas para transformação de dados a suavização, agregação, generalização e
normalização. A redundância é um tipo de problema relacionado à conformação de
dados.
Resolução comentada:
As duas asserções estão corretas e a segunda justifica a primeira. Na arquitetura de
duas camadas há uma economia em relação a arquitetura de três camadas porque
na arquitetura de duas camadas o servidor de aplicação e banco de dados é
executado fisicamente na mesma plataforma de hardware que o data warehouse.
Resolução comentada:
A identificação de fonte de dados candidatas visa avaliar as prováveis fontes de
dados que se acredita serem úteis no processo de tomada de decisões.
6)
7)
8)
Código da questão: 42834
O Capture, Transform e Flow (CTF) é uma categoria relativamente nova de ferramentas
de integração de dados, projetada para simplificar o movimento de dados em tempo real
por meio de tecnologias de bancos de dados heterogêneos.
Porque
A camada de aplicativo dos aplicativos transacionais é ignorada e, em vez disso, as trocas
diretas do banco de dados com o banco de dados são executadas.
Alternativas:
As duas asserções estão corretas e a segunda não justifica a primeira.  CORRETO
A primeira asserção está correta e a segunda está incorreta.
As duas asserções estão corretas e a segunda justifica a primeira.
A primeira asserção está incorreta e a segunda está correta.
A primeira asserção está incorreta e a segunda está incorreta.
Código da questão: 42858
A ________________ de dados é a ________________ de dados de ______________ fontes em uma
_________________única e coerente
Assinale a alternativa que completa adequadamente as lacunas acima:
Alternativas:
conformação – combinação – semelhantes – base de dados.
conformação – limpeza – diferentes – base de dados.
conformação – transformação – diferentes – base de dados.
combinação – conformação – diferentes – base de dados.
conformação – combinação – diferentes – base de dados.  CORRETO
Código da questão: 42845
São atividades de integração de dados:
( ) Identificar os sistemas de origem;
( ) Compreender os sistemas de origem;
( ) Criar e registrar a lógica de correspondência;
( ) Realizar a limpeza dos dados;
( ) Carregar a dimensão conformada.
Assinale a alternativa que contenha a sequência correta:
Alternativas:
V – V – V – F – V  CORRETO
V – V – V – V – V
V – V – V – V – F
Resolução comentada:
O Capture, Transform e Flow (CTF) é uma categoria relativamente nova de
ferramentas de integração de dados projetada para simplificar o movimento de
dados em tempo real por meio de tecnologias de bancos de dados heterogêneos. A
camada de aplicativo dos aplicativos transacionais é ignorada e, em vez disso, as
trocas diretas do banco de dados com o banco de dados são executadas. A segunda
afirmação é a consequência do uso da arquitetura, sendo determinada no projeto do
CTF.
Resolução comentada:
A conformação de dados é utilizada para combinar de dados de diferentes fontes
em uma base de dados única e coerente.
9)
10)
V – V – F – V – F
V – V – V – F – F
Código da questão: 42837
O componente final de todas as _______________, além da _________________ e da
____________________ é o conjunto de _____________________.
Assinale a alternativa que completa adequadamente as lacunas acima:
Alternativas:
dimensões – chave substituta – chave natural – atributos descritivos.
dimensões – chave primária – chave estrangeira – atributos descritivos.
dimensões – chave primária – chave substituta – atributos descritivos..
dimensões – chave primária – chave natural – atributos descritivos.  CORRETO
dimensões – chave estrangeira – chave natural – atributos descritivos.
Código da questão: 42850
Existem vários métodos para identificar os candidatos de registro alterados para carga
de ETL do microbatch no data warehouse em tempo real:
( ) Timestamps.
( ) Tabelas de log ETL.
( ) Log dos SGBD.
( ) Incompatibilidade de dados.
( ) Monitores de Rede.
Assinale a alternativa que contenha a sequência correta:
Alternativas:
V – V – V – F – F.
V – V – V – F – V.  CORRETO
V – V – F – V – F.
V – V – F – V – V.
V – V – V – V – V.
Código da questão: 42857
Resolução comentada:
São atividades de integração de dados identificar o sistema de origem, compreender
osistema de origem, criar e registrar a lógica de correspondência, estabelecer as
regras de negócio de atributos não chave e carregar dimensão conformada.
Resolução comentada:
As palavras que completam as lacunas são: “dimensões – chave primária – chave
natural – atributos descritivos”. Um conjunto de atributos descritivos, assim como a
chave primária e a chave natural, são considerados componentes finais de todas as
dimensões.
Resolução comentada:
Os vários métodos para identificar os candidatos de registro alterados para carga de
ETL do microbatch no data warehouse em tempo real são: Timestamps (método que
permite gravações frequentes de registros de data e hora nos sistemas para as
alterações e leituras frequentes), tabelas de log ETL (tabelas que contém o
identificados do registro novo ou alterado), Log dos SGBD (usados para identificar
novas transações e transações alteradas) e Monitores de Rede (utilitários que
monitoram algum conjunto de tráfego em um rede, filtrando e registrando o
tráfego).
Arquivos e Links

Continue navegando