Buscar

Integração e fluxo de dados (ETL)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Integração e fluxo de dados (ETL)
Professor(a): Washington Henrique Carvalho Almeida (Mestrado acadêmico)
1)
2)
Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação
Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até
cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode
responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo
estabelecido. Boa prova!
São características fundamentais dos data warehouse em relação aos dados:
I. Orientado por assunto
II. Integrado
III. Com apenas dados históricos.
IV. Variável no tempo.
V. Volátil.
São verdadeiras:
Alternativas:
I, III e V
I, II, IV e V
I, II, III e IV
I, II, III, IV e V
I, II e IV  CORRETO
Código da questão: 42820
Sobre as ferramentas ETL Puras:
( ) são produtos independentes da base de dados e ferramenta de BI
( ) são produtos dependentes da base de dados e ferramenta de BI
( ) permitem a migração para diferentes base de dados sem mudar o processo de integração
( ) permitem a migração para diferentes base de dados mudando o processo de integração
( ) as empresas não precisam depender de nenhum outro produto para a funcionalidade
oferecida
Assinale a alternativa que contenha a sequência correta:
Alternativas:
V – V – V – F – V
V – V – V – F – F
V – V – V – V – V
V – V – F – V – F
V – F – V – F – V  CORRETO
Código da questão: 42828
Resolução comentada:
As afirmativas III e V estão incorretas. Os data warehouse apresentam como
características fundamentais dados que devem ser orientados por assunto, integrados e
variáveis no tempo. Os data warehouse devem possuir dados atuais e dados históricos e
devem ser não voláteis. .
Resolução comentada:
As afirmativas 2 e 4 são falsas. As ferramentas de ETL Pura são produtos independentes
da base de dados e ferramenta ETL de Business Intelligence que se pretende usar. As
empresas não precisam depender de nenhum outro produto para a funcionalidade
oferecida e permitem a migração para diferentes bases de dados sem mudar o processo
de integração.
3)
4)
5)
A transformação de dados consiste em transformar ou consolidar os dados em um formato
mais adequado para o data warehouse. São considerados tipos de transformação:
( ) Suavização.
( ) Agregação. 
( ) Generalização.
( ) Normalização.
( ) Redundância.
Assinale a alternativa que contenha a sequência correta:
Alternativas:
V – V – F – V – V
V – V – F – V – F
V – V – V – V – F  CORRETO
V – V – V – F – F
V – V – V – V – V
Código da questão: 42847
São elementos do mapeamento de dados lógico:
I. Nome da tabela de destino;
II. Nome da coluna de destino;
III. Nome do SGBD de origem;
IV. Banco de dados de origem;
V. Banco de dados de destino.
São verdadeiras:
Alternativas:
I, II, III e IV.
I, III e V.
I, II, III, IV e V.
I, II e IV.  CORRETO
I, II, IV e V.
Código da questão: 42836
I. Na fase de descoberta de dados, a equipe de ETL deve aprofundar mais na descoberta dos
dados para determinar cada sistema, tabela e atributo de origem necessário para carregar o
data warehouse. 
PORQUE
II. Deve-se determinar a fonte adequada para cada elemento, em que, uma boa análise, evita
atrasos causados pelo uso de uma fonte errada.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas
Alternativas:
A primeira asserção está correta e a segunda está incorreta.
As duas asserções estão corretas e a segunda não justifica a primeira.
A primeira asserção está incorreta e a segunda está correta.
Resolução comentada:
São técnicas para transformação de dados a suavização, agregação, generalização e
normalização. A redundância é um tipo de problema relacionado à conformação de
dados.
Resolução comentada:
As afirmativas III e V estão incorretas. Os elementos do mapeamento de dados lógico
apresentados corretamente são o nome da tabela de destino, nome da coluna de
destino e banco de dados de origem.
6)
7)
8)
As duas asserções estão corretas e a segunda justifica a primeira  CORRETO
A primeira asserção está incorreta e a segunda está incorreta
Código da questão: 42838
O subsistema de limpeza de dados necessita ser minucioso em sua detecção, correção e
documentação da qualidade das informações que publica. Os usuários finais querem utilizar o
data warehouse como uma fonte de dados confiável, uma base sobre a qual pode construir
suas métricas, estratégias e políticas de gerenciamento. Assinale a alternativa que apresente,
corretamente, o objetivo de qualidade de dados descrito acima:
Alternativas:
Correção.
Validade.
Completude.  CORRETO
Rapidez.
Transparência.
Código da questão: 42839
Segundo Kimball e Caserta (2009), a chave primária fica armazenada em um único campo
contendo um valor inteiro único chamado valor substituto. Assinale a alternativa que
apresente, corretamente, a forma de relação que deve ser realizada com essas chaves.
Alternativas:
Criar e inserir chaves substitutas.  CORRETO
Criar e inserir chaves primárias.
Criar e inserir dados.
Criar e inserir chaves primárias e substitutas.
Criar e inserir chaves.
Código da questão: 42849
A ________________ de dados é a ________________ de dados de ______________ fontes em uma
_________________única e coerente
Assinale a alternativa que completa adequadamente as lacunas acima:
Resolução comentada:
As duas asserções estão corretas e a segunda justifica a primeira. Na fase de descoberta
de dados, a equipe de ETL deve aprofundar mais na descoberta dos dados para
determinar cada sistema, tabela e atributo de origem necessário para carregar o data
warehouse porque deve-se determinar a fonte adequada para cada elemento, em que,
uma boa análise, evita atrasos causados pelo uso de uma fonte errada.
Resolução comentada:
Ser completo (completude) tem como característica ser minucioso em sua detecção,
correção e documentação da qualidade das informações que publica. Os usuários finais
querem utilizar o data warehouse como uma fonte de dados confiável, uma base sobre
a qual pode construir suas métricas, estratégias e políticas de gerenciamento.
Resolução comentada:
A chave primária fica armazenada em um único campo contendo um valor inteiro único
chamado valor substituto. O processo de ETL do data warehouse deve sempre criar e
inserir as chaves substitutas, isto é, o data warehouse possui essas chaves e nunca
permite que outra entidade as atribua.
9)
10)
Alternativas:
combinação – conformação – diferentes – base de dados.
conformação – combinação – semelhantes – base de dados.
conformação – limpeza – diferentes – base de dados.
conformação – transformação – diferentes – base de dados.
conformação – combinação – diferentes – base de dados.  CORRETO
Código da questão: 42845
"Nessa atividade são identificadas as prováveis fontes de dados que acredite apoiar as
decisões necessárias, verificando nessas fontes de dados elementos que sejam úteis para os
dados do usuário final, sendo esses elementos de dados a entrada para a criação do perfil de
dados”. Assinale a alternativa que apresente, corretamente, a atividade descrita:
Alternativas:
Receber instruções para linhagem dos dados e regras de negócios.
Analisar sistemas de origem com ferramenta de criação de perfil de dados.
Identificar fonte de dados candidatas.  CORRETO
Criar um plano.
Validar cálculos e fórmulas.
Código da questão: 42834
São técnicas para suavização de ruídos:
( ) Compartimentalização (binning)
( ) Regressão Linear 
( ) Mineração de Dados
( ) Agrupamento (clustering)
( ) Regressão Não-Linear
Assinale a alternativa que contenha a sequência correta:
Alternativas:
V – V – F – V – F
V – V – V – F – V
V – V – F – V – V  CORRETO
V – V – V – V – V
V – V – V – F – F
Código da questão: 42842
Resolução comentada:
A conformação de dados é utilizada para combinar de dados de diferentes fontes em
uma base de dados única e coerente.
Resolução comentada:
A identificação de fonte de dados candidatas visa avaliar as prováveisfontes de dados
que se acredita serem úteis no processo de tomada de decisões.
Resolução comentada:
São técnicas para suavização de ruídos a compartimentalização (binning), a regressão
linear, o agrupamento (clustering) e a regressão não-linear. Mineração de dados não é
um método de suavização de ruídos porque é o exame de dados já coletados,
resultando em informações.
Arquivos e Links

Continue navegando

Outros materiais