Buscar

av de PDR-fluxo de dados (ETL)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 4 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

27/08/2021 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2347443/2506861 1/4
Integração e fluxo de dados (ETL)
Professor(a): Thiago Salhab Alves (Mestrado acadêmico)
1)
2)
3)
Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A
Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final.
Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas.
Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir
o prazo estabelecido. Boa prova!
O uso de banco de dados é essencial para o processo de manipulação de dados, porém
para fins analíticos é de difícil uso, sendo indicado o uso de um data warehouse. Assinale a
alternativa que apresenta, corretamente, o principal objetivo de um data warehouse:
Alternativas:
Armazenamento de dados
Alteração de dados
Auxiliar à tomada de decisões  CORRETO
Transformação de dados
Recuperação de dados
Código da questão: 42817
"Nessa atividade são identificadas as prováveis fontes de dados que acredite apoiar as
decisões necessárias, verificando nessas fontes de dados elementos que sejam úteis para os
dados do usuário final, sendo esses elementos de dados a entrada para a criação do perfil
de dados”. Assinale a alternativa que apresente, corretamente, a atividade descrita:
Alternativas:
Analisar sistemas de origem com ferramenta de criação de perfil de dados.
Receber instruções para linhagem dos dados e regras de negócios.
Validar cálculos e fórmulas.
Criar um plano.
Identificar fonte de dados candidatas.  CORRETO
Código da questão: 42834
I. Na arquitetura de duas camadas há uma economia em relação a arquitetura de três
camadas 
PORQUE 
II. Na arquitetura de duas camadas o servidor de aplicação e banco de dados é executado
fisicamente na mesma plataforma de hardware que o data warehouse. 
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
As duas asserções estão corretas e a segunda não justifica a primeira.
As duas asserções estão corretas e a segunda justifica a primeira  CORRETO
A primeira asserção está incorreta e a segunda está correta.
A primeira asserção está incorreta e a segunda está incorreta
A primeira asserção está correta e a segunda está incorreta.
Resolução comentada:
O principal objetivo de um data warehouse é auxiliar as organizações na tomada de
decisões, pois fornece dados que podem ser utilizados para fins analíticos.
Resolução comentada:
A identificação de fonte de dados candidatas visa avaliar as prováveis fontes de
dados que se acredita serem úteis no processo de tomada de decisões.
27/08/2021 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2347443/2506861 2/4
4)
5)
6)
Código da questão: 42822
I. O Data Flow é uma tarefa do fluxo de controle usada quando se necessita realizar a
transferência de dados 
PORQUE 
II. O Data Flow é utilizado para importar, exportar e transformar dados, tendo como
componentes Data Flow Sources, Data Flow Transformations e Data Flow Destinations.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
A primeira asserção está incorreta e a segunda está correta.
A primeira asserção está correta e a segunda está incorreta.
A primeira asserção está incorreta e a segunda está incorreta
As duas asserções estão corretas e a segunda justifica a primeira
As duas asserções estão corretas e a segunda não justifica a primeira.  CORRETO
Código da questão: 42829
Segundo Kimball e Caserta (2009), a chave primária fica armazenada em um único
campo contendo um valor inteiro único chamado valor substituto. Assinale a alternativa
que apresente, corretamente, a forma de relação que deve ser realizada com essas chaves.
Alternativas:
Criar e inserir chaves primárias e substitutas.
Criar e inserir chaves primárias.  INCORRETO
Criar e inserir chaves.
Criar e inserir dados.
Criar e inserir chaves substitutas. CORRETO
Código da questão: 42849
Dados dimensionais para dimensões grandes e complexas como cliente, fornecedor ou
produto são frequentemente extraídos de várias fontes em diferentes momentos. Isso
requer atenção especial ao reconhecimento da mesma entidade dimensional em vários
sistemas de origem. Assinale a alternativa que apresente, corretamente, um conflito que
pode ocorrer.
Alternativas:
Resolução comentada:
As duas asserções estão corretas e a segunda justifica a primeira. Na arquitetura de
duas camadas há uma economia em relação a arquitetura de três camadas porque
na arquitetura de duas camadas o servidor de aplicação e banco de dados é
executado fisicamente na mesma plataforma de hardware que o data warehouse.
Resolução comentada:
As duas asserções estão corretas e a segunda não justifica a primeira. O Data Flow é
uma tarefa do fluxo de controle usada quando se necessita realizar a transferência
de dados. A segunda asserção explica para que o Data Flow é usado e quais seus
componentes. .
Resolução comentada:
A chave primária fica armazenada em um único campo contendo um valor inteiro
único chamado valor substituto. O processo de ETL do data warehouse deve sempre
criar e inserir as chaves substitutas, isto é, o data warehouse possui essas chaves e
nunca permite que outra entidade as atribua.
27/08/2021 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2347443/2506861 3/4
7)
8)
Conflito de chaves.
Conflito com dimensões grandes.
Conflito de data e hora
Conflito em descrições sobrepostas. CORRETO
Conflito de extração de dados.  INCORRETO
Código da questão: 42853
São produtos fornecidos como opção ao comprar software de banco de dados e
algumas funcionalidades são incorporadas ao banco de dados e não estão disponíveis
separadamente na própria ferramenta ETL. Assinale a alternativa que apresenta,
corretamente, a categoria de ferramenta de ETL descrita:
Alternativas:
Ferramenta ETL Business Intelligence Integrada
Ferramenta ETL Produto de Nicho
Ferramenta ETL Pura
Ferramenta de ETL codificada manualmente
Ferramenta ETL Base de dados integrada  CORRETO
Código da questão: 42825
São técnicas para suavização de ruídos: 
( ) Compartimentalização (binning) 
( ) Regressão Linear 
( ) Mineração de Dados 
( ) Agrupamento (clustering) 
( ) Regressão Não-Linear 
Assinale a alternativa que contenha a sequência correta:
Alternativas:
V – V – V – F – F
V – V – F – V – V CORRETO
V – V – V – V – V
V – V – F – V – F  INCORRETO
V – V – V – F – V
Código da questão: 42842
Resolução comentada:
Ao se utilizar dados dimensionais para dimensões grandes e complexas, é necessário
uma atenção especial para reconhecer da mesma entidade dimensional em vários
sistemas de origem um conflito em descrições sobrepostas.
Resolução comentada:
A Ferramenta ETL Base de dados integrada é um produto fornecido como opção ao
comprar software de banco de dados e algumas funcionalidades são incorporadas
ao banco de dados e não estão disponíveis separadamente na própria ferramenta
ETL .
Resolução comentada:
São técnicas para suavização de ruídos a compartimentalização (binning), a
regressão linear, o agrupamento (clustering) e a regressão não-linear. Mineração de
dados não é um método de suavização de ruídos porque é o exame de dados já
coletados, resultando em informações.
27/08/2021 Cosmos · Cosmos
https://kroton.platosedu.io/lms/m/aluno/disciplina/index/2347443/2506861 4/4
9)
10)
Indique corretamente em qual etapa do processo ETL são preparadas as estruturas de
tabelas dimensionais de forma mais restrita:
Alternativas:
Entrega  CORRETO
Conformação
Extração
Transformação
Limpeza
Código da questão: 42852
São elementos do mapeamento de dados lógico: 
I. Nome da tabela de destino; 
II. Nome da coluna de destino; 
III. Nome do SGBD de origem; 
IV. Banco de dados de origem; 
V. Banco de dados de destino. 
São verdadeiras:
Alternativas:
I, II, III e IV.
I, III e V.I, II, III, IV e V.  INCORRETO
I, II, IV e V.
I, II e IV. CORRETO
Código da questão: 42836
Resolução comentada:
Na etapa de entrega de dados são preparadas as estruturas de tabelas dimensionais
de forma mais restrita.
Resolução comentada:
As afirmativas III e V estão incorretas. Os elementos do mapeamento de dados
lógico apresentados corretamente são o nome da tabela de destino, nome da coluna
de destino e banco de dados de origem.
Arquivos e Links

Continue navegando