Buscar

Integração e fluxo de dados (ETL)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A 
Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da 
média final. Você tem até cinco tentativas para “Enviar” as questões, que são 
automaticamente corrigidas. Você pode responder as questões consultando o material 
de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova! 
1) 
São algumas das técnicas de preenchimento de dados aplicadas a valores faltantes: 
I. Descartar toda a tupla; 
II. Preencher o valor faltante manualmente; 
III. Descartar todos os dados; 
IV. Usar constante global para preencher o valor faltante; 
V. Preencher os dados faltantes com null. 
São verdadeiras: 
 
Alternativas: 
 I, II, III e IV 
 I, II, III e V 
 I, II e IV CORRETO 
 I, III e V 
 I, II e III 
Resolução comentada: 
As afirmativas III e V estão incorretas. São algumas das técnicas de preenchimento de 
dados aplicados a valores faltantes o descarte de toda a tupla, preencher o valor 
faltante manualmente e utilizar uma constante global para preencher o valor faltante. A 
afirmativa III está incorreta pois descartar todos os dados não é uma técnica de 
preenchimento, e deixará o usuário sem dados para trabalhar. A afirmativa V está 
incorreta porque null não é um dado. 
Código da questão: 42841 
2) 
São atividades de integração de dados: 
( ) Identificar os sistemas de origem; 
( ) Compreender os sistemas de origem; 
( ) Criar e registrar a lógica de correspondência; 
( ) Realizar a limpeza dos dados; 
( ) Carregar a dimensão conformada. 
Assinale a alternativa que contenha a sequência correta: 
 
Alternativas: 
 V – V – V – V – V 
 V – V – V – V – F 
 V – V – V – F – V CORRETO 
 V – V – F – V – F 
 V – V – V – F – F 
Resolução comentada: 
São atividades de integração de dados identificar o sistema de origem, compreender o 
sistema de origem, criar e registrar a lógica de correspondência, estabelecer as regras 
de negócio de atributos não chave e carregar dimensão conformada. 
Código da questão: 42837 
3) 
O agrupamento (clustering) é utilizado para eliminar outliers. 
Porque 
Os dados são automaticamente divididos em grupos (clusters) e pontos que não 
pertencem a um dado grupo são eliminados. 
 
Alternativas: 
 A primeira asserção está correta e a segunda está incorreta. 
 As duas asserções estão corretas e a segunda justifica a primeira CORRETO 
 As duas asserções estão corretas e a segunda não justifica a primeira. 
 A primeira asserção está incorreta e a segunda está incorreta 
 A primeira asserção está incorreta e a segunda está correta. 
Resolução comentada: 
As duas asserções estão corretas e a segunda justifica a primeira. O agrupamento 
(clustering) se utiliza para que sejam eliminados os outliers, porque dessa forma, os 
dados se dividem em grupos (clusters) e alguns pontos não pertencentes a um dado 
grupo são eliminados. 
Código da questão: 42843 
4) 
A conformação de dados é a combinação de dados de diferentes fontes em uma base 
de dados única e coerente. São alguns problemas relacionados à conformação de 
dados: 
I. Identificação de Entidades. 
II. Redundância. 
III. Conflito de Valores. 
IV. Suavização. 
V. Agregação. 
São verdadeiras: 
 
Alternativas: 
 I, II e IV. 
 I, III e V. 
 I, II, III e IV. 
 I, II e III. CORRETO 
 I, II, III e V. 
Resolução comentada: 
As afirmações IV e V são falsas. São alguns dos problemas relacionas à conformação de 
dados, a identificação de entidades, a redundância e o conflito de valores. 
Código da questão: 42846 
5) 
Existem vários métodos para identificar os candidatos de registro alterados para carga 
de ETL do microbatch no data warehouse em tempo real: 
( ) Timestamps. 
( ) Tabelas de log ETL. 
( ) Log dos SGBD. 
( ) Incompatibilidade de dados. 
( ) Monitores de Rede. 
Assinale a alternativa que contenha a sequência correta: 
 
Alternativas: 
 V – V – V – F – V. CORRETO 
 V – V – V – V – V. 
 V – V – V – F – F. 
 V – V – F – V – F. 
 V – V – F – V – V. 
Resolução comentada: 
Os vários métodos para identificar os candidatos de registro alterados para carga de 
ETL do microbatch no data warehouse em tempo real são: Timestamps (método que 
permite gravações frequentes de registros de data e hora nos sistemas para as 
alterações e leituras frequentes), tabelas de log ETL (tabelas que contém o identificados 
do registro novo ou alterado), Log dos SGBD (usados para identificar novas transações 
e transações alteradas) e Monitores de Rede (utilitários que monitoram algum conjunto 
de tráfego em um rede, filtrando e registrando o tráfego). 
Código da questão: 42857 
6) 
São produtos fornecidos como opção ao comprar software de banco de dados e 
algumas funcionalidades são incorporadas ao banco de dados e não estão disponíveis 
separadamente na própria ferramenta ETL. Assinale a alternativa que apresenta, 
corretamente, a categoria de ferramenta de ETL descrita: 
 
Alternativas: 
 Ferramenta ETL Base de dados integrada CORRETO 
 Ferramenta ETL Business Intelligence Integrada 
 Ferramenta ETL Produto de Nicho 
 Ferramenta de ETL codificada manualmente 
 Ferramenta ETL Pura 
Resolução comentada: 
A Ferramenta ETL Base de dados integrada é um produto fornecido como opção ao 
comprar software de banco de dados e algumas funcionalidades são incorporadas ao 
banco de dados e não estão disponíveis separadamente na própria ferramenta ETL . 
Código da questão: 42825 
7) 
O subsistema de limpeza de dados necessita ser minucioso em sua detecção, correção 
e documentação da qualidade das informações que publica. Os usuários finais querem 
utilizar o data warehouse como uma fonte de dados confiável, uma base sobre a qual 
pode construir suas métricas, estratégias e políticas de gerenciamento. Assinale a 
alternativa que apresente, corretamente, o objetivo de qualidade de dados descrito 
acima: 
 
Alternativas: 
 Transparência. 
 Validade. 
 Correção. 
 Completude. CORRETO 
 Rapidez. 
Resolução comentada: 
Ser completo (completude) tem como característica ser minucioso em sua detecção, 
correção e documentação da qualidade das informações que publica. Os usuários finais 
querem utilizar o data warehouse como uma fonte de dados confiável, uma base sobre 
a qual pode construir suas métricas, estratégias e políticas de gerenciamento. 
Código da questão: 42839 
8) 
O Capture, Transform e Flow (CTF) é uma categoria relativamente nova de ferramentas 
de integração de dados, projetada para simplificar o movimento de dados em tempo 
real por meio de tecnologias de bancos de dados heterogêneos. 
Porque 
A camada de aplicativo dos aplicativos transacionais é ignorada e, em vez disso, as 
trocas diretas do banco de dados com o banco de dados são executadas. 
 
Alternativas: 
 A primeira asserção está incorreta e a segunda está incorreta. 
 As duas asserções estão corretas e a segunda não justifica a primeira. CORRETO 
 A primeira asserção está incorreta e a segunda está correta. 
 As duas asserções estão corretas e a segunda justifica a primeira. 
 A primeira asserção está correta e a segunda está incorreta. 
Resolução comentada: 
O Capture, Transform e Flow (CTF) é uma categoria relativamente nova de ferramentas 
de integração de dados projetada para simplificar o movimento de dados em tempo 
real por meio de tecnologias de bancos de dados heterogêneos. A camada de 
aplicativo dos aplicativos transacionais é ignorada e, em vez disso, as trocas diretas do 
banco de dados com o banco de dados são executadas. A segunda afirmação é a 
consequência do uso da arquitetura, sendo determinada no projeto do CTF. 
Código da questão: 42858 
9) 
Indique corretamente em qual etapa do processo ETL são preparadas as estruturas de 
tabelas dimensionais de forma mais restrita: 
 
Alternativas: 
 Conformação 
 Extração 
 Limpeza 
 Transformação 
 Entrega CORRETOResolução comentada: 
Na etapa de entrega de dados são preparadas as estruturas de tabelas dimensionais de 
forma mais restrita. 
Código da questão: 42852 
10) 
O uso de banco de dados é essencial para o processo de manipulação de dados, 
porém para fins analíticos é de difícil uso, sendo indicado o uso de um data warehouse. 
Assinale a alternativa que apresenta, corretamente, o principal objetivo de um data 
warehouse: 
 
Alternativas: 
 Alteração de dados 
 Armazenamento de dados 
 Auxiliar à tomada de decisões CORRETO 
 Recuperação de dados 
 Transformação de dados 
Resolução comentada: 
O principal objetivo de um data warehouse é auxiliar as organizações na tomada de 
decisões, pois fornece dados que podem ser utilizados para fins analíticos. 
Código da questão: 42817

Continue navegando