Buscar

Integração e fluxo de dados (ETL)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 7 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Integração e fluxo de dados (ETL)
Anhanguera
1)
Sobre as ferramentas ETL Puras:
( ) são produtos independentes da base de dados e ferramenta de BI
( ) são produtos dependentes da base de dados e ferramenta de BI
( ) permitem a migração para diferentes base de dados sem mudar o processo de integração
( ) permitem a migração para diferentes base de dados mudando o processo de integração
( ) as empresas não precisam depender de nenhum outro produto para a funcionalidade oferecida
Assinale a alternativa que contenha a sequência correta:
Alternativas:
· V – V – V – F – V
· V – V – V – V – V
· V – V – V – F – F
· V – V – F – V – F
· V – F – V – F – V CORRETO
Resolução comentada:
As afirmativas 2 e 4 são falsas. As ferramentas de ETL Pura são produtos independentes da base de dados e ferramenta ETL de Business Intelligence que se pretende usar. As empresas não precisam depender de nenhum outro produto para a funcionalidade oferecida e permitem a migração para diferentes bases de dados sem mudar o processo de integração.
Código da questão: 42828
2)
São subcategorias de classificação de ferramentas ETL:
I. Ferramentas ETL Pura
II. Ferramenta Base de dados integrada
III. Ferramenta Business Intelligence Integrada
IV. Ferramenta de Produto de Nicho
V. ETL automatizada
São verdadeiras:
Alternativas:
· I, II, III e IV CORRETO
· I, III e V
· I, II, III e V
· I, III, IV e V
· I, II, IV e V
Resolução comentada:
Apenas a V é incorreta. São subcategorias de classificação de ferramentas ETL as ferramentas ETL Puras, ferramenta ETL base de dados integrada, ferramenta ETL Business Intelligence integrada e ferramenta ETL produto de nicho.
Código da questão: 42827
3)
I. Na arquitetura de duas camadas há uma economia em relação a arquitetura de três camadas
PORQUE
II. Na arquitetura de duas camadas o servidor de aplicação e banco de dados é executado fisicamente na mesma plataforma de hardware que o data warehouse.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
· As duas asserções estão corretas e a segunda justifica a primeira CORRETO
· A primeira asserção está correta e a segunda está incorreta.
· A primeira asserção está incorreta e a segunda está correta.
· As duas asserções estão corretas e a segunda não justifica a primeira.
· A primeira asserção está incorreta e a segunda está incorreta
Resolução comentada:
As duas asserções estão corretas e a segunda justifica a primeira. Na arquitetura de duas camadas há uma economia em relação a arquitetura de três camadas porque na arquitetura de duas camadas o servidor de aplicação e banco de dados é executado fisicamente na mesma plataforma de hardware que o data warehouse.
Código da questão: 42822
4)
Dados dimensionais para dimensões grandes e complexas como cliente, fornecedor ou produto são frequentemente extraídos de várias fontes em diferentes momentos. Isso requer atenção especial ao reconhecimento da mesma entidade dimensional em vários sistemas de origem. Assinale a alternativa que apresente, corretamente, um conflito que pode ocorrer.
Alternativas:
· Conflito em descrições sobrepostas. CORRETO
· Conflito de data e hora
· Conflito de extração de dados.
· Conflito de chaves.
· Conflito com dimensões grandes.
Resolução comentada:
Ao se utilizar dados dimensionais para dimensões grandes e complexas, é necessário uma atenção especial para reconhecer da mesma entidade dimensional em vários sistemas de origem um conflito em descrições sobrepostas.
Código da questão: 42853
5)
São técnicas para suavização de ruídos:
( ) Compartimentalização (binning)
( ) Regressão Linear
( ) Mineração de Dados
( ) Agrupamento (clustering)
( ) Regressão Não-Linear
Assinale a alternativa que contenha a sequência correta:
Alternativas:
· V – V – V – F – V
· V – V – F – V – F
· V – V – V – V – V
· V – V – V – F – F
· V – V – F – V – V CORRETO
Resolução comentada:
São técnicas para suavização de ruídos a compartimentalização (binning), a regressão linear, o agrupamento (clustering) e a regressão não-linear. Mineração de dados não é um método de suavização de ruídos porque é o exame de dados já coletados, resultando em informações.
Código da questão: 42842
6)
A transformação de dados consiste em transformar ou consolidar os dados em um formato mais adequado para o data warehouse. São considerados tipos de transformação:
( ) Suavização.
( ) Agregação.
( ) Generalização.
( ) Normalização.
( ) Redundância.
Assinale a alternativa que contenha a sequência correta:
Alternativas:
· V – V – V – F – F
· V – V – V – V – F CORRETO
· V – V – V – V – V
· V – V – F – V – V
· V – V – F – V – F
Resolução comentada:
São técnicas para transformação de dados a suavização, agregação, generalização e normalização. A redundância é um tipo de problema relacionado à conformação de dados.
Código da questão: 42847
7)
As ferramentas ___________________ fornecem características de __________________, suportam vários arquivos de _______________ de entrada ou saída, funções de _________________ e banco de dados ________________.
Assinale a alternativa que completa adequadamente as lacunas acima:
Alternativas:
· ETL codificado manualmente– implementação – banco de dados – transformação - nativo.
· ETL codificado manualmente – transformação – banco de dados – transformação - nativo.
· ETL codificado manualmente– análise – banco de dados – transformação - nativo.
· ETL baseado em ferramenta – análise – banco de dados – transformação - nativo
· ETL baseado em ferramenta – transformação – banco de dados – transformação - nativo. CORRETO
Resolução comentada:
São características das ferramentas ETL baseadas em ferramenta o processo de transformação de dados, com suporte a vários arquivos de banco de dados, de entrada ou saída, com funções de transformação e suporte a banco de dados nativo.
Código da questão: 42826
8)
São elementos do mapeamento de dados lógico:
I. Nome da tabela de destino;
II. Nome da coluna de destino;
III. Nome do SGBD de origem;
IV. Banco de dados de origem;
V. Banco de dados de destino.
São verdadeiras:
Alternativas:
· I, II, III, IV e V.
· I, III e V.
· I, II, III e IV.
· I, II, IV e V.
· I, II e IV. CORRETO
Resolução comentada:
As afirmativas III e V estão incorretas. Os elementos do mapeamento de dados lógico apresentados corretamente são o nome da tabela de destino, nome da coluna de destino e banco de dados de origem.
Código da questão: 42836
9)
Indique corretamente em qual etapa do processo ETL são preparadas as estruturas de tabelas dimensionais de forma mais restrita:
Alternativas:
· Entrega CORRETO
· Conformação
· Transformação
· Limpeza
· Extração
Resolução comentada:
Na etapa de entrega de dados são preparadas as estruturas de tabelas dimensionais de forma mais restrita.
Código da questão: 42852
10)
De acordo com Kimbal e Caserta (2009), a conformação ou integração de dados diz respeito a criação de dimensões e instâncias de fatos configuradas, combinando as melhores informações de várias fontes de dados em uma visão mais abrangente. Dentre um dos problemas para conformação, estão dados duplicados e vários atributos podendo ser obtidos a partir de um outro atributo ou conjunto de valores. Assinale a alternativa que apresente, corretamente, qual o problema descrito acima:
Alternativas:
· Conflito de Valores.
· Valores que os campos podem assumir.
· Identificação de Entidades.
· Redundância. CORRETO
· Unidades diferentes.
Resolução comentada:
A redundância é um dos problemas que trata dados duplicados e vários atributos, podendo ser obtidos a partir de outro atributo ou conjunto de valores.
Código da questão: 42844

Continue navegando