Buscar

Integração e fluxo de dados (ETL)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova!
Parte superior do formulário
1)
São elementos do mapeamento de dados lógico:
I. Nome da tabela de destino;
II. Nome da coluna de destino;
III. Nome do SGBD de origem;
IV. Banco de dados de origem;
V. Banco de dados de destino.
São verdadeiras:
Alternativas:
· I, II, III, IV e V.
· I, II, III e IV.
· I, II, IV e V.
· I, II e IV.
checkCORRETO
· I, III e V.
Resolução comentada:
As afirmativas III e V estão incorretas. Os elementos do mapeamento de dados lógico apresentados corretamente são o nome da tabela de destino, nome da coluna de destino e banco de dados de origem.
Código da questão: 42836
2)
I. Na arquitetura de duas camadas há uma economia em relação a arquitetura de três camadas
PORQUE
II. Na arquitetura de duas camadas o servidor de aplicação e banco de dados é executado fisicamente na mesma plataforma de hardware que o data warehouse.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
· As duas asserções estão corretas e a segunda não justifica a primeira.
· A primeira asserção está correta e a segunda está incorreta.
· A primeira asserção está incorreta e a segunda está correta.
· As duas asserções estão corretas e a segunda justifica a primeira
checkCORRETO
· A primeira asserção está incorreta e a segunda está incorreta
Resolução comentada:
As duas asserções estão corretas e a segunda justifica a primeira. Na arquitetura de duas camadas há uma economia em relação a arquitetura de três camadas porque na arquitetura de duas camadas o servidor de aplicação e banco de dados é executado fisicamente na mesma plataforma de hardware que o data warehouse.
Código da questão: 42822
3)
Um ___________ é uma variação ou ____________ aleatório observado em uma ______________ medida, podendo introduzir erros nos ____________.
Assinale a alternativa que completa adequadamente as lacunas acima:
Alternativas:
· ruído – erro – análise - resultados.
· ruído – mudança – variável - resultados.
· ruído – erro – variável - ruídos.
· ruído – erro – variável - resultados.
checkCORRETO
· desvio – erro – variável - resultados.
Resolução comentada:
O ruído se mostra como uma variação ou erro que se observa em uma variável que está sendo medida, podendo assim, apresentar erros nos resultados.
Código da questão: 42840
4)
O componente final de todas as _______________, além da _________________ e da ____________________ é o conjunto de _____________________.
Assinale a alternativa que completa adequadamente as lacunas acima:
Alternativas:
· dimensões – chave primária – chave estrangeira – atributos descritivos.
· dimensões – chave primária – chave substituta – atributos descritivos..
· dimensões – chave estrangeira – chave natural – atributos descritivos.
· dimensões – chave substituta – chave natural – atributos descritivos.
· dimensões – chave primária – chave natural – atributos descritivos.
checkCORRETO
Resolução comentada:
As palavras que completam as lacunas são: “dimensões – chave primária – chave natural – atributos descritivos”. Um conjunto de atributos descritivos, assim como a chave primária e a chave natural, são considerados componentes finais de todas as dimensões.
Código da questão: 42850
5)
Existem vários métodos para identificar os candidatos de registro alterados para carga de ETL do microbatch no data warehouse em tempo real:
( ) Timestamps.
( ) Tabelas de log ETL.
( ) Log dos SGBD.
( ) Incompatibilidade de dados.
( ) Monitores de Rede.
Assinale a alternativa que contenha a sequência correta:
Alternativas:
· V – V – V – F – V.
checkCORRETO
· V – V – V – V – V.
· V – V – V – F – F.
· V – V – F – V – F.
· V – V – F – V – V.
Resolução comentada:
Os vários métodos para identificar os candidatos de registro alterados para carga de ETL do microbatch no data warehouse em tempo real são: Timestamps (método que permite gravações frequentes de registros de data e hora nos sistemas para as alterações e leituras frequentes), tabelas de log ETL (tabelas que contém o identificados do registro novo ou alterado), Log dos SGBD (usados para identificar novas transações e transações alteradas) e Monitores de Rede (utilitários que monitoram algum conjunto de tráfego em um rede, filtrando e registrando o tráfego).
Código da questão: 42857
6)
A transformação de dados consiste em transformar ou consolidar os dados em um formato mais adequado para o data warehouse. São considerados tipos de transformação:
( ) Suavização.
( ) Agregação.
( ) Generalização.
( ) Normalização.
( ) Redundância.
Assinale a alternativa que contenha a sequência correta:
Alternativas:
· V – V – V – V – V
· V – V – V – V – F
checkCORRETO
· V – V – F – V – V
· V – V – F – V – F
· V – V – V – F – F
Resolução comentada:
São técnicas para transformação de dados a suavização, agregação, generalização e normalização. A redundância é um tipo de problema relacionado à conformação de dados.
Código da questão: 42847
7)
De acordo com Kimbal e Caserta (2009), a conformação ou integração de dados diz respeito a criação de dimensões e instâncias de fatos configuradas, combinando as melhores informações de várias fontes de dados em uma visão mais abrangente. Dentre um dos problemas para conformação, estão dados duplicados e vários atributos podendo ser obtidos a partir de um outro atributo ou conjunto de valores. Assinale a alternativa que apresente, corretamente, qual o problema descrito acima:
Alternativas:
· Conflito de Valores.
· Valores que os campos podem assumir.
· Unidades diferentes.
· Redundância.
checkCORRETO
· Identificação de Entidades.
Resolução comentada:
A redundância é um dos problemas que trata dados duplicados e vários atributos, podendo ser obtidos a partir de outro atributo ou conjunto de valores.
Código da questão: 42844
8)
São produtos fornecidos como opção ao comprar software de banco de dados e algumas funcionalidades são incorporadas ao banco de dados e não estão disponíveis separadamente na própria ferramenta ETL. Assinale a alternativa que apresenta, corretamente, a categoria de ferramenta de ETL descrita:
Alternativas:
· Ferramenta ETL Base de dados integrada
checkCORRETO
· Ferramenta ETL Business Intelligence Integrada
· Ferramenta de ETL codificada manualmente
· Ferramenta ETL Produto de Nicho
· Ferramenta ETL Pura
Resolução comentada:
A Ferramenta ETL Base de dados integrada é um produto fornecido como opção ao comprar software de banco de dados e algumas funcionalidades são incorporadas ao banco de dados e não estão disponíveis separadamente na própria ferramenta ETL .
Código da questão: 42825
9)
Sobre as ferramentas ETL Puras:
( ) são produtos independentes da base de dados e ferramenta de BI
( ) são produtos dependentes da base de dados e ferramenta de BI
( ) permitem a migração para diferentes base de dados sem mudar o processo de integração
( ) permitem a migração para diferentes base de dados mudando o processo de integração
( ) as empresas não precisam depender de nenhum outro produto para a funcionalidade oferecida
Assinale a alternativa que contenha a sequência correta:
Alternativas:
· V – V – V – F – V
· V – V – F – V – F
· V – F – V – F – V
checkCORRETO
· V – V – V – V – V
· V – V – V – F – F
Resolução comentada:
As afirmativas 2 e 4 são falsas. As ferramentas de ETL Pura são produtos independentes da base de dados e ferramenta ETL de Business Intelligence que se pretende usar. As empresas não precisam depender de nenhum outro produto para a funcionalidade oferecida e permitem a migração para diferentes bases de dados sem mudar o processo de integração.
Código da questão: 42828
10)
São técnicas para suavização de ruídos:
( ) Compartimentalização (binning)
( ) Regressão Linear( ) Mineração de Dados
( ) Agrupamento (clustering)
( ) Regressão Não-Linear
Assinale a alternativa que contenha a sequência correta:
Alternativas:
· V – V – V – F – F
· V – V – V – V – V
· V – V – F – V – V
checkCORRETO
· V – V – F – V – F
· V – V – V – F – V
Resolução comentada:
São técnicas para suavização de ruídos a compartimentalização (binning), a regressão linear, o agrupamento (clustering) e a regressão não-linear. Mineração de dados não é um método de suavização de ruídos porque é o exame de dados já coletados, resultando em informações.
Código da questão: 42842
Parte inferior do formulário

Continue navegando