Buscar

Integração e fluxo de dados (ETL)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 6 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 6 páginas

Prévia do material em texto

Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina. A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da média final. Você tem até cinco tentativas para “Enviar” as questões, que são automaticamente corrigidas. Você pode responder as questões consultando o material de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova!
Parte superior do formulário
1)
Existem vários métodos para identificar os candidatos de registro alterados para carga de ETL do microbatch no data warehouse em tempo real:
( ) Timestamps.
( ) Tabelas de log ETL.
( ) Log dos SGBD.
( ) Incompatibilidade de dados.
( ) Monitores de Rede.
Assinale a alternativa que contenha a sequência correta:
Alternativas:
· V – V – V – F – F.
· V – V – F – V – V.
· V – V – V – V – V.
· V – V – F – V – F.
· V – V – V – F – V.
checkCORRETO
Resolução comentada:
Os vários métodos para identificar os candidatos de registro alterados para carga de ETL do microbatch no data warehouse em tempo real são: Timestamps (método que permite gravações frequentes de registros de data e hora nos sistemas para as alterações e leituras frequentes), tabelas de log ETL (tabelas que contém o identificados do registro novo ou alterado), Log dos SGBD (usados para identificar novas transações e transações alteradas) e Monitores de Rede (utilitários que monitoram algum conjunto de tráfego em um rede, filtrando e registrando o tráfego).
Código da questão: 42857
2)
I. Na arquitetura de duas camadas há uma economia em relação a arquitetura de três camadas
PORQUE
II. Na arquitetura de duas camadas o servidor de aplicação e banco de dados é executado fisicamente na mesma plataforma de hardware que o data warehouse.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre elas:
Alternativas:
· As duas asserções estão corretas e a segunda não justifica a primeira.
· A primeira asserção está correta e a segunda está incorreta.
· A primeira asserção está incorreta e a segunda está incorreta
· As duas asserções estão corretas e a segunda justifica a primeira
checkCORRETO
· A primeira asserção está incorreta e a segunda está correta.
Resolução comentada:
As duas asserções estão corretas e a segunda justifica a primeira. Na arquitetura de duas camadas há uma economia em relação a arquitetura de três camadas porque na arquitetura de duas camadas o servidor de aplicação e banco de dados é executado fisicamente na mesma plataforma de hardware que o data warehouse.
Código da questão: 42822
3)
São características fundamentais dos data warehouse em relação aos dados:
I. Orientado por assunto
II. Integrado
III. Com apenas dados históricos.
IV. Variável no tempo.
V. Volátil.
São verdadeiras:
Alternativas:
· I, II, III, IV e V
· I, III e V
· I, II e IV
checkCORRETO
· I, II, IV e V
· I, II, III e IV
Resolução comentada:
As afirmativas III e V estão incorretas. Os data warehouse apresentam como características fundamentais dados que devem ser orientados por assunto, integrados e variáveis no tempo. Os data warehouse devem possuir dados atuais e dados históricos e devem ser não voláteis. .
Código da questão: 42820
4)
O agrupamento (clustering) é utilizado para eliminar outliers.
Porque
Os dados são automaticamente divididos em grupos (clusters) e pontos que não pertencem a um dado grupo são eliminados.
Alternativas:
· A primeira asserção está incorreta e a segunda está correta.
· A primeira asserção está correta e a segunda está incorreta.
· As duas asserções estão corretas e a segunda justifica a primeira
checkCORRETO
· As duas asserções estão corretas e a segunda não justifica a primeira.
· A primeira asserção está incorreta e a segunda está incorreta
Resolução comentada:
As duas asserções estão corretas e a segunda justifica a primeira. O agrupamento (clustering) se utiliza para que sejam eliminados os outliers, porque dessa forma, os dados se dividem em grupos (clusters) e alguns pontos não pertencentes a um dado grupo são eliminados.
Código da questão: 42843
5)
O Capture, Transform e Flow (CTF) é uma categoria relativamente nova de ferramentas de integração de dados, projetada para simplificar o movimento de dados em tempo real por meio de tecnologias de bancos de dados heterogêneos.
Porque
A camada de aplicativo dos aplicativos transacionais é ignorada e, em vez disso, as trocas diretas do banco de dados com o banco de dados são executadas.
Alternativas:
· As duas asserções estão corretas e a segunda não justifica a primeira.
checkCORRETO
· A primeira asserção está correta e a segunda está incorreta.
· As duas asserções estão corretas e a segunda justifica a primeira.
· A primeira asserção está incorreta e a segunda está incorreta.
· A primeira asserção está incorreta e a segunda está correta.
Resolução comentada:
O Capture, Transform e Flow (CTF) é uma categoria relativamente nova de ferramentas de integração de dados projetada para simplificar o movimento de dados em tempo real por meio de tecnologias de bancos de dados heterogêneos. A camada de aplicativo dos aplicativos transacionais é ignorada e, em vez disso, as trocas diretas do banco de dados com o banco de dados são executadas. A segunda afirmação é a consequência do uso da arquitetura, sendo determinada no projeto do CTF.
Código da questão: 42858
6)
De acordo com Kimbal e Caserta (2009), a conformação ou integração de dados diz respeito a criação de dimensões e instâncias de fatos configuradas, combinando as melhores informações de várias fontes de dados em uma visão mais abrangente. Dentre um dos problemas para conformação, estão dados duplicados e vários atributos podendo ser obtidos a partir de um outro atributo ou conjunto de valores. Assinale a alternativa que apresente, corretamente, qual o problema descrito acima:
Alternativas:
· Conflito de Valores.
· Valores que os campos podem assumir.
· Redundância.
checkCORRETO
· Unidades diferentes.
· Identificação de Entidades.
Resolução comentada:
A redundância é um dos problemas que trata dados duplicados e vários atributos, podendo ser obtidos a partir de outro atributo ou conjunto de valores.
Código da questão: 42844
7)
Sobre as ferramentas ETL Puras:
( ) são produtos independentes da base de dados e ferramenta de BI
( ) são produtos dependentes da base de dados e ferramenta de BI
( ) permitem a migração para diferentes base de dados sem mudar o processo de integração
( ) permitem a migração para diferentes base de dados mudando o processo de integração
( ) as empresas não precisam depender de nenhum outro produto para a funcionalidade oferecida
Assinale a alternativa que contenha a sequência correta:
Alternativas:
· V – V – V – F – V
· V – V – V – V – V
· V – V – F – V – F
· V – V – V – F – F
· V – F – V – F – V
checkCORRETO
Resolução comentada:
As afirmativas 2 e 4 são falsas. As ferramentas de ETL Pura são produtos independentes da base de dados e ferramenta ETL de Business Intelligence que se pretende usar. As empresas não precisam depender de nenhum outro produto para a funcionalidade oferecida e permitem a migração para diferentes bases de dados sem mudar o processo de integração.
Código da questão: 42828
8)
Um ___________ é uma variação ou ____________ aleatório observado em uma ______________ medida, podendo introduzir erros nos ____________.
Assinale a alternativa que completa adequadamente as lacunas acima:
Alternativas:
· ruído – erro – variável - resultados.
checkCORRETO
· desvio – erro – variável - resultados.
· ruído – erro – variável - ruídos.
· ruído – mudança – variável - resultados.
· ruído – erro – análise - resultados.
Resolução comentada:
O ruído se mostra como uma variação ou erro que se observa em uma variável que está sendo medida, podendo assim, apresentar erros nos resultados.
Código da questão: 42840
9)
O componente final de todas as _______________, além da _________________ e da ____________________ é o conjunto de _____________________.
Assinale a alternativa que completa adequadamente as lacunas acima:
Alternativas:
· dimensões – chave primária– chave estrangeira – atributos descritivos.
· dimensões – chave primária – chave substituta – atributos descritivos..
· dimensões – chave substituta – chave natural – atributos descritivos.
· dimensões – chave primária – chave natural – atributos descritivos.
checkCORRETO
· dimensões – chave estrangeira – chave natural – atributos descritivos.
Resolução comentada:
As palavras que completam as lacunas são: “dimensões – chave primária – chave natural – atributos descritivos”. Um conjunto de atributos descritivos, assim como a chave primária e a chave natural, são considerados componentes finais de todas as dimensões.
Código da questão: 42850
10)
As ferramentas ___________________ fornecem características de __________________, suportam vários arquivos de _______________ de entrada ou saída, funções de _________________ e banco de dados ________________.
Assinale a alternativa que completa adequadamente as lacunas acima:
Alternativas:
· ETL codificado manualmente– análise – banco de dados – transformação - nativo.
· ETL baseado em ferramenta – transformação – banco de dados – transformação - nativo.
checkCORRETO
· ETL codificado manualmente– implementação – banco de dados – transformação - nativo.
· ETL baseado em ferramenta – análise – banco de dados – transformação - nativo
· ETL codificado manualmente – transformação – banco de dados – transformação - nativo.
Resolução comentada:
São características das ferramentas ETL baseadas em ferramenta o processo de transformação de dados, com suporte a vários arquivos de banco de dados, de entrada ou saída, com funções de transformação e suporte a banco de dados nativo.
Código da questão: 42826
Parte inferior do formulário

Mais conteúdos dessa disciplina