Buscar

Processo de ETL em um Data Warehouse

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 10 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

· Pergunta 1
1 em 1 pontos
	
	
	
	As ferramentas não devem apenas permitir o acesso aos dados, mas realizar uma análise significativa, de tal forma que transforme dados brutos em informação útil, que embase decisões estratégicas das empresas. O sucesso de um Data Warehouse pode depender das informações corretas e, assim, é necessária uma ferramenta que permita essa condução.
 
VARAGO, A. Processos de ETL em um Data Warehouse . Roteiro de Estudos. EAD.br. Disponível na Biblioteca Digital da Laureate.
 
Considerando o descrito como ferramentas para construção de um Data Warehouse , qual das alternativas, a seguir, dizem respeito à ferramenta que contempla componentes de Business Analytic s (BA) e Data Integration
(DI)?
	
	
	
	
		Resposta Selecionada:
	 
Pentaho.
	Resposta Correta:
	 
Pentaho.
	Feedback da resposta:
	Resposta correta. Pentaho é uma ferramenta que contempla as funcionalidades de acessar, integrar, manipular, visualizar e analisar os dados. Esses dados podem estar armazenados em um banco de dados relacional, bancos analíticos.
	
	
	
· Pergunta 2
0 em 1 pontos
	
	
	
	Os sistemas chamados de ETL são imprescindíveis, quando se diz respeito à preparação de dados a serem armazenados no DW. Existem diversos estudos sobre o processo de ETL que, de certa forma, é uma técnica já bem conhecida.
 
Considerando o descrito como sistemas de ETL, qual poderia ser considerada a principal responsabilidade no processo de Extração, Transformação e Carga (ETL)?
	
	
	
	
		Resposta Selecionada:
	 
Inserção de dados.
	Resposta Correta:
	 
Limpeza.
	
	
	
· Pergunta 3
0 em 1 pontos
	
	
	
	Sumários de dados contidos no modelo original, organizados de forma a atender consultas rotineiras de forma mais ágil, constituem-se em uma das formas mais eficientes de melhorar a performance das consultas em um DW.
VARAGO, A. Processos de ETL em um Data Warehouse . Roteiro de Estudos. EAD.br. Disponível na Biblioteca Digital da Laureate.
 
 
Considerando o descrito, qual forma de organização é um sumário de dados para a Data Warehouse ?
	
	
	
	
		Resposta Selecionada:
	 
Agregados.
	Resposta Correta:
	 
Dimensões.
	
	
	
· Pergunta 4
1 em 1 pontos
	
	
	
	Uma arquitetura de Data Warehouse pode ser definida como a forma de representar toda a estrutura do ambiente de dados, comunicação, processamento e apresentação disponível para o usuário na empresa.
Considerando o descrito e os conhecimentos adquiridos na leitura do Roteiro de Estudos da disciplina, com qual ferramenta os usuários finais interagem?
	
	
	
	
		Resposta Selecionada:
	 
Camada de acesso à informação.
	Resposta Correta:
	 
Camada de acesso à informação.
	Feedback da resposta:
	Resposta correta. Representa as ferramentas que o usuário utiliza no dia a dia para acessar as informações contidas em um DW, envolve hardware e software que são utilizados na obtenção de relatórios, planilhas, gráficos, entre outros. Nessa camada, também estão inseridas as ferramentas de mineração de dados ( data mining ) e análises dimensionais, as quais fornecem ao usuário maior flexibilidade, ao analisar um grande volume de dados.
	
	
	
· Pergunta 5
1 em 1 pontos
	
	
	
	Neste teste, procura-se assegurar que todos os dados esperados sejam carregados. Comparam-se o número de registos entre os dados das fontes e o número de registros carregados para o DW. Comparam-se valores únicos de determinados atributos entre as fontes e os dados carregados para o DW. Procura-se fazer um bom esquema de dados para perceber as limitações dos valores atribuídos. Procura-se validar os conteúdos de cada atributo, ou seja, não permitir que, por razões de codificação, o limite de caracteres entre cada esquema relacional (fonte e destino) não resulte na falha do fluxo de dados.
 
VARAGO, A. Processos de ETL em um Data Warehouse . Roteiro de Estudos. EAD.br. Disponível na Biblioteca Digital da Laureate.
 
Considerando o descrito como desenvolvimento de métodos de ETL, qual é o objetivo de assegurar que todos os dados esperados sejam carregados no processo de Extração, Transformação e Carga (ETL)?
	
	
	
	
		Resposta Selecionada:
	 
O preenchimento de dados possa ser realizado de forma satisfatória.
	Resposta Correta:
	 
O preenchimento de dados possa ser realizado de forma satisfatória.
	Feedback da resposta:
	Resposta correta. O preenchimento de dados procura assegurar que todos os dados esperados sejam carregados. Comparam-se valores únicos de determinados atributos entre as fontes e os dados carregados para o DW. Procura-se fazer um bom esquema de dados para perceber as limitações dos valores atribuídos. Procura-se validar os conteúdos de cada atributo, ou seja, não permitir que, por razões de codificação, o limite de caracteres entre cada esquema relacional (fonte e destino) não resulte na falha do fluxo de dados. Na transformação de dados, tenta-se assegurar que os dados sejam transformados corretamente de acordo com as regras de negócio especificadas. Procura-se criar testes, os mais diversos possíveis, para antever algumas situações consequentes. Tenta-se validar o processamento correto de campos no ETL, tais como: chaves estrangeiras. Procura-se verificar, sempre, se os tipos de dados presentes no DW são os que eram planejados. Ainda, procura-se testar a integridade referencial entre as tabelas.
	
	
	
· Pergunta 6
1 em 1 pontos
	
	
	
	A opção por uma abordagem de implementação é influenciada por fatores como a infraestrutura de Tecnologia de Informação, a arquitetura escolhida, o escopo da implementação, os recursos disponíveis e, principalmente, pela necessidade ou não de acesso corporativo dos dados, assim como pelo retorno de investimento desejado e velocidade de implementação.
Considerando o descrito, qual abordagem inicialmente faz levantamento de todos os requisitos, fontes de dados, padrões e outros, dos departamentos da empresa participantes da iniciativa, para então dar sequência na implementação de toda a estrutura?
	
	
	
	
		Resposta Selecionada:
	 
Abordagem top-down.
	Resposta Correta:
	 
Abordagem top-down.
	Feedback da resposta:
	Resposta correta. Esse tipo de abordagem baseia-se em um Data Warehouse corporativo central, baseado no modelo relacional e totalmente normalizado. O processo de extração, transformação e carga e, consequentemente, a área de estágio de dados são implementados de forma única e integrada.
	
	
	
· Pergunta 7
1 em 1 pontos
	
	
	
	O maior benefício de uma solução OLAP é a capacidade de fornecer recursos de cálculo altamente avançados, com surpreendentes tempos de resposta para os usuários finais. Agora que o opcional OLAP está disponível no banco de dados, a ferramenta oferece essa tecnologia de maneira fácil de usar.
 
VARAGO, A. Processos de ETL em um Data Warehouse . Roteiro de Estudos. EAD.br. Disponível na Biblioteca Digital da Laureate.
 
Considerando o trecho supracitado e os conhecimentos adquiridos por meio do Roteiro de Estudos da disciplina, qual das alternativas, a seguir, traz a ferramenta que possui as capacidades mencionadas?
	
	
	
	
		Resposta Selecionada:
	 
Oracle Warehouse Builder.
	Resposta Correta:
	 
Oracle Warehouse Builder.
	Feedback da resposta:
	Resposta correta. No Warehouse Builder, você cria um design
lógico que descreve os cubos OLAP em dimensões, hierarquias, medidas, medidas calculadas e todos os componentes necessários.
	
	
	
· Pergunta 8
1 em 1 pontos
	
	
	
	Entre as principais características de um Data Warehouse , destacam-se: ser um banco de dados projetado para análise, que usa dados de várias aplicações; ser projetado para um pequeno número de usuários com interações longas, que se destina à realização de consultas, as quais resultam em um conjunto grande de dados e, geralmente, envolvem leituras de tabelas inteiras.
 
VARAGO, A. Processos de ETL em um Data Warehouse . Roteiro de Estudos. EAD.br. Disponível na Biblioteca Digital da Laureate.
 
Considerando o trecho supramencionado sobre características de um Data Warehouse , qual das alternativas, a seguir,descreve, de forma adequada, o objetivo de sua utilização?
	
	
	
	
		Resposta Selecionada:
	 
Informação mais consistente.
	Resposta Correta:
	 
Informação mais consistente.
	Feedback da resposta:
	Resposta correta. Tornar a informação mais consistente é um dos seus objetivos, ou seja, informação de qualidade em toda a organização. Os termos usados em uma parte da empresa devem ter o mesmo significado em toda a empresa.
	
	
	
· Pergunta 9
1 em 1 pontos
	
	
	
	No Data Warehouse (DW), existem somente duas operações, a carga inicial e as consultas dos front-ends
aos dados. Após serem integrados e transformados, os dados são carregados em bloco para o Data Warehouse, para que estejam disponíveis aos usuários para acesso.
Considerando o descrito, qual característica de um Data Warehouse possui carregamento de dados em bloco?
	
	
	
	
		Resposta Selecionada:
	 
Não volatilidade.
	Resposta Correta:
	 
Não volatilidade.
	Feedback da resposta:
	Resposta correta. A não volatilidade pode ser definida pela maneira como os dados são carregados e tratados, é completamente diferente dos sistemas transacionais. No ambiente operacional, ao contrário, os dados são, em geral, atualizados registro a registro, em múltiplas transações. Essa volatilidade requer um trabalho considerável para assegurar integridade e consistência. Um Data Warehouse não requer este grau de controle típico dos sistemas orientados a transações, pois, no DW, o que acontece é somente ler os dados na origem e gravá-los no destino, ou seja, no banco modelado multidimensional.
	
	
	
· Pergunta 10
1 em 1 pontos
	
	
	
	Um Data Warehouse apresenta-se organizado por processos de negócios, não tendo orientação para o contexto da empresa/organização como um todo. Esse tipo de critério permite tomar decisões mais bem direcionadas ao negócio no qual se deseja trabalhar.
 
VARAGO, A. Processos de ETL em um Data Warehouse . Roteiro de Estudos. EAD.br. Disponível na Biblioteca Digital da Laureate.
Considerando o descrito como apresentação de um Data Warehouse, qual critério é definido para sua utilização?
	
	
	
	
		Resposta Selecionada:
	 
Orientado por assuntos.
	Resposta Correta:
	 
Orientado por assuntos.
	Feedback da resposta:
	Resposta correta. Pois a organização por processos determina uma orientação de acordo com o assunto específico.
	
	
	
· Pergunta 1
1 em 1 pontos
	
	
	
	Os sistemas chamados de ETL são imprescindíveis, quando se diz respeito à preparação de dados a serem armazenados no DW. Existem diversos estudos sobre o processo de ETL que, de certa forma, é uma técnica já bem conhecida.
 
Considerando o descrito como sistemas de ETL, qual poderia ser considerada a principal responsabilidade no processo de Extração, Transformação e Carga (ETL)?
	
	
	
	
		Resposta Selecionada:
	 
Limpeza.
	Resposta Correta:
	 
Limpeza.
	Feedback da resposta:
	Resposta correta. As responsabilidades do processo de Extração, Transformação e Carga (ETL) são: a extração dos dados de suas diversas fontes (tradicionalmente estruturadas); limpeza; customização para adequação ao modelo de dados e inserção de fato dos dados.
 
@Resposta incorreta. Ao contrário de algumas características do processo de Extração, Transformação e Carga (ETL), a extração dos dados é possível para diversas fontes, customização para adequação ao modelo de dados, em vez de mudança e inserção, de fato, dos dados. A redução de erros não é enquadrada como responsabilidade do processo de ETL.
	
	
	
· Pergunta 2
1 em 1 pontos
	
	
	
	A escolha da arquitetura é uma decisão gerencial do projeto e está normalmente baseada nos fatores relativos à infraestrutura disponível, ao ambiente de negócios (porte da empresa), concomitantemente com o escopo de abrangência desejado, assim como a capacitação dos empregados da empresa e dos recursos disponibilizados ou projetados para investimento.
Considerando o descrito, qual tipo de arquitetura implica em Data Marts não conectados?
	
	
	
	
		Resposta Selecionada:
	 
Arquitetura independente.
	Resposta Correta:
	 
Arquitetura independente.
	Feedback da resposta:
	Resposta correta. A arquitetura independente implica em Data Marts não conectados ( standalone ), controlados por um grupo específico de usuários e que atende somente às suas necessidades específicas e departamentais, sem foco corporativo algum. A implementação dessa arquitetura resulta sempre em uma implementação rápida, raramente impactando nos recursos de Tecnologia de Informação.
	
	
	
· Pergunta 3
1 em 1 pontos
	
	
	
	As ferramentas não devem apenas permitir o acesso aos dados, mas realizar uma análise significativa, de tal forma que transforme dados brutos em informação útil, que embase decisões estratégicas das empresas. O sucesso de um Data Warehouse pode depender das informações corretas e, assim, é necessária uma ferramenta que permita essa condução.
 
VARAGO, A. Processos de ETL em um Data Warehouse . Roteiro de Estudos. EAD.br. Disponível na Biblioteca Digital da Laureate.
 
Considerando o descrito como ferramentas para construção de um Data Warehouse , qual das alternativas, a seguir, dizem respeito à ferramenta que contempla componentes de Business Analytic s (BA) e Data Integration
(DI)?
	
	
	
	
		Resposta Selecionada:
	 
Pentaho.
	Resposta Correta:
	 
Pentaho.
	Feedback da resposta:
	Resposta correta. Pentaho é uma ferramenta que contempla as funcionalidades de acessar, integrar, manipular, visualizar e analisar os dados. Esses dados podem estar armazenados em um banco de dados relacional, bancos analíticos.
	
	
	
· Pergunta 4
1 em 1 pontos
	
	
	
	Sumários de dados contidos no modelo original, organizados de forma a atender consultas rotineiras de forma mais ágil, constituem-se em uma das formas mais eficientes de melhorar a performance das consultas em um DW.
VARAGO, A. Processos de ETL em um Data Warehouse . Roteiro de Estudos. EAD.br. Disponível na Biblioteca Digital da Laureate.
 
 
Considerando o descrito, qual forma de organização é um sumário de dados para a Data Warehouse ?
	
	
	
	
		Resposta Selecionada:
	 
Dimensões.
	Resposta Correta:
	 
Dimensões.
	Feedback da resposta:
	Resposta correta. Agregados são resumos construídos a partir de fatos individuais, inicialmente por questões de performance, ou quando o ambiente dos fatos é inexpressivo na menor granularidade.
@Resposta incorreta. As tabelas de fatos sem fatos são utilizadas para armazenar fatos que não podem ser associados a uma medida numérica. Tais tabelas podem ser utilizadas no rastreamento de eventos, como a frequência dos alunos nas salas de uma escola ou todos os elementos envolvidos em um acidente coberto por uma seguradora. Dimensões determinam o contexto em que ocorreram os fatos. No modelo dimensional, cada dimensão está associada a um ou mais fatos, sendo usualmente mapeadas em entidades não numéricas e informativas. A granularidade refere-se ao nível de detalhe ou resumo com o qual serão armazenados os dados no Data Warehouse, quanto maior o detalhamento, mais baixo será o nível de granularidade e vice-versa. O modelo Snowflake incorpora tabelas dimensionais principais, conectadas às tabelas de fato e tabelas bidimensionais de extensão, nas quais são armazenadas as descrições das dimensões.
	
	
	
· Pergunta 5
1 em 1 pontos
	
	
	
	Existem várias topologias que podem ser consideradas na implementação de um Data Warehouse. Essa abordagem não sobrecarrega a estação de trabalho cliente. Obtém-se uma melhora em termos de escalabilidade, porém tem-se um aumento de custo e complexidade da solução.
Considerando o descrito, qual topologia não sobrecarrega a estação de trabalho cliente e apresenta um aumento de custo e complexidade da solução?
	
	
	
	
		Resposta Selecionada:
	 
Três níveis ( Three-tier).
	Resposta Correta:
	 
Três níveis (Three-tier).
	Feedback da resposta:
	Resposta correta. Em relação aos Três níveis ( Three-tier ), esta abordagem difere da abordagem de dois níveis quando aplica uma estrita separação entre a interface gráfica,a lógica de negócios e os dados. Essa abordagem não sobrecarrega a estação de trabalho cliente. Obtém-se uma melhora em termos de escalabilidade, porém tem-se um aumento de custo e complexidade da solução. Cada uma das camadas dessa abordagem pode rodar em um processador ou hardware distinto, podendo a camada de lógica de negócios, muitas vezes, rodar no mesmo servidor de DW físico. Com essa topologia, os usuários não precisam saber onde e como os dados são armazenados ou a complexidade dos bancos de dados para usar as aplicações. Ela também simplifica a geração de SQL e otimiza o desempenho.
	
	
	
· Pergunta 6
1 em 1 pontos
	
	
	
	O maior benefício de uma solução OLAP é a capacidade de fornecer recursos de cálculo altamente avançados, com surpreendentes tempos de resposta para os usuários finais. Agora que o opcional OLAP está disponível no banco de dados, a ferramenta oferece essa tecnologia de maneira fácil de usar.
 
VARAGO, A. Processos de ETL em um Data Warehouse . Roteiro de Estudos. EAD.br. Disponível na Biblioteca Digital da Laureate.
 
Considerando o trecho supracitado e os conhecimentos adquiridos por meio do Roteiro de Estudos da disciplina, qual das alternativas, a seguir, traz a ferramenta que possui as capacidades mencionadas?
	
	
	
	
		Resposta Selecionada:
	 
Oracle Warehouse Builder.
	Resposta Correta:
	 
Oracle Warehouse Builder.
	Feedback da resposta:
	Resposta correta. No Warehouse Builder, você cria um design
lógico que descreve os cubos OLAP em dimensões, hierarquias, medidas, medidas calculadas e todos os componentes necessários.
	
	
	
· Pergunta 7
1 em 1 pontos
	
	
	
	Além de suas características, os Data Warehouses (DW) também possuem orientação por assunto, integração, variação no tempo, não volatilidade e localização.
Considerando o descrito, em qual orientação define-se a representação relacionada aos dados oriundos dos diversos sistemas que irão compor a base de dados do Data Warehouse ?
	
	
	
	
		Resposta Selecionada:
	 
Integração.
	Resposta Correta:
	 
Integração.
	Feedback da resposta:
	Resposta correta. A integração tem dois elementos básicos do DW, os quais estão relacionados com a integração: a área de estagiamento de dados e o armazenamento de dados operacionais. Os processos de limpeza, transformação e agregação ocorrem no estagiamento, enquanto a compatibilização e a integração, nos próprios sistemas legados.
	
	
	
· Pergunta 8
1 em 1 pontos
	
	
	
	Nem todos os dados disponíveis nos sistemas operacionais da empresa são necessariamente úteis para o Data Warehouse
(DW). Cabe ao arquiteto dos dados analisar, junto com os usuários, quais dados realmente contêm informações necessárias e desprezar aqueles que não fazem parte dos objetivos do DW.
Considerando o descrito, qual alternativa traz um possível problema que pode ocorrer durante o desenvolvimento de um sistema de DW e que leva a dados desnecessários?
	
	
	
	
		Resposta Selecionada:
	 
Carregar no DW informações somente porque elas estão disponíveis nos sistemas transacionais.
	Resposta Correta:
	 
Carregar no DW informações somente porque elas estão disponíveis nos sistemas transacionais.
	Feedback da resposta:
	Resposta correta. Carregar no DW informações somente porque elas estão disponíveis nos sistemas transacionais, em que nem todos os dados disponíveis nos sistemas operacionais da empresa são necessariamente úteis para o DW. Cabe ao arquiteto dos dados analisar, junto com os usuários, quais dados realmente contêm informações necessárias e desprezar aqueles que não fazem parte dos objetivos do DW.
	
	
	
· Pergunta 9
1 em 1 pontos
	
	
	
	O Data Warehouse pode ser apenas uma visualização lógica ou uma cópia dos dados operacionais e dados externos livres de inconsistências, em um formato que proporcione um acesso rápido e flexível.
 
Considerando o descrito, qual camada proporciona um acesso rápido e flexível a um Data Warehouse ?
	
	
	
	
		Resposta Selecionada:
	 
Camada Data Warehouse (física).
	Resposta Correta:
	 
Camada Data Warehouse (física).
	Feedback da resposta:
	Resposta correta. Esta camada corresponde aos dados usados para fins "informacionais", ou seja, o Data Warehouse propriamente dito. O Data Warehouse pode ser apenas uma visualização lógica ou uma cópia dos dados operacionais e dados externos livres de inconsistências, em um formato que proporcione um acesso rápido e flexível.
	
	
	
· Pergunta 10
1 em 1 pontos
	
	
	
	Existe uma ferramenta de Acesso ao Hadoop , inicialmente desenvolvida no Facebook , a qual permite aos usuários escreverem queries SQL convertidas em programas MapReduce .
 
Considerando o descrito como ferramenta de acesso ao Hadoop, qual das alternativas seguintes traz, de forma adequada, a ferramenta que permite realizar essa operação?
	
	
	
	
		Resposta Selecionada:
	 
Hive.
	Resposta Correta:
	 
Hive.
	Feedback da resposta:
	Resposta correta. O Hive é uma ferramenta de acesso ao Hadoop , inicialmente desenvolvida no Facebook. Permite aos usuários escrever queries SQL que são convertidas em programas MapReduce .

Continue navegando

Outros materiais