Prévia do material em texto
Disciplina: Business Intelligence na prática: Modelagem Multidimensional e Data Warehouse (19360) Avaliação: Avaliação II - Individual FLEX ( Cod.:650256) ( peso.:1,50) Prova: 26725824 Nota da Prova: 9,00 Legenda: Resposta Certa Sua Resposta Errada Parte superior do formulário 1. A partir da criação de um sistema de coleta, com um algoritmo acoplado à etapa de ETL, esse irá automaticamente classificar os dados coletados, aumentando assim a acurácia do classificador, e gerando uma base maior de dados. Sobre ETL, classifique V para as sentenças verdadeiras e F para as falsas: ( ) O processo de ETL pode ser desenvolvido utilizando a ferramenta Pentaho. ( ) O processo de ETL pode ser desenvolvido em nuvem. ( ) O processo de ETL pode ser desenvolvido com Big Data Streaming. ( ) O processo de ETL pode ser desenvolvido utilizando linguagens de programação. Assinale a alternativa que apresenta a sequência CORRETA: FONTE: MONTEIRO, Roger; NOGUEIRA, Rodrigo; MOSER, Greisse. Desenvolvimento de um sistema para a classificação de Fakenews acoplado à etapa de ETL de um Data Warehouse de Textos de Notícias em língua Portuguesa. In: Anais da XV Escola Regional de Banco de Dados. SBC, 2019. p. 131-140. a) F - F - F - F. b) F - V - F - V. c) F - V - V - F. d) V - V - V - V. 2. Considere o modelo de dados a seguir sobre um sistema OLTP que armazena dados sobre vendas e produtos. A partir do modelo, realize uma consulta que retorne os produtos que estão em estoque mas nunca foram vendidos. Sobre a sequência de comandos que devem compor a consulta SQL que responde à questão, ordene os itens a seguir: I- WHERE e.id_estoque is null II- ON e.id_produto=p.id_produto III- INNER JOIN produto_estoque e IV- LEFT JOIN item_venda iv V- ON iv.id_estoque=e.id_estoque VI- SELECT p.descricao FROM produto p Assinale a alternativa que apresenta a sequência CORRETA: a) V - VI - I - II - III - IV. b) IV - V - VI - I - II - III. c) VI - III - II - IV - V - I. d) I - II - III - IV - V - VI. 3. Os sistemas de data warehouse são um lugar onde usuários podem acessar seus dados. Apesar de genérica, a definição permite compreender que os data warehouses visam permitir o uso de dados e informações de forma transparente para o usuário, abstraindo-se da complexidade da arquitetura de sistemas tecnológicos, como uma verdadeira camada de acessibilidade de dados e informações numa organização. Sobre OLAP e OLTP, classifique V para as sentenças verdadeiras e F para as falsas: ( ) Um sistema de ponto de venda é OLAP. ( ) Um Data Warehouse é OLAP. ( ) Os sistemas OLTP são analíticos. ( ) Os sistemas OLAP são transacionais. Assinale a alternativa que apresenta a sequência CORRETA: a) V - F - V - F. b) F - V - V - F. c) F - V - F - F. d) F - F - V - V. 4. O Pentaho Data Integration é uma ferramenta que pertence ao grupo Hitachi, desenvolvido com o intuito de integrar dados. Na opção Data Analytics, pode ser utilizado também para integrar e analisar dados de quaisquer fontes de maneira mais visual. Sobre o Pentaho Data Integration, classifique V para as sentenças verdadeiras e F para as falsas: ( ) Com o Pentaho Data Integration não é possível salvar dados em arquivos CSV. ( ) O objeto Table Input é responsável por gravar dados em uma tabela de um banco de dados. ( ) O objeto Text File Output é responsável por gravar dados em um arquivo de texto. ( ) É possível executar consultas SQL para consumir dados com Table Input. Assinale a alternativa que apresenta a sequência CORRETA: a) V - F - F - V. b) F - V - V - F. c) F - F - V - V. d) F - V - F - V. 5. Considere o modelo de dados a seguir sobre um sistema OLTP que armazena dados sobre vendas e produtos. A partir do modelo, realize uma consulta que retorne o nome dos produtos que já foram vendidos. Sobre a sequência de comandos que devem compor a consulta SQL que responde à questão, ordene os itens a seguir: I- ON e.id_produto= p.id_produto II- INNER JOIN item_venda iv III- ON iv.id_estoque=e.id_estoque; IV- SELECT p.descricao FROM produto p V- INNER JOIN produto_estoque e Assinale a alternativa que apresenta a sequência CORRETA: a) I - II - III - IV - V. b) IV - V - III - I - II. c) IV - V - I - II - III. d) V - I - II - III - IV. 6. O Pentaho Data Integration, também conhecido como Kettle, é um dos módulos do Pentaho que tem por objetivo fazer a extração, transformação e carregamento ETL das bases de dados. Usando uma tecnologia orientada a metadados, pode ser altamente flexível, alterável a qualquer momento, criando formatos e telas que realizam consultas compatíveis com as mais distintas regras de negócios. Sobre o objeto Input Table, assinale a alternativa CORRETA: a) No processo de ETL, o Input Table representa a extração. b) No processo de ETL, o Input Table representa a transformação. c) No processo de ETL, o Input Table representa a SQL. d) No processo de ETL, o Input Table representa a carga. 7. O ETL está no coração de um projeto de Data Warehouse, pois em bancos de dados transacionais a integridade dos dados é responsabilidade de um SGBD, a partir de uma modelagem realizada com qualidade. Em um Data Warehouse, espera-se que os dados cheguem ao modelo multidimensional com a integridade garantida, e essa garantia é responsabilidade do processo de ETL. Sobre ETL, classifique V para as sentenças verdadeiras e F para as falsas: ( ) Um processo de ETL pode ser realizado somente com a ferramenta Pentaho. ( ) A ETL pode ser realizada em conjunto com ferramentas de Big Data Streaming. ( ) A ETL pode ser feita em nuvem, utilizando serviços de cloud. ( ) O AWS Glue é um serviço de extração, transformação e carga para usar localmente. Assinale a alternativa que apresenta a sequência CORRETA: a) F - V - V - F. b) V - F - V - F. c) V - F - F - V. d) F - V - F - V. 8. Em um ambiente de Data Warehouse, ferramentas ETL e limpeza de dados custam pelo menos um terço do esforço e das despesas no orçamento, mas esse número pode aumentar até 80% no tempo de desenvolvimento de um projeto. Sobre ETL, classifique V para as sentenças verdadeiras e F para as falsas: ( ) A extração é responsável pela limpeza dos dados. ( ) A transformação realiza padronização dos dados. ( ) A carga coleta dados na fonte. ( ) A carga armazena dados no Data Warehouse. Assinale a alternativa que apresenta a sequência CORRETA: a) F - F - V - V. b) F - V - V - F. c) V - F - V - F. d) F - V - F - V. 9. Considere o modelo de dados a seguir sobre um sistema OLTP que armazena dados sobre vendas e produtos. A partir do modelo, realize uma consulta que retorne o total (R$) de vendas. Sobre a sequência de comandos que devem compor a consulta SQL que responde à questão, ordene os itens a seguir: I- INNER JOIN produto_estoque e II- SELECT sum(p.preco) FROM produto p III- ON e.id_produto=p.id_produto IV- ON iv.id_estoque=e.id_estoque V- INNER JOIN item_venda iv Assinale a alternativa que apresenta a sequência CORRETA: a) II - I - III - V - IV. b) IV - V - I - II - III. c) I - II - III - IV - V. d) V - I - II - III - IV. 10. O desenvolvimento de um processo de ETL está no coração de um projeto de Data Warehouse, pois em bancos de dados transacionais a integridade dos dados é responsabilidade de um SGBD a partir de uma modelagem realizada com qualidade. Assinale a alternativa CORRETA que apresenta o significado desta sigla: a) Eliminação, Transformação e Carga. b) Extração, Transformação e Coleta. c) Extração, Transformação e Carga. d) Extração, Limpeza e Coleta. Parte inferior do formulário