Baixe o app para aproveitar ainda mais
Prévia do material em texto
Desa�o do Módulo 1 Entrega 7 mar em 21:00 Pontos 40 Perguntas 12 Disponível até 7 mar em 21:00 Limite de tempo Nenhum Instruções Histórico de tentativas Tentativa Tempo Pontuação MAIS RECENTE Tentativa 1 41 minutos 40 de 40 As respostas corretas estarão disponíveis em 10 mar em 23:59. Pontuação deste teste: 40 de 40 Enviado 18 fev em 18:42 O Desafio do Módulo 1 está disponível! 1. Instruções para realizar o desafio Consulte a data de entrega no teste e em seu calendário. Reserve um tempo para realizar a atividade e leia as orientações e enunciados com atenção. Em caso de dúvidas, utilize o "Fórum de dúvidas do Desafio do Módulo 1". Para iniciar o Desafio, clique em "Fazer teste". Você tem somente uma tentativa e não há limite de tempo definido para realizá-la. Caso você precise interromper a atividade, apenas deixe a página e, ao retornar, clique em "Retomar teste". Lembre-se de conferir tosas as questões antes de enviar a atividade, e clique em "Enviar teste" somente quando você tiver terminado. Uma vez terminado o prazo de entrega, a plataforma enviará as tentativas não finalizadas automaticamente. Por isso, fique atento ao prazo final. Novas tentativas só serão concedidas perante a apresentação de atestado médico. O gabarito será disponibilizado partir de sexta-feira, 10/03/2023, às 23h59. Bons estudos! 2. O arquivo abaixo contém o enunciado do desafio Enunciado do Desafio - Módulo 1 - Bootcamp Engenheiro(a) de Dados.pdf https://online.igti.com.br/courses/6055/quizzes/69887/history?version=1 https://online.igti.com.br/courses/6055/files/369595/download?wrap=1 Esta tentativa levou 41 minutos. 3,33 / 3,33 ptsPergunta 1 Sobre a definição de data warehouse, marque a alternativa INCORRETA: Seus dados refletem a variação em relação ao tempo, permitindo assim acompanhar o histórico de evolução deles. Os dados são voláteis, ou seja, devem ser atualizados sempre que houver alguma mudança na origem, o seu correspondente no DW é alterado também para refletir sempre a versão atual do dado. Dizemos que é um banco de dados integrado, pois os dados podem vir de diferentes fontes e precisam ser transformados em um único esquema ou formato. Dizemos que é orientado a assuntos, pois seus dados referem-se a um assunto ou fato em particular. 3,33 / 3,33 ptsPergunta 2 Analise as afirmativas abaixo com relação à modelagem dimensional. i. A tabela de dimensões é a principal tabela de um modelo dimensional, onde as medições numéricas de interesse da empresa estão armazenadas. ii. A tabela fato registra os fatos que serão analisados. É composta por uma chave primária (formada por uma combinação única de valores de chaves de dimensão) e pelas métricas de interesse para o negócio. iii. Uma tabela de dimensão contém o nome específico de cada membro da dimensão. O nome membro da dimensão é denominado Atributo. iv. A qualidade do banco de dados é proporcional à qualidade dos atributos de dimensões. Portanto, deve ser dedicado tempo e atenção à sua descrição, ao seu preenchimento e à garantia da qualidade dos valores em uma coluna de atributos. Assinale a alternativa que indica todas as afirmativas CORRETAS. São corretas apenas as afirmativas i e ii. São corretas apenas as afirmativas i, iii e iv. São corretas apenas as afirmativas ii, iii e iv. São corretas apenas as afirmativas i e iii. 3,33 / 3,33 ptsPergunta 3 Marque a alternativa que preencha CORRETAMENTE as lacunas: Um ______________ é uma coleção de dados obtidos de diversas fontes heterogêneas, orientada a assunto, contendo uma coleção de tecnologias de apoio à decisão. Dentre essas tecnologias, destacam- se as ferramentas _________ que permite a análise de dados complexos, cubos, utilizando, por exemplo, capacidades de computação distribuída. Quando há a necessidade de se trabalhar com um subconjunto de dados de uma organização, por exemplo, voltados a um único departamento, é possível utilizar um outro conceito conhecido como _________________. Data mart – OLTP – SGBDs Data warehouse – OLAP – Data marts Data mart – OLTP – Data warehouses Data mart – OLAP – SGBDs Data warehouse – OLTP – Data marts 3,33 / 3,33 ptsPergunta 4 Big Data surgiu a partir da necessidade de manipular um grande volume de dados e, com isso, novos conceitos foram introduzidos, como o Data Lake, que: pode ser considerado um conjunto de bancos de dados relacionais e com relacionamentos entre tabelas de diferentes esquemas de bancos de dados. pode ser considerado um repositório de dados relacionados, sendo, portanto, um armazém de dados orientado por assunto. é o resultado de sucessivas operações de mineração de dados, sendo um ambiente no qual é possível ter relatórios e dashboards de maneira amigável para os analistas de negócio. é projetado para armazenar dados de diversas fontes e formatos, não havendo a necessidade da definição de um esquema de dados para inserir novos itens. 3,33 / 3,33 ptsPergunta 5 Se eu quiser saber a quantidade de sinistros ocorridos por modelo de carro, por clientes e dia da semana (Segunda, terça, quarta, quinta) para fins analíticos, qual modelo abaixo melhor atenderia? (somente os atributos chaves foram mostrados para as dimensões Modelo, Marca, Carros e Cliente) Modelo 1 Modelo 2 Modelo 3 Modelo 4 Modelo 3 Modelo 4 Modelo 1 Modelo 2 3,33 / 3,33 ptsPergunta 6 Considerando o modelo de dados (relacional) sintetizado abaixo, que controla as operações diária da biblioteca, responda: Um dos data marts solicitados nas atividades é para tratar das questões sobre os livros escritos e seus respectivos autores. Das alternativas abaixo, qual delas representa um esquema de data mart válido, que sintetiza um possível modelo para responder à pergunta: Quantos livros cada autor já escreveu ao longo dos anos? A relação Dim_Cidade e Dim_Estado não estão normalizadas, porque estão quebradas em duas tabelas com relacionamento entre si, e, portanto, há redundância. Através da fato e seus relacionamentos podemos calcular QtdSinistro por Cliente, Carro, Cidade, Estado, por mês e ano. Através da fato e seus relacionamentos podemos calcular QtdSinistro por Cliente, Carro, Cidade e Estado, mas apenas por ano. Todos os relacionamentos são não identificados, ou seja, a FK não faz parte da PK da tabela que a recebeu. 3,33 / 3,33 ptsPergunta 7 Ainda segundo o modelo abaixo, podemos afirmar que: Neste cenário mostrado em Dim_Cliente, Cliente só pode ter 1 telefone. Se considerarmos apenas as métricas mostradas na figura, a métrica de média por mês poderia ser facilmente calculada. A conexão de Dim_Cidade com a fato e não Estado configura uma normalização que visa aumentar performance, mas causa maior gasto de espaço em função da redundância. Poderíamos ter duas novas dimensões, Marca e Modelo, se fossem retiradas de Carro, mas isso aumentaria a redundância em Carro. 3,33 / 3,33 ptsPergunta 8 Quais consultas abaixo retornam: “Quantos carros possuem mais de uma apólice, ativas ou não? ” Comando 1: SELECT COUNT(*), Carro_CodCarro FROM Apolice GROUP BY Carro_CodCarro HAVING COUNT(*)>1; Comando 2: SELECT COUNT(*), Carro_CodCarro FROM Apolice GROUP BY Carro_CodCarro WHERE COUNT(*)>1; Comando 3: SELECT AVG(*), Carro_CodCarro FROM Apolice GROUP BY Carro_CodCarro HAVING AVG(*)>1; Comando 4: SELECT AVG(*), Carro_CodCarro FROM Apolice GROUP BY Carro_CodCarro HAVING AVG(*)>1; Comando 1 Comando 4 Comando 3 Comando 2 3,33 / 3,33 ptsPergunta 9 Considerando os modelos abaixo, assinale o que descreva o que representa um modelo dimensional em sua estrutura convencional de fatos e dimensões: Modelo 1 Modelo 2 Modelo 3 Modelo 1 Modelo 3 Modelo 2 3,33 / 3,33 ptsPergunta 10 No contexto de Business Intelligence, os sistemas OLAP e OLTP se diferenciam em diversas características. Na tabela abaixo, no que diz respeito às características, está INCORRETO: Característica- Estrutura dos dados./OLAP - Armazenamento feito em Data Warehouse com otimização no desempenho em grandes volumes de dados. / OLTP - Armazenamento feito em bancos de dados convencionais pelos sistemas de informação da organização. Característica - Volatilidade. /OLAP - Dados históricos e não voláteis que praticamente não sofrem alterações salvo em casos específicos motivados por erros ou inconsistências. / OLTP -Dados voláteis, passíveis de modificação e exclusão. Característica - Foco./OLAP - Nível operacional da organização. Visa a execução operacional do negócio. / OLTP - Nível estratégico da organização. Visa a análise empresarial e tomada de decisão. Característica - Performance. /OLAP - Otimização para leitura e geração de análise e relatórios gerenciais. / OLTP - Alta velocidade na manipulação de dados operacionais, porém ineficiente para geração de análises gerenciais. 3,33 / 3,33 ptsPergunta 11 Uma das funcionalidades do OLAP, utilizada para realizar operações de projeção nas dimensões, compreende a extração de informações sumarizadas de um cubo de dados e extração de um "subcubo", a partir do valor de uma dimensão. Essa funcionalidade trata-se de: drill-sorting slice and dice. organizing. sorting. 3,37 / 3,37 ptsPergunta 12 Qual dos comandos SQL a seguir seleciona registros em tabelas diferentes que possuem colunas em comum? SELECT DISTINCT. JOIN. BETWEEN. SELECT GROUP BY. Pontuação do teste: 40 de 40
Compartilhar