Buscar

Desafio do Módulo 1 _ 2023-2A - Bootcamp Engenheiro(a) de Dados (3)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 13 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 13 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 13 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Desa�o do Módulo 1
Entrega 7 mar em 21:00 Pontos 40 Perguntas 12
Disponível até 7 mar em 21:00 Limite de tempo Nenhum
Instruções
Histórico de tentativas
Tentativa Tempo Pontuação
MAIS RECENTE Tentativa 1 41 minutos 40 de 40
 As respostas corretas estarão disponíveis em 10 mar em 23:59.
Pontuação deste teste: 40 de 40
Enviado 18 fev em 18:42
O Desafio do Módulo 1 está disponível!
1. Instruções para realizar o desafio
Consulte a data de entrega no teste e em seu calendário.
Reserve um tempo para realizar a atividade e leia as orientações e enunciados com atenção. Em
caso de dúvidas, utilize o "Fórum de dúvidas do Desafio do Módulo 1".
Para iniciar o Desafio, clique em "Fazer teste". Você tem somente uma tentativa e não há limite de
tempo definido para realizá-la. Caso você precise interromper a atividade, apenas deixe a página e,
ao retornar, clique em "Retomar teste".
Lembre-se de conferir tosas as questões antes de enviar a atividade, e clique em "Enviar
teste" somente quando você tiver terminado.
Uma vez terminado o prazo de entrega, a plataforma enviará as tentativas não finalizadas
automaticamente. Por isso, fique atento ao prazo final.
Novas tentativas só serão concedidas perante a apresentação de atestado médico.
O gabarito será disponibilizado partir de sexta-feira, 10/03/2023, às 23h59.
Bons estudos!
2. O arquivo abaixo contém o enunciado do desafio
Enunciado do Desafio - Módulo 1 - Bootcamp Engenheiro(a) de Dados.pdf
https://online.igti.com.br/courses/6055/quizzes/69887/history?version=1
https://online.igti.com.br/courses/6055/files/369595/download?wrap=1
Esta tentativa levou 41 minutos.
3,33 / 3,33 ptsPergunta 1
Sobre a definição de data warehouse, marque a alternativa
INCORRETA:
 
Seus dados refletem a variação em relação ao tempo, permitindo assim
acompanhar o histórico de evolução deles.
 
Os dados são voláteis, ou seja, devem ser atualizados sempre que
houver alguma mudança na origem, o seu correspondente no DW é
alterado também para refletir sempre a versão atual do dado.
 
Dizemos que é um banco de dados integrado, pois os dados podem vir
de diferentes fontes e precisam ser transformados em um único
esquema ou formato.
 
Dizemos que é orientado a assuntos, pois seus dados referem-se a um
assunto ou fato em particular.
3,33 / 3,33 ptsPergunta 2
Analise as afirmativas abaixo com relação à modelagem dimensional.
i. A tabela de dimensões é a principal tabela de um modelo
dimensional, onde as medições numéricas de interesse da empresa
estão armazenadas.
ii. A tabela fato registra os fatos que serão analisados. É composta por
uma chave primária (formada por uma combinação única de valores de
chaves de dimensão) e pelas métricas de interesse para o negócio.
iii. Uma tabela de dimensão contém o nome específico de cada
membro da dimensão. O nome membro da dimensão é denominado
Atributo.
iv. A qualidade do banco de dados é proporcional à qualidade dos
atributos de dimensões. Portanto, deve ser dedicado tempo e atenção
à sua descrição, ao seu preenchimento e à garantia da qualidade dos
valores em uma coluna de atributos.
Assinale a alternativa que indica todas as afirmativas CORRETAS.
 São corretas apenas as afirmativas i e ii. 
 São corretas apenas as afirmativas i, iii e iv. 
 São corretas apenas as afirmativas ii, iii e iv. 
 São corretas apenas as afirmativas i e iii. 
3,33 / 3,33 ptsPergunta 3
Marque a alternativa que preencha CORRETAMENTE as lacunas:
Um ______________ é uma coleção de dados obtidos de diversas
fontes heterogêneas, orientada a assunto, contendo uma coleção de
tecnologias de apoio à decisão. Dentre essas tecnologias, destacam-
se as ferramentas _________ que permite a análise de dados
complexos, cubos, utilizando, por exemplo, capacidades de
computação distribuída. Quando há a necessidade de se trabalhar
com um subconjunto de dados de uma organização, por exemplo,
voltados a um único departamento, é possível utilizar um outro
conceito conhecido como _________________.
 Data mart – OLTP – SGBDs 
 Data warehouse – OLAP – Data marts 
 Data mart – OLTP – Data warehouses 
 Data mart – OLAP – SGBDs 
 Data warehouse – OLTP – Data marts 
3,33 / 3,33 ptsPergunta 4
Big Data surgiu a partir da necessidade de manipular um grande
volume de dados e, com isso, novos conceitos foram introduzidos,
como o Data Lake, que:
 
pode ser considerado um conjunto de bancos de dados relacionais e
com relacionamentos entre tabelas de diferentes esquemas de bancos
de dados.
 
pode ser considerado um repositório de dados relacionados, sendo,
portanto, um armazém de dados orientado por assunto.
 
é o resultado de sucessivas operações de mineração de dados, sendo
um ambiente no qual é possível ter relatórios e dashboards de maneira
amigável para os analistas de negócio.
 
é projetado para armazenar dados de diversas fontes e formatos, não
havendo a necessidade da definição de um esquema de dados para
inserir novos itens.
3,33 / 3,33 ptsPergunta 5
Se eu quiser saber a quantidade de sinistros ocorridos por modelo de
carro, por clientes e dia da semana (Segunda, terça, quarta, quinta)
para fins analíticos, qual modelo abaixo melhor atenderia? (somente
os atributos chaves foram mostrados para as dimensões Modelo,
Marca, Carros e Cliente)
Modelo 1
 
Modelo 2
 
Modelo 3
 
Modelo 4
 Modelo 3 
 Modelo 4 
 Modelo 1 
 Modelo 2 
3,33 / 3,33 ptsPergunta 6
Considerando o modelo de dados (relacional) sintetizado abaixo, que
controla as operações diária da biblioteca, responda:
Um dos data marts solicitados nas atividades é para tratar das
questões sobre os livros escritos e seus respectivos autores. Das
alternativas abaixo, qual delas representa um esquema de data mart
válido, que sintetiza um possível modelo para responder à pergunta:
Quantos livros cada autor já escreveu ao longo dos anos?
 
A relação Dim_Cidade e Dim_Estado não estão normalizadas, porque
estão quebradas em duas tabelas com relacionamento entre si, e,
portanto, há redundância.
 
Através da fato e seus relacionamentos podemos calcular QtdSinistro
por Cliente, Carro, Cidade, Estado, por mês e ano.
 
Através da fato e seus relacionamentos podemos calcular QtdSinistro
por Cliente, Carro, Cidade e Estado, mas apenas por ano.
 
Todos os relacionamentos são não identificados, ou seja, a FK não faz
parte da PK da tabela que a recebeu.
3,33 / 3,33 ptsPergunta 7
Ainda segundo o modelo abaixo, podemos afirmar que:
 
Neste cenário mostrado em Dim_Cliente, Cliente só pode ter 1
telefone.
 
Se considerarmos apenas as métricas mostradas na figura, a métrica
de média por mês poderia ser facilmente calculada.
 
A conexão de Dim_Cidade com a fato e não Estado configura uma
normalização que visa aumentar performance, mas causa maior gasto
de espaço em função da redundância.
 
Poderíamos ter duas novas dimensões, Marca e Modelo, se fossem
retiradas de Carro, mas isso aumentaria a redundância em Carro.
3,33 / 3,33 ptsPergunta 8
Quais consultas abaixo retornam: “Quantos carros possuem mais de
uma apólice, ativas ou não? ”
Comando 1:
SELECT COUNT(*), Carro_CodCarro
FROM Apolice
GROUP BY Carro_CodCarro
HAVING COUNT(*)>1;
 
Comando 2:
SELECT COUNT(*), Carro_CodCarro
FROM Apolice
GROUP BY Carro_CodCarro
WHERE COUNT(*)>1;
 
Comando 3:
SELECT AVG(*), Carro_CodCarro
FROM Apolice
GROUP BY Carro_CodCarro
HAVING AVG(*)>1;
 
Comando 4:
SELECT AVG(*), Carro_CodCarro
FROM Apolice
GROUP BY Carro_CodCarro
HAVING AVG(*)>1;
 Comando 1 
 Comando 4 
 Comando 3 
 Comando 2 
3,33 / 3,33 ptsPergunta 9
Considerando os modelos abaixo, assinale o que descreva o que
representa um modelo dimensional em sua estrutura convencional de
fatos e dimensões:
Modelo 1
 
Modelo 2
 
Modelo 3
 Modelo 1 
 Modelo 3 
 Modelo 2 
3,33 / 3,33 ptsPergunta 10
No contexto de Business Intelligence, os sistemas OLAP e OLTP se
diferenciam em diversas características. Na tabela abaixo, no que diz
respeito às características, está INCORRETO:
 
Característica- Estrutura dos dados./OLAP - Armazenamento feito em
Data Warehouse com otimização no desempenho em grandes volumes
de dados. / OLTP - Armazenamento feito em bancos de dados
convencionais pelos sistemas de informação da organização.
 
Característica - Volatilidade. /OLAP - Dados históricos e não voláteis
que praticamente não sofrem alterações salvo em casos específicos
motivados por erros ou inconsistências. / OLTP -Dados voláteis,
passíveis de modificação e exclusão.
 
Característica - Foco./OLAP - Nível operacional da organização. Visa a
execução operacional do negócio. / OLTP - Nível estratégico da
organização. Visa a análise empresarial e tomada de decisão.
 
Característica - Performance. /OLAP - Otimização para leitura e
geração de análise e relatórios gerenciais. / OLTP - Alta velocidade na
manipulação de dados operacionais, porém ineficiente para geração de
análises gerenciais.
3,33 / 3,33 ptsPergunta 11
Uma das funcionalidades do OLAP, utilizada para realizar operações
de projeção nas dimensões, compreende a extração de informações
sumarizadas de um cubo de dados e extração de um "subcubo", a
partir do valor de uma dimensão. Essa funcionalidade trata-se de:
 drill-sorting 
 slice and dice. 
 organizing. 
 sorting. 
3,37 / 3,37 ptsPergunta 12
Qual dos comandos SQL a seguir seleciona registros em tabelas
diferentes que possuem colunas em comum?
 SELECT DISTINCT. 
 JOIN. 
 BETWEEN. 
 SELECT GROUP BY. 
Pontuação do teste: 40 de 40

Outros materiais