Buscar

Avaliação Final (Discursiva) - Individual

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

16/03/2024, 14:18 Avaliação Final (Discursiva) - Individual
about:blank 1/2
Prova Impressa
GABARITO | Avaliação Final (Discursiva) - Individual
(Cod.:687794)
Peso da Avaliação 4,00
Prova 42022360
Qtd. de Questões 2
Nota 7,28
Durante a pandemia do Coronavírus (covid-19) em 2020, cientistas das mais diversas áreas têm 
buscado soluções para combater a doença e mitigar seus impactos. Os cientistas de dados também exercem 
um papel importante, tendo muitos trabalhos desenvolvidos, desde o mapeamento da doença, até mesmo 
integrações com áreas médicas. Tomando como exemplo o estado de Santa Catarina, que contém 295 
cidades, onde cada cidade tem uma maneira de armazenar os dados sobre a doença (infectados, mortes, 
testes, entre outros), bem como o desafio de construir um Data Warehouse com os dados da doença, descreva 
o que é cada etapa da ETL para construir um Data Warehouse para um estado brasileiro com dados do 
Covid-19.
Resposta esperada
- Extração: é responsável por coletar os dados de cada cidade, independente do formato que estejam
- Transformação: é responsável por realizar a integração dos dados, visto que podem estar em diversos
formatos (Bancos Relacionais, NoSQL, Arquivos de Texto, PDF, Imagens). Também será responsável
por padronizar os dados coletados, por exemplo Sexo no formato Feminino e Masculino ou M/F.
- Carga: a carga é responsável por armazenar em um modelo desenvolvido para armazenar todos os
dados, no exemplo apresentado é interessante que a carga seja realizada diariamente.
Minha resposta
Para construirmos um Data Warehouse podemos citar 3 etapas da ETL, a primeira será a Extração que é
responsável por coletar os dados de cada cidade sem se importar o formato que estiver. Após, a segunda
será a etapa de Transformação que será responsável por criar um padrão dos dados coletados como por
exemplos os estados com todas as letras maiusculas sem acentos(SAO PAULO, RIO DE JANEIRO, ...)
ou somente com as siglas correspondentes (SP, RJ, ...), e também será responsável por realizar a
integração dos dados que estarão em vários formatos diferentes como arquivos de texts(.txt), portable
document font(.pdf), arquivos de imagens(.jpg, .png, ...), banco realcionais, NoSQL. Em seguinte a
terceira será a etapa da Carga, em que será responsável por armazenar em um modelo desenvolvido para
armazenar todos os dados, seguindo a idéia do exemplo é interessante que a carga seja realizada todos
os dias.
A modelagem multidimensional exerce um importante papel em um Data Warehouse, pois representa 
como os dados serão armazenados fisicamente. A modelagem dimensional é uma metodologia que permite 
modelar logicamente dados para melhorar o desempenho de consultas e prover facilidade de utilização a 
partir de um conjunto de eventos básicos de medição. Sobre a modelagem multidimensional, descreva e 
exemplifique tabela fato, dimensão e métricas.
Resposta esperada
*Tabela Fato: é o objeto de análise sob o qual se deseja extrair conhecimento. No exemplo de um data
warehouse de vendas, essa fato irá centralizar os dados.
 VOLTAR
A+
Alterar modo de visualização
1
2
16/03/2024, 14:18 Avaliação Final (Discursiva) - Individual
about:blank 2/2
*Dimensões: as dimensões fornecem valores que alimentam a tabela fato. Em um cenário de vendas,
pode existir a dimensão produto e dimensão cliente.
*Métricas: as métricas podem ser divididas em aditivas, semiaditivas e não aditivas, e são utilizadas
para medir ou quantificar os dados armazenados. Por exemplo, a quantidade de vendas ou total.
Minha resposta
A Tabela Fato é o objeto de análise sob o qual se extrai o conhecimento, por exemplo de um data
warehouse de vendas, esse fato irá centralizar os dados. As Dimensões fornecem os valores que
alimentam a tabela fato, pegando o mesmo exemplo de vendas, pode existir a dimensão produto e
dimensão cliente. As Métricas podem ser dividas em aditivas, semiaditivas e não aditivas em que são
utilizadas ara medir/quantificar os dados que foram armazenadas, seguindo o mesmo exemplo de venda,
pegamos a quantidade de vendas ou total.
Imprimir

Outros materiais