Baixe o app para aproveitar ainda mais
Prévia do material em texto
16/03/2024, 14:18 Avaliação Final (Discursiva) - Individual about:blank 1/2 Prova Impressa GABARITO | Avaliação Final (Discursiva) - Individual (Cod.:687794) Peso da Avaliação 4,00 Prova 42022360 Qtd. de Questões 2 Nota 7,28 Durante a pandemia do Coronavírus (covid-19) em 2020, cientistas das mais diversas áreas têm buscado soluções para combater a doença e mitigar seus impactos. Os cientistas de dados também exercem um papel importante, tendo muitos trabalhos desenvolvidos, desde o mapeamento da doença, até mesmo integrações com áreas médicas. Tomando como exemplo o estado de Santa Catarina, que contém 295 cidades, onde cada cidade tem uma maneira de armazenar os dados sobre a doença (infectados, mortes, testes, entre outros), bem como o desafio de construir um Data Warehouse com os dados da doença, descreva o que é cada etapa da ETL para construir um Data Warehouse para um estado brasileiro com dados do Covid-19. Resposta esperada - Extração: é responsável por coletar os dados de cada cidade, independente do formato que estejam - Transformação: é responsável por realizar a integração dos dados, visto que podem estar em diversos formatos (Bancos Relacionais, NoSQL, Arquivos de Texto, PDF, Imagens). Também será responsável por padronizar os dados coletados, por exemplo Sexo no formato Feminino e Masculino ou M/F. - Carga: a carga é responsável por armazenar em um modelo desenvolvido para armazenar todos os dados, no exemplo apresentado é interessante que a carga seja realizada diariamente. Minha resposta Para construirmos um Data Warehouse podemos citar 3 etapas da ETL, a primeira será a Extração que é responsável por coletar os dados de cada cidade sem se importar o formato que estiver. Após, a segunda será a etapa de Transformação que será responsável por criar um padrão dos dados coletados como por exemplos os estados com todas as letras maiusculas sem acentos(SAO PAULO, RIO DE JANEIRO, ...) ou somente com as siglas correspondentes (SP, RJ, ...), e também será responsável por realizar a integração dos dados que estarão em vários formatos diferentes como arquivos de texts(.txt), portable document font(.pdf), arquivos de imagens(.jpg, .png, ...), banco realcionais, NoSQL. Em seguinte a terceira será a etapa da Carga, em que será responsável por armazenar em um modelo desenvolvido para armazenar todos os dados, seguindo a idéia do exemplo é interessante que a carga seja realizada todos os dias. A modelagem multidimensional exerce um importante papel em um Data Warehouse, pois representa como os dados serão armazenados fisicamente. A modelagem dimensional é uma metodologia que permite modelar logicamente dados para melhorar o desempenho de consultas e prover facilidade de utilização a partir de um conjunto de eventos básicos de medição. Sobre a modelagem multidimensional, descreva e exemplifique tabela fato, dimensão e métricas. Resposta esperada *Tabela Fato: é o objeto de análise sob o qual se deseja extrair conhecimento. No exemplo de um data warehouse de vendas, essa fato irá centralizar os dados. VOLTAR A+ Alterar modo de visualização 1 2 16/03/2024, 14:18 Avaliação Final (Discursiva) - Individual about:blank 2/2 *Dimensões: as dimensões fornecem valores que alimentam a tabela fato. Em um cenário de vendas, pode existir a dimensão produto e dimensão cliente. *Métricas: as métricas podem ser divididas em aditivas, semiaditivas e não aditivas, e são utilizadas para medir ou quantificar os dados armazenados. Por exemplo, a quantidade de vendas ou total. Minha resposta A Tabela Fato é o objeto de análise sob o qual se extrai o conhecimento, por exemplo de um data warehouse de vendas, esse fato irá centralizar os dados. As Dimensões fornecem os valores que alimentam a tabela fato, pegando o mesmo exemplo de vendas, pode existir a dimensão produto e dimensão cliente. As Métricas podem ser dividas em aditivas, semiaditivas e não aditivas em que são utilizadas ara medir/quantificar os dados que foram armazenadas, seguindo o mesmo exemplo de venda, pegamos a quantidade de vendas ou total. Imprimir
Compartilhar