Baixe o app para aproveitar ainda mais
Prévia do material em texto
PERGUNTA Nesta terceira unidade, aprofundamos um pouco mais a definição de Big Data, Data Analytics e ciência de dados e vimos alguns detalhes e características de aplicações e da área em si. Com isso, foi possível perceber que alguns dos conceitos, por mais que pareçam, não são algo novo, e que o seu uso se tornou viável devido às condições ideais favorecidas pela contemporaneidade, com os avanços tecnológicos e mudanças trazidas pela globalização, que tornaram nosso modo de vida cada vez mais digital e conectado. Vimos que projetos no campo de ciência de dados possuem algumas particularidades, e que para serem orientadas a dados, muitas vezes, as organizações precisam adotar toda uma mudança de cultura, o que pode envolver um complexo, porém necessário, processo de mudança. Um projeto da área de engenharia de dados possui, dentre todas as suas etapas e ciclos, uma de especial importância, da qual depende o sucesso de todas as outras: a “modelagem”. Como aprendido na unidade 3, elabore um texto dissertativo que aborde a relação entre a modelagem e a engenharia de dados, incluindo as características de um projeto prático de engenharia de dados, com cerca de 15 a 30 linhas, e submeta à avaliação docente. RESPOSTA: Modelagem de banco de dados é o processo de levantamento, análise, categorização e exploração de todos os dados e tipos de informações que irão sustentar uma sistema e posteriormente uma tomada de decisão. Esta é uma etapa primordial no trabalho de encontrar a informação, pois toda informação terá determinados objetivos, para atender às necessidades do negócio em algum cenário. Segundo Aalst e Hee (2004), a modelagem de dados trata da concepção de projeto de banco de dados, desde o modelo conceitual, lógico e físico de um banco de dados e, sendo o dado a informação em seu estado bruto e este se tornará de fato uma informação quando a ele for atribuído um significado. Uma modelagem de banco de dados deve ser bem executada no início de qualquer projeto para as chances de que ele apresente falhas ou até mesmo de não suprir os objetivos, sejam as menores possíveis. E por conta da sua importância se faz necessário que sua realização seja por um Engenheiro de Dados, pois a modelagem computacional faz uso de um conjunto de métodos, ferramentas e formulações direcionadas à solução de problemas complexos, envolvendo grande número de variáveis, de dados, processamento e manipulação de imagens, tendo em seu campo de abrangência o desenvolvimento de modelos matemáticos, Naiburg e Maksimchuk (2001). Para que a modelagem, a extração e transformação dos dados tenham um significado e a capacidade de agregar valor em um projeto com o objetivo de disponibilizar informações de tomada decisões rápidas e precisas os Cientistas e Engenheiros de Dados se apoiam em vária ferramentas de mercado, em geral open source, como por exemplo: TensorFlow, Ggplot, Matplotlib entre outras. Assim, dentificar quais dessas ferramentas são relevantes e valiosas para cada tipo de negócio é um desafio considerável, Doll (2013).
Compartilhar