Prévia do material em texto
Papéis dos envolvidos em projetos de Big Data e ciência dos dados Apresentação A busca por profissionais e equipes cada vez mais multidisciplinares tem sido vista como vantagem competitiva no mercado de trabalho, e por esse motivo não seria diferente com as equipes de Tecnologia da Informação (TI). Novos perfis profissionais surgiram e foram agregados na equipe de TI, como administradores de banco de dados, engenheiros de dados e cientistas de dados. Alguns desses papéis surgiram recentemente e já estão contribuindo nas tomadas de decisões referentes aos negócios das corporações em que estão inseridos. Profissionais com visão estratégica e de mercado são muito importantes em projetos de Big Data e Ciência de Dados. São eles que irão compreender os dados e obter valor deles. Nesta Unidade de Aprendizagem, você vai estudar os papéis e as responsabilidades de funções relacionadas à Ciência de Dados. Também vai aprender sobre o perfil do profissional e suas responsabilidades nos processos de Ciência de Dados e Big Data. Bons estudos. Ao final desta Unidade de Aprendizagem, você deve apresentar os seguintes aprendizados: Reconhecer os perfis e as responsabilidades de funções relacionadas à Ciência de Dados.• Identificar as tarefas dos papéis administrativos nos processos de Ciência de Dados.• Definir as tarefas dos papéis técnicos nos processos de Ciência de Dados.• Desafio As empresas estão em constante evolução para oferecer novos produtos e serviços à população com a intenção de captar mais clientes e fazê-los comprar cada vez mais. Veja a seguir uma empresa que enfrenta esse desafio: Você, como gerente de projetos, é responsável por montar uma equipe para construir esse projeto. Portanto, responda as seguintes perguntas: a) Qual perfil profissional o gerente de marketing está representando? b) Além de você, com quais outros profissionais você montará sua equipe? c) Quais serão suas próprias reponsabilidades? d) Como você saberá que o projeto foi bem-sucedido? Infográfico Entre os papéis dos envolvidos em projetos de Ciência de Dados e Big Data, há perfis administrativos e perfis técnicos. Ambos são igualmente importantes para o bom andamento do projeto: um voltado para o negócio e outro voltado para a tecnologia. É fundamental que as equipes de Ciência de Dados e Big Data sejam multidisciplinares e que cada membro some à equipe sua expertise, seja no pilar técnico (programação, bancos de dados, matemática, estatística, etc.), seja no pilar administrativo (mercado, negócios, produtos, serviços, etc.), para que se possa ter ao final do projeto um produto/serviço não só mais completo tecnicamente, mas também mais útil para o negócio. No Infográfico a seguir, você vai ver um pouco mais sobre os perfis técnicos. Aponte a câmera para o código e acesse o link do conteúdo ou clique no código para acessar. https://statics-marketplace.plataforma.grupoa.education/sagah/c6a8746b-a07a-4954-8c95-bbb1fc9a4ff3/a3fe5db4-e141-4b10-a594-9bca723daa83.png Conteúdo do livro É necessário que o profissional de Ciência de Dados conheça os projetos em que estará envolvido, a equipe com a qual trabalhará e as características e responsabilidades de cada um dos envolvidos no desenvolvimento de produto e afins. Na obra Introdução à Ciência de Dados, leia o capítulo Os papéis dos envolvidos em projetos de Big Data e Ciência de Dados, em que você vai ver como identificar as atribuições e compreender os perfis dos envolvidos em projetos de Big Data e Ciência de Dados. Boa leitura. INTRODUÇÃO À CIÊNCIA DE DADOS Saulo Samuel Pereira Furtado Papéis dos envolvidos em projetos de big data e ciência de dados Objetivos de aprendizagem Ao final deste texto, você deve apresentar os seguintes aprendizados: Reconhecer os perfis e as responsabilidades de funções relacionadas à ciência de dados. Identificar as tarefas dos papéis administrativos nos processos de ciência de dados. Definir as tarefas dos papéis técnicos nos processos de ciência de dados. Introdução Hoje as empresas disputam fatias de mercado em um cenário cada vez mais competitivo, no qual toda venda interessa e cada cliente importa. Não apenas para se diversificarem, mas também para tomarem melhores decisões de negócio, as empresas entenderam que precisam usar os dados a seu favor. Elas precisam coletar e entender os dados do passado, buscar correlações e respostas que predizem o futuro e, então, agir de forma mais garantida para a boa fluidez dos negócios. Contudo, as empresas perceberam que podem oferecer ao cliente produtos e serviços que também utilizem dados, melhorando a sua experiência com maior possibilidade de retenção e fidelização. Para tanto, é necessária uma equipe de colaboradores especializados, que conheçam desde o processo de coleta, armazenamento e processamento até a geração de visualizações relacionadas a esses dados, de modo que seja possível extrair valor deles. Neste capítulo, você vai estudar sobre os perfis profissionais envolvidos em um projeto de ciência de dados e big data. Alguns deles são mais voltados para o negócio da empresa e o mercado em que ela atua, já outros são mais direcionados a construir produtos e oferecer serviços orientados a dados e baseados em tecnologia, auxiliando na tomada de decisão e agregando valor para o negócio e para o cliente. 1 Perfis e responsabilidades de funções relacionadas à ciência de dados Como destaca a Oracle (2020), a maior empresa de sistemas gerenciadores de banco de dados do mundo, os cientistas de dados são mais efi cazes traba- lhando em equipes: eles nunca trabalham sozinhos. Essa afi rmação parece ser uma verdade absoluta para qualquer profi ssão em todo mercado, mas é especialmente verdadeira quando se refere a projetos de ciência de dados e big data. Isso se dá, em grande medida, porque esse é um assunto no qual é possível ser profundamente técnico em vários domínios do conhecimento e, ao mesmo tempo, ter de lidar com projetos com graus de complexidade diferentes. Uma equipe de ciência de dados e big data com maior chance de sucesso nos seus projetos será composta por profissionais de diferentes áreas, os quais somam à equipe a sua expertise e contribuem para a interdisciplinaridade dos projetos. Um projeto de ciência de dados e big data não é apenas um projeto de tecnologia da informação (TI), mas um projeto corporativo, um projeto de negócio em que a empresa está inserida. Ele pode ou não começar pela TI, mas com certeza não fica apenas nela, entregando o seu valor para as áreas de negócio interessadas no projeto. Embora esse tópico seja recente e haja certa liberdade para que as empresas escolham os seus profissionais, dependendo muitas vezes do seu orçamento, naturalmente você perceberá que uma equipe de ciência de dados e big data será composta por profissionais de negócios e de tecnologia da informação. Nessas equipes, entre os vários domínios do conhecimento, geralmente os profissionais se dividem em dois grandes perfis ou pilares, como você vê na Figura 1: administrativos ou de negócios; técnicos ou de TI. Papéis dos envolvidos em projetos de big data e ciência de dados2 Figura 1. Os pilares de uma equipe de ciência de dados e big data. Obviamente, cada pilar conta com profissionais diferentes e olhares dis- tintos. Porém, você verá que ambos são igualmente importantes para o bom andamento de um projeto de ciência de dados e big data. Vale ressaltar que há uma margem para definir como cada profissional atuará e as responsabilidades de cada um, mas a seguir você verá tópicos gerais do que esperar de cada profissional desses pilares. 2 Tarefas dos papéis administrativos nos processos de ciência de dados Em uma equipe de ciência de dados e big data, os papéis administrativos (ou de negócios) são aqueles mais direcionados para o negócio da empresa e o mercado no qual ela está inserida. Esses profi ssionais são aqueles com visão para produtos,serviços, riscos, oportunidades de negócio, e estão preocupados com a atuação da empresa, os seus negócios, projetos e processos como um todo. 3Papéis dos envolvidos em projetos de big data e ciência de dados Usuário solicitante O usuário solicitante é o profi ssional mais interessado no produto fi nal alcançado pela equipe de ciência de dados e big data: as análises, res- postas obtidas ou até mesmo novas funcionalidades para o sistema de informação empresarial. Ele está na ponta, onde há perguntas importantes a serem respondidas sobre o negócio, e necessita de melhor embasamento para auxiliá-lo na tomada de decisão ou simplesmente zela pela melhoria contínua da sua área e do negócio como um todo. Como o nome indica, o usuário solicitante geralmente é quem tem de- terminada necessidade de negócio no seu cotidiano e solicita a construção de um projeto orientado a dados para que essa necessidade seja suprida. A questão de para quem essa solicitação será feita vai depender do grau de maturidade e entendimento que os próprios usuários têm sobre esse processo na empresa e o quão forte está a presença da equipe de ciência de dados e big data na corporação. Em empresas nas quais os processos referentes a projetos orientados a dados ainda não estão totalmente definidos (ou quando a equipe de ciência de dados e big data ainda não está suficientemente madura ou não tem uma presença tão forte na empresa), essa solicitação poderá ser feita diretamente à equipe, e o projeto acabará se concretizando apenas com essas duas partes. Já em empresas em que os processos envolvendo projetos orientados a dados são bem-definidos (ou quando a equipe de ciência de dados e big data já é madura ou tem uma presença forte na empresa), essa solicitação em geral passa primeiramente por um analista de negócio. Esse profissional entenderá a solicitação de modo a otimizar o projeto e poderá acrescentar outros profissionais, a depender da solicitação feita e do seu grau de complexidade. Os usuários solicitantes geralmente não fazem restrições quanto às tecnologias empregadas, visto que o seu interesse está no produto final: se ele o atende e o quão confiável é para fundamentar as suas decisões de negócio. Contudo, esses profissionais devem zelar pela boa descrição e pelo detalhamento do que querem e necessitam que seja realizado, com clareza nas suas necessidades e objetividade naquilo que precisa ou não ser feito. Em resumo, são de sua responsabilidade: Papéis dos envolvidos em projetos de big data e ciência de dados4 a descrição precisa da sua necessidade e de como inicialmente propõem supri-las; o acompanhamento da realização do projeto; a remoção dos impedimentos quanto à usabilidade do produto final; a validação de uso nas principais etapas que ocorrerem no decorrer do projeto; a validação de uso final e conclusão da solicitação de projeto. Analista de negócios O analista de negócios é o profi ssional que faz a ponte entre o usuário solicitante e a equipe de ciência de dados e big data, servindo como intermediário entre ambos. Ele em geral tem conhecimento profundo de negócios e não superfi cial em TI, e faz uso dos conhecimentos de ambas áreas para remover impedimentos e garantir que tudo o que for necessário seja produzido com a devida qualidade. O analista de negócios está em constante processo de análise dos produtos e serviços oferecidos pela empresa. Ele identifica novos negócios, tendências e oportunidades, e pode repensar e relançar produtos já existentes ou pro- por o lançamento de novos produtos e serviços. Nessa jornada em busca de oportunidades de negócio, é possível que o analista de negócios sugira criar ou melhorar um produto orientado a dados. Isso significa que, além da sua atuação, ele ainda pode se adequar ao perfil de usuário solicitante, partindo dele a necessidade de um produto orientado a dados. Logo, a participação do analista de negócios se faz muito valiosa, não só para a equipe de ciência de dados e big data e os seus produtos, mas para a empresa em geral. Em empresas pequenas, pode não ser possível ter um analista de negócios nos projetos orientados a dados, mas a participação desse profissional pode ser crucial para o bom andamento e a conclusão dos projetos. Servindo como “cola” que une as áreas de negócios e de TI, o analista de negócios não só terá o papel de “traduzir” o que uma área diz para a outra, mas também de retirar obstáculos que possam impedir o bom andamento do projeto e de sugerir formas de construção, uso e validação dele. O analista de negócios é um profissional com grande interesse no produto final. Invariavelmente, os projetos enfrentarão percalços e atritos, e cabe ao analista de negócios o papel de mediador de conflitos, a fim de buscar sempre o equilíbrio entre o esforço para se criar um produto orientado a dados e o valor que esse produto pode agregar ao negócio. 5Papéis dos envolvidos em projetos de big data e ciência de dados Em uma equipe de ciência de dados e big data, o analista de negócios deve: dominar o negócio da empresa; conhecer os produtos e serviços tanto da própria empresa quanto da concorrência; encontrar oportunidades de negócio e sugerir produtos e serviços que atendam a elas; ser um facilitador entre as áreas de negócios e de TI; remover impedimentos e mediar conflitos; zelar pelo bom andamento dos projetos. Gerente de projetos Veja que, até agora, não falamos sobre o escopo do projeto, a formação da equipe, o custo do projeto, o que é o produto fi nal e as suas etapas de entrega, a liderança do projeto, a defi nição dos stakeholders e executores, a documen- tação e o registro das atividades, o cronograma, etc. Essas são algumas das responsabilidades do gerente de projetos. O gerente de projetos é o profissional que garante o bom andamento do projeto como um todo, mas não se envolve com o teor do projeto em si ou se o produto final realmente tem um significado para o negócio — esses são pontos que são discutidos pelos usuários solicitantes e analistas de negócios. O gerente de projetos deve garantir que a construção de um projeto tenha um ciclo de vida (início, meio e fim), seja cumprido no prazo acordado, tenha sido executado por todos aqueles que se comprometeram no início, e que o feedback do usuário solicitante seja ouvido. Perceba que as atribuições de um gerente de projetos se encaixam não apenas em projetos orientados a dados, mas em qualquer projeto da empresa. Algumas das suas responsabilidades são as seguintes: liderar a equipe para um objetivo em comum; definir o escopo do projeto; definir o cronograma e garantir que ele seja cumprido; identificar os obstáculos e deliberar soluções; avaliar riscos e mitigá-los; negociar conflitos entre as partes interessadas; documentar o projeto quanto à sua construção e fazer saber aos demais. Papéis dos envolvidos em projetos de big data e ciência de dados6 O PMI (Project Management Institute ou instituto de gestão de projetos) é uma instituição sem fins lucrativos reconhecida internacionalmente, que serve como uma associação para profissionais de gestão de projetos. Trata-se de uma instituição respeitada que investiga as boas práticas da gestão de projetos. De tempos em tempos, essa organização lança o guia Project Management Body of Knowledge (PMBOK), que, em 2020, já está na sua 6ª edição, lançada em 2017. Esse guia traz as melhores práticas e diretrizes em gestão de projetos e discorre sobre todo o ciclo de vida de um projeto. Há ainda as certificações oferecidas por esse instituto. Entre as várias possíveis, a mais conhecida é a que certifica o profissional como PMP (Project Management Professional ou profissional de gestão de projetos). Esse profissional, quando atua em uma empresa com uma equipe especializada e focada em gestão de projetos, lidera o que o instituto chama de PMO (Project Management Office ou escritório de gestãode projetos), responsável por gerir os diversos projetos da empresa. Dependendo do tipo e da abordagem utilizada nos projetos de TI da empresa, pode-se ou não ter o papel do gerente de projetos. Em empresas que utilizam métodos ágeis para o desenvolvimento de software, como o Scrum ou XP, as responsabilidades de gerência do projeto podem ser distribuídas entre os demais integrantes da equipe. 3 Tarefas dos papéis técnicos nos processos de ciência de dados Os papéis técnicos (ou de tecnologia da informação) de uma equipe de ciência de dados e big data são voltados, em sua maioria, para os sistemas de infor- mação e computação, a construção e a manutenção de produtos e serviços ligados à tecnologia, seja para uso do cliente fi nal ou para uso interno das áreas de negócio. Obviamente, quanto mais conhecimento de negócio esses profi ssionais tiverem, melhor. Contudo, são papéis que geralmente necessitam de analistas de negócios e/ou de gerentes de projetos ou papéis similares para intermediarem os projetos, de modo a melhor entenderem as necessidades de negócios da empresa e concluírem os projetos com êxito e qualidade. 7Papéis dos envolvidos em projetos de big data e ciência de dados Administrador de banco de dados Os administradores de bancos de dados, conhecidos como DBAs (por sua denominação em inglês, Database Administrator), são os profi ssionais responsáveis por criar e manter bancos de dados. Nos primórdios da com- putação, eles trabalhavam mais com bancos de dados SQL ou relacionais, mas esse papel tem sido desenvolvido por profi ssionais que trabalham também com bancos de dados NoSQL. Principalmente pela integridade de dados que ela proporciona, essa categoria de banco de dados é utilizada nas empresas há bastante tempo e em praticamente todas as áreas, o que fez com que o DBA fosse um dos profi ssionais mais requisitados pelo mercado de trabalho. Os DBAs não só criam e mantêm bancos de dados SQL, mas são respon- sáveis também pelas seguintes atividades: manutenção do servidor físico do banco de dados; recuperação de desastres; melhoria no desempenho de consultas ao banco de dados feito por aplicações da empresa; controle de acesso aos dados; criação de objetos (tabelas, funções, procedimentos, visualizações, etc.) no banco de dados; uso dos dados da empresa para alimentar os processos de negócios. Todos esses pontos são importantes, mas é o último citado que fez o DBA não ser visto somente como parte operacional de TI, mas também como parte estratégica de negócio. Com um profundo conhecimento de como os dados dos bancos de dados são criados, armazenados e utilizados, os DBAs sempre foram profissionais importantes para um projeto voltado a dados. Atualmente, são vistos como profissionais tradicionais de TI, mantendo bancos de dados robustos e operantes, que alimentam sistemas de informação empresariais operacionais e estratégicos. Dessa forma, os DBAs somam à equipe de ciência de dados e big data não só a sua expertise em armazenamento e consumo dos dados, mas também o significado e o valor que eles têm para o negócio. Além disso, são também os precursores dos engenheiros de dados. Para cumprirem as suas responsabili- dades, os DBAs geralmente trabalham com os seguintes itens: Papéis dos envolvidos em projetos de big data e ciência de dados8 banco de dados SQL e NoSQL (como Oracle, SQL Server, MySQL, Hive, MongoDB); linguagem SQL e as suas extensões (como PL-SQL para Oracle, T-SQL para SQL Server e HSQL para o Hive); sistemas operacionais Linux e Windows; infraestrutura de TI (servidores, redes de computadores e segurança). Engenheiro de dados Assim como os cientistas de dados, os engenheiros de dados são profi ssionais novos no mercado de trabalho. Da mesma forma, eles são profi ssionais ex- tremamente valiosos para uma equipe orientada a dados. Os engenheiros de dados cuidam de todos os processos, desde a captura e o armazenamento dos dados — geralmente sistemas NoSQL — até a entrega para uso dos cientistas de dados ou até mesmo dados processados para a área de negócios. Além disso, esses profissionais são capazes de lidar com o grande volume, a velocidade, a variedade, a veracidade e o valor dos dados — hoje concei- tualmente chamados de cinco Vs do big data, como você viu anteriormente. São algumas responsabilidades dos engenheiros de dados: criar e manter sistemas de captura e armazenamento de dados sob demanda, em lote ou em tempo real (streaming); cuidar do inventário dos dados brutos; cuidar da catalogação e manter metadados de todos os dados; fazer a classificação dos dados quanto ao seu teor e sensibilidade frente aos diversos acessos; fazer o versionamento e definir o ciclo de vida dos dados e o seu tempo de vida; garantir a confiabilidade dos dados; recuperar dados pertinentes ao negócio em tempo hábil. O engenheiro de dados precisa dominar algumas tecnologias e ferramentas de uso recorrente em uma equipe de ciência de dados e big data. Algumas delas são as seguintes: Hadoop (Hadoop Common, Hadoop Yarn, HDFS e Hadoop MapReduce); outras tecnologias do ecossistema Hadoop (Spark, HBase, Hive, Pig, Flume, Sqoop, Mahout etc.); 9Papéis dos envolvidos em projetos de big data e ciência de dados sistemas operacionais Linux; computação em nuvem (AWS, Google Cloud Platform, Microsoft Azure); bancos de dados SQL (como Oracle, SQL Server e MySQL) e NoSQL (como MongoDB, Cassandra e Redis). No site da AWS Amazon (maior empresa de computação em nuvem do mundo), você conhecerá um pouco sobre bancos de dados NoSQL. Atualmente, é a empresa de sistema de banco de dados com maior expansão no mercado. Cientista de dados O cientista de dados é peça fundamental em um projeto orientado a dados. É ele que tem a missão de extrair conhecimento dos dados da empresa, geralmente preparados e entregues pelo engenheiro de dados, a fi m de agregar valor ao negócio. Estamos falando de um profi ssional multidisciplinar por natureza, portanto, esse profi ssional: utiliza programação e outros conhecimentos de computação para ma- nipular dados; detém conhecimento matemático e estatístico para validar as análises feitas nos dados; possui razoável expertise do negócio da empresa e do mercado onde ela está inserida para saber fazer as perguntas corretas e como respondê- -las com os dados. De acordo com Sharda, Delen e Turban (2019, p. 544): Cientistas de dados usam uma combinação de suas habilidades empresa- riais e técnicas para investigar Big Data, buscando maneiras de aprimorar práticas atuais de análise de negócios (desde descritivas e preditivas até prescritivas) e, assim, melhorar as decisões para novas oportunidades de negócios. O cientista de dados geralmente é uma pessoa curiosa e investigativa, que manipula os dados à procura de correlações e explicações para determinadas Papéis dos envolvidos em projetos de big data e ciência de dados10 necessidades de negócio. Ainda, deve saber reportar as suas descobertas e análises aos profissionais de negócio e tomadores de decisão, sabendo pontuar: de onde são os dados, em qual contexto aqueles dados estão inseridos; quais perguntas pretendem responder; quais as respostas propostas; qual nível de confiança têm as suas análises e respostas. Um cientista de dados precisa também dominar técnicas de machine le- arning (em português, aprendizado de máquina), pois é com esse tipo de técnica que se torna possível predizer acontecimentos futuros com base em dados do passado. Machine learning é o ato de fazer o computador aprender correlações em dados de forma que, quando novos dados forem apresentados, a máquina consiga dizer do que se trata ou até mesmo nos fazer saber quando determinado evento vai ocorrer no futuro — por exemplo, uma oportunidade de investimento na bolsa de valores ou uma possível compra de um cliente no seu site. Em um projetoorientado a dados, os cientistas de dados geralmente coletam dados históricos de uma área da empresa (como logística ou departamento financeiro) e aplicam conhecimentos estatísticos e machine learning em busca de correlações nos dados do passado, que possam ser confiáveis a ponto de conseguirem predizer o futuro. Veja, então, que não se trata de saber somente o que aconteceu no passado e por que aconteceu, mas também o que acontecerá no futuro e o que se pode fazer a respeito. O cientista de dados é responsável por: coletar os dados corretos para determinado problema de negócio; manipular os dados de modo a entender as suas características e particularidades; aplicar conhecimento estatístico para encontrar correlações ou infor- mações pertinentes ao negócio em estudo; testar hipóteses provenientes dos profissionais de negócio ou aquelas concebidas pelo próprio profissional; garantir um nível de confiabilidade nas análises feitas; buscar por padrões nos dados do passado, a fim de treinar o computador para a predição de eventos futuros; reportar as suas descobertas, conclusões e valor agregado ao negócio adquiridos com todo o processo. 11Papéis dos envolvidos em projetos de big data e ciência de dados Um cientista de dados geralmente domina: linguagem de programação R e/ou Python e as suas bibliotecas (Pandas, Numpy, Scikit-learn, Tensorflow); linguagem SQL; matemática e estatística descritiva e inferencial; Machine learning (aprendizado supervisionado, não supervisionado e por reforço); assunto ao qual os dados se referem. Como você viu neste capítulo, há muitos caminhos que pode seguir, em termos de equipes de ciência de dados e big data. Sejam mais voltados para o negócio ou para a tecnologia da informação, todos os papéis têm importância na empresa, ainda que contribuam de maneiras diferentes. Nesse sentido, é certo que ter uma equipe especializada no desenvolvimento de projetos orientados a dados é um grande diferencial, principalmente por garantir que o projeto terá os seus custos otimizados, atenderá à solicitação de negócio, será documentado e cumprido no prazo acordado. Esses fatores são fundamentais para qualquer empresa, por conta da alta competitividade de mercado. ORACLE. O que é ciência de dados? [2020]. Disponível em: https://www.oracle.com/br/ data-science/what-is-data-science.html. Acesso em: 15 abr. 2020. SHARDA, R.; DELEN, D.; TURBAN, E. Business Intelligence e análise de dados para gestão do negócio. 4. ed. Porto Alegre: Bookman, 2019. Leituras recomendadas AWS. O que é NoSQL? 2020. Disponível em: https://aws.amazon.com/pt/nosql/. Acesso em: 15 abr. 2020. LEDESMA, B. Como prever a gravidez de clientes aumenta as vendas: caso Target. [2020]. Disponível em: https://www.analisepreditiva.com.br/como-prever-a-gravidez-de- -clientes-aumenta-as-vendas-caso-target/. Acesso em: 15 abr. 2020. PROJECT MANAGEMENT INSTITUTE. [Site]. [2020]. Disponível em: https://www.pmi. org/. Acesso em: 15 abr. 2020. Papéis dos envolvidos em projetos de big data e ciência de dados12 Os links para sites da web fornecidos neste capítulo foram todos testados, e seu fun- cionamento foi comprovado no momento da publicação do material. No entanto, a rede é extremamente dinâmica; suas páginas estão constantemente mudando de local e conteúdo. Assim, os editores declaram não ter qualquer responsabilidade sobre qualidade, precisão ou integralidade das informações referidas em tais links. 13Papéis dos envolvidos em projetos de big data e ciência de dados Dica do professor Ultimamente têm surgido nas empresas, principalmente no desenvolvimento de software, formas diferentes de se construir produtos, as chamadas metodologias ágeis. Há diversos tipos de metodologias ágeis em uso nas empresas (principalmente em startups), mas com certeza a mais famosa e com grande adesão ultimamente é o Scrum. O Scrum tem tido grande adesão por ser relativamente fácil de entender e aplicar, por já ter mostrado resultados em grandes empresas pelo mundo e, não menos importante, por ser também muito eficiente em equipes de Ciência de Dados e Big Data. Confira, na Dica do Professor a seguir, um pouco sobre o Scrum, sua metodologia e os papéis dos envolvidos. Aponte a câmera para o código e acesse o link do conteúdo ou clique no código para acessar. https://fast.player.liquidplatform.com/pApiv2/embed/cee29914fad5b594d8f5918df1e801fd/e3947598fc00188e25e9af9314262f34 Exercícios 1) Ultimamente, com a crescente utilização de técnicas e ferramentas de Big Data, grande parte das empresas estão decidindo armazenar seus dados em nuvem e mais recentemente em bancos de dados NoSQL. Qual profissional está apto a trabalhar e manter sistemas de dados com essas tecnologias? A) Cientista de dados. B) Administrador de banco de dados. C) Gerente de projetos. D) Engenheiro de dados. E) Analista de negócios. 2) Muito do que uma companhia produz é proveniente de projetos, no desenvolvimento tanto de novos produtos e serviços para o cliente quanto para o próprio uso da empresa. O bom andamento dos projetos em uma empresa é um fator muito importante, pois a sistematização da má gestão em projetos pode acarretar desperdício financeiro, de recursos humanos e de tempo, além de afetar gravemente os negócios. Isso pode refletir em perdas de oportunidades, diminuição na participação no mercado ou em situações mais graves como a falência do negócio. Visto que todo projeto pode ter um custo financeiro associado e invariavelmente tem uma duração para que seja realizado, entre os papéis estudados de uma equipe de Ciência de Dados e Big Data, qual profissional é responsável por esses assuntos para um bom andamento do projeto? A) Analista de negócios. B) Cientista de dados. C) Engenheiro de dados. D) Administrador de banco de dados. E) Gerente de projetos. 3) Independente do cargo de um funcionário em uma empresa, há atribuições que são trabalhadas especialmente por ele. Isso não é diferente em equipes de Ciência de Dados e Big Data. Sempre conseguimos identificar uma responsabilidade que é de um profissional específico e de nenhum outro, tendo em vista, por exemplo, sua formação na área, experiência, domínio ou simplesmente vocação. Considerando a natureza multidisciplinar dos cientistas de dados e a quantidade de tecnologias, métodos e assuntos que eles precisam dominar, qual opção abaixo é trabalhada especialmente por eles? A) Recuperação de desastres. B) Machine learning. C) Ciclo de vida do projeto. D) Banco de dados SQL. E) Cuidar do inventário dos dados brutos. 4) Para uma equipe de Ciência de Dados e Big Data é importante que se conheça bem o negócio em foco e o mercado onde a empresa está inserida. Conhecer a empresa é saber o que é ou pode ser oferecido ao cliente no futuro, por exemplo; é conhecer o mercado e entender a concorrência, como cada empresa age frente aos concorrentes e o que pode ser feito para crescer nesse ambiente. É extremamente valioso para os técnicos da equipe de Ciência de Dados e Big Data ter em mãos essas informações de negócios para guiá-los no desenvolvimento de produtos e serviços orientados a dados. Dito isso, ter domínio do negócio da empresa, ser um facilitador entre o negócio e a TI e conhecer bem os produtos e serviços da própria empresa e da concorrência são atribuições de qual perfil? A) Analista de negócios. B) Cientista de dados. C) Administrador de banco de dados. D) Engenheiro de dados. E) Usuário solicitante. 5) Muitas profissões são evoluções de outras que já existiram, seja por necessidades de negócio, seja por conta da própria evolução tecnológica. Dito isso, qual perfil profissional voltado a dados foi o precursor do engenheiro de dados? A) Usuário solicitante. B) Gerente de projetos. C) Administrador de banco de dados. D) Cientista de dados. E) Analista de negócios. Na prática Quando uma ideia de negócio aparece, pode-se não saber comotestá-la e implementá-la na empresa. Acredita-se que essa ideia seja promissora, mas pode-se não ter o domínio necessário de ferramentas e métodos para que a ideia saia do papel. Naturalmente, envolvem-se outros profissionais e monta-se uma equipe multidisciplinar, em que cada um tem suas responsabilidades, mas soma-se a sua expertise ao projeto. Acompanhe, neste Na Prática, um exemplo de caso em que uma equipe de Ciência de Dados e Big Data foi montada para resolver um problema de negócio. Conteúdo interativo disponível na plataforma de ensino! Saiba + Para ampliar o seu conhecimento a respeito desse assunto, veja abaixo as sugestões do professor: Business intelligence e análise de dados para gestão do negócio. No livro a seguir, você poderá conhecer mais detalhes sobre a profissão de cientista de dados e outros aspectos de uma carreira de dados. Conteúdo interativo disponível na plataforma de ensino! 10 carreiras em Big Data e Data Science No link abaixo, veja algumas outras carreiras em dados que podem ser seguidas, entre elas arquiteto de soluções de Big Data, engenheiro de machine learning e desenvolvedor de visualização de dados. Aponte a câmera para o código e acesse o link do conteúdo ou clique no código para acessar. Mapa Completo das Funções em Ciência de Dados No link abaixo, veja um resumo sobre as funções em Ciência de Dados respondendo dúvidas comum para quem está começando. Aponte a câmera para o código e acesse o link do conteúdo ou clique no código para acessar. https://blog.dsacademy.com.br/10-carreiras-em-big-data-e-data-science/ https://blog.dsacademy.com.br/mapa-completo-das-funcoes-em-ciencia-de_dados/