Buscar

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 29 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 29 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 29 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Papéis dos envolvidos em projetos de Big 
Data e ciência dos dados
Apresentação
A busca por profissionais e equipes cada vez mais multidisciplinares tem sido vista como vantagem 
competitiva no mercado de trabalho, e por esse motivo não seria diferente com as equipes de 
Tecnologia da Informação (TI). Novos perfis profissionais surgiram e foram agregados na equipe de 
TI, como administradores de banco de dados, engenheiros de dados e cientistas de dados. Alguns 
desses papéis surgiram recentemente e já estão contribuindo nas tomadas de decisões referentes 
aos negócios das corporações em que estão inseridos.
Profissionais com visão estratégica e de mercado são muito importantes em projetos de Big Data e 
Ciência de Dados. São eles que irão compreender os dados e obter valor deles.
Nesta Unidade de Aprendizagem, você vai estudar os papéis e as responsabilidades de funções 
relacionadas à Ciência de Dados. Também vai aprender sobre o perfil do profissional e suas 
responsabilidades nos processos de Ciência de Dados e Big Data.
Bons estudos.
Ao final desta Unidade de Aprendizagem, você deve apresentar os seguintes aprendizados:
Reconhecer os perfis e as responsabilidades de funções relacionadas à Ciência de Dados.•
Identificar as tarefas dos papéis administrativos nos processos de Ciência de Dados.•
Definir as tarefas dos papéis técnicos nos processos de Ciência de Dados.•
Desafio
As empresas estão em constante evolução para oferecer novos produtos e serviços à população 
com a intenção de captar mais clientes e fazê-los comprar cada vez mais.
Veja a seguir uma empresa que enfrenta esse desafio:
Você, como gerente de projetos, é responsável por montar uma equipe para construir esse projeto. 
Portanto, responda as seguintes perguntas:
a) Qual perfil profissional o gerente de marketing está representando?
b) Além de você, com quais outros profissionais você montará sua equipe?
c) Quais serão suas próprias reponsabilidades?
d) Como você saberá que o projeto foi bem-sucedido?
Infográfico
Entre os papéis dos envolvidos em projetos de Ciência de Dados e Big Data, há perfis 
administrativos e perfis técnicos. Ambos são igualmente importantes para o bom andamento do 
projeto: um voltado para o negócio e outro voltado para a tecnologia.
É fundamental que as equipes de Ciência de Dados e Big Data sejam multidisciplinares e que cada 
membro some à equipe sua expertise, seja no pilar técnico (programação, bancos de dados, 
matemática, estatística, etc.), seja no pilar administrativo (mercado, negócios, produtos, serviços, 
etc.), para que se possa ter ao final do projeto um produto/serviço não só mais completo 
tecnicamente, mas também mais útil para o negócio.
No Infográfico a seguir, você vai ver um pouco mais sobre os perfis técnicos.
Aponte a câmera para o 
código e acesse o link do 
conteúdo ou clique no 
código para acessar.
https://statics-marketplace.plataforma.grupoa.education/sagah/c6a8746b-a07a-4954-8c95-bbb1fc9a4ff3/a3fe5db4-e141-4b10-a594-9bca723daa83.png
Conteúdo do livro
É necessário que o profissional de Ciência de Dados conheça os projetos em que estará envolvido, 
a equipe com a qual trabalhará e as características e responsabilidades de cada um dos envolvidos 
no desenvolvimento de produto e afins.
Na obra Introdução à Ciência de Dados, leia o capítulo Os papéis dos envolvidos em projetos de Big 
Data e Ciência de Dados, em que você vai ver como identificar as atribuições e compreender os 
perfis dos envolvidos em projetos de Big Data e Ciência de Dados.
Boa leitura.
INTRODUÇÃO À 
CIÊNCIA DE 
DADOS
Saulo Samuel Pereira Furtado
Papéis dos envolvidos 
em projetos de big data 
e ciência de dados
Objetivos de aprendizagem
Ao final deste texto, você deve apresentar os seguintes aprendizados:
  Reconhecer os perfis e as responsabilidades de funções relacionadas 
à ciência de dados.
  Identificar as tarefas dos papéis administrativos nos processos de 
ciência de dados.
  Definir as tarefas dos papéis técnicos nos processos de ciência de 
dados.
Introdução
Hoje as empresas disputam fatias de mercado em um cenário cada vez 
mais competitivo, no qual toda venda interessa e cada cliente importa. 
Não apenas para se diversificarem, mas também para tomarem melhores 
decisões de negócio, as empresas entenderam que precisam usar os 
dados a seu favor. Elas precisam coletar e entender os dados do passado, 
buscar correlações e respostas que predizem o futuro e, então, agir de 
forma mais garantida para a boa fluidez dos negócios.
Contudo, as empresas perceberam que podem oferecer ao cliente 
produtos e serviços que também utilizem dados, melhorando a sua 
experiência com maior possibilidade de retenção e fidelização. Para 
tanto, é necessária uma equipe de colaboradores especializados, que 
conheçam desde o processo de coleta, armazenamento e processamento 
até a geração de visualizações relacionadas a esses dados, de modo que 
seja possível extrair valor deles.
Neste capítulo, você vai estudar sobre os perfis profissionais envolvidos 
em um projeto de ciência de dados e big data. Alguns deles são mais 
voltados para o negócio da empresa e o mercado em que ela atua, já 
outros são mais direcionados a construir produtos e oferecer serviços 
orientados a dados e baseados em tecnologia, auxiliando na tomada de 
decisão e agregando valor para o negócio e para o cliente.
1 Perfis e responsabilidades de funções 
relacionadas à ciência de dados
Como destaca a Oracle (2020), a maior empresa de sistemas gerenciadores 
de banco de dados do mundo, os cientistas de dados são mais efi cazes traba-
lhando em equipes: eles nunca trabalham sozinhos. Essa afi rmação parece 
ser uma verdade absoluta para qualquer profi ssão em todo mercado, mas é 
especialmente verdadeira quando se refere a projetos de ciência de dados e 
big data. Isso se dá, em grande medida, porque esse é um assunto no qual é 
possível ser profundamente técnico em vários domínios do conhecimento e, ao 
mesmo tempo, ter de lidar com projetos com graus de complexidade diferentes. 
Uma equipe de ciência de dados e big data com maior chance de sucesso 
nos seus projetos será composta por profissionais de diferentes áreas, os quais 
somam à equipe a sua expertise e contribuem para a interdisciplinaridade dos 
projetos. Um projeto de ciência de dados e big data não é apenas um projeto 
de tecnologia da informação (TI), mas um projeto corporativo, um projeto 
de negócio em que a empresa está inserida. Ele pode ou não começar pela 
TI, mas com certeza não fica apenas nela, entregando o seu valor para as áreas 
de negócio interessadas no projeto.
Embora esse tópico seja recente e haja certa liberdade para que as empresas 
escolham os seus profissionais, dependendo muitas vezes do seu orçamento, 
naturalmente você perceberá que uma equipe de ciência de dados e big data 
será composta por profissionais de negócios e de tecnologia da informação. 
Nessas equipes, entre os vários domínios do conhecimento, geralmente 
os profissionais se dividem em dois grandes perfis ou pilares, como você vê 
na Figura 1: 
  administrativos ou de negócios; 
  técnicos ou de TI.
Papéis dos envolvidos em projetos de big data e ciência de dados2
Figura 1. Os pilares de uma equipe de ciência de dados e big data.
Obviamente, cada pilar conta com profissionais diferentes e olhares dis-
tintos. Porém, você verá que ambos são igualmente importantes para o bom 
andamento de um projeto de ciência de dados e big data. Vale ressaltar que há 
uma margem para definir como cada profissional atuará e as responsabilidades 
de cada um, mas a seguir você verá tópicos gerais do que esperar de cada 
profissional desses pilares. 
2 Tarefas dos papéis administrativos 
nos processos de ciência de dados
Em uma equipe de ciência de dados e big data, os papéis administrativos (ou 
de negócios) são aqueles mais direcionados para o negócio da empresa e o 
mercado no qual ela está inserida. Esses profi ssionais são aqueles com visão 
para produtos,serviços, riscos, oportunidades de negócio, e estão preocupados 
com a atuação da empresa, os seus negócios, projetos e processos como um todo.
3Papéis dos envolvidos em projetos de big data e ciência de dados
Usuário solicitante
O usuário solicitante é o profi ssional mais interessado no produto fi nal 
alcançado pela equipe de ciência de dados e big data: as análises, res-
postas obtidas ou até mesmo novas funcionalidades para o sistema de 
informação empresarial. Ele está na ponta, onde há perguntas importantes 
a serem respondidas sobre o negócio, e necessita de melhor embasamento 
para auxiliá-lo na tomada de decisão ou simplesmente zela pela melhoria 
contínua da sua área e do negócio como um todo.
Como o nome indica, o usuário solicitante geralmente é quem tem de-
terminada necessidade de negócio no seu cotidiano e solicita a construção 
de um projeto orientado a dados para que essa necessidade seja suprida. 
A questão de para quem essa solicitação será feita vai depender do grau 
de maturidade e entendimento que os próprios usuários têm sobre esse 
processo na empresa e o quão forte está a presença da equipe de ciência 
de dados e big data na corporação.
Em empresas nas quais os processos referentes a projetos orientados 
a dados ainda não estão totalmente definidos (ou quando a equipe de 
ciência de dados e big data ainda não está suficientemente madura ou não 
tem uma presença tão forte na empresa), essa solicitação poderá ser feita 
diretamente à equipe, e o projeto acabará se concretizando apenas com 
essas duas partes. Já em empresas em que os processos envolvendo projetos 
orientados a dados são bem-definidos (ou quando a equipe de ciência de 
dados e big data já é madura ou tem uma presença forte na empresa), essa 
solicitação em geral passa primeiramente por um analista de negócio. Esse 
profissional entenderá a solicitação de modo a otimizar o projeto e poderá 
acrescentar outros profissionais, a depender da solicitação feita e do seu 
grau de complexidade. 
Os usuários solicitantes geralmente não fazem restrições quanto às 
tecnologias empregadas, visto que o seu interesse está no produto final: 
se ele o atende e o quão confiável é para fundamentar as suas decisões 
de negócio. Contudo, esses profissionais devem zelar pela boa descrição 
e pelo detalhamento do que querem e necessitam que seja realizado, com 
clareza nas suas necessidades e objetividade naquilo que precisa ou não 
ser feito. Em resumo, são de sua responsabilidade: 
Papéis dos envolvidos em projetos de big data e ciência de dados4
  a descrição precisa da sua necessidade e de como inicialmente propõem 
supri-las;
  o acompanhamento da realização do projeto;
  a remoção dos impedimentos quanto à usabilidade do produto final;
  a validação de uso nas principais etapas que ocorrerem no decorrer 
do projeto;
  a validação de uso final e conclusão da solicitação de projeto.
Analista de negócios
O analista de negócios é o profi ssional que faz a ponte entre o usuário solicitante 
e a equipe de ciência de dados e big data, servindo como intermediário entre 
ambos. Ele em geral tem conhecimento profundo de negócios e não superfi cial 
em TI, e faz uso dos conhecimentos de ambas áreas para remover impedimentos 
e garantir que tudo o que for necessário seja produzido com a devida qualidade.
O analista de negócios está em constante processo de análise dos produtos 
e serviços oferecidos pela empresa. Ele identifica novos negócios, tendências 
e oportunidades, e pode repensar e relançar produtos já existentes ou pro-
por o lançamento de novos produtos e serviços. Nessa jornada em busca de 
oportunidades de negócio, é possível que o analista de negócios sugira criar 
ou melhorar um produto orientado a dados. Isso significa que, além da sua 
atuação, ele ainda pode se adequar ao perfil de usuário solicitante, partindo 
dele a necessidade de um produto orientado a dados. Logo, a participação do 
analista de negócios se faz muito valiosa, não só para a equipe de ciência de 
dados e big data e os seus produtos, mas para a empresa em geral.
Em empresas pequenas, pode não ser possível ter um analista de negócios 
nos projetos orientados a dados, mas a participação desse profissional pode 
ser crucial para o bom andamento e a conclusão dos projetos. Servindo como 
“cola” que une as áreas de negócios e de TI, o analista de negócios não só terá 
o papel de “traduzir” o que uma área diz para a outra, mas também de retirar 
obstáculos que possam impedir o bom andamento do projeto e de sugerir 
formas de construção, uso e validação dele. 
O analista de negócios é um profissional com grande interesse no produto 
final. Invariavelmente, os projetos enfrentarão percalços e atritos, e cabe ao 
analista de negócios o papel de mediador de conflitos, a fim de buscar sempre 
o equilíbrio entre o esforço para se criar um produto orientado a dados e o 
valor que esse produto pode agregar ao negócio.
5Papéis dos envolvidos em projetos de big data e ciência de dados
Em uma equipe de ciência de dados e big data, o analista de negócios deve: 
  dominar o negócio da empresa; 
  conhecer os produtos e serviços tanto da própria empresa quanto da 
concorrência; 
  encontrar oportunidades de negócio e sugerir produtos e serviços que 
atendam a elas; 
  ser um facilitador entre as áreas de negócios e de TI; 
  remover impedimentos e mediar conflitos; 
  zelar pelo bom andamento dos projetos.
Gerente de projetos
Veja que, até agora, não falamos sobre o escopo do projeto, a formação da 
equipe, o custo do projeto, o que é o produto fi nal e as suas etapas de entrega, 
a liderança do projeto, a defi nição dos stakeholders e executores, a documen-
tação e o registro das atividades, o cronograma, etc. Essas são algumas das 
responsabilidades do gerente de projetos.
O gerente de projetos é o profissional que garante o bom andamento do 
projeto como um todo, mas não se envolve com o teor do projeto em si ou se 
o produto final realmente tem um significado para o negócio — esses são 
pontos que são discutidos pelos usuários solicitantes e analistas de negócios. 
O gerente de projetos deve garantir que a construção de um projeto tenha um 
ciclo de vida (início, meio e fim), seja cumprido no prazo acordado, tenha 
sido executado por todos aqueles que se comprometeram no início, e que o 
feedback do usuário solicitante seja ouvido.
Perceba que as atribuições de um gerente de projetos se encaixam não 
apenas em projetos orientados a dados, mas em qualquer projeto da empresa. 
Algumas das suas responsabilidades são as seguintes:
  liderar a equipe para um objetivo em comum;
  definir o escopo do projeto;
  definir o cronograma e garantir que ele seja cumprido; 
  identificar os obstáculos e deliberar soluções;
  avaliar riscos e mitigá-los; 
  negociar conflitos entre as partes interessadas;
  documentar o projeto quanto à sua construção e fazer saber aos demais.
Papéis dos envolvidos em projetos de big data e ciência de dados6
O PMI (Project Management Institute ou instituto de gestão de projetos) é uma instituição 
sem fins lucrativos reconhecida internacionalmente, que serve como uma associação 
para profissionais de gestão de projetos. Trata-se de uma instituição respeitada que 
investiga as boas práticas da gestão de projetos. 
De tempos em tempos, essa organização lança o guia Project Management Body of 
Knowledge (PMBOK), que, em 2020, já está na sua 6ª edição, lançada em 2017. Esse 
guia traz as melhores práticas e diretrizes em gestão de projetos e discorre sobre todo 
o ciclo de vida de um projeto.
Há ainda as certificações oferecidas por esse instituto. Entre as várias possíveis, 
a mais conhecida é a que certifica o profissional como PMP (Project Management 
Professional ou profissional de gestão de projetos). Esse profissional, quando atua em 
uma empresa com uma equipe especializada e focada em gestão de projetos, lidera 
o que o instituto chama de PMO (Project Management Office ou escritório de gestãode projetos), responsável por gerir os diversos projetos da empresa.
Dependendo do tipo e da abordagem utilizada nos projetos de TI da empresa, 
pode-se ou não ter o papel do gerente de projetos. Em empresas que utilizam 
métodos ágeis para o desenvolvimento de software, como o Scrum ou XP, 
as responsabilidades de gerência do projeto podem ser distribuídas entre os 
demais integrantes da equipe.
3 Tarefas dos papéis técnicos nos processos 
de ciência de dados
Os papéis técnicos (ou de tecnologia da informação) de uma equipe de ciência 
de dados e big data são voltados, em sua maioria, para os sistemas de infor-
mação e computação, a construção e a manutenção de produtos e serviços 
ligados à tecnologia, seja para uso do cliente fi nal ou para uso interno das 
áreas de negócio. Obviamente, quanto mais conhecimento de negócio esses 
profi ssionais tiverem, melhor. Contudo, são papéis que geralmente necessitam 
de analistas de negócios e/ou de gerentes de projetos ou papéis similares para 
intermediarem os projetos, de modo a melhor entenderem as necessidades de 
negócios da empresa e concluírem os projetos com êxito e qualidade.
7Papéis dos envolvidos em projetos de big data e ciência de dados
Administrador de banco de dados
Os administradores de bancos de dados, conhecidos como DBAs (por sua 
denominação em inglês, Database Administrator), são os profi ssionais 
responsáveis por criar e manter bancos de dados. Nos primórdios da com-
putação, eles trabalhavam mais com bancos de dados SQL ou relacionais, 
mas esse papel tem sido desenvolvido por profi ssionais que trabalham 
também com bancos de dados NoSQL. Principalmente pela integridade 
de dados que ela proporciona, essa categoria de banco de dados é utilizada 
nas empresas há bastante tempo e em praticamente todas as áreas, o que 
fez com que o DBA fosse um dos profi ssionais mais requisitados pelo 
mercado de trabalho.
Os DBAs não só criam e mantêm bancos de dados SQL, mas são respon-
sáveis também pelas seguintes atividades: 
  manutenção do servidor físico do banco de dados;
  recuperação de desastres; 
  melhoria no desempenho de consultas ao banco de dados feito por 
aplicações da empresa; 
  controle de acesso aos dados; 
  criação de objetos (tabelas, funções, procedimentos, visualizações, 
etc.) no banco de dados; 
  uso dos dados da empresa para alimentar os processos de negócios.
Todos esses pontos são importantes, mas é o último citado que fez o DBA 
não ser visto somente como parte operacional de TI, mas também como parte 
estratégica de negócio. Com um profundo conhecimento de como os dados 
dos bancos de dados são criados, armazenados e utilizados, os DBAs sempre 
foram profissionais importantes para um projeto voltado a dados. Atualmente, 
são vistos como profissionais tradicionais de TI, mantendo bancos de dados 
robustos e operantes, que alimentam sistemas de informação empresariais 
operacionais e estratégicos.
Dessa forma, os DBAs somam à equipe de ciência de dados e big data não 
só a sua expertise em armazenamento e consumo dos dados, mas também o 
significado e o valor que eles têm para o negócio. Além disso, são também os 
precursores dos engenheiros de dados. Para cumprirem as suas responsabili-
dades, os DBAs geralmente trabalham com os seguintes itens: 
Papéis dos envolvidos em projetos de big data e ciência de dados8
  banco de dados SQL e NoSQL (como Oracle, SQL Server, MySQL, 
Hive, MongoDB);
  linguagem SQL e as suas extensões (como PL-SQL para Oracle, T-SQL 
para SQL Server e HSQL para o Hive);
  sistemas operacionais Linux e Windows; 
  infraestrutura de TI (servidores, redes de computadores e segurança).
Engenheiro de dados
Assim como os cientistas de dados, os engenheiros de dados são profi ssionais 
novos no mercado de trabalho. Da mesma forma, eles são profi ssionais ex-
tremamente valiosos para uma equipe orientada a dados. Os engenheiros de 
dados cuidam de todos os processos, desde a captura e o armazenamento dos 
dados — geralmente sistemas NoSQL — até a entrega para uso dos cientistas 
de dados ou até mesmo dados processados para a área de negócios.
Além disso, esses profissionais são capazes de lidar com o grande volume, 
a velocidade, a variedade, a veracidade e o valor dos dados — hoje concei-
tualmente chamados de cinco Vs do big data, como você viu anteriormente. 
São algumas responsabilidades dos engenheiros de dados:
  criar e manter sistemas de captura e armazenamento de dados sob 
demanda, em lote ou em tempo real (streaming); 
  cuidar do inventário dos dados brutos; 
  cuidar da catalogação e manter metadados de todos os dados; 
  fazer a classificação dos dados quanto ao seu teor e sensibilidade frente 
aos diversos acessos;
  fazer o versionamento e definir o ciclo de vida dos dados e o seu tempo 
de vida; 
  garantir a confiabilidade dos dados; 
  recuperar dados pertinentes ao negócio em tempo hábil.
O engenheiro de dados precisa dominar algumas tecnologias e ferramentas 
de uso recorrente em uma equipe de ciência de dados e big data. Algumas 
delas são as seguintes: 
  Hadoop (Hadoop Common, Hadoop Yarn, HDFS e Hadoop MapReduce); 
  outras tecnologias do ecossistema Hadoop (Spark, HBase, Hive, Pig, 
Flume, Sqoop, Mahout etc.);
9Papéis dos envolvidos em projetos de big data e ciência de dados
  sistemas operacionais Linux; 
  computação em nuvem (AWS, Google Cloud Platform, Microsoft Azure); 
  bancos de dados SQL (como Oracle, SQL Server e MySQL) e NoSQL 
(como MongoDB, Cassandra e Redis).
No site da AWS Amazon (maior empresa de computação em nuvem do mundo), você 
conhecerá um pouco sobre bancos de dados NoSQL. Atualmente, é a empresa de 
sistema de banco de dados com maior expansão no mercado. 
Cientista de dados
O cientista de dados é peça fundamental em um projeto orientado a dados. 
É ele que tem a missão de extrair conhecimento dos dados da empresa, 
geralmente preparados e entregues pelo engenheiro de dados, a fi m de agregar 
valor ao negócio. Estamos falando de um profi ssional multidisciplinar por 
natureza, portanto, esse profi ssional: 
  utiliza programação e outros conhecimentos de computação para ma-
nipular dados; 
  detém conhecimento matemático e estatístico para validar as análises 
feitas nos dados; 
  possui razoável expertise do negócio da empresa e do mercado onde ela 
está inserida para saber fazer as perguntas corretas e como respondê-
-las com os dados.
De acordo com Sharda, Delen e Turban (2019, p. 544): 
Cientistas de dados usam uma combinação de suas habilidades empresa-
riais e técnicas para investigar Big Data, buscando maneiras de aprimorar 
práticas atuais de análise de negócios (desde descritivas e preditivas até 
prescritivas) e, assim, melhorar as decisões para novas oportunidades 
de negócios.
O cientista de dados geralmente é uma pessoa curiosa e investigativa, que 
manipula os dados à procura de correlações e explicações para determinadas 
Papéis dos envolvidos em projetos de big data e ciência de dados10
necessidades de negócio. Ainda, deve saber reportar as suas descobertas e 
análises aos profissionais de negócio e tomadores de decisão, sabendo pontuar: 
  de onde são os dados, 
  em qual contexto aqueles dados estão inseridos; 
  quais perguntas pretendem responder; 
  quais as respostas propostas; 
  qual nível de confiança têm as suas análises e respostas. 
Um cientista de dados precisa também dominar técnicas de machine le-
arning (em português, aprendizado de máquina), pois é com esse tipo de 
técnica que se torna possível predizer acontecimentos futuros com base em 
dados do passado. Machine learning é o ato de fazer o computador aprender 
correlações em dados de forma que, quando novos dados forem apresentados, 
a máquina consiga dizer do que se trata ou até mesmo nos fazer saber quando 
determinado evento vai ocorrer no futuro — por exemplo, uma oportunidade 
de investimento na bolsa de valores ou uma possível compra de um cliente 
no seu site.
Em um projetoorientado a dados, os cientistas de dados geralmente coletam 
dados históricos de uma área da empresa (como logística ou departamento 
financeiro) e aplicam conhecimentos estatísticos e machine learning em busca 
de correlações nos dados do passado, que possam ser confiáveis a ponto de 
conseguirem predizer o futuro. Veja, então, que não se trata de saber somente o 
que aconteceu no passado e por que aconteceu, mas também o que acontecerá 
no futuro e o que se pode fazer a respeito.
O cientista de dados é responsável por: 
  coletar os dados corretos para determinado problema de negócio; 
  manipular os dados de modo a entender as suas características e 
particularidades; 
  aplicar conhecimento estatístico para encontrar correlações ou infor-
mações pertinentes ao negócio em estudo; 
  testar hipóteses provenientes dos profissionais de negócio ou aquelas 
concebidas pelo próprio profissional; 
  garantir um nível de confiabilidade nas análises feitas; 
  buscar por padrões nos dados do passado, a fim de treinar o computador 
para a predição de eventos futuros; 
  reportar as suas descobertas, conclusões e valor agregado ao negócio 
adquiridos com todo o processo. 
11Papéis dos envolvidos em projetos de big data e ciência de dados
Um cientista de dados geralmente domina:
  linguagem de programação R e/ou Python e as suas bibliotecas (Pandas, 
Numpy, Scikit-learn, Tensorflow); 
  linguagem SQL; 
  matemática e estatística descritiva e inferencial; 
  Machine learning (aprendizado supervisionado, não supervisionado 
e por reforço);
  assunto ao qual os dados se referem.
Como você viu neste capítulo, há muitos caminhos que pode seguir, em 
termos de equipes de ciência de dados e big data. Sejam mais voltados para o 
negócio ou para a tecnologia da informação, todos os papéis têm importância na 
empresa, ainda que contribuam de maneiras diferentes. Nesse sentido, é certo 
que ter uma equipe especializada no desenvolvimento de projetos orientados a 
dados é um grande diferencial, principalmente por garantir que o projeto terá 
os seus custos otimizados, atenderá à solicitação de negócio, será documentado 
e cumprido no prazo acordado. Esses fatores são fundamentais para qualquer 
empresa, por conta da alta competitividade de mercado. 
ORACLE. O que é ciência de dados? [2020]. Disponível em: https://www.oracle.com/br/
data-science/what-is-data-science.html. Acesso em: 15 abr. 2020.
SHARDA, R.; DELEN, D.; TURBAN, E. Business Intelligence e análise de dados para gestão 
do negócio. 4. ed. Porto Alegre: Bookman, 2019.
Leituras recomendadas
AWS. O que é NoSQL? 2020. Disponível em: https://aws.amazon.com/pt/nosql/. Acesso 
em: 15 abr. 2020.
LEDESMA, B. Como prever a gravidez de clientes aumenta as vendas: caso Target. [2020]. 
Disponível em: https://www.analisepreditiva.com.br/como-prever-a-gravidez-de-
-clientes-aumenta-as-vendas-caso-target/. Acesso em: 15 abr. 2020.
PROJECT MANAGEMENT INSTITUTE. [Site]. [2020]. Disponível em: https://www.pmi.
org/. Acesso em: 15 abr. 2020.
Papéis dos envolvidos em projetos de big data e ciência de dados12
Os links para sites da web fornecidos neste capítulo foram todos testados, e seu fun-
cionamento foi comprovado no momento da publicação do material. No entanto, a 
rede é extremamente dinâmica; suas páginas estão constantemente mudando de 
local e conteúdo. Assim, os editores declaram não ter qualquer responsabilidade 
sobre qualidade, precisão ou integralidade das informações referidas em tais links.
13Papéis dos envolvidos em projetos de big data e ciência de dados
Dica do professor
Ultimamente têm surgido nas empresas, principalmente no desenvolvimento de software, formas 
diferentes de se construir produtos, as chamadas metodologias ágeis. Há diversos tipos de 
metodologias ágeis em uso nas empresas (principalmente em startups), mas com certeza a mais 
famosa e com grande adesão ultimamente é o Scrum.
O Scrum tem tido grande adesão por ser relativamente fácil de entender e aplicar, por já ter 
mostrado resultados em grandes empresas pelo mundo e, não menos importante, por ser também 
muito eficiente em equipes de Ciência de Dados e Big Data.
Confira, na Dica do Professor a seguir, um pouco sobre o Scrum, sua metodologia e os papéis dos 
envolvidos.
Aponte a câmera para o código e acesse o link do conteúdo ou clique no código para acessar.
https://fast.player.liquidplatform.com/pApiv2/embed/cee29914fad5b594d8f5918df1e801fd/e3947598fc00188e25e9af9314262f34
Exercícios
1) Ultimamente, com a crescente utilização de técnicas e ferramentas de Big Data, grande 
parte das empresas estão decidindo armazenar seus dados em nuvem e mais recentemente 
em bancos de dados NoSQL. Qual profissional está apto a trabalhar e manter sistemas de 
dados com essas tecnologias?
A) Cientista de dados.
B) Administrador de banco de dados.
C) Gerente de projetos.
D) Engenheiro de dados.
E) Analista de negócios.
2) Muito do que uma companhia produz é proveniente de projetos, no desenvolvimento tanto 
de novos produtos e serviços para o cliente quanto para o próprio uso da empresa. O bom 
andamento dos projetos em uma empresa é um fator muito importante, pois a 
sistematização da má gestão em projetos pode acarretar desperdício financeiro, de recursos 
humanos e de tempo, além de afetar gravemente os negócios. Isso pode refletir em perdas 
de oportunidades, diminuição na participação no mercado ou em situações mais graves 
como a falência do negócio.
Visto que todo projeto pode ter um custo financeiro associado e invariavelmente tem uma 
duração para que seja realizado, entre os papéis estudados de uma equipe de Ciência de 
Dados e Big Data, qual profissional é responsável por esses assuntos para um bom 
andamento do projeto?
A) Analista de negócios.
B) Cientista de dados.
C) Engenheiro de dados.
D) Administrador de banco de dados.
E) Gerente de projetos.
3) Independente do cargo de um funcionário em uma empresa, há atribuições que são 
trabalhadas especialmente por ele. Isso não é diferente em equipes de Ciência de Dados e 
Big Data. Sempre conseguimos identificar uma responsabilidade que é de um profissional 
específico e de nenhum outro, tendo em vista, por exemplo, sua formação na área, 
experiência, domínio ou simplesmente vocação.
Considerando a natureza multidisciplinar dos cientistas de dados e a quantidade de 
tecnologias, métodos e assuntos que eles precisam dominar, qual opção abaixo é trabalhada 
especialmente por eles?
A) Recuperação de desastres.
B) Machine learning.
C) Ciclo de vida do projeto.
D) Banco de dados SQL.
E) Cuidar do inventário dos dados brutos.
4) Para uma equipe de Ciência de Dados e Big Data é importante que se conheça bem o 
negócio em foco e o mercado onde a empresa está inserida. Conhecer a empresa é saber o 
que é ou pode ser oferecido ao cliente no futuro, por exemplo; é conhecer o mercado e 
entender a concorrência, como cada empresa age frente aos concorrentes e o que pode ser 
feito para crescer nesse ambiente. É extremamente valioso para os técnicos da equipe de 
Ciência de Dados e Big Data ter em mãos essas informações de negócios para guiá-los no 
desenvolvimento de produtos e serviços orientados a dados. Dito isso, ter domínio do 
negócio da empresa, ser um facilitador entre o negócio e a TI e conhecer bem os produtos e 
serviços da própria empresa e da concorrência são atribuições de qual perfil?
A) Analista de negócios.
B) Cientista de dados.
C) Administrador de banco de dados.
D) Engenheiro de dados.
E) Usuário solicitante.
5) 
Muitas profissões são evoluções de outras que já existiram, seja por necessidades de 
negócio, seja por conta da própria evolução tecnológica. Dito isso, qual perfil profissional 
voltado a dados foi o precursor do engenheiro de dados?
A) Usuário solicitante.
B) Gerente de projetos.
C) Administrador de banco de dados.
D) Cientista de dados.
E) Analista de negócios.
Na prática
Quando uma ideia de negócio aparece, pode-se não saber comotestá-la e implementá-la na 
empresa. Acredita-se que essa ideia seja promissora, mas pode-se não ter o domínio necessário de 
ferramentas e métodos para que a ideia saia do papel. Naturalmente, envolvem-se outros 
profissionais e monta-se uma equipe multidisciplinar, em que cada um tem suas responsabilidades, 
mas soma-se a sua expertise ao projeto.
Acompanhe, neste Na Prática, um exemplo de caso em que uma equipe de Ciência de Dados e Big 
Data foi montada para resolver um problema de negócio.
Conteúdo interativo disponível na plataforma de ensino!
Saiba +
Para ampliar o seu conhecimento a respeito desse assunto, veja abaixo as sugestões do professor:
Business intelligence e análise de dados para gestão do negócio.
No livro a seguir, você poderá conhecer mais detalhes sobre a profissão de cientista de dados e 
outros aspectos de uma carreira de dados.
Conteúdo interativo disponível na plataforma de ensino!
10 carreiras em Big Data e Data Science
No link abaixo, veja algumas outras carreiras em dados que podem ser seguidas, entre elas 
arquiteto de soluções de Big Data, engenheiro de machine learning e desenvolvedor de visualização 
de dados.
Aponte a câmera para o código e acesse o link do conteúdo ou clique no código para acessar.
Mapa Completo das Funções em Ciência de Dados
No link abaixo, veja um resumo sobre as funções em Ciência de Dados respondendo dúvidas 
comum para quem está começando.
Aponte a câmera para o código e acesse o link do conteúdo ou clique no código para acessar.
https://blog.dsacademy.com.br/10-carreiras-em-big-data-e-data-science/
https://blog.dsacademy.com.br/mapa-completo-das-funcoes-em-ciencia-de_dados/