Buscar

Ebook Data Science Guia de Carreira (1)

Prévia do material em texto

ASOMOSTERA.COM
DATA
SCIENCE
O guia completo para 
começar na área
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
SUMÁRIO
INTRODUÇÃO 
ENTENDENDO A ÁREA 
DE DATA SCIENCE
O PAPEL DE CIENTISTAS 
DE DADOS 
PASSO A PASSO DE 
CONHECIMENTOS 
DO ZERO À VAGA 
[BÔNUS] DICAS PARA 
PROCESSOS SELETIVOS COM 
O EXPERT ALLAN DIEGUEZ
CONCLUSÃO 
02
04
14
18
33
41
02SOMOSTERA.COM
INTRODUÇÃO
Para quem está em transição de carreira para uma área 
tão vasta e recente no mercado como é a Ciência de 
Dados, o caminho para sair do zero e evoluir até uma 
vaga de emprego nem sempre está claro.
Existe um benefício claro com o acesso às informações 
pela internet: são conteúdos em blogs, cursos gratui-
tos, fóruns e grupos de discussão que favorecem uma 
imersão no universo dos dados. 
Mas é fácil se perder nesse processo de estudos ou 
acabar colocando muita energia em materiais que 
nem sempre fazem diferença para entrevistas e pro-
cessos seletivos.
É por isso que, eventualmente, preferimos e precisamos 
de um caminho bem traçado que nos “leve pela mão” 
e mostre conteúdos realmente relevantes para o 
desenvolvimento na carreira.
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://www.linkedin.com/school/somostera/
https://somostera.com/
03SOMOSTERA.COM
Essa é a proposta deste e-book. Após ler este material, 
esperamos que você:
 » se sinta confiante ao dominar os 
principais conceitos da área;
 » tenha pontos de partida seguros para 
estudar temas mais desafiadores;
 » entenda a dinâmica das vagas e 
processos seletivos do mercado;
 » saiba como se preparar para conquistar 
sua primeira vaga como cientista de dados.
Boa leitura e bom aprendizado.
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://www.linkedin.com/school/somostera/
https://somostera.com/
ENTENDENDO A 
ÁREA DE DATA SCIENCE 
05SOMOSTERA.COM
_
ENTENDENDO A ÁREA DE DATA SCIENCE
Chamamos de Data Science a área que estuda 
a coleta, o processamento, o tratamento, a aná-
lise, a modelagem e a visualização de dados. 
Geralmente, os dados passam por esses proces-
sos para serem convertidos em insights e em 
informação para gerar conhecimento e viabilizar 
a tomada de decisões nas empresas.
É uma área que envolve muitos campos inter-
conectados: negócios, matemática, estatís-
tica, programação e outros. Está associada 
a estratégias de construção de arquitetura de 
armazenamento de dados, criação de modelos e 
algoritmos para análise e geração de formas de 
visualizar e comunicar os dados de uma forma 
mais compreensível.
Os insumos principais para a Data Science são 
os dados massivos gerados em todo lugar atual-
mente. A ideia de Big Data é fundamental para 
entender isso. São dados em diversos formatos e 
tamanhos, gerados em bases massivas, estrutu-
rados ou não estruturados, com erros e/ou ruídos.
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
06SOMOSTERA.COM
_
ENTENDENDO A ÁREA DE DATA SCIENCE
Big data faz referência ao grande volume, 
variedade e velocidade de dados que 
demandam formas inovadoras e rentáveis 
de processamento da informação, para 
melhor percepção e tomada de decisão. 
 
Big Data, segundo a Gartner
Nesses dados, a pessoa responsável, chamada de 
data scientist, terá que tratar as bases, buscar 
padrões e tendências e, eventualmente, automa-
tizar a análise, caso precise. Para isso, existe uma 
série de ferramentas, padrões e linguagens que 
mencionaremos ao longo deste guia.
A área de Ciência de Dados é extremamente 
ampla e continua em constante crescimento. 
Nela, você pode se especializar em engenharia de 
dados, em visualização, em modelos de machine 
learning, em testes e otimização de algoritmos, 
entre outras funções.
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
07SOMOSTERA.COM
_
ENTENDENDO A ÁREA DE DATA SCIENCE
IMPORTÂNCIA 
NO NEGÓCIO
A carreira de cientista de dados aparece em 
primeiro lugar na lista de profissões em alta 
demanda para os próximos anos, de acordo com 
o relatório Future of Jobs, do Fórum Econômico 
Mundial. O motivo é sua relevância para os ne-
gócios e seu consequente impacto em toda a 
sociedade moderna.
Não se trata somente de analisar os dados. A área 
envolve uma análise que se volta a problemas 
reais e a responder questionamentos que estão 
sendo feitos. Desse modo, a pessoa cientista de 
dados precisa ter uma boa visão do negócio para 
saber o que priorizar e o que descartar em suas 
análises.
A Ciência de Dados pode ser uma das profissões 
mais interessantes do momento. Mas, para que 
realmente faça a diferença dentro de uma em-
presa, profissionais de dados precisam ir além da 
tecnologia, entendendo a fundo o negócio a ser 
amparado pela análise. 
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
08SOMOSTERA.COM
_
ENTENDENDO A ÁREA DE DATA SCIENCE
Alguns pontos fundamentais para diminuir o 
abismo entre Data Science e negócios:
ENTENDER PARA ATENDER
O time de Ciência de Dados precisa entender, na 
íntegra, de forma empática, as decisões-chave 
que líderes da organização estão tentando tomar. 
Só então cientistas poderão apresentar resul-
tados analíticos que vão contribuir para essas 
decisões.
CRIAR LAÇO COM OS 
OBJETIVOS-CHAVE
Para garantir que os resultados analíticos sejam 
relevantes para a empresa, é também indispen-
sável estabelecer um laço entre esses resultados 
e os principais objetivos de negócio: eficiência, 
custo, receita.
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
09SOMOSTERA.COM
_
ENTENDENDO A ÁREA DE DATA SCIENCE
VIVER E RESPIRAR O BUSINESS
Em qualquer empresa, sempre há pessoas expe-
rientes em termos de relação com clientes, de 
desenvolvimento de produto, de mercado etc. 
Data scientists devem ter proximidade com elas. 
Devem trocar constantemente e de forma ágil 
para dar transparência à evolução dos projetos 
e experimentos. E os feedbacks dessas pessoas 
vão indicar se estão no caminho certo ou não.
MEDIR OS RESULTADOS
Um time de Data Science só deve começar um 
projeto se souber o porquê de ele existir, e como 
ele ficará se for bem-sucedido. Não tem segredo: 
se você não utilizar um placar, só estará treinando, 
e não jogando.
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
10SOMOSTERA.COM
_
ENTENDENDO A ÁREA DE DATA SCIENCE
“ Para ser cientista de 
dados de verdade, você 
tem que entender que seu 
trabalho não é apenas 
sobre a pesquisa. Você 
precisa quantificar e 
qualificar o que faz de 
forma que faça sentido 
para toda a companhia.” 
GORDON RIOS, 
primeiro Data Scientist da Pandora, 
rádio online norte-americana e responsável 
pelo ambicioso Music Genome Project.
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
http://www.pandora.com/about/mgp
11SOMOSTERA.COM
_
ENTENDENDO A ÁREA DE DATA SCIENCE
DIFERENTES 
PAPÉIS NO CICLO 
DOS DADOS
É importante entender que a Ciência de Dados é 
considerada uma grande área, unindo conheci-
mentos que serão responsáveis por todo ciclo de 
dados em uma empresa.
Esse ciclo abrange desde a limpeza e modela-
gem de dados até a fase em que os dados podem 
ser visualizados e interpretados para tomada de 
decisões. Nele, entram profissionais de Engenharia 
de Dados, Data Science, Engenharia de Machine 
Learning, Análise de Dados, entre outros.
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/https://www.linkedin.com/school/somostera/
12SOMOSTERA.COM
_
ENTENDENDO A ÁREA DE DATA SCIENCE
Compreensão 
do problema 
de negócio
Abordagem 
analítica 
Modelagem
Feedback
Dados 
requisitados
Deployment
Coleta 
de dados 
Avaliação Compreensão 
dos dados 
Preparação 
dos dados 
JOHN ROLLINS 
Data Scientist, IBM Analytics, IBM
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
13SOMOSTERA.COM
_
ENTENDENDO A ÁREA DE DATA SCIENCE
ANALISTAS 
E CIENTISTAS 
DE DADOS
Um ponto que costuma ser motivo de dúvida para 
quem está entrando no mercado de Data Science 
e até mesmo para quem já vivencia a rotina na 
empresa é sobre a fronteira entre Análise e 
Ciência de Dados.
A falta de clareza acontece por esse ser um 
campo de conhecimento relativamente novo e 
em constante evolução. Assim, empresas podem 
lidar de formas diferentes com as nomenclaturas 
e responsabilidades de analistas e cientistas.
A principal diferença entre analista de dados e 
cientista de dados é que analistas terão maior 
foco em análises para respostas rápidas, geração 
de insights para decisões e até união dos dados 
com a experiência e intuição para a resolução de 
problemas.
Enquanto isso, cientistas de dados assumem 
projetos de longo prazo, desenvolvendo modelos 
para uma finalidade específica ou mesmo fazendo 
a limpeza dos dados desde os primeiros estágios.
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
O PAPEL DE 
CIENTISTAS DE DADOS
15SOMOSTERA.COM
_ 
O PAPEL DE CIENTISTAS DE DADOS
Com esse pano de fundo, podemos nos apro-
fundar melhor no papel de cientistas de dados. 
Profissionais dessa área vão mergulhar nos dados 
para, através deles, encontrar padrões e infor-
mações que sejam importantes para resolver um 
problema. 
Para atuar como cientista de dados, é necessário 
desenvolver uma bagagem ampla, que reúna 
conhecimentos de tecnologia, programação, es-
tatística, matemática e — muito importante — do 
modelo de negócio em que você está trabalhando.
Isso porque cientistas de dados têm um papel 
fundamental em alimentar com inteligência e 
informações as mais diversas áreas da empre-
sa. Muito mais do que uma área técnica, essa é 
uma carreira estratégica e de alto impacto nas 
organizações.
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
16SOMOSTERA.COM
_ 
O PAPEL DE CIENTISTAS DE DADOS
Mais algumas informações que podem te 
interessar sobre o papel de data scientists:
 
O dia a dia da profissão envolve trabalhar 
em problemas específicos por períodos 
significativos; a ciência exige método, 
paciência, experimentos e resiliência 
quando iniciativas não derem certo;
Suas funções vão depender do contexto da 
empresa em que você vai atuar e da maturidade 
de dados dela; enquanto alguns negócios já 
têm dados estruturados, outros precisam de 
profissionais para conduzir esse processo 
desde os estágios iniciais;
Você não precisa ter domínio avançado dos 
três pilares da Ciência de Dados — tecnologia, 
estatística e negócios —, mas é essencial 
ter domínio de todas essas áreas e mais 
profundidade em pelo menos uma delas;
Para entender melhor o que o mercado está 
pedindo, o ideal é observar as vagas para 
cientistas de dados de empresas com perfis 
que você considera interessantes.
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
17SOMOSTERA.COM
A Tera levantou dados interessantes sobre perfil, habi-
lidades e responsabilidades de cientistas de dados nas 
empresas brasileiras. Confira a seguir e entenda como 
se preparar para a rotina dessa carreira.
COMO SE 
DESENVOLVE 
YouTube, Cursos e 
treinamentos, livros
HABILIDADES 
TÉCNICAS 
interpretação do 
problema, modelagem 
de dados, captação 
de dados e ETL
SOFT SKILLS 
Mentalidade orientada 
a dados, resolução de 
problemas complexos, 
resiliência, criatividade
RESPONSABILIDADES 
Engajamento com 
outros stakeholders, 
coleta de dados, 
análise de dados, 
modelagem de dados
FERRAMENTAS 
Python, SQL, Git
jcomp - Freepik.com
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://www.linkedin.com/school/somostera/
https://somostera.com/
O PASSO A PASSO 
DE CONHECIMENTOS 
DO ZERO A VAGA DE 
EMPREGO 
19SOMOSTERA.COM
_ 
PASSO A PASSO DE CONHECIMENTOS DO ZERO À VAGA
Depois de conhecer mais sobre a área de Ciência 
de Dados e as diferentes possibilidades de atu-
ação nesse mercado tão aquecido, é essencial 
compreender como de fato se desenvolver com 
confiança.
Nas próximas páginas, você vai navegar por 
habilidades técnicas e comportamentais, teorias 
e ferramentas que consideramos chaves para 
destravar esse mercado e seu currículo como 
cientista de dados.
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
20SOMOSTERA.COM
_ 
PASSO A PASSO DE CONHECIMENTOS DO ZERO À VAGA
LINGUAGENS DE 
PROGRAMAÇÃO
Para entender como começar em ciência de dados, 
é preciso compreender as linguagens de progra-
mação. Na área, temos a proeminência de Python, 
por ser uma linguagem orientada a objetos, 
versátil, extremamente limpa e apresentar uma 
série de bibliotecas já implementadas. 
Além disso, outra vantagem de Python é dispor de 
um conjunto de elementos já configurados, como 
ambientes de desenvolvimento. Eles ajudam 
muito a lidar com as instalações de bibliotecas 
necessárias e a preparar a máquina para geren-
ciar os dados nas tarefas do cotidiano. Desse 
modo, você só precisa importar de forma simples 
quando precisar de alguma função. 
Como opções que você deve conhecer, citamos 
o Anaconda e as ferramentas de notebook, 
que preparam toda a estrutura para o desen-
volvimento na nuvem. É fundamental também 
dominar o github e seus controles de versiona-
mento para organizar a codificação e ter uma boa 
visão na programação em grupo. 
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
21SOMOSTERA.COM
_ 
PASSO A PASSO DE CONHECIMENTOS DO ZERO À VAGA
MODELAGEM DE 
BANCO DE DADOS
Na ciência dos dados, a modelagem de banco 
de dados, evidentemente, cumpre um papel 
muito importante. Nesse sentido, a pessoa cien-
tista deve entender muito bem o padrão SQL e 
dominar as ferramentas que implementam seus 
conceitos em Python, como os bancos de dados 
SQlite e PostGreSQL. É importante ter a capaci-
dade de desenvolver modelos para estruturar 
a relação entre os dados e implementá-los com 
uma linguagem.
Da mesma forma, é necessário aprender a ma-
nipular os dados em estruturas relacionais, de 
modo a efetuar consultas, filtragens e alterações 
nas bases. Também é interessante conhecer fer-
ramentas para dados não estruturados, como as 
tecnologias e o NoSQL. 
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
22SOMOSTERA.COM
_ 
PASSO A PASSO DE CONHECIMENTOS DO ZERO À VAGA
RESOLUÇÃO 
DE PROBLEMAS 
COMPLEXOS
A pessoa cientista de dados deverá se deparar 
com problemas complexos e reais que afetam as 
pessoas. Por isso, é importante ser analítico e sa-
ber dividir os problemas para chegar à solução de 
maneira ágil. Nesse ponto, os conhecimentos do 
negócio são úteis também.
ESTATÍSTICA 
DESCRITIVA
Outro importante campo é a estatística descriti-
va. É fundamental compreender os métodos de 
análise para descrever os dados e buscar infor-
mações imediatas acerca deles, como médias, 
medianas, tabelas de frequências e gráficos. 
Isso é fundamental, por exemplo, para comparar 
dados em bases diferentes e estabelecer uma 
visão de como cada uma delas estácaracterizada.
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
23SOMOSTERA.COM
_ 
PASSO A PASSO DE CONHECIMENTOS DO ZERO À VAGA
Além disso, a probabilidade e as distribuições aju-
dam a compreender e embasar outros conceitos 
relevantes, principalmente na modelagem estatís-
tica. São conceitos que devem estar solidificados 
na mente da pessoa que trabalha com dados. 
ANÁLISE 
EXPLORATÓRIA 
DE DADOS
É mandatório também conhecer os métodos para 
uma boa análise exploratória em uma base de 
dados. Nesse sentido, a pessoa profissional pre-
cisa saber como encontrar padrões e tendências 
nos dados, a partir de manipulações de funções 
e recursos já existentes em bibliotecas como o 
Pandas e Matplotlib. 
Inclusive, essa parte ajuda na criação de hipóte-
ses que podem ser confirmadas ou negadas pos-
teriormente. É uma forma de estudar as bases 
com a ajuda de elementos visuais como os grá-
ficos e outros métodos de visualização de dados. 
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
24SOMOSTERA.COM
_ 
PASSO A PASSO DE CONHECIMENTOS DO ZERO À VAGA
MODELAGEM 
ESTATÍSTICA
A modelagem estatística é outra parte integral do 
currículo de quem lida com dados. É necessário 
entender como coletá-los e transformá-los para 
atender a um modelo, com técnicas de inteligên-
cia artificial e aprendizado de máquina. 
Um modelo estatístico é uma representação 
da realidade na qual definimos a relação entre 
variáveis para entender e prever o comportamen-
to de um fenômeno. Estabelecemos quais serão 
as variáveis independentes e qual será a variável 
dependente; a partir dos elementos independen-
tes, tentamos prever um valor para o elemento 
dependente.
Com isso, os modelos ajudam as pessoas cien-
tistas de dados a preverem um resultado para o 
problema em análise. Uma pessoa cientista de 
dados precisa considerar esses fatores, pois terá 
que lidar com cenários complexos em que os 
modelos têm que estar preparados para novos 
dados e mudanças nas características analisadas. 
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
25SOMOSTERA.COM
_ 
PASSO A PASSO DE CONHECIMENTOS DO ZERO À VAGA
MODELOS DE 
APRENDIZADO 
SUPERVISIONADO
Outro assunto que faz parte do currículo é o 
aprendizado de máquina supervisionado. O dia a 
dia da pessoa cientista de dados envolverá pro-
blemas dessa natureza, em que é preciso buscar 
a melhor maneira de dividir as bases de dados 
entre treinamento e teste, bem como selecionar 
o melhor algoritmo. Existem várias opções nesse 
campo, como as famosas árvores de decisão, o 
naive-bayes, o SVM e as redes neurais.
Toda a área do Deep Learning supervisionado 
entra nessa categoria, aliás. É necessário domi-
nar a noção de extração de características que as 
redes neurais ajudam a automatizar, bem como 
entender como usar camadas emprestadas de 
modelos já treinados para o caso de problemas 
muito complexos, como análise e reconheci-
mento de imagens.
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
26SOMOSTERA.COM
_ 
PASSO A PASSO DE CONHECIMENTOS DO ZERO À VAGA
MODELOS DE 
APRENDIZADO NÃO 
SUPERVISIONADO
Em complemento aos modelos supervisionados, 
temos os modelos não supervisionados. São 
exemplos: algoritmos como as regras de associa-
ção, as técnicas de agrupamento e as técnicas 
utilizadas para sistemas de recomendação, como 
filtragem colaborativa e outros. 
Nesse sentido, é preciso compreender bem a 
diferença entre os dois tipos de aprendizado 
para saber quais problemas se encaixam me-
lhor em cada um. Uma visão analítica também 
ajuda na hora de filtrar as conclusões que o algo-
ritmo fornece, de modo a eliminar alguns ruídos 
e informações não relevantes e gerar uma visão 
mais precisa para aquele negócio. 
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
27SOMOSTERA.COM
_ 
PASSO A PASSO DE CONHECIMENTOS DO ZERO À VAGA
TÉCNICAS DE 
MACHINE LEARNING 
COM EFEITO 
TEMPORAL
Outro importante fator a considerar na carreira é 
o aprendizado de técnicas de machine learning 
(ML) para analisar um efeito temporal. Ou seja, é 
preciso analisar os dados com a compreensão de 
como eles mudam ao longo do tempo, bem como 
buscar a identificação de possíveis padrões nes-
sas variações. 
Um exemplo disso são as séries temporais, um 
importante conceito da estatística. Elas ajudam 
a entender eventos que ocorrem ao longo de um 
período, de forma sequencial, como o número de 
vendas em uma loja em um ano. Assim, é possível 
estudar o comportamento dos dados nesse mo-
mento histórico.
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
28SOMOSTERA.COM
_ 
PASSO A PASSO DE CONHECIMENTOS DO ZERO À VAGA
COMPREENSÃO 
DE ÉTICA 
Além de conhecer e dominar as dimensões mate-
máticas, estatísticas e computacionais, a pessoa 
cientista de dados também precisa de uma com-
preensão ética acerca de sua profissão e das 
implicações dela para a sociedade. 
Afinal, os sistemas criados por esses profissio-
nais não existem sozinhos, eles existem em um 
contexto, em uma organização/uma sociedade e 
geram impacto na vida de pessoas em todos os 
âmbitos.
Nesse sentido, o ideal é aprofundar a considera-
ção da tecnologia em serviço da sociedade, para o 
bem de todos, e não somente como um mero pro-
duto para um fim. É importante entender a rela-
ção entre os sistemas e as pessoas e saber como 
lidar com as particularidades do ser humano.
Um exemplo prático disso é a discussão acerca 
de dados e privacidade no mundo contemporâ-
neo. As pessoas geram muitos dados que são 
úteis para empresas e cientistas de dados em 
suas aplicações.
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
29SOMOSTERA.COM
_ 
PASSO A PASSO DE CONHECIMENTOS DO ZERO À VAGA
Contudo, muitos desses dados carregam aspec-
tos da dignidade e dos direitos básicos dos seres 
humanos. Nesse sentido, o tratamento dos dados 
deve respeitar essa questão e estar alinhado a 
esses princípios morais e éticos.
EVOLUÇÃO DAS 
SOLUÇÕES DE DADOS 
COM MLOPS
No processo de Data Science, existe a parte que 
cuida do deploy de algoritmos de ML para uti-
lização em outras aplicações, a engenharia de 
machine learning. Nesse sentido, o MLOps é 
uma tecnologia importante, pois automatiza não 
somente o fluxo de deploy e testes, como tam-
bém o treinamento e a preparação dos dados que 
ocorre depois.
A pessoa que decide trabalhar com ciência de 
dados entende no seu dia a dia que os modelos 
perdem qualidade assim que terminam de ser de-
senvolvidos. Novas características surgem e 
influenciam o que chamamos de degradação 
do modelo. Para melhorar continuamente e ga-
rantir os melhores resultados com os testes e o 
treinamento, é preciso usar as técnicas de MLOps.
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
30SOMOSTERA.COM
_ 
PASSO A PASSO DE CONHECIMENTOS DO ZERO À VAGA
DATA 
STORYTELLING
A comunicação é outro aspecto-chave do tra-
balho da pessoa que gerencia dados. Afinal, não 
é só tratamento de dados e modelagens: o dia a 
dia envolve comunicar os insights encontrados 
de modo que eles gerem influência e cooperem 
com as decisões tomadas. Ou seja, é necessário 
traduzir uma linguagem de dados técnicos e 
variáveis estatísticas de desempenho para 
uma linguagem de negócios.
Para isso, temos o Data Storytelling. São técnicas 
e boas práticas que ajudam a transformar estatís-
ticas, gráficose relatórios complexos em histórias 
interessantes de entender e de acompanhar. O 
objetivo é ser o mais democrático possível ao es-
palhar o conhecimento para que todos consigam 
compreender, de maneira clara e precisa. 
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
31SOMOSTERA.COM
_ 
PASSO A PASSO DE CONHECIMENTOS DO ZERO À VAGA
CONSTRUÇÃO 
DE INTERFACES
Aliás, outro momento essencial para a finalização 
do processo de Data Science é a construção de 
interfaces e aplicações que contêm os modelos. 
Em algumas organizações, esse processo é feito 
por desenvolvedores front-end, mas em outros 
casos, a pessoa cientista de dados mesmo ficará 
encarregada disso. Ou seja: é bom ter essa habili-
dade também para se destacar no mercado.
Estamos falando do uso de ferramentas, como o 
streamlit do Python, que ajudam a construir de 
forma prática uma aplicação web para abrigar um 
modelo e facilitar o uso por pessoas não técnicas. 
Também envolve a conexão com dashboards para 
comunicação dos resultados de forma automáti-
ca para decisores, por exemplo.
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
32SOMOSTERA.COM
_ 
PASSO A PASSO DE CONHECIMENTOS DO ZERO À VAGA
CRIAÇÃO DE 
PORTFÓLIO E 
PREPARAÇÃO PARA 
ENTREVISTAS
A pessoa na carreira de ciência de dados preci-
sa saber se portar como profissional. Isso inclui a 
criação e organização de um portfólio com pro-
jetos pessoais e feitos incríveis que possam ser 
mostrados em uma entrevista. Envolve também a 
própria postura na entrevista, como uma boa ca-
pacidade de comunicação e de entendimento 
dos aspectos que vão além do conhecimento 
técnico.
Ou seja, se a pessoa já sabe traduzir números em 
negócio na entrevista, esse é um bom indício de 
que conseguirá transmitir bem os resultados e 
realmente ajudar a empresa a crescer. Os entre-
vistadores vão gostar muito disso.
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
[BÔNUS]
DICAS PARA PROCESSOS 
SELETIVOS COM O 
EXPERT ALLAN DIEGUEZ 
DO LUIZALABS
ALLAN DIEGUEZ
Head do Chapter 
de Data Science 
LuizaLabs
Expert do curso de 
Data Science e Machine 
Learning da Tera
https://www.linkedin.com/in/allan-dieguez/
https://www.linkedin.com/in/allan-dieguez/
34SOMOSTERA.COM
_ 
[BÔNUS] DICAS PARA PROCESSOS SELETIVOS COM O EXPERT ALLAN DIEGUEZ
Para ganhar mais confiança durante uma tran-
sição de carreira, nada melhor do que receber 
dicas estratégicas de especialistas na área. Por 
isso, trouxemos algumas dicas do expert Allan 
Dieguez, Head do Chapter de Data Science do 
Luizalabs. Elas vão ajudar você a compreender as 
fases da seleção de cientistas de dados e como 
você pode se destacar.
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
35SOMOSTERA.COM
_ 
[BÔNUS] DICAS PARA PROCESSOS SELETIVOS COM O EXPERT ALLAN DIEGUEZ
PREPARE SEU 
CURRÍCULO PARA 
A TRIAGEM 
O primeiro passo da candidatura para uma vaga 
de data scientist é o envio do currículo para ava-
liação. O expert Allan Dieguez explica que, nesse 
momento, recrutadores olham se a pessoa real-
mente tem as habilidades de cientista de dados e 
quais são os objetivos declarados no seu resumo 
profissional. Se a pessoa nunca trabalhou na área, 
não pode ser contratada para nível pleno, por 
exemplo.
Seu currículo precisa deixar claro que você tem as 
skills necessárias para atuar em Ciência de Dados. 
Habilidades em Python, Machine Learning, SQL, 
Análise de Dados e Estatística são fundamen-
tais, assim como projetos relevantes em Data 
Science. 
Estude sua 
candidatura.
Entenda mais sobre 
a empresa: qual 
o core business e 
nível de maturidade 
data driven em que 
ela se encontra.
Entenda seus 
pontos fortes 
e fracos e sua 
senioridade em 
relação à vaga.
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
36SOMOSTERA.COM
_ 
[BÔNUS] DICAS PARA PROCESSOS SELETIVOS COM O EXPERT ALLAN DIEGUEZ
MOSTRE 
ALINHAMENTO NA 
ENTREVISTA DE FIT 
CULTURAL
Para ter um bom desempenho nessa fase, Allan 
Dieguez aponta que é necessário mostrar inte-
resse no modelo de negócio da empresa, aplicar 
seus conhecimentos técnicos ao contexto da 
empresa e se comunicar com habilidade.
“É importante mostrar que você 
consegue conversar com diferentes tipos 
de pessoas de forma simples e direta. 
Eu quero um cientista de dados que 
fale em português. Eu preciso que eles 
sejam humanos. Você precisa traduzir 
algo extremamente complexo e colocar 
de forma simples o suficiente para que 
qualquer pessoa entenda.”
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
37SOMOSTERA.COM
_ 
[BÔNUS] DICAS PARA PROCESSOS SELETIVOS COM O EXPERT ALLAN DIEGUEZ
 » Escolha um projeto com aprendizados;
 » Explique de forma sucinta, caprichando 
no storytelling;
 » Use o método STAR (Situação, Tarefa, 
Ação, Resultado) como guia;
 » Atenção às perguntas do time.
SAIBA SE 
COMUNICAR NA 
ENTREVISTA TÉCNICA
A entrevista técnica também tem como meta ob-
servar como cada pessoa se comunica e explica 
seus conhecimentos. É preciso saber se expressar 
bem e controlar o nervosismo.
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
38SOMOSTERA.COM
_ 
[BÔNUS] DICAS PARA PROCESSOS SELETIVOS COM O EXPERT ALLAN DIEGUEZ
“Eu quero saber o quanto a pessoa sabe 
tecnicamente e o quanto ela se comunica 
bem. Em uma entrevista técnica, 
não é sobre se você saber fazer tudo 
tecnicamente. É eu te colocar em um 
ambiente controlado para se comunicar 
com estranhos de conhecimento elevado 
na área e ver se você não trava sob esse 
tipo de pressão.” 
 » Tente entender a pergunta antes 
de responder;
 » Raciocine em voz alta, deixe seu 
raciocínio ser percebido;
 » Escreva, desenhe, rabisque;
 » Mais de uma solução é bom, se pelo 
menos uma funciona.
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
39SOMOSTERA.COM
_ 
[BÔNUS] DICAS PARA PROCESSOS SELETIVOS COM O EXPERT ALLAN DIEGUEZ
MOSTRE COMO 
TRABALHA NO 
DESAFIO TÉCNICO
Se você passar pelas primeiras etapas, já está 
muito perto da sua vaga de cientista de dados. A 
última fase do processo seletivo é o desafio téc-
nico: um case proposto pela empresa, que precisa 
ser resolvido por você ao longo de alguns dias, e 
apresentado para o time em seguida.
Allan Dieguez ressalta que, além de avaliar o nível 
técnico de quem está pleiteando a vaga de data 
scientist, a etapa de case também quer enten-
der melhor como a pessoa se comunica e explica 
seus raciocínios por trás do trabalho realizado. É 
uma simulação do dia a dia do negócio.
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
40SOMOSTERA.COM
_ 
[BÔNUS] DICAS PARA PROCESSOS SELETIVOS COM O EXPERT ALLAN DIEGUEZ
 » Crie hipóteses iniciais sobre o problema 
para validar durante a solução;
 » Versione o projeto em uma estrutura que 
facilite a reprodução;
 » Registre seus insights e descobertas 
em um relatório;
 » Use ao máximo o storytelling para descrever 
a solução e suas descobertas.
O mercado de Data Science está em constante 
evolução e cheio de boas oportunidades, por isso, 
garanta que você tem os conhecimentos e ferra-
mentas necessários para conquistar seu espaço.
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
41SOMOSTERA.COMCONCLUSÃO
As centenas de vagas para cientistas de dados em 
aberto nos sites de recrutamento deixam claro que ain-
da existe uma lacuna a ser preenchida nesse mercado. 
Faltam profissionais com a preparação necessária para 
pleitear as oportunidades.
Em uma sociedade em que dados estão no centro das 
decisões, das tecnologias inovadoras e das transfor-
mações positivas, precisamos que mais pessoas sejam 
encorajadas e guiadas para ocupar esses espaços de 
forma igualitária e representativa.
Esperamos que este e-book seja uma das ferramentas 
para atingir este objetivo e que você consiga usá-lo de 
forma estratégica na sua evolução em Ciência de Dados.
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://www.linkedin.com/school/somostera/
https://somostera.com/
42SOMOSTERA.COM
Seja estudando de forma independente ou fazendo um 
curso completo que te ajude a adquirir todas as habili-
dades, agora você tem uma visão mais clara sobre essa 
área e sobre o que o mercado está buscando.
Você pode contar com a Tera em sua jornada de de-
senvolvimento. Nosso novo curso de Data Science 
e Machine Learning tem a proposta de levar você do 
zero até a conquista da sua vaga. Com cerca de 500 
horas de conteúdo, interações ao vivo com experts, 
mentorias sobre carreira e empregabilidade e projetos 
práticos assinados por grandes empresas, você poderá 
dar passos confiantes nessa carreira promissora.
CONHEÇA O CURSO DE DATA SCIENCE
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://www.linkedin.com/school/somostera/
https://somostera.com/
https://somostera.com/cursos/data-science-machine-learning?utm_campaign=Guias-de-carreira-ebooks&utm_source=ebook-dsc&utm_content=botao-conheca-curso-ebook-dsc
SOBRE A TERA
Somos mais do que uma escola, somos uma comunida-
de de pessoas apaixonadas por educação e tecnologia.
Acreditamos que um mundo melhor nasce do trabalho 
de pessoas conscientes, responsáveis e corajosas que 
se apropriam da tecnologia para servir ao coletivo.
EQUIPE EDITORIAL
Redação 
Rebeca Nascimento e Gabriel Sacramento 
Direção de arte 
Tatiane Rocha 
Diagramação 
Leear Martiniano 
Apoio de conteúdo 
Ana Paula Lafuente, Victor Morganti e Allan Dieguez
45SOMOSTERA.COM
SOMOSTERA.COM
https://pt-br.facebook.com/somostera/
https://www.instagram.com/somostera
https://somostera.com/
https://www.linkedin.com/school/somostera/
https://somostera.com/
	introdução

Continue navegando