Deep Learning

•

Ce Balao Magico

Marco Legiere

31/05/2018

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 20 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 20 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 20 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Deep Learning
Conjunto de técnicas de Aprendizado de Máquina que tem revolucionado diversas áreas
do conhecimento.

Sumário
Deep Learning ....................................................................................................................... 1
Machine Learning .................................................................................................................. 1
Supervisionada .............................................................................................................. 2
Semi-supervisionada ...................................................................................................... 2
Não supervisionada ....................................................................................................... 2
k-Nearest Neighbors ...................................................................................................... 3
Regressão Linear ............................................................................................................ 4
Regressão Logística ........................................................................................................ 4
Support Vector Machines (SVMs) ................................................................................... 5
Árvores de decisão e Random Forests ............................................................................ 6
Redes Neurais Artificiais ................................................................................................ 7
Redes Neurais Recorrentes .......................................................................................... 10
Aplicações de deep learning no mercado ............................................................................. 12
Como deep learning funciona? ......................................................................................... 12
Gerar sons para filmes mudos ...................................................................................... 12
Aumentar a resolução de imagens ............................................................................... 13
Dar cor a imagens em preto e branco ........................................................................... 13
Replicar o estilo de um artista plástico em qualquer imagem ....................................... 13
Gerar textos automáticos ............................................................................................. 13
Elaborar legendas descritivas para imagens ................................................................. 14
Dirigir carros automatizados ........................................................................................ 14
Fazer diagnósticos médicos .......................................................................................... 14
Vantagens e Desvantagens .................................................................................................. 15
Vantagens do Machine Learning e o Deep Learning para empresas .................................. 15
Machine Learning ........................................................................................................ 15
Seguindo pelas desvantagens do aprendizado da máquina .............................................. 17
Conclusão ........................................................................................................................ 18
Referência ........................................................................................................................... 18
Bibliografia .......................................................................................................................... 18
1
Deep Learning

Para entendermos o que é Deep Learning, precisamos remontar a uma das tendências tecnológicas do
momento: o aprendizado de máquina, ou aprendizado automático, do inglês Machine Learning (ML).
Ela diz respeito ao fato de os computadores e dispositivos conectados desempenharem suas funções
sem que pareçam programados e, mais propriamente, que “aprendam” conforme são utilizados.

Falando de uma forma bem simples de entender, Deep Learning (aprendizagem profunda, em
português) é um tema emergente dentro do campo da Inteligência Artificial. Uma subcategoria de
aprendizado de máquina que diz respeito a oportunidades de aprendizagem profundas com o uso de
redes neurais para melhorar as coisas, tais como reconhecimento de fala, visão computacional e
processamento de linguagem natural. Isso está rapidamente se tornando um dos mais estudados e
procurados campos dentro da ciência da computação moderna.

O Deep Learning é a tecnologia base para ferramentas como o Google Translate (Google Tradutor) e o
Cortana (assistente personalizado da Microsoft), por exemplo.

Em suma, com enorme quantidade de poder computacional, as máquinas podem agora reconhecer
objetos e traduzir voz em tempo real. O Deep Learining, portanto, torna finalmente a inteligência
artificial de fato inteligente e aplicável.

Agora vamos falar sobre o Machine Learning

Machine Learning

O Machine Learning e seus principais algoritmos de aprendizagem supervisionada

O Machine Learning (Aprendizado de Máquina) é um dos assuntos mais quentes do momento e, por
tal motivo, é quase certo que você já tenha ouvido falar neste termo. Convenhamos, não é por acaso.
Peixes grandes como a Microsoft, Google, Facebook, IBM, Oracle e Nvidia têm apostado alto nesta
seara, investindo quantias generosas em P&D com o objetivo de proporcionar cada vez mais inovação
e inteligência para seus principais produtos, os quais nós costumamos utilizar diariamente e que
agilizam as nossas tarefas (no caso do Microsoft Word, Google Tradutor, Google Search). Além destes,
há também várias outras empresas abraçando esta nova realidade, sendo que Embratel, Itaú e Danone
estão entre elas.
2
O Machine Learning veio para ficar e está revolucionando mercados, tendo impulsionado muitos
negócios ao permitir o desenvolvimento de produtos muito mais inteligentes e competitivos. Diante
de tudo o que você já viu na internet até agora sobre este assunto, em algum momento já deve ter se
perguntado sobre o que exatamente seria o Machine Learning e em quais princípios, ou algoritmos,
isto se fundamenta. Vejamos.

De um modo geral, o ML é uma junção de matemática (álgebra linear, cálculo integral e derivadas,
estatística, teoria da probabilidade, etc), software e dados (estruturados ou semi-estruturados). Esta
combinação permite que as máquinas "aprendam" e desempenhem tarefas específicas sem serem
explicitamente programadas para isto. Portanto, não estamos falando daquela abordagem
determinística tradicional, normalmente baseada em regras, onde a máquina segue um "roteiro" que
orienta todos os passos a serem seguidos sem a devida capacidade para lidar com imprevistos. O ML,
pelo contrário, atua em um ambiente onde a incerteza é um conceito chave.

Ao ser exposto a uma certa quantidade de dados (dados de treino), o algoritmo de ML consegue
identificar padrões e aprender com eles, gerando modelos capazes de obter generalizações (predição)
em dados completamente novos. Atualmente, as três formas de aprendizado de máquina mais
utilizadas são:
Supervisionada - normalmente usado em tarefas de classificação, onde os dados de treino são
totalmente rotulados (a saída desejada é conhecida) e orientam o aprendizado da máquina. É como se
um professor estivesse presente o tempo inteiro durante a fase de aprendizado. É o método de
aprendizagem mais utilizado hoje em dia;
Semi-supervisionada - apenas parte dos dados possui rótulos e o restante não possui umasaída
conhecida. Neste caso, o algoritmo baseia-se nos dados rotulados para formar agrupamentos daqueles
que não foram rotulados, normalmente agrupando aquelas informações que possuem alguma
similaridade entre elas;
Não supervisionada - frequentemente utiliza-se este método de aprendizado em análises
exploratórias, onde o algoritmo não conhece a saída dos dados e precisa identificar estruturas,
regularidades e relacionamentos nos dados para, então, apresentar uma saída.
A aprendizagem supervisionada é, de longe, a mais comum, onde a relação entre a entrada e a saída
(f(x) = y) dos dados de treino já é conhecida e o algoritmo não precisa tentar encontrar esta relação
sozinho.

Para que a aprendizagem supervisionada possa gerar modelos capazes de fazer boas predições, é
preciso tomar alguns cuidados, tais como ter dados representativos no domínio da tarefa e escolher o
algoritmo mais adequado para cada situação. Para que isto seja possível, é necessário que você
conheça estes algoritmos e saiba quando usar cada um deles (ou quando não usar). Mas, que
algoritmos são esses? Já é o momento de apresentá-los:

k-N earest Neighbors

Frequentemente aplicado em reconhecimento de padrões e mineração de dados, este é um dos mais
básicos no leque de ferramentas de um Engenheiro de Machine Learning. O k-Nearest-Neighbor (K
vizinhos mais próximos) é muito adotado em problemas de classificação e regressão. Ele recebe apenas
um parâmetro, que é o número de vizinhos k (um número inteiro e positivo). Sendo um dos algoritmos
mais simples, a construção do modelo limita-se ao armazenamento do conjunto de dados de treino. A
predição em cima de novos dados é feita quando o KNN consegue encontrar os pontos de dados mais
próximos a estes no conjunto de dados de exemplo.

Na ilustração acima, os pontos em formato circular representam os dados de exemplo (ou de treino),
ao passo em que os pontos em formato de x representam dados ainda não "vistos" pelo modelo. Dado
um k inteiro positivo e uma observação x (como mostrado na figura), o classificador KNN primeiro
identifica os k pontos no conjunto de treino que são mais próximos de x (na figura, k=1). Em seguida,
o modelo estima a probabilidade condicional para uma classe j com base na fração dos pontos de
dados de treino cujos valores de classe (o y da função) são iguais a j. Para compor a saída, o modelo
aplica a regra de Bayes e classifica a observação de teste x com a classe que possuir a maior
probabilidade de ser a correta (considerando as classes dos pontos na vizinhança). Trazendo isto para
dentro de um contexto mais matemático, o KNN funciona assim:

Regressão Linear

A regressão linear é uma outra abordagem que está entre as mais simples. Foi desenvolvida no campo
da estatística e é tratada como um modelo útil para entender o relacionamento entre valores
numéricos de entrada e saída. O ML a "tomou emprestado" e, assim, a regressão linear se tornou uma
das ferramentas mais úteis neste campo. Torna-se uma abordagem útil sempre que se deseja estimar
uma resposta quantitativa, como o valor de um imóvel, em face de determinadas variáveis de entrada,
tais como a quantidade de cômodos, latitude/longitude, renda per capita das pessoas, etc. Trata-se de
um método largamente utilizado e é importante que você tenha um bom entendimento em torno dos
princípios da regressão linear, antes de partir para metodologias de aprendizado mais complexas, as
quais costumam ser vistas como generalizações ou extensões da mesma.

Resumidamente, o objetivo é estimar uma variável quantitativa Y com base em preditor(res) X e
assume-se que haja um relacionamento linear entre X e Y. Matematicamente, nós podemos descrever
a regressão linear assim:

Bo e B1 são coeficientes (também chamados de parâmetros) cujos valores não se conhece e serão
estimados com base nos dados de treino.

Uma vez obtidos os valores aproximados destes parâmetros, seria possível, por exemplo, estimar um
valor em vendas (Y) com base no quanto se está investindo em anúncios de Facebook (X). Isto ajuda a
responder perguntas como: Qual plataforma de anúncios contribui mais para as vendas (qual variável
de entrada afeta mais o valor da saída)? Evidentemente que se trata de uma estimativa a ser feita com
base em um modelo gerado a partir de dados históricos (de treino) representativos.

Regressão Logística

A regressão logística é a análise de regressão utilizada quando a variável dependente é categórica,
normalmente assumindo valores binários (como 0 ou 1). Ao ser utilizada em problemas de
classificação, ela determina a probabilidade de ocorrência de uma classe específica com base nos
valores das variáveis de entrada. Similar à regressão linear, a regressão logística torna-se um pouco
diferente basicamente pelo uso da função que dá o nome a esta modelagem: função logística.

Considerando que o interesse aqui é obter a probabilidade de ocorrência de um determinado evento
(classe), dadas as variáveis de entrada, os valores de saída deverão, assim, está contidos no intervalo
5
[0,1]. Desta forma, para qualquer variável de entrada X, a função logística garantirá que a saída seja
um valor compreendido entre 0 e 1.

A função logística é representada pela seguinte curva:

Support Vector Machines (SVMs)

O SVM (Máquina de Vetores de Suporte) é um classificador que toma como entrada um conjunto de
observações e estima, para cada valor dado, a classe à qual pertence este valor. O algoritmo consegue
obter um hiperplano capaz de separar os dados em classes distintas. Pode ser usado tanto para
classificar dados que sejam linearmente separáveis quanto aqueles que não são linearmente
separáveis por um hiperplano. O SVM é essencialmente um classificador binário e linear, mas pode ser
estendido para classificar dados em mais de duas classes e que não possam ser separados linearmente.
Para isto, o SVM conta com uma técnica chamada Kernel Methods, a qual constitui-se numa ponte
entre a linearidade e a não-linearidade. Um kernel é uma função que quantifica a similaridade entre
duas observações. Exemplo de um kernel não linear, quando d > 1:

A equação acima é conhecida como kernel polinomial de grau d, onde d é um número inteiro e positivo.
Se d = 1, a equação torna-se linear. O kernel polinomial leva à presença de linhas curvadas no espaço
de entradas:

Perceba que neste caso o ajuste da linha ao lados ocorre de uma maneira muito mais flexível (lado
esquerdo).

Árvores de decisão e Random Forests

As árvores de decisão estão entre os modelos de ML mais populares. Apenas para citar um exemplo,
o sensor de movimentos do Kinect (o famoso acessório do console Xbox, da Microsoft), utiliza um
modelo classificador baseado em árvores de decisão. Trata-se de um conjunto de modelos em árvore
chamado Random Forests. Lembre-se deste detalhe quanto estiver jogando Just Dance no Xbox One
;-).

7
Os modelos em árvore são relativamente fáceis de interpretar e de treinar, podendo ser aplicados em
uma larga variedade de tarefas. Entre estas tarefas estão: classificação, estimativa de probabilidade,
regressão e clustering.

No contexto destes modelos em árvore, o Random Forests é um dos mais populares. Trata-se de um
conjunto de múltiplas árvores de decisão que subdivide o espaço de entrada em regiões menores.
Quando usado em tarefas de classificação, por exemplo, o random forest toma a estimativa (o voto)
de cada árvore do conjunto para obter a classificação combase na maioria dos votos. A figura abaixo
ilustra bem o funcionamento deste algoritmo.

Da próxima vez em que você ouvir alguém falar a frase "várias cabeças pensam melhor do que uma",
lembre de que o Random Forest baseia-se exatamente neste princípio.

Redes Neurais Artificiais

As redes neurais artificiais são algoritmos de Machine Learning que se baseiam no funcionamento do
cérebro biológico e suas conexões sinápticas. Aliás, é por conta delas que cunhou-se o termo deep
learning (aprendizagem profunda), o qual envolve o uso de redes neurais com várias camadas. Por
muitos anos, o uso de RNAs se manteve inviável, dado que sempre exigiram tempo e capacidade
computacional consideráveis. Mas este panorama mudou a partir do momento em que a computação
paralela ganhou um novo impulso, graças ao surgimento de GPUs (Unidades de Processamento
Gráfico) cada vez mais poderosas, ao mesmo tempo em que o custo de aquisição destes hardwares se
tornou bem mais acessível. De fato, o poder de processamento paralelo oferecido pelas GPUs melhora
significativamente a performance de treino de uma rede neural. Por tal motivo, estes dispositivos se
tornaram essenciais para os processos de criação de inteligências artificiais e para o deep learning.
8
Atualmente já existem serviços de Cloud Computing com GPUs dedicadas e especialmente
dimensionados para tarefas de aprendizagem profunda, como o GPU Cloud Computing, da Nvidia, e o
Amazon EC2 Elastic GPUs.

As RNA's tornam-se bastante úteis a partir do momento em que passa a ser difícil resolver problemas
com as abordagens mais tradicionais de aprendizado de máquina. Elas podem ser empregadas em
tarefas como:

• Classificação (Ex: imagens e textos)
• Reconhecimento de padrões
• Tarefas de predição
• Análise de séries temporais
• Processamento de sinais

Uma RNA é composta por neurônios artificiais interligados e organizados em camadas. Cada neurônio
artificial é representado por uma função matemática que computa os pesos sinápticos (parâmetros)
da rede. O ajuste destes parâmetros é feito automaticamente e em diversas iterações e determina o
aprendizado da rede.

A figura acima ilustra um modelo de neurônio artificial chamado Perceptron (lado direito), que é a
base para as redes neurais multicamadas, comparando-o com um neurônio biológico (lado esquerdo).
Os dendritos, que correspondem aos dados de entrada {x1, x2, …, xm}, também chamados de features,
estão associados ao neurônio artificial por meio dos pesos sinápticos {w1, w2, …, wm}. Opcionalmente,
um neurônio Perceptron pode ter uma entrada extra como sendo uma constante chamada bias, cujo
valor (também chamado de valor de ativação) é sempre 1 e cujo peso associado é denotado por w0.
O núcleo do corpo celular é representado por uma função somatória que combina as entradas do
neurônio (eu prefiro chamar de combinador linear). Uma função de ativação, por sua vez, é aplicada
ao resultado do somatório, gerando um valor de saída no axônio. A ideia central é extrair combinações
lineares das entradas e, então, modelar a saída como uma função não linear. Para isto, costuma-se
utilizar uma função de ativação não-linear, como a sigmóide, por exemplo. De fato, esta é uma das
funções de ativação mais utilizadas - o nome "sigmóide" vem da forma em "S" do seu gráfico.
9

É possível observar que a sigmóide possui um balanceamento entre um comportamento linear e não-
linear, promovendo uma mudança gradual entre 0 e 1. Isto nos permite criar um algoritmo de
aprendizado que se adapta aos poucos, reduzindo progressivamente os erros produzidos nas saídas
dos neurônios artificiais.

De um modo geral, uma RNA multicamadas é o agrupamento de vários Perceptrons interligados,
também chamado de Perceptron Multicamadas. Durante o treino, o algoritmo recebe um conjunto de
dados como entrada (Xn), ajusta os pesos (Wm) e produz uma saída (Yk). Entretanto, normalmente a
saída é acompanhada de um erro, que seria a diferença entre o valor alvo (valor de saída desejado) e
a saída que foi produzida pela rede. O objetivo é promover tantas iterações quanto possível nos dados
de treino até que este erro seja minimizado. Durante estas iterações, os pesos serão ajustados
inúmeras vezes até que a rede seja capaz de generalizar com o mínimo de erro. Estes ajustes nos pesos
ocorrem por meio da retropropagação do erro produzido na saída, na qual a rede o propaga pelo
caminho inverso do fluxo (camada por camada), utilizando a derivada parcial com base no valor deste
erro para promover o ajuste dos pesos até que tal erro se reduza ao mínimo possível.

O diagrama abaixo ilustra uma rede neural feed-foward (alimentada adiante) de duas camadas, sendo
que uma delas é oculta.

10
Perceba que os pesos (parâmetros) são representados por ligações entre cada nó (neurônio) da rede.
As setas verdes indicam o fluxo no qual ocorre o aprendizado. A seguinte função ilustra estes estágios:

É evidente, contudo, que esta é uma representação simplificada do processo de aprendizado de uma
RNA, visto que o interesse aqui não é abordar este assunto de uma forma aprofundada.

As redes neurais possuem algumas variações, cada uma destinando-se à tarefas específicas. Entre
estas variações, há duas que vêm recebendo bastante atenção:

Redes Neurais Recorrentes - muito utilizadas em tarefas relacionadas ao processamento de
linguagem natural, como modelagem e marcação de sequências, reconhecimento de entidades,
análise de sentimentos, reconhecimento de voz, tradução de textos, etc.

11
Redes Neurais Convolucionais - são muito utilizadas no campo de visão computacional, como
classificação de imagens e reconhecimento de objetos em fotografias e vídeos. Entretanto,
recentemente as ConvNets revelaram uma grande capacidade para processar linguagem natural,
trazendo resultados bastante respeitáveis.

As RNA's entram em cena para nos ajudar a resolver problemas que normalmente parecem ser
intratáveis. Problemas estes que envolvem não apenas uma complexidade maior, como também
volumes de dados consideravelmente grandes. São algoritmos que estão em muita evidência agora,
porque se mostraram capazes de resolver estes problemas, proporcionando resultados no estado-da-
arte em diversas tarefas.

Atualmente, grandes produtos e serviços que fazem parte do nosso cotidiano e facilitam a nossa vida
contam com tecnologias neurais. O Google Tradutor, por exemplo, já está na sua segunda geração,
agora contando com modelos neurais capazes de compreender o contexto das sentenças e
proporcionar traduções muito melhores. A Apple, por sua vez, está utilizando tecnologias baseadas
em deep learning para tornar os seus produtos muito mais competitivos, como é o caso das versões
mais recentes do IOS e do seu novo aparelho, que está para ser lançado, HomePod. O novo iPhone X,
por exemplo, já conta com um chip neural.
12
Aplicações de deep learning no mercado

Deep learning já está entre nós. Essa poderosa tecnologia dentro do campo de inteligência artificial é
capaz de realizar feitos surpreendentes, como reconhecer objetos em imagens ou até mesmo
diagnosticar câncer de pulmão melhor do que médicos.

O mais interessante sobre as ferramentas de aprendizagem profunda, no entanto, é o modo como elas
funcionam. Conheça algumas aplicações muito relevantes do deep learning para o nosso dia a dia —
mas, antes, saiba mais sobre essa tecnologia.

Como deep learning funciona?

O deep learning é, em essência, uma percepção apurada de inteligênciaartificial, que funciona de
forma parecida com a nossa — combinada com a capacidade de gerar conteúdos baseados no
aprendizado a partir dessa assimilação.

Os algoritmos de deep learning são capazes de analisar dados não-estruturados sem praticamente
nenhum tipo de pré-processamento ou supervisão.

Essa tecnologia faz com que a máquina seja capaz de decifrar a linguagem natural e estabelecer
modelos preditivos coerentes — preenchendo vazios em fotografias e diagnosticando doenças em
exames médicos, por exemplo.

O deep learning é uma solução extremamente proveitosa, que pode ser aplicada em inúmeros campos.
Suas possibilidades ainda estão sendo exploradas, mas o mais animador é que não temos de esperar
o futuro para ver essa tecnologia explodir: ela já é utilizada em muitos setores e deve ganhar cada vez
mais espaço.

Conheça agora algumas das aplicações mais interessantes de deep learning:

Gerar sons para filmes mudos

O deep learning é capaz de assistir a um vídeo sem som e gerar áudio que corresponda àquilo que
pode ser enxergado.
13
Logo, se alguém bate com um martelo em um prego durante um filme mudo, por exemplo, a
ferramenta consegue identificar qual barulho deveria ser aplicado à cena e elabora o áudio adequado
para aquele momento.

Aumentar a resolução de imagens

Quem trabalha com imagens sabe que reduzir a resolução de uma fotografia é algo simples. Aumentar,
por outro lado, é impossível. Na verdade, era impossível: já existem testes práticos da utilização do
deep learning para aprimorar a qualidade de uma imagem, melhorando a sua resolução.

Quando isso é feito, a máquina também acrescenta detalhes que, teoricamente, seriam invisíveis em
resoluções menores.

Dar cor a imagens em preto e branco

Colorir imagens antigas em preto e branco é um trabalho artesanal bem complexo e quase artístico —
quando feito por humanos. Se deep learning é utilizado para executar essa tarefa, ele consegue
resultados impressionantes em segundos, usando redes neurais para compreender a cor de cada
elemento em uma fotografia antiga, por exemplo.

O mesmo vale para a colorização de longa-metragens antigos em preto e branco: a ferramenta analisa
um filme mudo antigo em preto e branco e acrescenta cor e som à obra.

Replicar o estilo de um artista plástico em qualquer imagem

O aprendizado profundo também é capaz de criar verdadeiras obras de arte. Partindo de fotografias
— ou até mesmo de simples rascunhos —, o deep learning pode usar redes neurais para replicar o
estilo de Van Gogh ou Botticelli, por exemplo. Os resultados são bem interessantes, como podem ser
vistos neste artigo sobre a técnica.

Gerar textos automáticos

A tecnologia permite que o computador gere textos sozinho — inclusive obras que, na teoria,
precisariam da criatividade humana. A máquina é capaz de escrever peças de teatro seguindo o estilo
de Shakespeare ou até mesmo um romance completo, além de artigos da Wikipédia e textos para
blogs.
14
A ferramenta usa redes neurais imensas para relacionar palavras e sentenças, conseguindo, dessa
forma, contar histórias coerentes e escrever sobre qualquer tema.

Elaborar legendas descritivas para imagens

O deep learning consegue descrever em detalhes o que foi capturado em uma imagem, identificando
ações, objetos e pessoas. Com isso, o algoritmo pode elaborar legendas descritivas para fotografias.

A aplicação tem um nível de precisão notável, com legendas bem detalhadas, como “cachorro preto e
branco salta sobre uma barreira” ou “pedreiro em roupa de segurança laranja está trabalhando na
estrada” — mas também pode cometer algumas falhas em casos de imagens com baixa definição ou
com ruídos.

Dirigir carros automatizados

Existem inúmeros empregos do deep learning nas tecnologias que compõem os carros autônomos. As
redes neurais podem ser utilizadas para entender a angulação da direção e identificar elementos na
estrada, como pessoas, outros carros e até animais.

Além disso, a inteligência artificial que controla um carro autônomo conta com deep learning para
aprender melhor sobre os comportamentos de outros motoristas — tomando decisões de acordo com
eles e prevendo acidentes.

Fazer diagnósticos médicos

O deep learning pode realizar diagnósticos médicos baseados em imagens e, em alguns casos, até
mesmo com maior precisão do que profissionais da área da saúde.

Segundo dados da Enlitic, uma startup dos Estados Unidos, seu sistema baseado em deep learning
consegue detectar câncer de pulmão com uma taxa de acerto 50% maior que a dos radiologistas.

O sistema da Enlitic também é mais preciso no diagnóstico de fraturas no pulso: uma acurácia de 97%,
enquanto médicos acertam em 85% das vezes.

Outras aplicações de deep learning
15
As possibilidades de deep learning não param por aí. Aplicações dessa tecnologia são testadas em
diversas áreas: aplicativos de reconhecimento de voz — como o Google Now e a Siri — são baseados
em deep learning, por exemplo.

Como essa ainda é uma área relativamente nova, há muito para ser aprendido e explorado em
inúmeros outros âmbitos:

Composição de música: assim como no caso das artes plásticas e da escrita, as redes neurais podem
compor canções, da música clássica ao rap;
Tradução mais poderosa: com o deep learning, é possível fazer traduções bem mais fidedignas,
inclusive em tempo real;
Classificação e organização de fotografias: como o deep learning consegue perceber pessoas e objetos
em qualquer imagem, algoritmos podem ser usados também para organizar coleções muito grandes,
com vários filtros baseados no conteúdo das fotos;
Jogos de videogames: com base apenas em estímulos visuais e sonoros, é possível ensinar uma
máquina a jogar videogame e outros jogos a partir do deep learning. Foi com essa tecnologia que o
Google DeepMind conseguiu criar um software capaz de vencer um grande mestre de Go.

Vantagens e Desvantagens

Vantagens do Machine Learning e o Deep Learning para empresas

Machine Learning e Deep Learning são técnicas de análises de dados que automatizam o
desenvolvimento de modelos analíticos e levam o conceito de inteligência artificial a um novo nível.

Elas já estão presentes em diversas ferramentas e máquinas — dos carros que dirigem sem motoristas
até exemplos que já se tornaram mais do que comuns para nós, como o filtro de spam dos serviços de
e-mail e as recomendações de conteúdo dos principais serviços de streaming.

Conheça um pouco mais sobre essas técnicas que ganham cada vez mais força nesses tempos onde a
informação é tão valorizada e veja algumas vantagens que elas podem trazer para as empresas.

Machine Learning

Muitas vezes traduzido como “aprendizagem de máquina”, é a tecnologia responsável por elaborar
conjuntos de regras e sistemas capazes de analisar dados e, por meio de complexos cálculos e
cruzamentos de informações, extrair aprendizados em altíssima velocidade.
16

A Machine Learning permite desenvolver algoritmos capazes de realizar automaticamente tarefas que
poderiam consumir muitas horas de trabalho (e raciocínio lógico) de seres humanos.

Deep Learning

A Deep Learning — ou “Aprendizagem Profunda” — é uma técnica que facilita implementação da
Machine Learning — atualmente é quase impossível falar de uma sem citar a outra. A Deep Learning
permite a um dispositivo pensar, aprender e agir como um ser humano, graças ao uso inteligente de
sistemas de aprendizagem contínuae de redes neurais artificiais que imitam a atividade em camadas
dos neurônios no neocórtex.

Um exemplo de prática de Deep Learning são as ferramentas de reconhecimento de imagens que
alcançam taxas de acerto maiores que a de humanos em diferentes cenários. É possível reconhecer
automaticamente em uma imagem elementos que podem ser desde fotos de gatinhos fofos até a
presença de tumores em exames de ressonância magnética.

Agora que você já está mais familiarizado com os conceitos de Machine Learning e Deep Learning,
conheça as principais vantagens que eles podem trazer aos negócios:

Aprender mais (e melhor) com os dados

O enorme volume e variedade de dados que temos disponíveis em um mundo hiperconectado, o atual
poder de processamento computacional e as novas — e mais acessíveis — soluções de
armazenamento de informações abriram todo um novo leque de possibilidades para as empresas.
Tornou-se viável analisar dados complexos em grande escala e, principalmente, aprender com eles.

É possível criar algoritmos capazes de realizar previsões de cenários muito mais assertivas do que as
feitas por nós, meros humanos, e em uma velocidade que nunca conseguiríamos alcançar. Excelente
solução para, dentre outros usos, identificar se o lançamento de um novo produto será bem-sucedido
ou prever qual será a demanda no próximo semestre com base na análise do histórico de vendas e
levando em conta todas as variáveis possíveis.

Aumento da produtividade

Soluções de Machine Learning e Deep Learning são capazes de substituir e automatizar diversas tarefas
que há bem pouco tempo só poderiam ser feitas por humanos — e, o melhor, como uma velocidade e
assertividade muito superior.
17

Isso permite uma ágil identificação de problemas e suas soluções, análises de relatórios, auxílio na
tomada de decisões etc. Ao fazer com que a equipe não gaste mais tempo nessas tarefas, você libera
os colaboradores a se dedicarem àquilo que fazem melhor e foram contratados para fazer. A
produtividade da empresa aumentará sem a necessidade de ampliar o quadro de funcionários.

Redução de custos por meio do Machine Learning

Além de uma forma de aumentar a produtividade da equipe, o uso de aprendizagem de máquina
também permite substituir os serviços oferecidos por fornecedores por soluções mais eficazes. Um
exemplo é o uso de sistemas baseados em Machine Learning, capazes de analisar contratos e
“traduzir” a linguagem jurídica para termos de mais fácil compreensão para as partes.

É possível também determinar algum item que esteja faltando ou que não deveria estar presente,
como alguma taxa ou comissão não negociada. Isso dispensa a necessidade de admitir um advogado,
que muitas vezes seria contratado apenas para ler um documento.

Seguindo pelas desvantagens do aprendizado da máquina

Como os sistemas de aprendizado de máquinas não estão explicitamente programados para resolver
problemas, é difícil saber como um sistema chegou aos seus resultados. Isso é conhecido como um
problema de "caixa preta", e pode ter consequências, especialmente em indústrias reguladas.

À medida que o Machine Learning se torna mais amplamente utilizado, você precisará explicar por que
seus sistemas fazem o que fazem. Alguns mercados - habitação, decisões financeiras e cuidados de
saúde - já possuem regulamentos que exigem que você dê explicações para as decisões. Você também
pode querer transparência algorítmica para que você possa auditar o desempenho do sistema de
Machine Learning. Os detalhes dos dados de treinamento e os algoritmos em uso não são suficientes.
Existem muitas camadas de processamento não-linear que ocorrem dentro de uma Deep Learning,
tornando muito difícil entender por que uma rede profunda está tomando uma decisão específica.
Uma técnica comum é usar outro sistema de Machine Learning para descrever o comportamento do
primeiro.

Você também precisa estar ciente dos perigos do viés algorítmico, como quando um sistema de
Machine Learning reforça o viés em um conjunto de dados que associa homens com esportes e
mulheres com tarefas domésticas porque todos os seus exemplos de atividades esportivas têm fotos
de homens e todas as pessoas retratadas nas cozinhas são mulheres. Ou quando um sistema que
correlaciona informações não médicas toma decisões que prejudicam as pessoas com uma
determinada condição médica.
18
O Machine Learning será tão bom quanto os dados de treinamento que ele usa para construir seu
modelo e os dados que ele processa, por isso é importante examinar os dados que você está usando.
Sistema ML também não compreendem os dados ou os conceitos por trás deles como uma pessoa
consegue fazer.

Há muitos problemas de reconhecimento e classificação que o aprendizado da máquina pode resolver
de forma mais rápida e eficiente do que os humanos, mas, considerando o futuro previsível, Machine
Learning deve ser considerado como um conjunto de ferramentas para apoiar as pessoas no trabalho
em vez de substituí-las.

Conclusão

O objetivo deste trabalho foi trazer uma visão geral, não aprofundada, dos algoritmos de
aprendizagem supervisionada mais frequentes em tarefas de Machine Learning e Deep Learning,
aplicações, vantagens e desvantagens. Embora eu tenha tentado limitar a apresentação de jargões
matemáticos, é preciso entender que o Machine Learning é, por natureza, fundamentado nesta
ciência. Por tal motivo, é importante que você compreenda estes fundamentos, caso queira atuar no
mercado como um cientista de dados, um engenheiro de machine learning ou se apenas deseja
incorporar o ML em seus produtos ou serviços. Por outro lado, para o usuário final, resta apenas
usufruir dos benefícios proporcionados por esta ciência aparentemente "mágica".

Referência:

https://pt.linkedin.com/pulse/o-machine-learning-e-seus-principais-algoritmos-de-lu%C3%ADs-fred
http://blog.justdigital.com.br/3-vantagens-do-machine-learning-e-o-deep-learning-para-empresas/
https://br.udacity.com/blog/post/aplicacoes-deep-learning-mercado

Bibliografia:

Álgebra Linear com Aplicações - Anton, Howard
Deep Learning - Goodfellow, Ian
An Introduction to Statistical Learning: With Applications in R: 103 - James, Gareth
The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition - Hastie,
Trevor et al.
Pattern Recognition and Machine Learning - Christopher M. Bishop