Buscar

INTELIGÊNIA ARTIFIIAL E APRENDIZADO DE MAQUINA - UNIDADE 3

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 53 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 53 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 53 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

INTELIGÊNCIA ARTIFICIAL EINTELIGÊNCIA ARTIFICIAL E
APRENDIZADO DE MÁQUINAAPRENDIZADO DE MÁQUINA
APRENDIZAGEM DE MÁQUINAAPRENDIZAGEM DE MÁQUINA
E REDES NEURAISE REDES NEURAIS
Autor: Me. Jackson Luis Schirigatti
Revisor : Rene Marcel ino Abr i t ta Te ixe ira
IN IC IAR
introdução
Introdução
O aprendizado de máquina é uma surpreendente área da inteligência
arti�cial. Quando nos aprofundamos em conceitos sobre como as máquinas
podem aprender, questionamos: teremos em um futuro próximo humanoides
ou robôs convivendo e aprendendo ao nosso lado? Gostaria que você mesmo
tirasse essa conclusão a partir do nosso estudo sobre a teoria do aprendizado
de máquina e sobre os agentes inteligentes. Compreendemos que a teoria
aprendizagem de máquina é formada por programas de computadores, que
são algoritmos de aprendizagem e base de dados de conhecimento, cada qual
com sua peculiaridade de aprendizado. Focaremos neste estudo a
aprendizagem por conceito que trabalha com o viés indutivo e
apresentaremos a aprendizagem no contexto dos agentes inteligentes e no
contexto na mineração de dados, fundamentais para compreendermos a
inteligência das máquinas.
A capacidade da inteligência humana é aprender, e todo o progresso humano
é o resultado dos esforços anteriores e da evolução do nosso entendimento.
A aprendizagem automática das máquinas, também denominada
Aprendizado de Máquina (AM), ou machine learning, é um ramo da ciência da
computação em que cientistas há décadas vêm fazendo com que máquinas
aprendam. Com o avanço da computação em termos de processamento e
memória e através dos algoritmos de aprendizagem, eles contribuíram para a
revolução da inteligência arti�cial. Atualmente, as máquinas já aprendem
através dos sistemas inteligentes, e robôs em fábricas já estão sendo
utilizados para automatizar diversas tarefas. A Figura 3.1 mostra um robô-
secretária que realiza diversas tarefas em um escritório. Essa, hoje, é uma
realidade próxima.
Aprendizagem deAprendizagem de
MáquinaMáquina
A Aprendizagem de Máquina é uma das áreas mais importantes da
inteligência arti�cial que trata do aprendizado das máquinas através de
algoritmos, métodos e técnicas computacionais de aprendizagem, como a
mineração de dados e as redes neurais.
Para Luger (2013), o aprendizado é importante para aplicações práticas de
inteligência arti�cial e acontece quando ocorrem mudanças em um sistema e
este possui melhoras quando for repetida a mesma tarefa pela segunda vez.
Caso contrário, a máquina não aprendeu. O aprendizado envolve a
generalização a partir da experiência, e, para uma generalização ideal, o
desempenho deve melhorar não apenas na repetição da mesma tarefa, e sim
em tarefas semelhantes do domínio através de um viés indutivo.
O aprendizado indutivo aplica o processo de generalização, ou seja, executa
uma classi�cação de dados e cria grupos de objetos ou exemplos. Em nosso
estudo de AM (aprendizagem   de máquina), apresentaremos métodos,
algoritmos e técnicas com base no viés indutivo, ou seja, da teoria da
aprendizagem automática.
Bengfort e Kim (2016) comentam que o objetivo do aprendizado de máquina é
derivar modelos preditivos a partir de dados atuais e históricos. De acordo
com as premissas, um algoritmo realiza o aprendizado quando obtém as
Figura 3.1 - Robô-secretária, um desenho que representava um futuro
distante, hoje, um futuro presente 
Fonte: Валерий Качаев / 123RF.
devidas melhorias com uma excessiva quantidade de treinamento ou
experiência. Tais resultados e�cientes são alcançados pelos algoritmos de
aprendizado de máquina para domínios muito restritos usando modelos
treinados a partir de um grande conjunto de dados.
Já para Siegel (2017), os métodos de indução são os que estão por detrás do
aprendizado de máquina. Os métodos de modelagem variam, mas todos
enfrentam o mesmo problema: “aprender o máximo possível”. O objetivo do
aprendizado de máquina é a indução , ou seja, é o raciocínio que parte de
fatos detalhados para princípios gerais (do efeito para causa). Já diferente de
dedução , que é o raciocínio que parte do geral para o particular (ou da causa
para o efeito). A dedução é direta e parte da aplicação direta de regras. Já a
indução parte dos detalhes para generalizar e veri�car padrões que
continuarão se aplicando em situações ainda não vistas. Portanto, devemos
compreender que:
Indução = raciocínio que parte dos detalhes para a generalização,
gerando novos conhecimentos = método indutivo  = modelos preditivos =
aprendizagem.
Dedução = raciocínio que parte da generalização para os detalhes. Parte
das experiências e dos fatos não produzindo conhecimentos novos.
Vimos que existem dois tipos de modelagem de aprendizagem, uma é
indução e outra é a dedução. A maior parte dos problemas de aprendizagem
está relacionada à indução. Vejamos agora uma visão geral desses problemas
e técnicas de aprendizagem.
Visão Geral de Problemas e Técnicas
Na aprendizagem arti�cial, existem várias formas de modelar a
aprendizagem, como vimos, uma delas, a mais utilizada, é a do viés indutivo
com informações de uma base de dados do passado e do presente. Essa
abordagem, segundo Coppin (2017), compreende a maioria dos problemas de
aprendizado, em que a tarefa é aprender a classi�car entradas de acordo com
um conjunto �nito, ou até in�nito de classi�cações. Vimos em nossos estudos
anteriores que um sistema de aprendizado possui uma base de dados de
treinamento que é classi�cada manualmente. Um sistema somente aprende
quando, a partir de uma base de treinamento, consegue realizar uma
classi�cação e, em seguida, em uma nova base de dados não treinada,
consegue realizar uma nova classi�cação. Existem duas maneiras de
aprender:
Por hábito;
Por conceito;
A palavra “hábito” vem de realizar uma tarefa ou comportamento
permanente, frequente ou costumeiro. Na inteligência arti�cial, segundo
Coppin (2017), a aprendizagem por hábitos está relacionada ao treinamento
que envolve a armazenagem de cada fragmento de dados de treinamento e
sua classi�cação. Após, é veri�cado se cada novo item de informação está
armazenado na memória. Se estiver na memória, então a classi�cação que foi
armazenada com aquele item será retornada. Nesse método o aprendiz só
consegue classi�car os dados que já conhece, e não há esforços de aproximar
a função de mapeamento. Na prática, esses tipos de sistemas ou robôs
efetuam tarefas automatizadas e aprendem de acordo com novas
informações armazenadas. Esses sistemas são os sistemas especialistas, que
possuem uma base de fatos e dados (base de conhecimento). Sempre que a
base é alimentada com novas informações, que se relacionam de acordo com
fatos e regras (conhecimento), um aprendizado é realizado.
A Figura 3.2 ilustra uma associação de tarefas programadas em uma linha de
produção ou manutenção de robôs. O robô irá aprender de acordo com o que
é ensinado em sua base de conhecimento. Nenhum outro mapeamento é
realizado automaticamente. Uma diferença que devemos compreender com
relação a um algoritmo que realiza um conjunto de tarefas pré-programadas,
com um algoritmo que classi�ca dados através de critérios (regras) e fatos,
gerando um resultado verdadeiro ou falso, é que o primeiro algoritmo é um
conjunto de ações prede�nidas e o segundo é um conjunto de informações
programadas que geram classi�cações e decisões.
Figura 3.2 - Robôs montando robôs em uma fábrica 
Fonte: Macrovector / 123RF.
Já o aprendizado por conceitos envolve determinar um mapeamento a partir
de um conjunto de variáveis de entrada em um valor Booleano. Os métodos
que conseguem mapear corretamente um conjunto de dados de treinamento
em classi�cações, então também conseguirá mapear dados não observados
anteriormente, ou seja, conseguirá realizar generalizações a partir de um
saiba mais
Saiba mais
Dois elementos-chave são necessários para
que os computadores aprendam a base de
conhecimento e a inferência. A base deconhecimento é um conjunto de fatos e
regras a respeito de um objeto. Já um
mecanismo de inferência acessa, seleciona e
interpreta um conjunto de regras do objeto,
aplicando, assim, esse conjunto de regras aos
fatos para compor novos fatos. Com isso, o
computador aprendeu.
Um exemplo de fato seria: Patrícia é esposa
de Pedro, e consequentemente um novo fato
ocorre: Pedro é marido de Patrícia. Já uma
regra seria: se X é esposa de Y, então Y é
marido de X. Dessa forma, o computador
pode aplicar a regra ao fato.
Fonte: Belmiro (2014, p. 34).
A linguagem de programação Prolog realiza
tal experiência de acesso e interpretação de
regras de objetos. Para conhecer um tutorial
de uso da linguagem Prolog, apresentado por
Oliveira e Silva (2013), da Universidade
Estadual de Maringá, acesse o link disponível
em:
ACESSAR
https://www.seer.ufrgs.br/rita/article/view/rita_v20_n2_p155WesleyVol20Nr2_214
conjunto de dados de treinamento. Os métodos de aprendizado do tipo
conceito podem ser de diversos tipos, conforme Luger (2013) explica:
Aprendizado de máquina simbólico: é uma abordagem que se utiliza
de um conjunto de símbolos que representam entidades e relações de
um domínio do problema.
Aprendizado de máquina conexionista: é uma abordagem que se
utiliza da biologia ou das redes neurais.
Aprendizado genético e emergente: é uma abordagem que considera
algoritmos inspirados nos processos subjacentes da evolução: moldar
uma população de indivíduos por meio da sobrevivência dos seus
membros mais ajustados.
Aprendizado probabilístico: é uma abordagem que utiliza ferramentas
probabilísticas e tecnologias estocásticas para o aprendizado máquina.
O Quadro 3.1 apresenta as características e os algoritmos, métodos ou
técnicas de cada aprendizado máquina:
Aprendizado Características
Algoritmos, métodos,
técnicas
Aprendizado
simbólico
●   Os algoritmos estão
baseados na suposição
de que a principal
in�uência sobre o
comportamento do
programa seja a sua
base de conhecimento
do domínio
representada
explicitamente. ●  
Baseada em sentenças
em linguagem simbólica.
Algoritmos de espaços
de conceitos. Linguagem
Lex: busca heurística.
Algoritmo de eliminação
de candidatos. Algoritmo
ID3 para indução de
árvore de decisão.
Aprendizado
conexionista
●   O conhecimento está
implícito na organização
e na interação desses
neurônios. ●   Neurônios
arti�ciais conectados. ●  
As redes neurais não
aprendem adicionando
representações à sua
base de conhecimento,
em vez disso, elas
aprendem modi�cando
sua estrutura global, de
modo a se adaptar às
contingências do mundo
que habitam.
Algoritmos de
treinamento de
perceptron. Aprendizado
por retroprogramação.
Aprendizado competitivo
(o vencedor leva tudo,
rede de Kohonen, redes
outstar e
contraprogramação,
máquinas de vetor de
suporte). Aprendizado
hebbiano por
coincidência. Redes de
atratores ou “memórias”.
Aprendizado
genético e
●   O aprendizado é
realizado por meio de
Modelos de aprendizado
social e emergente.
Quadro 3.1 - Características dos aprendizado de máquina 
Fonte: Adaptado de Luger (2013).
Portanto, o aprendizado de máquina computacional é a aplicação de técnicas
computacionais na tentativa de encontrar padrões explícitos e observáveis.
Para Fawcett e Provost (2018), o aprendizado de máquina está preocupado
com muitos tipos de melhorias de desempenho, incluindo campos da robótica
e da visão computacional usando o conhecimento aprendido para raciocinar e
interagir com o ambiente. Outro campo em que o aprendizado de máquina
atua é a mineração de dados, que faz parte da descoberta do conhecimento,
mas não atua no ambiente propriamente dito, e sim nas bases de dados,
emergente adaptação por analogias
biológicas. ●   
Aprendizado inspirado
na evolução através da
modelagem de uma
população de indivíduos
por meio da
sobrevivência de seus
membros mais
ajustados.
Algoritmo genético.
Sistemas classi�cadores
e programação genética.
Algoritmos de autômatos
celulares (o jogo da vida).
Aprendizado
de máquina
probabilístico
●   Representações
complexas do mundo
através das ferramentas
probabilísticas. ●   Os
eventos podem ser
relacionados um ao
outro de forma
probabilística. ●   Os
modelos estocásticos
capturam bem as
mudanças do mundo.
Modelos estocásticos e
dinâmicos de
aprendizado: Modelo de
Markov e Redes
Bayesianas
preparando e analisando os dados e criando modelos de aprendizagem para
as e�cientes tomadas de decisões.
Veremos agora como uma máquina pode aprender através de métodos e
técnicas de mineração de dados, ou seja, na busca do conhecimento implícito
ou não compreendido.
Aprendizado de Máquina no Contexto de Mineração
de Dados
Todos os dias criamos dados de forma cada vez mais rápida do que em
qualquer outra época da história humana, milhões de dados de pesquisa,
vídeos e redes sociais são acessados diariamente. Essa é uma oportunidade
sem �m para os computadores aprenderem e para os cientistas da
computação testarem e re�narem as técnicas de aprendizado de máquina.
Hoje, todos nós contribuímos com essa experiência através das pesquisas na
internet, acessos aos links e nas redes sociais através de smartphones e
computadores.
Os sistemas inteligentes estão rastreando informações sobre nossas vidas,
nossas preferências e o que fazemos. Nas organizações, as bases
transacionais (bancos de dados que processam transações) são utilizadas
para rastrear padrões e tendências para as complexas tomadas de decisões
em qualquer nível organizacional. Uma área da inteligência arti�cial que está
ajudando a encontrar conhecimento em grandes bases de dados para
resolver problemas para a tomada de decisão é a mineração de dados.
Castro e Ferrari (2016, p. 7) a�rmam que:
[...] a mineração de dados pode levar a uma capacidade preditiva
[e analítica poderosa de dados]. As funcionalidades da mineração
de dados são usadas para especi�car os tipos de informações nas
tarefas descritivas e preditivas. As tarefas descritivas caracterizam
as propriedades gerais dos dados [já as preditivas fazem inferência
a partir dos dados objetivando predições].
O software de mineração de dados inclui formas de inteligência arti�cial,
como redes neurais, sistemas especialistas e abordagens simbólicas. As
ferramentas de mineração de dados aplicam algoritmos a conjuntos de
informações para a descoberta de tendências e padrões (BALTZAN, PHILLIPS,
2012).
A Figura 3.3 ilustra um processamento da mineração de dados, onde se
coletam dados de diversas bases transacionais, e, através de ferramentas e
algoritmos se encontram padrões, agrupamentos ou estimativas para uma
e�ciente tomada de decisão. Uma mineração não quer dizer que ela possui
aprendizagem. Essa é uma próxima etapa possível da mineração de dados.
Para encontrar informações necessárias, seria su�ciente chegar a uma análise
descritiva ou a um agrupamento. Mas, para uma descoberta de
conhecimento, em uma base de dados, é necessário fazer com que o
algoritmo aprenda de acordo com seu desempenho (classi�cando, estimando
ou associando dados).
Os algoritmos de aprendizagem são ferramentas poderosas para a
descoberta de conhecimento em bases de dados e podem atuar nas diversas
etapas da mineração. Essas etapas podem ser:
De análise descritiva de dados
Análise de grupos
Figura 3.3 - Processamento de mineração de dados 
Fonte:  Pratyaksa / 123RF.
Predição (classi�cação e estimação)
Associação
Na etapa de análise descritiva , é possível realizar uma sumarização e uma
compreensão dos objetos da base e seus atributos através de distribuições de
frequências, de medidas de centro e variação e de medidas de posição
relativa e associação de dados. Na etapa predição , ė utilizado ou
desenvolvido um modelo para avaliar a classe de um objeto não rotulado ou
para estimar um valor de um ou mais atributos de dados objeto. A etapa de
avaliação da classe, denominada também de tarefa de classi�cação e
estimação do valor, é denominada de regressão ou estatística. Já a etapade
análise de grupos é um processo de posicionamento ou segmentação de um
conjunto de objetos em clusters de objetos similares. Na etapa de associação,
são encontradas relações ou estimativas entre os objetos da base de dados.
Na regra de associação são realizadas descobertas de regras de associação
que apresentam valores de atributos de ocorrência conjunta na mesma base
de dados transacionais (CASTRO; FERRARI, 2016).
Portanto, é possível dividir uma mineração de dados em uma sequência para
a descoberta do conhecimento:
1. Pré-processamento de dados: etapa que diz respeito ao processo de
preparação da base de dados, limpeza, integração, redução,
transformação e discretização dos dados.
2. Análise descritiva dos dados: etapa que diz respeito ao processo de
visualização dos dados.
3. Análise de grupos: etapa que diz respeito ao processo de agrupamento
de dados (similaridades e formas de representação dos agrupamentos).
4. Aprendizagem: é a etapa de aprendizagem através de algoritmos de
aprendizagem que podem ser por classi�cação, estimação ou por regras
de associação.
Podemos visualizar com mais detalhes as características das etapas da
mineração e seus benefícios através do Quadro 3.2.
Podemos visualizar no Quadro 3.2 que, em termos de aprendizagem de
máquina dentro de um processo de mineração de dados, temos o grupo de
classi�cação de dados, estimação e associação. Alguns autores ainda dividem
em quatro grupos de aprendizagem, acrescentando ao que já vimos, o grupo
de regressão, que se refere a uma estimativa de um ou mais atributos de
dados objeto.
Veremos agora, com mais detalhes, como funciona o processo de
aprendizagem por classi�cação através da compreensão de um modelo de
aprendizagem máquina.
praticar
Vamos Praticar
Quadro 3.2 – Características e benefícios das etapas da mineração de dados 
Fonte: Adaptado de Castro e Ferrari (2016) e Amaral (2016).
A mineração de dados é dividida de forma que sejam realizados tratamentos e se
chegue à descoberta do conhecimento a partir de uma base de dados. Marque a
alternativa correta que se refere ao processo de visualização de dados dentro da
mineração de dados.
a) pré-processamento de dados.
b) análise descritiva dos dados.
c) análise de grupos dos dados.
d) aprendizagem.
e) reprocessamento dos dados.
Em uma aprendizagem de máquina de classi�cação, segundo Amaral (2016),
deve ser analisado quais são as características que de�nem cada forma e
atribui esta a cada um dos grupos, como mostra a Figura 3.4. Nos retângulos,
as formas já estão classi�cadas de acordo com seu tipo: triângulo, quadrado
ou círculo. Já uma forma à esquerda do retângulo com uma interrogação ao
centro ainda não teve seu tipo identi�cado. Em uma base de dados relacional,
os dados já estão classi�cados como os elementos do retângulo, mas em
categoria de clientes, produtos, fornecedores, compras, vendas, etc. Um
algoritmo computacional de aprendizagem só aprende a classi�car objetos ou
dados quando eles ainda não foram classi�cados por ele. Para isso, é
necessário que o algoritmo realize comparações com uma base de
treinamento, ou seja, uma base de objetos já classi�cados. 
Aprendizagem deAprendizagem de
Máquina por Classi�caçãoMáquina por Classi�cação
Como já vimos, o aprendizado de máquina pode ser dividido em três grandes
grupos: classi�cação, estimação e associação. A tarefa mais comum é a de
classi�cação. A classi�cação funciona com dados históricos. Contudo, em uma
base de dados relacional de clientes ou produtos, essa classi�cação já está
pronta, pois as tabelas ou a classe dos objetos já estão na forma estruturada.
Porém, é necessário veri�car se os dados são necessários, convenientes e
preparados para o propósito, caso contrário, será preciso aplicar a primeira
etapa de pré-processamento (limpeza, integração, redução, transformação e
discretização). Então, o próximo passo do aprendizado de máquina é criar um
modelo preditivo a partir dos dados históricos já classi�cados.
Um exemplo da construção de um modelo de aprendizado de máquina é
ilustrado no diagrama na Figura 3.5. A partir de uma base de dados
transacional, são extraídos os dados históricos do cliente. Uma parte dos
dados disponíveis é usada para a geração do modelo preditivo (um conjunto
de treinamento) e uma outra parte é usada para avaliar a qualidade do
modelo (conjunto de teste).
Figura 3.4 - Aprendizagem por classi�cação 
Fonte: Adaptado de Amaral (2016, p. 7).
O treinamento do modelo de aprendizagem de máquina consiste de dados
treinados para ajuste de parâmetros. Nos modelos preditivos de redes
neurais, os parâmetros seriam os pesos, e, nos modelos de árvores de
decisão, seriam os nós.   Esse ajuste do modelo deve ser realizado para que
haja um desempenho avaliado pela aplicação do modelo.
A partir de nosso tópico de laboratório, compreenderemos sobre a tarefa de
classi�cação. Essa tarefa é realizada com ferramentas e técnicas denominadas
de árvore de decisão e suas etapas algorítmicas.
Laboratório: Cenários de Aplicação
Segundo Castro e Ferrari (2016, p. 158), “a classi�cação é a tarefa preditiva de
identi�cação da classe à qual um objeto pertence. Para que isso seja possível,
um modelo de classi�cação precisa ser construído, que é feito com base em
um conjunto de treinamento previamente rotulado [...]”. O desempenho
depende da qualidade do seu treinamento através da avaliação, ou seja, do
percentual de classi�cação correta (acurácia preditiva).
Uma forma de classi�car seria pela árvore de decisão (decision
tree), ela é uma estrutura em forma de árvore na qual cada nó
interno corresponde a um teste de atributo, cada ramo representa
um resultado do teste e os nós folhas representam classes ou
distribuições de classes. O nó mais elevado da árvore é conhecido
como nó raiz, e cada caminho da raiz até um nó folha corresponde
Figura 3.5 - Construção de um modelo preditivo 
Fonte:  Elaborada pelo autor.
a uma regra de classi�cação [...]. Uma vez construída a árvore, ela
pode ser usada para classi�car um objeto de classe desconhecida.
Para isso, basta testar os valores dos atributos na árvore e
percorrê-la até atingir um nó folha, que corresponde à classe
predita para aquele objeto. (CASTRO; FERRARI, 2016, p. 170).
Na representação por Vieira et al . (2018), a árvore de decisão é constituída de
uma cadeia de nós de decisão, conectados por rami�cações (ramos)
estendendo-se do nó raiz até os nós folhas e tendo como requisito básico o
atributo-alvo ou o atributo-problema.
As árvores de decisões são técnicas con�áveis para a construção de modelos
preditivos de apoio à tomada de decisão. Possuem uma forma hierárquica,
como mostra o exemplo ilustrado na Figura 3.6, onde o primeiro nó (nó raiz) é
o atributo-problema “peso”. Os valores do atributo se encontram nos ramos, e
os testes são realizados (peso < 50, peso >= 50; sexo masculino, feminino),
gerando, assim, um resultado (verdadeiro ou falso). Nos nós folhas são as
distribuições das classes ou valores das classes (doente ou saudável). As
árvores de decisão segmentam os dados heterogêneos através de suas
similaridades em dados mais homogêneos em relação à variável-alvo. Elas
possuem a capacidade do modelo em predizer no presente as interações que
ocorrerão no futuro com certo nível de certeza (VIEIRA et al ., 2018).
Figura 3.6 - Árvore de decisão 
Fonte: Adaptado de Amaral (2016, p. 98).
Sua construção é materializada computacionalmente através de algoritmos
denominados C.45 ou J48 e sua estrutura adota uma técnica de “dividir para
conquistar”. O algoritmo de indução de árvore de decisão que constrói a
árvore de cima para baixo, dividindo e conquistando, seria, de maneira
resumida, os seguintes passos:
1. A árvore inicia com um nó raiz o qual representa a base de dados (no
caso do exemplo, o atributo-problema é o nó peso). O problema-alvo
está relacionado à classi�cação das pessoas que estão “doentes” e
“saudáveis”.
2. Se todos os objetos pertencemà mesma classe, então, o próximo nó se
torna um nó folha e rotula o objeto com aquela classe (não é o caso do
exemplo da Figura 3.6).
3. Senão, o algoritmo calcula o atributo que melhor separa a classe em
classes individuais (divisão: peso >= 50, classe doente, gerando um nó
folha e o peso <50 gera um nó sexo). Nesse caso, o atributo pode se
tornar o “atributo teste” (nó interno teste = sexo M ou F) ou realiza o
atributo de decisão (peso >50), que, nesse caso, gerou o nó folha ou a
classe doente).
4. Para cada valor conhecido do atributo teste (sexo = M ou F), a base é
particionada seguindo esses valores. Gerando, assim, os nós folhas ou as
classes saudável ou doente.
5. O algoritmo usa o mesmo processo recursivamente para formar uma
árvore de decisão para os objetos de cada participação.
6. A recursividade é interrompida quando todos os objetos para um dado
nó pertencem à mesma classe ou quando não há mais atributos para os
quais os objetos precisam ser particionados. Uma divisão que mantém
as proporções de classes em todas as partições é inútil. Já uma divisão
onde em cada partição todos os exemplos são da mesma tem utilidade
máxima.
Fawcett e Provost (2018) comentam que a técnica de indução de árvore de
decisão ou modelo estruturado fornece um modelo que pode representar
exatamente o tipo de segmentação supervisionada que queremos, sendo,
assim, possível prever valores para novos casos. Existem diversos algoritmos
que constroem a árvore de decisão, como ID3, C 4.5 e J8 por Ross Quinlan. O
Quadro 3.3 apresenta as características desses algoritmos que estão
baseados na indução de árvore de decisão.
Quadro 3.3 – Algoritmos que constroem árvores de decisão 
Fonte: Elaborado pelo autor.
Como vimos, é possível, através de algoritmos avançados de aprendizagem,
programar máquinas com uma grande equipe de programadores e técnicos
que podem realizar automações em fábricas com robôs inteligentes. É
possível também utilizar grandes bases transacionais, de marketing,
produção, vendas e de outras áreas funcionais para que os algoritmos
procurem padrões ou tendências e que aprendam em novas bases de dados.
Algoritmo Características
ID3
●  É considerado um dos algoritmos precursores de
árvore de decisão; 
● Tem como base à inferência; 
● A partir de um conjunto de dados treinados ou
exemplos, o algoritmos realiza a construção da árvore
de decisão; 
● A árvore resultante é utilizada para classi�car
amostras futuras; 
● O algoritmo realiza a separação de dados de
treinamento em subconjuntos de classes exemplos.
C 4.5
●  Abordagem recursiva de particionamento de base de
dados 
●  Lida com atributos contínuos e discretos; 
●  Lida com dados de treinamento com atributos
incompletos; 
●  Lida com atributos com diferentes custos; 
●  Poda de árvore após criação; 
●  Desenvolvido em Linguagem C. 
Contudo, também é possível ensinar as máquinas através do treinamento, ou
seja, por hábitos perceptivos. Elas podem aprender com os humanos sem
precisar programá-los. Assim, as máquinas podem realizar tarefas
automatizadas enquanto os humanos podem se especializar em outras
tarefas.
Comentamos em alguns momentos de nosso estudo formas de
aprendizagem na aplicação de modelos de aprendizagem, portanto, agora
compreenderemos melhor esses tipos de aprendizagem, sendo elas de duas
formas: supervisionada e não supervisionada.
Aprendizado Supervisionado e não Supervisionado
Castro e Ferrari (2016, p. 16) apresentam a de�nição de paradigma de
aprendizagem: “um procedimento bem-de�nido para treinar uma técnica de
aprendizagem de máquina (MA) que é denominado algoritmo de
aprendizagem ou algoritmo de treinamento, e a maneira pela qual o
ambiente in�uencia a técnica em seu aprendizado de�ne o paradigma de
aprendizagem”.
Portanto, para obtermos um melhor aprofundamento sobre a aprendizagem
da máquina na Inteligência Arti�cial e sobre o conceito de aprendizado
indutivo (que possui a capacidade de aprender a partir de exemplos),
veremos dois paradigmas de aprendizagem mais comuns e que são
amplamente utilizados com a mineração de dados e a Inteligência Arti�cial.
No livro de Castro e Ferrari (2016, p. 16), temos dois principais paradigmas:
1. Aprendizado supervisionado: é baseado em um conjunto de objetos
para os quais as saídas desejadas são conhecidas, ou em algum outro
tipo de informação que presente o comportamento que deve ser
apresentado pelo sistema.
2. Aprendizado não supervisionado: é baseado apenas em objetos de
base, cujos rótulos são desconhecidos. Basicamente, o algoritmo deve
aprender a “categorizar” ou rotular objetos.
Para Coppin (2017), redes de aprendizado supervisionado aprendem quando
são apresentadas a dados de treinamento classi�cados. Esses modelos são
inspirados nos neurônios do cérebro humano e realizam o aprendizado
através da modi�cação dos pesos das conexões de suas redes, já as redes
neurais que não utilizam aprendizado supervisionado aprendem sem
qualquer intervenção humana. Um exemplo de aprendizado não
supervisionado é o mapa de Kohonen, que é uma rede neural que é capaz de
aprender a classi�car um conjunto de dados de entrada sem ter sido
informada sobre a classi�cação e sem receber dados de treinamento.
Ainda quanto à aplicação do aprendizado supervisionado, Barth (2004, p. 38)
comenta, por exemplo, em redes neurais, onde o aprendizado supervisionado
“é aplicado quando de fato existe uma amostra do desenvolvimento, cujos
elementos serão utilizados para oferecer uma crítica às tentativas de resposta
da rede neural (com bases nessas críticas, a rede neural vai ‘aprendendo’ a
gerar respostas mais precisas)”. Com relação à aplicação do aprendizado não
supervisionado, Barth (2004, p. 38) comenta que “é aplicado quando não
existe um conjunto de casos conhecidos cujas respostas são conhecidas (na
verdade, a rede neural vai apenas agrupar os diversos casos de acordo com
as similaridades nas características observáveis)”.
O aprendizado de máquina tem sido amplamente utilizado em diversas
tarefas que podem ser organizadas em diferentes critérios, e um deles refere-
se ao paradigma de aprendizado. Esse paradigma adotado irá liderar a tarefa.
De acordo com os critérios, as tarefas de aprendizado podem ser preditivas
ou descritivas . As tarefas preditivas estão relacionadas à hipótese por
indução, cujo objetivo é encontrar uma função (modelo ou hipótese) que, a
partir de dados de treinamento, possa ser utilizada para prever um rótulo ou
valor que caracterize um exemplo, com base nos valores de entrada. Os
algoritmos que utilizam   os modelos preditivos seguem o paradigma de
aprendizado supervisionado. Isso signi�ca que a simulação é realizada por um
supervisor externo. Já em tarefas de descrição, o objetivo é explorar ou
descrever um conjunto de dados. Nesse modelo por descrição, não se utiliza
o atributo saída, por isso, segue um padrão de aprendizado não
supervisionado. Nas tarefas descritivas por agrupamento de dados, o
algoritmo descritivo tem como objetivo encontrar objetos idênticos ao
conjunto de dados ou até mesmo encontrar “regras de associação” que
relacionam grupos por atributos.  (FACELI, 2011).
A Figura 3.7, esquematizada e adaptada de Faceli (2011, p. 6), ilustra a
hierarquia de aprendizado de acordo com os tipos de tarefas de aprendizado.
No topo da hierarquia, aparece o aprendizado indutivo, no qual são realizadas
as generalizações a partir dos dados. Na sequência da hierarquia de
aprendizado, há dois tipos de aprendizado: o supervisionado, relacionado à
predição, e o não supervisionado, relacionado à descrição. As tarefas
supervisionadas são divididas em classi�cação e regressão (tipos de rótulos
de dados). Já o aprendizado não supervisionado é dividido em agrupamento
(dados agrupados por similaridade), associação (encontram-se padrões
frequentes entre os atributos de um conjunto de dados) e sumarização
(descoberta de descrição simples e compacta para um conjunto de dados).
praticar
V P tiFigura 3.7 - Hierarquia de aprendizado 
Fonte: Adaptado de Faceli (2011, p. 6).
praticar
Vamos Praticar
O processo de indução de hipóteses procura uma hipótese em uma base de
treinamento ou base de testes e esta por si só realiza o aprendizado na base
original, classi�cando os novos dados não observados durante o treinamento. Para
Faceli (2011), os algoritmos podem realizar a indução de hipóteses através de um
conjunto de critérios. Esses critérios são descritos através de técnicas como:
a) critérios de raciocínio lógico.
b) critérios de árvore de decisão.
c) teste de Turing.
d) teste de dedução por predicados.
e) lógica nebulosa.
Nas décadas que seguiram com os estudos da Inteligência Arti�cial, a
preocupação dos cientistas e pesquisadores não era mais criar um robô tão
inteligente quanto o ser humano, e sim com o entendimento do cérebro
humano que soluciona problemas. As pesquisas que envolviam esse
entendimento eram baseadas em algoritmos, heurísticas e metodologias.
Consequentemente, as áreas que evoluíram foram: aprendizado de máquina,
sistemas multiagente, vida arti�cial, visão por computador, planejamento e
jogos (COPPIN, 2017).
Durante as décadas de 1960 e 1970, predominou a Inteligência Arti�cial
simbólica, denominada como a primeira onda de IA, de características
relacionadas à manipulação simbólica e à memória. Os pesquisadores da
época trabalharam com a emulação das funções do cérebro, pois acreditava-
se que, através de um programa de computador, seria possível emular a
mente. Com isso, foram aperfeiçoados os softwares inteligentes e
especi�camente os sistemas especialistas, que solucionam problemas
acoplados a imensos bancos de memória. Com esse acoplamento, o sistema
especialista pode responder às consultas, fornecer conselhos e apoiar os
Redes NeuraisRedes Neurais
especialistas humanos. Na época, se destacaram os sistemas especialistas
Mycin e o Prospector. O Mycin indicava medicação para os pacientes com
infecções bacterianas, enquanto o Prospector auxiliava os geólogos na
descoberta de metais raros (TEIXEIRA, 2014).
Para Castro e Ferrari (2016), as técnicas tradicionais de Inteligência Arti�cial
que surgiram na década de 1950 e prevaleceram até a década de 1980
�caram conhecidas como IA clássica e eram essencialmente simbólicas. As
técnicas tradicionais propunham que uma manipulação algorítmica de
estruturas simbólicas (palavras) seria su�ciente para o desenvolvimento de
sistemas inteligentes.
Para Teixeira (2014), no começo dos anos de 1980, se inicia a segunda onda
da Inteligência Arti�cial, denominada de Inteligência Arti�cial conexionista.
Essa onda não teve mais um pensamento de imitação da mente por meio de
símbolos, e sim tratava da criação de um modelo do cérebro, construindo
redes neurais a partir de neurônios arti�ciais.
Redes Neurais Naturais vs. Arti�iciais
Os neurônios arti�ciais, como os neurônios naturais (Figura 3.8), estão
conectados entre si, podendo ser ativados ou inibidos através de conexões,
funcionando como um sistema dinâmico, o qual espalha excitações e
inibições entre os neurônios arti�ciais. Para a onda conectivista, não há
distinção entre mente e cérebro, pois a mente emerge do cérebro e a
inteligência surge do aumento da conectividade entre os neurônios. 
Figura 3.8 - Neurônios naturais 
Fonte: Natalia Romanova / 123RF.
A Figura 3.8 ilustra os neurônios do cérebro humano (redes neurais naturais)
e suas conexões, os quais podem estar em estado ativado ou de inibição.
O sistema nervoso de qual faz parte o cérebro é um conjunto
complexo de células que determinam o funcionamento e o
comportamentos dos seres vivos. Ele está presente em todos os
seres vivos vertebrados e na maioria dos invertebrados. A unidade
fundamental do sistema nervoso é a célula nervosa, o neurônio,
que se distingue de outras células por apresentar excitabilidade,
que lhe permite responder a estímulos internos e externos. Isso
possibilita a transmissão de impulsos nervosos a outros neurônios
e a células musculares e glandulares. (FACELI et al., p. 108)
Para Haykin (2007), o trabalho em redes arti�ciais, usualmente denominadas
de “redes neurais” - ou RNAs, Redes Neurais Arti�ciais -, tem sido motivado
desde o começo pelo reconhecimento de que o cérebro humano se comporta
de forma diferente de um computador digital convencional de processamento
complexo, paralelo, não linear. O cérebro tem a capacidade de organizar os
neurônios de forma a realizar processamento de reconhecimento de padrões,
percepção e controle motor muito mais rapidamente do que um computador
digital de hoje em dia.
Uma rede neural é formada por um conjunto de células nervosas (neurônios)
que conduzem pulsos elétricos ou transmissão de sinais. Sistematicamente, é
considerada unidade de processamento de informação e armazenamento do
conhecimento tácito (experiências). A história da inteligência arti�cial continua
através de pesquisas e avanços sobre as redes neurais e o aperfeiçoamento
dos sistemas inteligentes.
Haykin (2007) comenta que as redes neurais extraem seu poder
computacional através de sua estrutura maciça paralela distribuída e da
habilidade de aprender ou generalizar. O autor comenta, ainda, que
generalizar se refere à capacidade de produzir saídas adequadas para as
entradas que não foram observadas em uma base de dados durante o
treinamento, para, assim, poder realizar a aprendizagem.
As redes neurais estão sendo implementadas de maneira recorrente em
nosso dia a dia. Isso está acontecendo através dos sistemas inteligentes
híbridos, como, por exemplo, na veri�cação de peças defeituosas em uma
linha de produção. Utilizar a visão computacional, uma das áreas de IA que
trabalham com aquisição, processamento e entendimento da imagem, em
conjunto com a implementação dos algoritmos de redes neurais, que
trabalham com aprendizagem para diminuir o defeito das peças, pode
potencializar a inteligência produtiva com qualidade e e�ciência. A rede
neural arti�cial pode descobrir em uma base com milhares de informações
que tipos de padrões de defeitos ocorrem em determinadas peças. Através
dessa classi�cação, é possível fazer com que determinados parâmetros
produtivos (temperatura, corte, componentes, matéria-prima, etc.) sejam
ajustados pela própria máquina inteligente por meio de uma
retroalimentação do sistema.
Neurônio Arti�icial e Redes Neurais
O neurônio arti�cial é um modelo computacional ou unidade fundamental de
uma rede neural arti�cial inspirado em um neurônio biológico. Um neurônio
arti�cial é ilustrado na Figura 3.9, constituído de entradas, pesos, bias, função
de ativação e saída.
Para Castro e Ferrari (2016), Rosenblatt, em 1958, introduziu a primeira rede
neural arti�cial, o Perceptron, como a arquitetura mais básica de uma rede
neural capaz de realizar a classi�cação de padrões linearmente separáveis. O
Perceptron é um conjunto de elementos de uma rede maior neural, com uma
única camada de pesos, ou seja, uma constituição de neurônios ou nós de
entrada e neurônios ou nós de saída, com pesos sinápticos (pesos das
conexões) e bias ajustáveis, como mostra a Figura 3.9.
Portanto, o modelo ou arquitetura de um neurônio Perceptron possui as
entradas à esquerda da Figura 3.10 e constituem o vetor
. Os terminais de entrada são
os pesos sinápticos imitando os dendritos dos neurônios do cérebro humano
(caminhos que transmitem mensagens), representado por w = [
 A segunda �leira é constituída das funções que recebem,
combinam (somatório das entradas) e ponderam
(pesos sinápticos) os valores recebidos pelas entradas. Essa função, segundo
Faceli et al . (2011, p. 111), é denominada de função de ativação, sendo ela
sigmoidal, representa uma aproximação contínua e diferenciável da função
limiar. Essa função é uma soma ponderada de todas as entradas de outros
neurônios que realizaram um disparo.
Figura 3.9 - Neurônio arti�cial 
Fonte: Castro e Ferrari (2016, p. 209).
x  =  [ , ,   … ]x0 x1xm x  =  [ , ,   … ]x0 x1 xm
,   ,  . . .   ]w0 w1 wm .
  =   .  yn ∑
d
j=1 xj wj
A função é dada pela fórmula .
Segundo Faceli et al . (2011, p. 111),
[...] em uma rede neural arti�cial, os neurônios podem estar
dispostos em uma ou mais camadas. Quando duas ou mais
camadas são utilizadas, um neurônio pode receber em seus
terminais de entrada valores de saída de (um ou mais) neurônio(s)
da camada anterior e/ou enviar seu valor de saída para terminais
de entrada de neurônio da camada seguinte.
Essas camadas que recebem esses valores podem ser ilustradas na rede
neural Perceptron Multilayer (MLP) (Figura 3.11), que apresenta uma rede de
3 camadas denominadas de multicamadas.
Coppin (2017, p. 263) também comenta que “a maioria dos problemas da vida
real não é linearmente separável e, embora Perceptron seja um modelo
interessante para estudar como os neurônios arti�ciais podem funcionar, é
necessário alguma coisa com mais capacidade”. O modelo MLP possui a
arquitetura e as características a seguir:
alimentação adiante e recorrente.
  =   .  yn ∑
d
j=1 xj wj
Figura 3.10 - Rede neural de uma camada 
Fonte: Castro e Ferrari (2016, p. 209).
camada de entrada e saída.
camada oculta ou intermediária.
retropropagação.
Vejamos mais detalhes sobre essas características e arquitetura da MLP:
A MLP é uma rede Perceptron com pelo menos uma camada intermediária. A
camada de entrada localiza-se mais à esquerda da rede neural. À primeira
camada de neurônios recebem os valores de entrada e os neurônios da
segunda camada recebem os valores da primeira camada (alimentação
recorrente). A primeira e segunda camadas são denominadas camadas
intermediárias. A terceira camada de neurônios recebem os valores de saída,
denominada de camada de saída.
As redes multicamadas Perceptron, segundo Faceli et al . (2011), utilizam nas
camadas intermediárias funções de ativação não lineares, como a função
sigmoidal. Cada neurônio da rede MLP realiza uma função combinada das
funções da camada anterior. O processamento se torna cada vez mais
complexo quando se avança para as últimas camadas, isso devido à
combinação de funções das camadas anteriores. A Figura 3.12 ilustra o papel
de cada neurônio da rede. A cada camada que avança para dentro da rede
neural, novas classi�cações são realizadas pelas funções de ativação.
Figura 3.11 - Rede neural MLP, Perceptron multicamada 
Fonte: Castro e Ferrari (2016, p. 215).
Figura 3.12 - Papel de cada neurônio nas camadas da rede neural MLP 
Fonte: Faceli (2011, p. 216).
Os neurônios realizam uma classi�cação (reconhecimento), como vimos na
Figura 3.4, aprendendo a classi�car um novo objeto através de uma
aprendizagem supervisionada (rotulando os dados, pré-classi�cados) e,
portanto, sendo uma aprendizagem por conceito e não por hábito. Faceli et al
. (2011) comenta que a rede aprende quando a classi�cação do objeto é
correta e somente se o valor for o mais elevado produzido pela rede, este
gerado pelo neurônio de saída que corresponde à classe correta do objeto.
Caso exista um erro de classi�cação, os pesos são ajustados através de um
método denominado retropropagação, atribuindo responsabilidades aos
diferentes pesos, só assim a rede irá aprender corretamente (melhor
desempenho). Segundo Rezende (2005, p. 158), “o principal objetivo de
aprendizado em redes neurais é a obtenção de modelos de boa capacidade
de generalização tendo como base o conjunto de dados”.
Cada neurônio que é ativado, como em nosso cérebro humano, é uma
pequena unidade de processamento que executa uma classi�cação de
objetos através de pesos (aprendizagem por indução), e cada novo neurônio
executa novas generalizações. A implementação das redes neurais através de
algoritmos possui alta e�ciência para as atividades de classi�cação,
reconhecimento de padrões escondidos em uma base de dados, predições
ocultas, por exemplo, novos clientes, fornecedores e produtos, melhoria em
processos de diagnósticos médicos, predições �nanceiras, identi�cação de
imagens, análise de documentos e muitas outras aplicações.
Veremos agora um laboratório para compreendermos melhor as ferramentas
(algoritmos) e as aplicações das redes neurais arti�ciais.
praticar
Vamos Praticar
O software de mineração de dados inclui formas de inteligência arti�cial, como as
redes neurais. As ferramentas de mineração de dados aplicam algoritmos a
conjuntos de informações para a descoberta de tendências e padrões. Marque a
alternativa correta que apresenta características relacionadas aos algoritmos
conexionistas RNAs.
a) Utiliza classi�cadores em forma de árvores.
b) Busca relações de co-ocorrência.
c) Baseados em redes de unidades interconectadas.
d) Baseados em estimação probabilística.
e) Utiliza um conjunto de regras prede�nidas.
As aplicações de redes neurais arti�ciais são vastas e podem ser aplicadas
através de sistemas computacionais e robôs na produção de produtos, na
medicina, na agricultura, nos investimentos, na segurança das cidades, ou
seja, as redes neurais são implementadas para que as máquinas realizem as
mais diversas tarefas automatizadas de maneira inteligente.
Para Lucas (2006, p. 269-270),
[...] as redes neurais provaram ser bastantes robustas em
problemas de classi�cação. Suponha que sua �rma queira
classi�car novos clientes em 3 tipos: os que provavelmente pagam
suas contas em dia, os que podem levar de três a seis meses e
provavelmente os que não pagarão. Você poderia projetar uma
rede neural para tentar classi�car potenciais clientes. A entrada
para a rede seriam as informações sobre o cliente, e a saída seria
uma classi�cação em um dos quatro grupos correspondentes à
categoria de probabilidades de pagamento.
Redes Neurais eRedes Neurais e
AplicaçõesAplicações
Contudo, nesse exemplo dado por Lucas (2006), é necessário realizar a
elaboração de uma rede neural Perceptron multicamadas (3 camadas por
exemplo), de alimentação para frente e realizar seu treinamento. Para treinar
a rede, o processo deve ser realizado no sentido de trás para a frente
ajustando os pesos através de dados históricos. Somente assim, a rede irá
aprender e obter o melhor desempenho. A tarefa de
classi�cação/reconhecimento é realizada através do modelo preditivo, como
vimos anteriormente na Figura 3.5.
A Figura 3.13 mostra uma rede de neurônios treinada, onde as �guras
geométricas são representações de informações já classi�cadas (base
treinada). Nesse sentido, a estrutura da rede neural pode ser constituída de
diversos algoritmos, um deles é o de treinamento. Para Rezende (2005, p.
158), “o objetivo dos algoritmos de treinamento deve se o de aproximar as
funções geradoras [...] dos dados e não simplesmente o de minimizar o erro
do conjunto de treinamento”.
Figura 3.13 - Rede neural MLP com input para classi�cação do padrão e base
de treino já classi�cada 
Fonte: Elaborada pelo autor.
O input de um objeto é feito na entrada da primeira camada e será
classi�cado pela rede neural, gerando o resultado da classi�cação.
Vejamos agora como as redes neurais podem ser implementadas para a
realização de aplicações inteligentes.
Laboratório: Ferramentas
As ferramentas que implementam as Redes Neurais Arti�ciais (RNAs) são os
algoritmos que podem ser pseudocódigos de treinamento e execução de uma
rede neural ou softwares que implementam esses algoritmos. Todos os
algoritmos compilados para as máquinas e os computadores são combinados
com outras ferramentas de IA.
Dentro da área de automação e controle, por exemplo, as redes neurais com
a combinação de ferramentas de sensoriamento e interfaceamento podem
alcançar desempenhos satisfatórios como uma máquina inteligente. Já que a
autonomia é um objetivo importante dos projetistas de sistemas de controle,
no caso os controladores inteligentes (HAYKIN, 2007).
Uma ferramenta inteligente híbrida surpreendente na área de automação e
controle é a combinação da lógica nebulosa (sistemas difusos) com as redes
neurais. Enquantoa lógica nebulosa, baseada em regras, quanti�ca as
entradas linguísticas e fornece aproximação operacional para as regras de
entrada dos sistemas, a lógica neural está na habilidade de aprender com os
dados. Assim, temos uma máquina inteligente.
A Figura 3.13 ilustra um exemplo de automação e controle em uma indústria.
Com a combinação da lógica nebulosa (precisão), da robótica (automação e
controle), do sensoriamento e da identi�cação de imagens (visão
computacional) e da rede neural (aprendizado), a industrialização se torna
mais precisa e autoajustável, obtendo um melhor desempenho e uma
qualidade produtiva.
Vimos que as redes neurais podem ser implementadas em conjunto com
outras tecnologias de Inteligência Arti�cial, como sistemas especialistas, visão
computacional e outras, formando uma inteligência híbrida para potencializar
as tarefas das máquinas. Vejamos agora uma maior gama dos cenários onde
são aplicadas as redes neurais arti�ciais.
Exemplos de Aplicações
As aplicações das redes neurais arti�ciais estão crescendo no nosso dia a dia.
Além da automação e do controle inteligente, as RNAs são implementadas
onde for necessário o aprendizado. Como, por exemplo, na IoT (Internet das
Coisas), na Segurança da Informação, na Medicina, na Agronomia e outras.
Redes Neurais na IoT
Para Silva et al . (2019, p. 156), as redes neurais são aplicadas nas IoT (Internet
das Coisas, IoT - Internet of Things) ou a “comunicação entre coisas”, sendo
um conceito bastante útil, isso porque permite que uma rede de pequenos
dispositivos seja capaz de interagir de forma descentralizada, processando as
informações de cada elemento na nuvem, e os dados são processados pelo
Figura 3.14 - Redes neurais e lógica nebulosa combinadas na automação e no
controle industrial 
Fonte: Wklzzz / 123RF.
conjunto de operações efetuadas por cada dispositivo. Essa rede se aproxima
muito da rede de neurônios.
Através de um smartphone, é possível controlar e receber informações dos
diversos equipamentos e objetos de uma casa, escritório ou de um veículo.
Em uma casa (Figura 3.14), é possível acionar as luzes intensi�cando-as ou
não, nos diversos ambientes da residência ou ainda veri�car e comparar o
consumo de energia com os meses anteriores. Também é possível acionar os
diversos pontos de luzes em modos diferenciados, modo equilíbrio, alta
energia, econômico, etc., como em um ar-condicionado, um exaustor para
cozinha, em uma TV smart, em uma torneira de água quente, em um chuveiro
elétrico ou até preparar o seu banho de maneira e�ciente veri�cando a
temperatura do ambiente através de sensores instalados no banheiro. A
automação e o controle inteligente são características da subárea do
planejamento, da robótica e das redes neurais.
Figura 3.15 - Redes neurais aplicados na IoTl 
Fonte: Cheskyw /123RF.
No cenário industrial, a Internet das Coisas está relacionada com o
desenvolvimento das plataformas industriais que, a partir dos dados
coletados, podem obter e�ciência energética, redução de perdas,
manutenção preventiva (planejamento) e preditiva (comparativa), o que antes,
em termos de diagnósticos precoces, seriam inacessíveis (SILVA, 2018).
Redes Neurais na Segurança da Informação
Já a questão da garantia da segurança da informação nas plataformas
industriais e nos sistemas de informações é um aspecto vital nessa nova
saiba mais
Saiba mais
Atualmente, a aprendizagem de máquina
(AM), também denominada de segunda onda
de IA, é uma área de pesquisa que visa
desenvolver programas capazes de
automaticamente melhorar seu desempenho
por meio da experiência. A área de AM está
baseada em conceitos e resultados de muitas
outras áreas, como estatística, inteligência
arti�cial, �loso�a, teoria da informação,
biologia, ciências cognitivas, complexidade
computacional e teoria de controle. O link
abaixo apresenta a aplicação da Inteligência
Arti�cial, através de material cientí�co de
Ricardo Torre Bispo, da Universidade de
Brasília (2018), onde modelos de
aprendizado profundo realizam a detecção
de planetas extrassolares. Através dos
algoritmos de aprendizagem de máquina, é
possível fazer com que as máquinas
aprendam com os dados e façam previsões
classi�cando milhões de dados de maneira
e�ciente e com alta velocidade.
ACESSAR
http://bdm.unb.br/handle/10483/2244
abordagem da Internet das Coisas, ou seja, de nada serve capturar todos os
dados, nos quais os IoTs realizam bem, se houver falhas na transmissão,
roubos na informação, envio de informação errada ou inadequada na
aplicação.
A Inteligência Arti�cial, através das redes neurais arti�ciais, pode atuar na
análise de informações incompatíveis com padrões prede�nidos como
aceitáveis em termos de segurança da informação. Tais padrões aceitáveis
correspondem às boas práticas de segurança. Algumas dessas práticas
de�nidas pelos especialistas são: a veri�cação da proteção em sistemas
distribuídos, de�nição e aplicação de políticas claras assegurando que cada
ponto em estruturas distribuídas esteja seguro e tenha controle contínuo de
acesso; garantia de integridade das informações armazenada nos bancos de
dados relacionais; proteção do armazenamento de dados e dos registros de
logs dos bancos de dados; utilização de monitoramento e conformidade em
tempo real para evitar a entrada de dados falsos; de�nição clara dos direitos e
dos deveres de cada usuário, tendo, assim, permissões especí�cas de acesso
e de como realizar o seu trabalho; utilização de criptogra�a (chaves públicas e
privadas); controle de acesso granular para cada usuário; realização de
auditorias granulares e protegidas dos dados e, ainda, a veri�cação da origem
dos dados para assegurar a e�ciência do processo de segurança da
informação (SILVA, 2018).
O aprendizado de máquina é um dos direcionamentos para a identi�cação e
respostas a incidentes, criando um cenário complexo de informações do
ambiente vulnerável. Através da identi�cação de padrões, caso esses padrões
não sejam aceitáveis com as práticas ou as políticas de segurança da
informação, o sistema pode operacionalizar ações preventivas (aprendendo
com o cenário) e corretivas.
Redes Neurais na Medicina
Silva et al . (2019) comentam que na medicina as RNAs têm sido aproveitadas
para o processamento de imagens, onde, através da capacidade da rede de
aprender sozinha, é possível um reconhecimento de padrões de imagens
onde a ciência não tenha conhecimento.
As redes neurais podem ser treinadas para varrer enormes bases de dados de
imagens, como exames de ressonância magnética, tomogra�a e sequências
de DNA, e buscar respostas ou encontrar irregularidades. A Figura 3.15 ilustra
a aplicação da ressonância magnética, quando usada com as RNAs, pode
construir imagens em um espaço menor de tempo, através de um
entendimento da relação espaçotemporal de uma sequência de imagens
(Silva et al ., 2019).
En�m, as redes neurais, combinadas com outras áreas da Inteligência
Arti�cial, potencializam as aplicações através de um raciocínio indutivo,
compreendendo e aprendendo novos padrões, criando máquinas inteligentes
para o benefício da humanidade.
praticar
Vamos Praticar
Figura 3.16 - Redes neurais aplicados na medicina 
Fonte: Aurielaki / 123RF.
A automação e o controle inteligente são características da subárea do
planejamento, da robótica, da lógica nebulosa e das redes neurais da inteligência
arti�cial. No cenário industrial, a Internet das Coisas está relacionada ao
desenvolvimento de:
a) Bases de dados especialistas.
b) Processamento de exames de ressonância magnética.
c) Processamento em sequências de DNA.
d) Virtualização de sistemas.
e) Plataformas industriais para a manutenção preventiva e preditiva.
indicações
Material
Complementar
LIVRO
Inteligência Arti�icial
Fabricio M. da Silva e colaboradores
Editora: SAGAH
Ano: 2019
Comentário: Uma ótima leitura complementar sobre o
aprendizado de máquina através das redes neurais
arti�ciais, apresentando os algoritmosneurais e suas
aplicações. A obra traz re�exões sobre o tema de
aprendizagem de máquina inteligente.
FILME
Chappie
Ano: 2015
Comentário: O �lme mostra a aplicação da Inteligência
Arti�cial em um robô pensante chamado Chappie. O
�lme foi produzido em 2015, algo não tão distante do
que está acontecendo com alguns humanoides
construídos na atualidade. Chappie apresenta uma
evolução em aprendizagem de máquina que
impressiona e ao mesmo tempo preocupa alguns que
são contra a evolução das máquinas inteligentes. Para
conhecer mais sobre o �lme, assista ao seu trailer
disponível em:
TRA ILER
conclusão
Conclusão
Podemos resumir nosso estudo em quatro partes: o que é a aprendizagem de
máquina, a aplicação do aprendizado por classi�cação e o estudo das redes
neurais, e suas aplicações. Na parte do aprendizado de máquina,
compreendemos que a maioria dos problemas de aprendizagem é resolvida
pelo método indutivo. Vimos também que as máquinas podem aprender
pelos hábitos e por conceito. Pelo hábito aprendem através de tarefas ou
comportamentos permanentes, frequentes ou costumeiros. Já a
aprendizagem por conceito envolve mapear corretamente um conjunto de
dados de treinamento em classi�cações, então também conseguirá mapear
dados não observados anteriormente. No estudo das redes neurais, vimos
que as máquinas aprendem e se modi�cam para se adaptar às contingências
do mundo em que habitam.
referências
Referências
Bibliográ�cas
AMARAL, F. Introdução a ciência de dados : mineração de dados e Big Data.
Rio de Janeiro: Alta Books, 2016.
BALTZAN, P.; PHILLIPS, A. Sistemas de informação . São Paulo: Bookman,
2012.
BARTH, N. L. Inadimplência : construção de modelos de previsão. São Paulo:
Nobel, 2004.
BELMIRO, N. J. Informática aplicada . São Paulo: Pearson Educação do Brasil,
2014.
BENGFORT, B.; KIM, J. Analítica de dados com Hadoop : uma introdução para
cientistas de dados. São Paulo: Novatec, 2016.
CASTRO, L. N.; FERRARI, D. G. Introdução à Mineração de Dados . São Paulo:
Saraiva, 2016.
COPPIN, B. Inteligência Arti�cial . Rio de Janeiro: LTC, 2017.
FACELI, K. et al . Inteligência Arti�cial : uma abordagem de aprendizado de
máquina. Rio de Janeiro: LTC, 2011.
FAWCETT, T.; PROVOST, F. Data Science para negócios : o que você precisa
saber sobre mineração de dados e pensamento analítico de dados. Rio de
Janeiro: AltaBooks, 2018.
HAYKIN, S. Redes neurais: princípios e prática. 2. ed. Porto Alegre: Bookman,
2007.
LUCAS, H. C. Tecnologia da Informação : tomada de decisão estratégica para
administradores. Rio de Janeiro: LTC, 2006.
LUGER, G. F. Inteligência arti�cial . 6. ed. São Paulo: Pearson Education do
Brasil, 2013.
REZENDE, S. O. Sistemas inteligentes : fundamentos e aplicações. São Paulo:
Manole, 2005.
SIEGEL, E. Análise preditiva : o poder de prever quem vai clicar, comprar,
mentir ou morrer. Rio de Janeiro: Alta Books, 2017.
SILVA, F. et. al . Inteligência Arti�cial . Porto Alegre: SAGH, 2019.
SILVA, J. R. A. E. Gestão de Negócios : planejamento e organização para a
indústria. São Paulo: Érica, 2018.
TEIXEIRA, J. F. Inteligência Arti�cial . São Paulo: Editora Paulus, 2014.
VIEIRA, E. M. A. et al .   Avaliação de Performance do Algoritmo J48 para a
construção de modelos baseados em árvores de decisão. Revista brasileira
de computação aplicada, Paraíba, v. 10, n. 2, p. 80-90, 2018.

Continue navegando