Modulo1 - MODELOS DE APRENDIZADO DE MAQUINA

•

FMU

Carolina Rivera

14/06/2022

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 26 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 26 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 26 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Aprendizado de Máquina

291 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina
https://ambienteacademico.com.br/course/view.php?id=12373 1/26
MODELOS DE APRENDIZADOMODELOS DE APRENDIZADO
DE MÁQUINA DE MÁQUINA
UNIDADE 1 – INTRODUÇÃO ÀUNIDADE 1 – INTRODUÇÃO À
APRENDIZAGEM DE MÁQUINA APRENDIZAGEM DE MÁQUINA
Autora: Stella Marys Dornelas Lamounier Autora: Stella Marys Dornelas Lamounier
Revisor: Fernando Esquirio Torres Revisor: Fernando Esquirio Torres
INICIAR
Introdução
O aprendizado de máquina se tornou um dos modelos de sistema computacionais com melhores resultados, estando
disperso pela maioria das áreas do conhecimento. Problemas complexos que antes eram impossíveis de se resolver
utilizando sistemas comuns agora são resolvidos com o surgimento de sistemas inteligentes. Isso porque o
aprendizado de uma máquina reproduz, por meio de técnicas e algoritmos que imitam o conhecimento humano,
análises de dados que são gerados a todo momento. Esses sistemas são capazes de reconhecer imagens, falas,
auxiliar médicos em diagnósticos e tratamentos e até identificar SPAM e transações bancárias legais ou fraudulentas.
Os modelos de aprendizado mais utilizados são o supervisionado e o não supervisionado. O primeiro é utilizado
quando já temos os rótulos de dados estabelecidos, ou seja, o conjunto de dados é previamente conhecido. São
divididos em modelos de classificação e regressão.
Já no aprendizado não supervisionado não existem dados a priori, ou seja, o sistema analisa os dados a partir de
similaridades ou com objetivos semelhantes no conjunto. Esses dados, então, são separados em grupos divididos
em, modelos de agrupamento e associação.
Não podemos deixar de citar o aprendizado semissupervisionado, que engloba técnicas dos dois modelos anteriores,
isto é, pode utilizar dados rotulados e não rotulados, tendo, como objetivo, uma melhor acurácia por poder misturar
estes dois tipos de dados. Ainda podemos contar com a aprendizagem por reforço: muito diferente de todos os
modelos citados, essa técnica não utiliza nenhum conjunto de treinamento, seja rotulado ou não. A máquina utiliza o
processo de tentativa e erro para encontrar a solução do problema, recebendo recompensas e penalidades para
executar uma determinada ação.
27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina
https://ambienteacademico.com.br/course/view.php?id=12373 2/26
1.1 Aprendizagem de máquina – visão geral
Não se pode falar de aprendizado de máquina sem antes citar a inteligência artificial, campo da ciência da
computação que estuda e constrói sistemas inteligentes, máquinas automatizadas que imitam o conhecimento
humano para desempenhar tarefas ou resolver problemas complexos (RUSSEL; NORVIG, 2013).
A inteligência artificial (IA) surgiu por volta da década de 1950, como uma das áreas mais importantes do meio
tecnológico para a humanidade. Com o avanço das tecnologias, na época, a expectativa era que chegaríamos a um
patamar tecnológico que nenhuma máquina havia chegado. No entanto, houve uma série de fracassos e decepções
nos projetos que envolviam a IA, mas, mesmo assim, outros campos da ciência da computação evoluíram, como por
exemplo a engenharia de software, bancos de dados e processamento compartilhado. Nesse ínterim, é possível
afirmar que a IA representa o auge da tecnologia computacional, com diferentes características cada uma de acordo
com a forma com a qual se abordam as questões de inteligência ou o problema a ser solucionado (MEDEIROS,
2018).
Portanto, é preciso saber a definição adequada do termo aprendizado em sistemas inteligentes, que segundo Mendel
e McLaren (1994, p. 287), é:
Inteligência Artificial
» Clique nas abas para saber mais sobre o assunto
De acordo com Luger (2013), duas preocupações ainda norteiam os pesquisadores em IA: a representação do
conhecimento e a busca . A primeira trata como capturar a linguagem formal, isso é, a linguagem adequada para
ser manipulada pelo computador, formular resposta para as seguintes perguntas: como será representado o
conhecimento humano? Como programas inteligentes devem representar conhecimento? A busca é a solução ótima
do problema, quais estágios sucessivos e alternativos devem ser seguidos para a resolução do problema, como por
exemplo, diferentes configurações do tabuleiro em um jogo de xadrez.
Segundo Mehta (2017) e Barnes (2015), a IA possui seis campos do saber:
Processamento de linguagem natural;
Representação de conhecimento;
Raciocínio automatizado;
Aprendizado de máquina;
Visão computacional;
Robótica.
Aprendizado é o processo pelo qual um sistema inteligente é adaptado através do estímulo do
ambiente no qual está inserido. O tipo de aprendizado é determinado pela maneira através da
qual esta adaptação é realizada.
1950 1980 2010
27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina
https://ambienteacademico.com.br/course/view.php?id=12373 3/26
O aprendizado de máquina é uma área da IA em que os algoritmos são capazes de aprender, a partir de conjuntos
de dados, modelos de aprendizagem e análises anteriores para prever resultados, tendências e padrões. Nesse
sentido, Faceli et al. (2015) destacam que:
O aprendizado de máquina ( Machine Learning ) é uma das ferramentas tecnológicas mais discutidas nos tempos
atuais. Os sistemas dotados desse tipo de tecnologia têm auxiliado empresas no processo de tomada de decisões,
por meio da construção de sistemas capazes de auxiliar gestores e demais profissionais de modo automatizado. São
sistemas capazes de tomar decisões baseadas em informações anteriores, ou seja, experiências já adquiridas por
soluções bem-sucedidas de problemas ocorridos anteriormente (BRINK e RICHARDS, 2016).
Cada vez mais esse termo ganha espaço nas organizações, embora não seja um método totalmente novo no
mercado. O termo surgiu no final da década de 1950, com o engenheiro Arthur Samuel, do Instituto de Tecnologia de
Massachusetts (MIT), que popularizou o termo Machine Learning , que ele descrevia como um campo de estudo que
dá aos computadores a habilidade de aprender sem terem sido programados para isso um sistema de computador
capaz de jogar damas com um humano. O sistema analisava cada movimento do jogo e aprendia com os erros e
acertos do adversário humano, assim, a cada partida jogada, o computador conseguia prever, com precisão, quais
seriam as melhores jogadas a serem feitas (AL MAYAHI; AL-BAHRI, 2020).
Entretanto, sua popularização só tomou força devido ao grande volume de dados gerados pelas organizações depois
da popularização da internet. Além disso, o melhoramento tecnológico de hardware potencializou ainda mais o
desenvolvimento da aprendizagem de máquina. Esse último elemento (potência) proporcionou maior acesso a
ferramentas de Machine Learning, devido à diminuição do preço dos hardwares que suportavam efetivamente essas
atividades tecnológicas. Atualmente, é possível processar enormes quantidades de dados com um baixo custo de
operação (MARQUES, 2017).
Embora muitos algoritmos de aprendizado de máquina já existam há muito tempo, é importante entender o
processamento e a funcionalidade de cada um, sua capacidade de processar dados e o modelo adotado para, assim,
escolher o modelo que deve se adaptar melhor quando um enorme volume de dados chegar. Assim, o modelo
Em Aprendizado de Máquina, computadores são programados para aprender com a
experiência passada. Para tal, empregam um princípio denominado indução, no qual se obtêm
conclusões genéricas a partir de um conjunto particular de exemplos. Assim, algoritmos de
Aprendizado de Máquina aprendem a induzir uma função ou hipótese capaz de resolver um
problema a partir de dados que representam instâncias do problema a ser resolvido (FACELI
et al., 2015, p. 3).
VOCÊ SABIA?
O termo aprendizado de máquina é frequentemente confundido com inteligência artificial? A IA é a ciência e a
engenharia de criar máquinas inteligentes, especialmente programas de computador inteligentes e o aprendizado de
máquina (ML) pode ser definidocomo um modo de implementar a inteligência artificial. Semelhante a IA, o
aprendizado de máquina é um ramo da ciência da computação que desenvolve ou estuda o design de algoritmos.
Em resumo, a IA é uma grande área que contempla o aprendizado de máquina, o aprendizado profundo e a ciência
de dados, responsável pela análise e a manipulação de conjuntos de dados (DIAS, 2019).
27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina
https://ambienteacademico.com.br/course/view.php?id=12373 4/26
escolhido deve ser capaz de se ajustar por meio de treinamento e com a entrada de mais novos dados quando a
primeira resposta não for a desejada (SAS, 2019).
Os sistemas de aprendizado de máquina são, sem dúvida, ferramentas crescentes que já fazem parte do nosso
cotidiano e nos ajudam a encontrar insights e padrões valiosos nos dados, detalhes que não seriam identificados por
métodos tradicionais. No mundo real, essas técnicas oferecem um modo de identificar tendências, prever
comportamentos e fazer recomendações baseadas em fatos e aplicações de gestão. Ajudam, também, na criação de
mecanismos de segurança, carros autônomos, campanhas de marketing (BRINK; RICHARDS, 2016). A Figura 1
mostra um modelo de carro autônomo, do grupo Google, capaz de transportar pessoas sem a presença de
motoristas (AGRELA, 2019).
Figura 1 – Carro autômato Waymo.
Fonte: AGRELA, 2019.
Outro segmento que aplica aprendizado de máquina é o setor de negócios, desde a detecção de fraudes,
direcionamento ao cliente e recomendação de produto, até o monitoramento industrial em tempo real, a análise de
sentimento e o diagnóstico médico. Os sistemas inteligentes são capazes de resolver problemas que não podem
ser gerenciados manualmente, devido à grande quantidade de dados gerados simultaneamente, e que devem ser
processados de modo ágil e assertivo. A técnica pode encontrar relacionamentos entre dados tão sutis que nenhum
meio manual os descobriria; e quando muitos desses relacionamentos “fracos” são combinados, eles se tornam
#PraCegoVer : fotografia mostrando um carro autônomo. No centro da imagem há um carro
branco, modelo sedan, de frente, com a lateral direita visível, com vidros escuros e uma faixa
azul e preta na parte inferior do carro. Na porta traseira, na parte inferior, há uma logomarca,
um W azul e, embaixo, em preto, o nome do carro, Waymo. Há um dispositivo sobre o teto do
carro, composto por uma base branca e uma estrutura em formato de domo preta, que é um
dos sensores utilizados para captação de dados do sistema autônomo. Ele trafega na pista
central de uma avenida de três pistas, em que não há outros carros. Ao fundo, vê-se uma
série de prédios clássicos e uma fileira de quatro árvores pequenas com cerca de meio metro
de distância entre uma e outra. Pode-se observar, atrás da quarta árvore, no sentindo
contrário ao do carro, duas pessoas caminhando na calçada.
27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina
https://ambienteacademico.com.br/course/view.php?id=12373 5/26
fortes preditores.
Assim, o processo de aprender com os dados e, subsequentemente, usar o conhecimento adquirido para informar as
decisões futuras é extremamente poderoso. Neste contexto, o aprendizado de máquina está se tornando
rapidamente o motor que impulsiona a economia moderna, já que ela é baseada em dados.
Basicamente, a Aprendizagem de Máquina é dividida em cinco etapas: Aquisição de dados, Construção de modelo,
Análise, Otimização e Predição. A partir de um conjunto de dados escolhido, é possível chegar a uma resposta
desejada por meio de um minucioso treinamento do conjunto de dados apresentado, embora se deva levar em conta
a avaliação de um método eficaz, que se adapte por quantas vezes forem necessárias à busca das resoluções de
problemas complexos (BRINK; RICHARDS, 2016). Ainda, de acordo com Brink e Richards (2016), as etapas
mencionadas acima podem ser revistas várias vezes, até que atinjam um resultado que esteja de acordo com o
planejado para uma tomada de decisão. O Infográfico 1 relata o ciclo de aprendizado de máquina de modo
detalhado.
Infográfico 1 – Fluxo de trabalho de aprendizado de máquina adaptado
Fonte: BRINK; RICHARDS, 2016, p. 106 (Adaptado).
#PraCegoVer : diagrama. Trata-se de um fluxograma que relata o fluxo de trabalho do
aprendizado de máquina em cinco etapas, desde a concepção dos dados até o modelo
satisfatório sendo aplicado. No topo do fluxograma, temos um retângulo com o termo
aquisição de dados. Em seguida, uma seta para baixo apontando para o próximo tópico, um
retângulo verde, escrito engenharia de características. Em seguida, uma seta para baixo
aponta para um retângulo cinza claro que engloba um ciclo de três retângulos mais finos em
azul, em que consta um primeiro retângulo centralizado, na parte de cima do retângulo maior,
com o termo construção de modelos, ligado por uma seta para baixo e para a esquerda ao
segundo retângulo com o termo aquisição do modelo, que tem uma seta direcionada para a
27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina
https://ambienteacademico.com.br/course/view.php?id=12373 6/26
O ciclo de trabalho em Aprendizado de Máquina é muito utilizado na resolução de problemas complexos, sendo
iniciado na avaliação e na construção do método desejado até chegar no modelo apropriado. A primeira tarefa é a
aquisição dos dados . Deve-se tomar muito cuidado com o tipo de dados proposto (como dado ordinal, categórico,
numérico, desordenado etc.) para que seja apresentado um bom resultado ao final do método escolhido.
Posteriormente, é utilizado o processo de engenharia de características , que representa todo um conjunto de
informações sobre os dados brutos para que estejam sempre mais perto do mundo real, melhorando manualmente
os dados de entrada que jamais foram trabalhados em dados que pudessem representar o modelo preditivo
(BROWNLEE, 2014).
Na parte da construção do modelo , são usados modelos matemáticos e de máquinas em busca de encontrar
relacionamentos no conjunto de dados. Após sua construção, é necessário realizar a testagem dos dados, medir sua
performance e níveis de precisão, escolhendo a métrica que se adapte ao modelo escolhido. Tem-se, como objetivo,
avaliar a coesão dentro e fora dos grupos criados. Este processo é realizado pelas tarefas de Avaliação e
Otimização de Modelos (SCIKIT-LEARN, 2014).
Nesse contexto, é constatado que o modelo construído pode ser repetido quantas vezes for necessário, até que o
resultado esteja de acordo com a resposta desejada. Dependendo do conjunto de dados, todas as etapas podem ser
revistas desde a primeira etapa do ciclo – a aquisição de novos dados – passando, posteriormente, para engenharia
de característica.
Assim, ao obter o resultado, é possível realizar a análise de desempenho das predições por meio do processamento
de dados anteriores. Os novos dados, então, podem ajudar a melhorar o desempenho, em se tratando de atingir a
métrica desejada (DE LIMA, 2014).
1.2 Uso de técnica de aprendizagem de máquina
Sabemos que o aprendizado de máquina é uma ferramenta poderosa para a aquisição de conhecimento e resultados
satisfatórios, mas por si só não é possível aplicar técnicas sobre uma massa de dados em seu formato original,
devido às diferentes características, dimensões e formatos que esses dados podem apresentar. Desse modo, é
necessário realizar a retirada de dados antes mesmo de iniciar o seu processamento, ou seja, tratar dados que
possam prejudicar o resultado esperado, como dados faltosos, inconsistentes ou ruidosos, sendo necessário aplicar
técnicas na base de dados.
Após a análise dos dados, deve-se também observar que o aprendizado de máquina não apresenta apenas um
algoritmo, e sim uma infinidade de modelos com características distintas e singulares. Nesse sentido, é importante
compreender o funcionamento da técnica e suas limitações através do conhecimento metodológico que cada uma
direita, para o terceiro retângulo, onde se lê otimização de modelos,que consequentemente,
para fechar o ciclo tem uma seta para cima e para a esquerda, apontando para o primeiro
retângulo, construção de modelos. Fora do retângulo maior, cinza claro, à esquerda, tem-se
uma seta para cima, apontando para ele, vinda de um retângulo verde, em que consta o termo
engenharia de características, que é seguido de uma seta para cima, vinda de um retângulo
verde alinhado abaixo, com o termo, novos dados. Ainda abaixo do retângulo cinza claro
maior, tem-se à direita uma seta para baixo apontando para um retângulo verde com o termo
predições, que está alinhado ao retângulo verde de engenharia de características.
27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina
https://ambienteacademico.com.br/course/view.php?id=12373 7/26
apresenta. Assim, serão apresentados algoritmos e técnicas que permitam ao usuário escolher o melhor modelo para
a resolução dos seus problemas (BARRETO, 2018).
Antes de demonstrar os principais algoritmos, entretanto, é necessário conhecer alguns conceitos que norteiam
esses modelos, segundo as definições de Monard (2003).
Conceitos importantes do aprendizado de máquina
ITEM CONCEITOS
PADRÃO
É um conjunto de padrões que têm características
similares entre si.
ATRIBUTO
Consiste em um objeto, processo, evento ou
entidade que pode ter um nome.
CLASSE
São as características de um dado ou aspecto dos
dados que podem ser divididos entre nominal e
contínuo. O primeiro não possui ordem de valor,
apenas características, e o último existe em uma
forma linear, como por exemplo, elemento do
conjunto de números reais.
CLASSIFICAÇÃO
Consiste em agrupar os dados em classes, ou seja,
identificar a qual classe pertence uma determinada
amostra de dados.
RUÍDO
É imperfeição, distorção ou imprecisão dos dados.
Ocorre, na maioria das vezes, durante a extração dos
dados.
CLASSIFICADORES
São usados na classificação dos dados e
descobrimento de padrões por meio de suas
características.
OVERFITTING
Sobreajuste dos dados, ou excesso de ajuste dos
dados. Ocorre quando o modelo utilizado foi ajustado
perfeitamente e se adaptou tão bem que o modelo
decorou o conjunto de dados treino, mas não
consegue diferenciar os dados quando chegarem
novos dados de testes.
27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina
https://ambienteacademico.com.br/course/view.php?id=12373 8/26
UNDERFITTING
Ao contrário do overfitting, o termo quer dizer que o
desempenho do modelo já apresenta problemas no
próprio treinamento. Não consegue encontrar as
relações entre varáveis e teste, sendo o modelo de
conjunto de dados descartado.
Fonte: ONARD; BARANAUSKAS, 2003. (Adaptado).
1.3 Tipos de algoritmos
Após o conhecimento dos principais conceitos que norteiam o aprendizado de máquina, os cards a seguir
apresentam os tipos de aprendizagem.
Tipos de aprendizagem
» Clique nas setas ou arraste para visualizar o conteúdo
Desse modo, entende-se que a aprendizagem indutiva possui duas divisões: os modelos de aprendizado de máquina
supervisionado e os de aprendizado não supervisionado. O primeiro modelo é dividido em algoritmo de
classificação e regressão , enquanto o segundo é dividido em algoritmos de agrupamento e associação . Essa
hierarquia está representada no Diagrama 1.
Diagrama 1 – Tipos de aprendizagem de máquina
É o tipo de aprendizado que se encontra no topo dos modelos, engloba as técnicas de aprendizado
supervisionado e não supervisionado.
APRENDIZADO SUPERVISIONADO
Quando o conjunto de dados já é previamente conhecido e que existe uma relação entre os dados
de entrada e saída, este modelo é dividido em classificação e regressão.
APRENDIZADO NÃO SUPERVISIONADO
Quando não existe um conjunto de dados a priori, isso é, ainda não se tem uma ideia de como o
resultado vai se apresentar, pois os rótulos ainda são desconhecidos. São divididos em modelos de
agrupamento e associação.
27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina
https://ambienteacademico.com.br/course/view.php?id=12373 9/26
Fonte: MONARD; BARANAUSKAS, 2003, p. 41. (Adaptado).
Sistemas de computação que utilizam a aprendizagem indutiva são capazes de prover melhores desempenhos em
técnicas de programação do que softwares convencionais por meio de suas regras e produções semânticas, pois
possuem habilidades para a geração de aprendizado por indução, promovendo a transferência de conhecimento do
especialista para a máquina. Exemplos disso são diagnósticos de doenças em plantações de soja ou a aquisição de
regras para um jogo de xadrez. O Quadro 1 exemplifica os principais algoritmos de acordo com sua técnica.
Quadro 1 – Principais algoritmos utilizados no aprendizado de máquina
CLASSIFICAÇÃO
Regressão linear
SUPERVISIONADOS NÃO SUPERVISIONADOS
REGRESSÃO AGRUPAMENTO ASSOCIAÇÃO
Apriori
Random Forest Partition
Regressão logística
LS-SVM: Least-squares
Eclat
FP Growth
#PraCegoVer : diagrama ilustrando a hierarquia do aprendizado de máquina. No topo, ao
centro do diagrama, temos um retângulo azul com o termo o aprendizado indutivo. Em
seguida, para baixo há uma linha ligando dois novos retângulos amarelos, um à esquerda
com o termo aprendizado supervisionado, e o outro à direita, com o termo aprendizado não
supervisionado. Há um terceiro nível nesse diagrama. Sendo que abaixo de aprendizado
supervisionado, tem uma linha ligando dois retângulos verdes, no primeiro à esquerda,
indica-se classificação e o segundo, à direita, regressão. Alinhado a eles, mais dois
retângulos também em verde, estão ligados ao aprendizado não supervisionado, sendo que o
primeiro, à esquerda, está escrito agrupamento, e o segundo, à direita, está escrito
associação.
KNN (K-Nearest
Neighbors)
Redes neurais artificiais
Naive Bayes
SVM: Support Vector
k-medoid
k-means
Bisecting k means
27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina
https://ambienteacademico.com.br/course/view.php?id=12373 10/26
support vector machine
FP-Growth
Fonte: Elaborado pela autora, 2020.
1.3.1 Supervisionado
Em modelos de algoritmos supervisionados, os dados de entrada já estão previamente rotulados, isto é, os atributos
de entrada e saída já são conhecidos. Busca-se, portanto, a partir desses conjuntos de dados já conhecidos, prever
resultados mais exatos em relação à predição de valores para novos dados (BRINK; RICHARDS, 2016).
Sobre o modelo supervisionado, Neves et al. (2018) indicam que:
Segundo Carvalho (2014, p. 34-35), no algoritmo supervisionado, exemplos já classificados pelo usuário são levados
em consideração para encontrar um modelo capaz de classificar novos conjuntos de dados, a partir do aprendizado
obtido com o conjunto de dados de treinamento. É importante que esses dados de treinamento sejam de qualidade,
ou seja, que não sejam dados duplicados, faltantes ou inconsistentes, para que não ocorram erros na classificação
dos novos conjuntos, utilizando modelos que possam predizer novos padrões de modo efetivo.
Ainda, de acordo com Silva (2018), o conceito de aprendizado supervisionado é:
Segundo Amaral (2016), modelos de aprendizado supervisionados são divididos em modelos de classificação e
regressão. Os de classificação são modelos mais utilizados e com um maior número de algoritmos em mineração de
dados, além de serem tratados como os mais complexos da categoria.
Machine
Bisecting k-means
Este modelo utiliza um conjunto de dados (amostra) que contém registros de exemplos com
suas respectivas classes (rótulos). Baseado nesses exemplos, o algoritmo classificador
generaliza as respostas recebidas e aplica essas generalizações a registros novos e de
classes desconhecidas, com a finalidade de determinar corretamente suas respectivas
classes (NEVES, 2018, p. 29-30).
Aprendizagem supervisionada é a tarefa de encontrar uma função a partir de dados de
treinamento rotulados. O objetivo é encontrar os parâmetros ótimos que ajustem um modelo
que possa prever rótulos desconhecidos em outros objetos (o conjunto de teste). Se o rótulo
é um númeroreal, a tarefa chama-se regressão. Se o rótulo vem de um conjunto finito e não
ordenado, então a tarefa chama-se classificação (SILVA, 2018, n.p.).
VOCÊ QUER VER?
Assista o vídeo Machine Learning: como ensinar uma máquina a aprender | Nerdologia Tech e aprenda um
pouco mais sobre aprendizado de máquina e sua utilidade, exemplo e importância no mundo atual.
27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina
https://ambienteacademico.com.br/course/view.php?id=12373 11/26
» Algoritmos classificação
Algoritmos de classificação buscam classificar os dados em diferentes classes, ou seja, um certo conjunto de dados
é associado a uma determinada classe, a separação desses dados se dá de acordo com as características de
grupos específicos, que associam ou classificam um item em uma ou várias classes predefinidas, com o objetivo
maior de atribuir classes (ou rótulos) a um conjunto finito de dados. A resposta do modelo supervisionado geralmente
é definida por variáveis ditas categóricas, com resultados nominais, que são, geralmente, aplicadas em detecção de
SPAM, reconhecimento de imagens e fala.
Um exemplo clássico que utiliza algoritmos de classificação é prever se um determinado indivíduo será um bom ou
mau pagador de um empréstimo bancário. Nesse caso, as informações de entrada são baseadas em dados
históricos para que o modelo possa conhecer e aprender sobre o perfil analisado, ou seja, por meio de
movimentações bancárias, históricos de empréstimos anteriores, renda e número de filhos, o algoritmo é capaz de
prever se aquele perfil será de um bom ou mau pagador (AMARAL, 2016).
Esse exemplo é descrito no Quadro 2, utilizando uma base de dados fictícia. Em um certo conjunto de dados, ou
seja, dados históricos de uma instituição bancária, tem-se a idade e a categoria de pagamento do indivíduo, sendo
um para bom pagador e zero para não bom pagador.
Quadro 2 – Base de dados para treino
IDADE
0
CATEGORIA
1
1
18
46
34
27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina
https://ambienteacademico.com.br/course/view.php?id=12373 12/26
0
0
Fonte: AMARAL, 2016, p. 31. (Adaptado).
A partir dos dados históricos demonstrados no Quadro 2, é possível criar um modelo para prever se novos clientes
podem ser bons ou maus pagadores. Por meio da variável de entrada “idade”, o classificador processa as
informações de entrada e cria o resultado como mostra o Quadro 3.
Quadro 3 – Nova base de dados: classificador
IDADE CATEGORIA
0
1
0
1
Fonte: AMARAL, 2016, p. 32. (Adaptado).
Podemos, a partir do treinamento apresentado, prever novos clientes. O algoritmo observa o modelo construído a
partir da base de dados e retorna se o novo cliente é bom ou mau pagador. Por outro lado, é importante destacar que
nenhum algoritmo de aprendizado de máquina acerta em 100%, ou seja, deve-se, então, considerar seu
desempenho na previsão de dados anteriores. Isso é feito a partir da separação dos dados em dois subconjuntos:
treinamento e teste , em que dados de treino são submetidos ao classificador e produzem o modelo e os dados de
testes são submetidos ao modelo para que seja feita a previsão. Caso o desempenho do modelo seja satisfatório,
pode ser, então, colocado em produção para a classificação de novos dados (AMARAL 2016). Ainda segundo o
autor, esses conjuntos podem utilizar diferentes técnicas de treinamento e testes conforme mencionado abaixo:
» Clique nas abas para saber mais sobre o assunto
Teste seus conhecimentos
Atividade não pontuada.
21
37
18 ~ 22
23 ~ 35
36 ~ 45
45 ~ 65

Hold out Validação cruzada
27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina
https://ambienteacademico.com.br/course/view.php?id=12373 13/26
VAMOS PRATICAR
A tabela abaixo demonstra classes de animais, caso o animal possua a característica, deve-se marcar um
para verdadeiro, caso contrário, zero para falso. A partir dos dados, tem-se o classificador determinador G
para gato e P para pato.
AMOSTRA
É
PELUDO?
FAZ
MIAU?
TEM
PENAS?
TEM
ASAS?
É ANIMAL
DOMÉSTICO?
É
PEQUENO?
QUAL É
O
ANIMAL?
1 0 1 G
0 1
1
P0
1
0
G0 1
G0 1
0 1 G
Sabemos, então, que a máquina usará os dados acimar para identificar um padrão e, com isso, aprender o
que é gato e o que é pato. Com base nesses dados históricos citados na tabela anterior, faça a previsão do
animal abaixo, cuja classificação ainda não conhecemos, mas temos suas características.
AMOSTRA
É
PELUDO?
FAZ
MIAU?
TEM
PENAS?
TEM
ASAS?
É ANIMAL
DOMÉSTICO?
É
PEQUENO?
QUAL É
O
ANIMAL?
0 1 1 ?
Os dados são coletados, divididos em amostras de treinamento e teste, o modelo é treinado, ou seja, apresentam-se
os dados ao algoritmo e o modelo preditivo é criado. Por fim, é feito o teste e a validação utilizando outros conjuntos
de dados para saber se o modelo tem um bom nível de acurácia. Um exemplo de previsão seria o da venda ou
lançamento de um novo produto no mercado. O sistema preveria se o produto seria ou não aceito por uma
determinada população (DEY, 2016).
1 1
2
0
3
1
4
5
0 1
1
1
0
1
0
0
0 1
1
0
Oculta 0 1 1
27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina
https://ambienteacademico.com.br/course/view.php?id=12373 14/26
Principais fenômenos acústicos
CATEGORIA CONCEITOS
Os dados são coletados, ou seja, um conjunto de
dados existentes
Os dados são divididos em amostras e aplica-se
técnicas de estatísticas e amostragem, criando
amostras de treino e teste.
Escolhe-se o modelo de algoritmo que mais se
adapta ao problema.
Os dados são apresentados ao modelo de algoritmo,
criando o modelo preditivo
É feito os testes e validações utilizando outros
conjuntos de dados para saber se o modelo
escolhido tem um bom nível de acurácia, ou seja, um
bom nível de precisão.
Por fim, a produção é responsável por colocar o
modelo para fazer aquilo que foi criado, por exemplo,
uma previsão de vendas.
Fonte: DEY, 2018, p. 1176. (Adaptado).
Existem inúmeros modelos de algoritmos de classificação, cada um com suas particularidades e características,
assim, o profissional deverá ter o cuidado de escolher o modelo que mais se adapta a sua base de dados e ao
resultado que pretende chegar. Sendo assim, analisaremos os modelos que mais têm se destacado no aprendizado
de máquinas por apresentarem melhor acurácia nos resultados.
» Algoritmo K-NN K-Nearest Neighbors (KNN)
O algoritmo de K-Nearest Neigbours (KNN) é um dos algoritmos mais simples e mais usados em modelagem
supervisionada de classificação. Seu classificador é baseado no quanto um dado é similar ao outro, isso é, na
similaridade dos dados entre k vizinhos mais próximo. Nesse contexto, a máquina pode dizer a que classe um certo
volume de dados pertence. O KNN pode ser usado para algoritmos de regressão, que fornecem um número real
como saída desejada a partir da análise de dados. No K-NN, após a definição do conjunto de dados para instanciar o
treinamento, o modelo classifica uma nova instância, calculando a distância mais próximas ou a mais similar e em
relação ao novo exemplo. Os vizinhos mais próximos são denominados K , são eles que vão decidir em qual classe
Dados brutos
Amostras de dados
Algoritmo
Modelo treinado
Teste e validação
Produção
27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina
https://ambienteacademico.com.br/course/view.php?id=12373 15/26
deve ser classificado, por meio de votação entre os mesmos, onde a classe que aparece com maior frequência
dentre os vizinhos selecionados deve ser a classe atribuída à nova instância (WITTEN; FRANK, 2005).
Para se classificar um conjunto de dados desconhecido, é necessário calcular a distância de cada um para todos os
conjuntos de treinamento, isso é, calcular a distância entre a nova instância e todas as instâncias do conjunto de
treinamento, em que a menor distância é identificada e a classe mais representada dentre essas k instâncias é
considerada a classe de saída do algoritmo. A distância mencionada pode ser calculada utilizando diversas funções,
como adistância euclidiana para valores contínuos ou distância de Hamming para valores simbólicos. Além disso,
uma das principais vantagens desse modelo é que ele pode ser aplicado em um pequeno conjunto de dados (KUHN;
JOHNSON, 2013; BAY, 1998).
» Máquina de vetores de suporte (SVM)
A máquina de vetores de suporte (SVM) é um algoritmo de aprendizado supervisionado criado a partir de ideias
iniciadas em 1964 no trabalho Generalised Portrait Method , de Vapnik e Chervonenkins. No início, o SVM foi criado
como uma técnica de classificação e, posteriormente, tornou-se uma ferramenta eficaz na estimativa de funções que
utilizam regressão de valores reais. Na literatura, a regressão pode ser referenciada como SVM ou SVR ( Support
Vector Regression ). Esse tipo de algoritmo mapeia os dados de entrada de treinamento para um espaço
multidimensional, de forma que seja possível encontrar um hiperplano que separe as duas classes. Sendo assim,
após o treinamento, o mecanismo precisa ser capaz de determinar à qual dessas classes um item desconhecido
pertence.
O melhor hiperplano para um SVM significa aquele com a maior margem entre as duas classes (RUSSELL;
NORVIG, 2013). Muitas são as características desse modelo, mas ele é fortemente usado para reconhecimento de
voz, imagem e visão computacional. Na Figura 2, podemos observar duas classes separadas: uma azul e outra
laranja. Se os objetos novos, ao entrarem para as análises, estiverem mais à esquerda, serão classificados na classe
azul, caso contrário, se estiverem posicionados mais à direita, serão classificados na classe laranja (PORTELA,
2017).
Figura 2 – Separação de dados no modelo SVM simples.
Fonte: PORTELA et al., 2017.
27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina
https://ambienteacademico.com.br/course/view.php?id=12373 16/26
» Rede neural artificial
Uma rede neural artificial (RNA) é um modelo de processamento de dados em paralelo, constituído de unidades
simples de processamento, inspiradas no sistema neural. Essas têm propensão natural para armazenar
conhecimento extraído de dados, tornando-o disponível para uso. Sua semelhança com o cérebro humano está
relacionada a dois aspectos: ao conhecimento adquirido pelo processo de aprendizagem e à conexão de pesos
sinápticos, que possuem a função de armazenar o conhecimento adquirido. Com a utilização de técnicas de
algoritmos de aprendizagem, é possível modificar os pesos para que se alcance um objetivo. A maioria dos modelos
de redes neurais possui alguma regra de treinamento, isto é, aprendem através de treinamentos, em que os pesos
de suas conexões são adaptados de acordo com os padrões apresentados, ou seja, através de exemplos (HAYKIN,
2001).
Uma rede neural artificial é um sistema massivamente paralelo e distribuído, constituído de unidades simples de
processamento interconectadas, denominadas neurônicas, inspiradas no sistema neural humano, com capacidade
natural de armazenar e utilizar conhecimento (NEGNEVITSKY, 2005; NILSSON, 2014).
Embora a utilização de técnica de inteligência artificial tenha como objetivo auxiliar, por meio de dispositivos
computacionais, a solução de problemas e maximizar a precisão nas informações, deve-se ressaltar que não existe
uma técnica ideal a ser adotada. Assim, é importante levar em consideração a relevância do problema, fatores
humanos e éticos.
Teste seus conhecimentos
Atividade não pontuada.
» Sistema de inferência Fuzzy
O sistema de inferência Fuzzy é uma teoria matemática aplicada em conceitos incertos ou vagos, em que não existe
raciocínio preciso. Por meio de observações de vários fenômenos, constatou-se que a resolução desses problemas
poderia se dar sem a posse de informações precisas, apenas com valores entre zero e um, denominados graus de
pertinência de cada elemento a um determinado conjunto. Isso é, em modelos Fuzzy não existe fronteira definida
para que o elemento pertença ou não a um conjunto de dados (ZADEH, 1965).
De acordo com Chenci, Rignel e Lucas (2011), utilizando-se diferentes funções de pertinência e variáveis linguísticas,
como demonstrado no Gráfico 1, os sistemas Fuzzy podem ser aplicados em diversos segmentos, como no ajuste de
controle de peso em máquinas de lavar, câmeras fotográficas para medir o campo de visão do equipamento e no
controle de temperatura de ar-condicionado.
#PraCegoVer : a ilustração exibe um gráfico criado a partir de um algoritmo SVM, que
classifica os dados em dois conjuntos. Um conjunto está na forma de 14 círculos na cor azul,
situado na parte inferior esquerda do gráfico, mais próximo ao eixo central. Há, também, um
conjunto de dados de 14 círculos na cor amarela, que representa os dados mais afastados do
eixo. Por fim, para separar a classificação dos dois conjuntos, tem-se uma reta grossa, na cor
preta, exatamente ao meio dos dois conjuntos de dados, em diagonal, da esquerda para a
direita.
27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina
https://ambienteacademico.com.br/course/view.php?id=12373 17/26
Gráfico 1 – Variável linguística de entrada
Fonte: CHENCI et al., 2005, p. 24. (Adaptado).
#PraCegoVer : gráfico com eixos X e Y. No eixo X, na horizontal, é exibido o peso de pessoas
50, 75 e 100 quilos, e no eixo Y, na vertical, as pertinências zero e um. Os dados centrais do
gráfico representam variáveis linguísticas classificadas em baixo, médio e alto – da esquerda
para a direita. Logo, percebe-se que: pessoas de até 50 kg apresentam grau de pertinência
igual a um, no conjunto baixo; o grau de pertinência nesse conjunto decresce à medida que o
peso aumenta. A pessoa de 75 kg é totalmente pertencente ao conjunto médio. E pessoas
acima de 80 kg (aproximadamente) apresentam grau de pertinência diferente de zero, em alto.
E pessoas acima de 100 kg, definitivamente estão com o peso alto.
» Algoritmos regressão
A regressão é definida como a tarefa de aprender uma função f , que mapeie cada conjunto de atributos X em uma
saída com valor contínuo Y . Ou seja, é uma modelagem preditiva, que analisa as dependências entre os valores de
atributos, a partir de um conjunto de itens, e cria um modelo que possa prever valores de atributos para novos (TAN;
STEINBACH; KUMAR, 2018).
É necessário aplicar análise de regressão em algumas situações em que o resultado não depende apenas de uma
variável, sendo necessário explorar a relação entre elas (MORETTIN; BUSSAB, 2013).
Os modelos de regressão predizem um número – por exemplo, o quanto de receita ou despesas um cliente gerará
no próximo ano ou mês. Sendo assim, é um dos métodos mais populares em estatística, porque estima a relação
entre as variáveis, sendo constantemente utilizado para determinar quantidades de fatores específicos, como a alta
do dólar, por exemplo.
Com a análise de regressão, queremos predizer um número, chamado de resposta ou variável Y . O modelo mais
simples é de “Regressão Linear Simples”, que corresponde a uma relação linear entre a variável dependente e a
outra independente, verificando se existe uma relação entre estas duas variáveis. Por exemplo: temos duas variáveis
X (independente) e Y (dependente). Deste modo X é o responsável por explicar Y , que é utilizada para explicar e/ou
prever o resultado de Y . Este modelo de regressão é amplamente utilizado para prever a relação de alteração dos
salários e taxa de desemprego, demanda dos produtos de uma firma e publicidade, etc.
27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina
https://ambienteacademico.com.br/course/view.php?id=12373 18/26
Já a regressão múltipla, por sua vez, usa duas ou mais variáveis independentes para prever um resultado. Com a
regressão logística, variáveis dependentes com valores discretos são previstas a partir das relações entre variáveis
dependentes e independentes de padrões já conhecidos. A variável de resposta é categórica, o que significa que
pode assumir um número limitado de valores. A regressão logística realiza a classificação binária. Com o rótulo de
resposta, tem apenasdois valores (0 e 1), contudo, os modelos mais usuais são aqueles que apresentam rótulos
com números reais ou contínuos (SILVA, 2018).
Os algoritmos mais comuns que utilizam esses modelos são as redes neurais artificiais, o SVM e o KNN.
» Modelos de séries temporais
Uma série temporal é um conjunto de dados sobre uma variável de tempo e registrado por períodos. Esses períodos
são marcados e coletados dentro de um intervalo, sejam em dias, meses, anos ou até mesmo horas. Os dados são
coletados e armazenados para a análise posterior. Esses modelos podem ser aplicados em análise de vendas
mensais de um determinado produto, em previsões de temperatura em um intervalo de tempo, visitas em sites da
internet por hora e valores de fechamento do índice de uma bolsa de valores. Seu principal objetivo é identificar
padrões variáveis no tempo na série temporal de uma variável de interesse. Assim, a observação desse
comportamento passado pode permitir previsões sobre o futuro, orientando a tomada de decisões (SAS, 2019).
Segundo (MORETTIN; TOLOI, 2006), uma série temporal pode ser compreendida como a representação matemática
do comportamento de um processo ou sistema através de um conjunto de observações ordenadas no tempo. O
Gráfico 2 mostra a uma série temporal da temperatura média mensal, na cidade de Lavras/MG.
Gráfico 2 – Série temporal (média mensal de temperatura)
Fonte: SOARES, 2017, p. 17. (Adaptado).
#PraCegoVer : o gráfico cartesiano retrata um modelo de série temporal da média da
temperatura na cidade de Lavras, em MG. No eixo X, na horizontal, encontra-se o índice de
tempo, iniciado no ano de 1990 e com intervalo de cinco em cinco anos até 2010 (1990, 1995,
2000, 2005, 2010). No eixo Y, na vertical, está a temperatura média da cidade com valores, de
baixo para cima, de 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 e 25 ºC. O modelo do gráfico adotado
pelo autor é um gráfico de linhas, representado na cor verde, que demonstra a tendência
27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina
https://ambienteacademico.com.br/course/view.php?id=12373 19/26
irregular da temperatura no intervalo de tempo, com as altas e baixas de temperatura,
variando entre 16 e 25 ºC.
VOCÊ QUER VER?
Você sabia que a robô Sophia é uma humanoide com Inteligência Artificial? Ela é uma cidadã saudita e
possui milhares de seguidores no Instagram. Ela fez aparições em diversos programas de televisão e até já
discursou na ONU. A robô chama a atenção por sua capacidade de reprodução facial, de contar piadas e de
debater sobre assuntos existenciais. Para saber um pouco mais sobre essa simpática robô acesse:
1.3.2 Não supervisionado
Diferente do aprendizado supervisionado, o modelo não supervisionado não apresenta dados rotulados, ou seja, ele
não possui um conjunto de dados a priori. Assim, o algoritmo aprende a partir de entradas submetidas segundo uma
medida de qualidade ou similaridade (ABREU, 2016).
Segundo Bueno (2018), a aprendizagem não supervisionada encontra padrões ocultos ou estruturas intrínsecas aos
dados. Ela é usada para extrair características de conjuntos de dados sem respostas rotuladas, desconhecidos.
Inúmeras técnicas utilizam esse tipo de aprendizagem, embora a de agrupamento seja a técnica mais comum. De
todo modo, a aprendizagem não supervisionada é comumente utilizada para a análise exploratória de dados,
buscando padrões ocultos ou agrupamentos nos dados.
Segundo SAS (2019), esse modelo é utilizado quando não existe um agente externo indicando a resposta desejada,
como dados históricos ou uma resposta certa. Assim, para os padrões de entrada, esse tipo de aprendizado tem,
27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina
https://ambienteacademico.com.br/course/view.php?id=12373 20/26
como objetivo, explorar os dados e encontrar alguma estrutura dentro deles, aplicações que utilizam modelos não
supervisionados incluem análise de sequência de genes, pesquisa de mercado, reconhecimento de objetos,
campanhas de marketing, recomendação de produtos e a identificação de pontos discrepantes nos dados.
Esses modelos também são conhecidos como algoritmos descritivos, que possuem a funcionalidade de descobrir
regras e padrões para gerar os dados. Nesse contexto, destacam-se três modelos: o agrupamento que divide o
conjunto de dados por similaridade, isso é, por características; os modelos de associação que buscam encontrar
padrões frequentes nos dados, de tal modo que itens que ocorram juntos regularmente sejam descobertos; e, por
fim, o modelo menos usual de sumarização (CARMO et al., 2018).
Inúmeros são os algoritmos que utilizam essa técnica para obter um melhor resultado na tomada de decisão.
Todavia, não podemos julgar qual o melhor modelo. Por isso, é preciso analisar qual seria o mais específico, e qual
deles melhor se adapta ao conjunto de dados implícitos.
» Algoritmos não supervisionados com técnicas de agrupamento
Com o considerável aumento do volume de dados e de informações distintas geradas com a internet, nos últimos
tempos, tornou-se necessário agrupar dados de acordo com sua similaridade. O processo de agrupar dados
abstratos por características comuns é denominado clusterização. Um cluster nada mais é que uma coleção de
dados agrupados dentro de um mesmo grupo similar ou em grupos distintos.
Para Fernandes e Filho (2019), técnicas de agrupamento não supervisionado são aquelas em que os dados são
divididos por partições, ou seja, por cluster. Nesse, são considerados os algoritmos de agrupamento, e o usuário é
quem vai definir a quantidade de clusters a ser empregado.
Existem inúmeros modelos de algoritmos de clusterização, o mais comum é o modelo algoritmo k-means (k-medias).
Esse algoritmo separa aleatoriamente cada centro do conjunto de dados e a cada nova interação agrupa os pontos
mais próximos ao centroide, por meio da menor distância quadrática euclidiana. Os centroides são também
atualizados pela média dos pontos de cada cluster . O algoritmo termina (converge) quando não há mais mudanças
significativas dos centroides.
» Algoritmos não supervisionado com regras de associação
Algoritmos que utilizam regras de associação prescritivas são muito usados como suportes para tomadas de decisão,
como em sistemas de diagnósticos; análise de dados de vendas; descoberta de tendências; estudo das informações
coletadas durante a venda simultânea de itens etc.
De acordo com Brusso (2000), regras de associação são padrões descritivos, que representam a probabilidade de
que um conjunto de itens apareça em uma transação, visto que outro conjunto está presente.
Uma regra de associação tem como objetivo encontrar elementos que implicam na presença de outros elementos em
uma mesma transação, ou seja, encontrar relacionamentos ou padrões frequentes entre diversos conjuntos de
dados. O termo transação indica quais itens foram consultados em uma determinada operação de consulta.
Um exemplo citado por Vasconcelos e Carvalho (2018) é a venda de sapatos. Por meio de regras de associação, o
algoritmo mostra que o cliente que compra cinto e bolsa possivelmente comprará um sapato. Para isso, são
utilizadas regras que especificam o grau de certeza: o fator de suporte e o fator de confiança.
27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina
https://ambienteacademico.com.br/course/view.php?id=12373 21/26
Com o avanço das tecnologias, novos equipamentos foram criados para a coleta de conjunto de dados, ou seja,
coletar informações e armazená-las já faz parte do cotidiano das empresas, sejam elas de pequeno, médio ou
grande porte. Com esse conhecimento disponível, as organizações facilitam a tomada de decisão e promovem
estratégias certeiras de marketing, que potencializam o cliente e o layout de catálogos de produtos a partir dos dados
coletados (VASCONCELOS; CARVALHO, 2018).
Segundo Pichiliani (2008), as regras de associação podem ser geradas por meio da utilização de diversos algoritmos
no mercado. O mais comum e popular é o algoritmoa priori, que tem como função principal encontrar todos os
conjuntos de itens frequentes, fazendo o uso de duas funções: a primeira denominada a priori, para gerar dados e
eliminar aqueles que não são frequentes; e a segunda função Genrules , utilizada para extrair as regras de
associação.
1.4 Identificar as diferenças entre algoritmo supervisionado e não
supervisionado
Como podemos notar, ao longo da unidade, o aprendizado de máquina é dotado por uma quantidade enorme de
algoritmos inteligentes. Cada modelo se destaca por sua capacidade de resolver um problema específico, dando
auxílio aos usuários na tomada de decisão, seja para aumentar os lucros de uma empresa ou auxiliar o homem do
campo sobre índices de chuva em uma determinada região.
É importante entender como e qual técnica deve-se ser empregada naquele conjunto de dados específicos, por
exemplo: quando temos os dados já visíveis, rotulados, por exemplo: ao usarmos dados históricos de clientes para
tentarmos prever novos clientes em potencial, empregaremos modelos de algoritmos supervisionados, que ainda
podem ser divididos para resolver problemas de classificação e regressão. No entanto, quando não se tem nenhum
desses dados a priori, ou seja, ainda não existe nenhum dado histórico ou conjunto de dados, a técnica utilizada é de
algoritmos não supervisionados, que ainda se divide para resolver problemas de agrupamento e associação.
Por fim, não existe uma técnica perfeita; o profissional de tecnologia, aliado ao bom gestor, é quem ditará qual o
modelo que mais vai auxiliar na tomada de decisão de uma empresa.
Síntese
Nesta unidade, vimos os principais conceitos e definições sobre o aprendizado de máquina, além de uma descrição
sobre os principais tipos de modelos dessa área. Vimos, também, os principais algoritmos que norteiam os sistemas
inteligentes, isso é, que possuem uma melhor acurácia; esses algoritmos são dotados de técnicas de classificação e
regressão quando se trata de aprendizado supervisionado. Ademais, outra categoria que estudamos foi a dos
modelos de aprendizado não supervisionados, que separam os dados por meio de modelos de agrupamento ou de
regras de associação.
Por fim, vale ressaltar que, quanto maior a compreensão do algoritmo, limitações e desempenho, mais
adequadamente o profissional poderá aplicá-los na tomada de decisão.
27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina
https://ambienteacademico.com.br/course/view.php?id=12373 22/26
SAIBA MAIS
Título: Inteligência artificial aplicada – uma abordagem introdutória
Autor(a) ou autores(as): Luciano Frontino de Medeiros
Editora: Intersaberes
Ano: 2018
Comentário: Leia a Capítulo 1 do livro, que irá ajudar a compreender as bases da Inteligência
Artificial, através de seu contexto histórico que abrange diversas linhas de pesquisa da IA podendo
ser em aplicados em diferentes ramos de negócios, auxiliando assim o gestor em uma tomada de
decisão correta.
Onde encontrar? Biblioteca Virtual .
Referências bibliográficas
ABREU, A. L. E. Bootstrap e modelos de Support Vector Machine : SVM. 2016. 115 f. Tese (Doutorado em
Métodos Numéricos em Engenharia) – Pós-graduação em Métodos Numéricos em Engenharia, Universidade Federal
do Paraná, Curitiba, 2016. Disponível em: < https://acervodigital.ufpr.br/bitstream/handle/1884/43555/R%20-
%20T%20-%20ANDRE%20LUIZ%20EMIDIO%20DE%20ABREU.pdf?sequence=1&isAllowed=y >. Acesso em: 17
nov. 2020.
AGRELA, L. Carro autônomo do Google já pode transportar pessoas. Revista Exame , 03 jul. 2019. Disponível em: <
https://exame.com/tecnologia/carro-autonomo-do-google-ja-pode-transportar-pessoas >. Acesso em: 11 nov. 2020.
AL MAYAHI, Khalfan; AL-BAHRI, Mahmood. Machine Learning Based Predicting Student Academic Success. In:
International Congress on Ultra Modern Telecommunications and Control Systems and Workshops (ICUMT), 12.,
2020. Anais […] [s. l.]: IEEE, 2020. p. 264-268. Disponível em: <
https://ieeexplore.ieee.org/abstract/document/9222435 >. Acesso em: 11 nov. 2020.
AMARAL, F. Aprenda mineração de dados : teoria e prática. São Paulo: Alta Books, 2016.
BARNES, J. Microsoft azure essentials azure machine learning . Redmond: Microsoft Press, 2015.
BARRETO, C. A. S. Uso de técnicas de aprendizado de máquina para identificação de perfis de uso de
t ó i b d d d t ti 2018 92 f Di t ã (M t d E h i d S ft )
https://acervodigital.ufpr.br/bitstream/handle/1884/43555/R%20-%20T%20-%20ANDRE%20LUIZ%20EMIDIO%20DE%20ABREU.pdf?sequence=1&isAllowed=y
https://exame.com/tecnologia/carro-autonomo-do-google-ja-pode-transportar-pessoas
https://ieeexplore.ieee.org/abstract/document/9222435
27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina
https://ambienteacademico.com.br/course/view.php?id=12373 23/26
automóveis baseado em dados automotivos . 2018. 92 f. Dissertação (Mestrado em Engenharia de Software) –
Pós-Graduação em Engenharia de Software, Universidade Federal do Rio Grande do Norte, Natal, 2018. Disponível
em: <
https://repositorio.ufrn.br/jspui/bitstream/123456789/26017/1/Usot%c3%a9cnicasaprendizado_Barreto_2018.pdf >.
Acesso em: 17 nov. 2020.
BAY, S. D. Combining nearest neighbor classifiers through multiple feature subsets . In: Proc. 15th International
Conf. on Machine Learning. Proc. 15th International Conf. no aprendizado de máquina. Morgan Kaufmann, San
Francisco, CA. p. 37-45, 1998. Disponível em: < http://citeseerx.ist.psu.edu/viewdoc/download?
doi=10.1.1.52.455&rep=rep1&type=pdf >. Acesso em: Acesso em: 17 nov. 2020.
BROWNLEE, J. Discover feature engineering, how to engineer features and how to get good at it. 2014.
Disponível em: < https://machinelearningmastery.com/discover-feature-engineering-how-to-engineer-features-and-
how-to-get-good-at-it/ >Acesso: 06 dez. 2020.
BRINK, H.; RICHARDS, J. W. Real-world machine learning . 2016. Disponível em: <
https://www.manning.com/books/real-world-machine-learning >. Acesso: 08 nov. 2020.
BRUSSO, M. J. Access miner : uma proposta para a extração de regras de associação aplicada à mineração do uso
da web. 2000. 96 f. Dissertação (Mestre em Ciência da Computação) – Instituto de Informática, Universidade Federal
do Rio Grande do Sul, Porto Alegre, 2000. Disponível em: < https://lume.ufrgs.br/handle/10183/2074 >. Acesso em:
17 nov. 2020.
BUENO, A. L. C. Relaxamento adaptativo da sincronização através do uso de métodos de aprendizagem
supervisionada . 2018. 80 f. Tese (Doutorado em Informática) – Pontifícia Universidade Católica do Rio de Janeiro,
Rio de Janeiro, 2018. Disponível em: < http://www.dbd.puc-
rio.br/pergamum/tesesabertas/1321841_2018_completo.pdf >. Acesso em: 12 nov. 2020.
CARMO, P. N. S. et al. Aprendizado de máquina em ações de controle no tribunal de contas do Estado do Maranhão.
In: I Jornada de Informática do Maranhão, 7., 2018, Maranhão. Anais ... Maranhão, 2018. Disponível em: <
http://sistemas.deinf.ufma.br/anaisjim/artigos/2018/201809.pdf >. Acesso em: 12 nov. 2020.
CARVALHO, H. M. Aprendizado de máquina voltado para mineração de dados : árvores de decisão. 2014. 68 f.
Monografia submetida ao curso de graduação em Engenharia de Software – Faculdade de Engenharia de Software,
Universidade de Brasília, Distrito Federal, 2014. Disponível em: <
http://fga.unb.br/articles/0000/5556/TCC_Hialo_Muniz.pdf >. Acesso em: 17 nov. 2020.
CHENCI, G. P.; RIGNEL, D. G. S.; LUCAS, C. A. Uma introdução à lógica Fuzzy. Revista Eletrônica de Sistemas
de Informação e de Gestão Tecnológica , São Paulo. v. 1, n. 1, p. 17-28, 2011. Disponível em: <
http://www.logicafuzzy.com.br/wp-content/uploads/2013/04/uma_introducao_a_logica_fuzzy.pdf >. Acesso em: 18
nov. 2020.
DE LIMA, G. C. Pesquisa e Desenvolvimento de um Método de Aprendizagem de Máquina com Aprendizado
Incremental . 2014. Disponível em: < http://fga.unb.br/articles/0000/7764/tcc_GustavoCorreiaDeLima.pdf > Acesso:
08 nov. 2020.
https://repositorio.ufrn.br/jspui/bitstream/123456789/26017/1/Usot%c3%a9cnicasaprendizado_Barreto_2018.pdf
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.52.455&rep=rep1&type=pdfhttps://machinelearningmastery.com/discover-feature-engineering-how-to-engineer-features-and-how-to-get-good-at-it/
https://www.manning.com/books/real-world-machine-learning
http://www.dbd.puc-rio.br/pergamum/tesesabertas/1321841_2018_completo.pdf
http://sistemas.deinf.ufma.br/anaisjim/artigos/2018/201809.pdf
http://fga.unb.br/articles/0000/5556/TCC_Hialo_Muniz.pdf
http://www.logicafuzzy.com.br/wp-content/uploads/2013/04/uma_introducao_a_logica_fuzzy.pdf
http://fga.unb.br/articles/0000/7764/tcc_GustavoCorreiaDeLima.pdf
27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina
https://ambienteacademico.com.br/course/view.php?id=12373 24/26
DEY, A. Machine learning algorithms: a review. International Journal of Computer Science and Information
Technologies , [s.l.]. v. 7, n. 3, p. 1174-1179, 2016. Disponível em: <
http://ijcsit.com/docs/Volume%207/vol7issue3/ijcsit2016070332.pdf >. Acesso em: Acesso em: 17 nov. 2020.
DIAS, M. D. Democratizando a inteligência artificial. Serpro , 18 out. 2019. Disponível em: <
https://www.serpro.gov.br/menu/noticias/noticias-2019/democratizando-a-inteligencia-artificial >. Acesso em: 10 nov.
2020.
FACELI, K. et al. Inteligência artificial : uma abordagem de aprendizado de máquina. Rio de Janeiro: LTC, 2015.
FERNANDES, F. T.; FILHO, A. D. P. C. Perspectivas do uso de mineração de dados e aprendizado de máquina em
saúde e segurança no trabalho. Revista Brasileira de Saúde Ocupacional , São Paulo. v. 44, n. 13, p. 1-12, 04 nov.
2019. Disponível em: < https://www.scielo.br/scielo.php?script=sci_arttext&pid=S0303-76572019000101401 >.
Acesso em: 12 nov. 2020.
HAYKIN, S. Redes neurais : princípios e prática. 2. ed. Porto Alegre: Bookman, 2001.
KUHN, M.; JOHNSON, K. Applied Predictive Modelling . New York: Springer, 2013.
LAMOUNIER, S. M. D. Modelagem incremental fuzzy para detecção incipiente e estimação do grau de
severidade da doença de parkinson a partir de sinais de voz . 2018. 82 f. Dissertação (Mestrado em Engenharia
de Sistemas e Automação) – Área de Concentração em Engenharia de Sistemas e Automação, Universidade Federal
de Lavras, Lavras, 2018. Disponível em: < encurtador.com.br/qtAU0 >. Acesso em: 17 nov. 2020.
CLUSTERING. Scikit-learn , 2014. Disponível em: < http://scikit-learn.org/stable/modules/clustering.html >.Acesso
em: 06 dez. 2020.
LUGER, G. F. Inteligência artificial . São Paulo: Pearson, 2013.
Machine Learning: como ensinar uma máquina a aprender | Nerdologia Tech . Postado por Nerdologia. (10min.
10s.). son. color. port. Disponível em: < https://www.youtube.com/watch?v=mhe5e2B9bL8&t=43s >. Acesso em: 12
nov. 2020.
MARQUES, K. M. O que é Machine Learning (ML)? Exemplos & Aplicações! Becode , 2017. Disponível em: <
https://becode.com.br/o-que-e-machine-learning/ >. Acesso em: 12 nov. 2020.
MEDEIROS, L. F. Inteligência artificial aplicada : uma abordagem introdutória. Curitiba: Intersaberes, 2018.
MEHTA, R. Big data analytics with Java . Birmingham: Packt Publishing, 2017.
MENDEL, J. M.; R. W. MCLAREN. Reinforcement-learning control and pattern recognition systems . Rio de
Janeiro: Elsevier, 1994.
MONARD, M. C.; BARANAUSKAS, J. A. Sistemas Inteligentes : Fundamentos e Aplicações. Barueri: Manole, 2003.
MORETTIN, P. A.; TOLOI, C. Análise de séries temporais . São Paulo: Blucher, 2006.
http://ijcsit.com/docs/Volume%207/vol7issue3/ijcsit2016070332.pdf
https://www.serpro.gov.br/menu/noticias/noticias-2019/democratizando-a-inteligencia-artificial
https://www.scielo.br/scielo.php?script=sci_arttext&pid=S0303-76572019000101401
http://scikit-learn.org/stable/modules/clustering.html
https://www.youtube.com/watch?v=mhe5e2B9bL8&t=43s
https://becode.com.br/o-que-e-machine-learning/
27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina
https://ambienteacademico.com.br/course/view.php?id=12373 25/26
MORETTIN, P. A.; BUSSAB, W. O. Estatística básica . São Paulo: Saraiva Educação, 2017.
NEGNEVITSKY, M. Artificial intelligence : a guide to intelligent systems. London: Pearson education, 2005.
NEVES, D. V.; DIAS, F. C. A.; CORDEIRO, D. Uso de aprendizado supervisionado para análise de confiabilidade de
dados de crowdsourcing sobre posicionamento de ônibus. In: WORKSHOP BRASILEIRO DE CIDADES
INTELIGENTES (WBCI), 2018, Natal. Anais [...]. Porto Alegre: Sociedade Brasileira de Computação, 2018.
Disponível em: < https://sol.sbc.org.br/index.php/wbci/article/view/3229/3191 >. Acesso em: 18 nov. 2020.
NILSSON, N. J. Principles of artificial intelligence . Burlington, Massachusetts: Morgan Kaufmann, 2014.
PICHILIANI, M. Data Mining na prática: regras de associação. iMasters , 21 jan. 2018. Disponível em: <
https://imasters.com.br/back-end/data-mining-na-pratica-regras-de-associacao >. Acesso em: 10 nov. 2020.
PORTELA, C. et al. Tutorial de SVM. LAMFO , 13 jul. 2017. Disponível em: < https://lamfo-
unb.github.io/2017/07/13/svm/ >. Acesso em: 09 nov. 2020.
ROBÔ Sophia: “Deveríamos ser parceiros, não substitutos” [CT Entrevista] . Postado por Canaltech. (7min.
54s.). son. color. port. Disponível em: < https://www.youtube.com/watch?v=pKCgl7r9Qw8 >. Acesso em: 10 nov.
2020.
RUSSEL, S.; NORVIG, P. Artificial intelligence : a modern approach. Nova Jersey: Prentice Hall, 2013.
SAS. Inteligência artificial . O que é qual sua importância? Disponível em: <
https://www.sas.com/pt_br/insights/analytics/inteligencia-artificial.html >. Acesso em: 10 nov. 2020.
SILVA, J. C. Algoritmos de aprendizagem de máquina: qual deles escolher? Medium , 25 mar. 2018. Disponível em:
< https://medium.com/machina-sapiens/algoritmos-de-aprendizagem-de-m%C3%A1quina-qual-deles-escolher-
67040ad68737 >. Acesso em: 10 nov. 2020.
SOARES, E. A. Sistemas evolutivos baseados em regras para previsão de séries temporais meteorológicas .
2017. 75 f. Dissertação (Mestrado em Engenharia de Sistemas e Automação) – Pós-Graduação em Engenharia de
Sistemas e Automação, Universidade Federal de Lavras, Lavras, 2017. Disponível em: < encurtador.com.br/lFST4 >.
Acesso em: 11 nov. 2020.
TAN, P.; STEINBACH, M.; KUMAR, V. Introduction to data mining . 2. ed. Chennai: Pearson India Education
Services, 2018.
VASCONCELOS, L. M. R.; CARVALHO, C. L. Aplicação de regras de associação para mineração de dados na web.
Revista Telfract , São Paulo, v. 1, n. 1, p. 1-19, 24 abr. 2018. Disponível em: <
http://ww2.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_004-04.pdf >. Acesso em: 11 nov. 2020.
VAPNIK, V. N.; CHERVONENKIS, A. Y. On the uniform convergence of the frequencies of occurrence of events to
their probabilities. In: Empirical Inference. Springer, Berlin, Heidelberg, 2013. p. 7-12.
https://sol.sbc.org.br/index.php/wbci/article/view/3229/3191
https://imasters.com.br/back-end/data-mining-na-pratica-regras-de-associacao
https://lamfo-unb.github.io/2017/07/13/svm/
https://www.youtube.com/watch?v=pKCgl7r9Qw8
https://www.sas.com/pt_br/insights/analytics/inteligencia-artificial.html
https://medium.com/machina-sapiens/algoritmos-de-aprendizagem-de-m%C3%A1quina-qual-deles-escolher-67040ad68737
http://ww2.inf.ufg.br/sites/default/files/uploads/relatorios-tecnicos/RT-INF_004-04.pdf
27/05/2022 18:36 Unidade 1 - Modelos de aprendizado de máquina
https://ambienteacademico.com.br/course/view.php?id=12373 26/26
WITTEN, I. H.; FRANK, E. Data mining : Practical Machine Learning Tools and Techniques with Java
implementations. 2. ed. Philadelphia: Elsevier. 2005.
ZADEH, L. A. Fuzzy sets. Information and control , v. 8, n. 3, p. 338-353, 1965. Disponível em: <
https://www.sciencedirect.com/science/article/pii/S001999586590241X >. Acesso em: 11 nov. 2020.
https://www.sciencedirect.com/science/article/pii/S001999586590241X