Aula 03 Aprendizado de Máquina Clássico

•

FASAM

IoT FASAM

15/05/2018

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 3, do total de 31 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 6, do total de 31 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Você viu 9, do total de 31 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Tecnologia Internet

357 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

Aula 03: Aprendizado de Máquina Clássico
Parte I
Prof. Me. Lucas da Silva Assis
Módulo 03 - Machine Learning
● Sobre mim:
2
Engenheiro Eletricista pela EMC - Universidade Federal de Goiás.
Durante a graduação co-fundou o Núcleo de Robótica Pequi
Mecânico - UFG e tornou-se coordenador da equipe de futebol de
robôs (categoria IEEE Very Small Size Soccer). Mestre em Ciência
da Computação pelo INF - Universidade Federal de Goiás, sendo
bolsista CAPES. Durante o mestrado continuou a pesquisa com a
temática de futebol de robôs, com o foco na movimentação e
geração de trajetórias para robôs móveis. Atualmente é
Doutorando em Ciência da Computação pela Universidade Federal
de Goiás. Possui experiência nas áreas de Robótica, Eletrônica
Embarcada, Internet das Coisas, Inteligência Computacional,
Computação Evolutiva e Aprendizado de Máquina. Também é
Instrutor certificado pelo NVIDIA’s Deep Learning Institute para os
cursos de Visão Computacional Inteligente.
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 02- Regressão Linear e Logística
3
● Plano de hoje:
○ Aprendizado Supervisionado
○ Algoritmo dos K-vizinhos mais próximos
○ Support Vector Machine (SVM)
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 02- Regressão Linear e Logística
4
● Motivação :
○ A ideia principal deste módulo é a familiarização com funções objetivas, computar seus
gradientes e otimizar os objetivos em um conjunto de parâmetros.
○ Essas ferramentas básicas formarão a base para algoritmos mais sofisticados
posteriormente!
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 02- Regressão Linear e Logística
5
● Os pilares da Inteligência Artificial
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 02- Regressão Linear e Logística
6
● Aprendizado Supervisionado
○ Problemas de aprendizagem supervisionados
são agrupados em problemas de “regressão” ou
“classificação”.
○ Em um problema de regressão, estamos
tentando prever os resultados em uma saída
contínua, o que significa que estamos tentando
mapear variáveis de entrada para alguma função
contínua.
○ Em um problema de classificação, estamos
tentando prever os resultados em uma saída
discreta. Em outras palavras, estamos tentando
mapear variáveis de entrada em categorias
distintas.
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 02- Regressão Linear e Logística
7
● Regressão x Classificação
○ Exemplos ?
■
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 02- Regressão Linear e Logística
8
● K-Nearest Neighbors (KNN)
○ O KNN é um classificador baseado na analogia.
○ O conjunto de treinamento é formado por vetores n-dimensionais e cada elemento deste
conjunto representa um ponto no espaço n-dimensional.
● Funcionamento
○ Para determinar a classe de um elemento que não pertença ao conjunto de treinamento, o
classificador KNN procura K elementos do conjunto de treinamento que estejam mais
próximos deste elemento desconhecido, ou seja, que tenham a menor distância.
○ Estes K elementos são chamados de K-vizinhos mais próximos. Verifica-se quais são as
classes desses K vizinhos e a classe mais freqüente será atribuída à classe do elemento
desconhecido.
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 02- Regressão Linear e Logística
9
● K-Nearest Neighbors (KNN)
○ A influência do número K :
○ KNN é um classificador que possui apenas um parâmetro livre (o número de K-vizinhos) que
é controlado pelo usuário com o objetivo de obter uma melhor classificação.
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 02- Regressão Linear e Logística
10
● K-Nearest Neighbors (KNN)
○ A influência do número K :
○ KNN é um classificador que possui apenas um parâmetro livre (o número de K-vizinhos) que
é controlado pelo usuário com o objetivo de obter uma melhor classificação.
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 02- Regressão Linear e Logística
11
● K-Nearest Neighbors (KNN)
○ Métricas de distância :
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico
A distância de Minkowski é a
generalização das duas
distâncias anteriores.
Quando q = 1, esta distância
representa a distância de
Manhattan e quando
q = 2, a distância Euclidiana.
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 02- Regressão Linear e Logística
12
● K-Nearest Neighbors (KNN)
○ O processo de classificação do KNN pode ser computacionalmente exaustivo se
considerado um conjunto com muitos dados. Para determinadas aplicações, no entanto, o
processo é aceitável.
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 02- Regressão Linear e Logística
13
● K-Nearest Neighbors (KNN)
○ Implementação : https://colab.research.google.com/notebooks/welcome.ipynb
○ Dataset : Iris Data Set
Este é talvez o dataset mais conhecido na literatura de reconhecimento de padrões. O
conjunto de dados contém 3 classes de 50 instâncias cada, onde cada classe se refere a
características de um tipo de Íris. Uma classe é linearmente separável das outras duas; no
entanto, as últimas duas NÃO são linearmente separáveis uma da outra.
○ Atributo previsto: Espécie de Íris.
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 02- Regressão Linear e Logística
14
● Iris Plant Dataset
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 02- Regressão Linear e Logística
15
● Iris Plant Dataset
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 02- Regressão Linear e Logística
16
● Implementação do KNN :
1. Manipular dados: abra o conjunto de dados do CSV e divida em conjuntos de dados de
teste / treino.
2. Similaridade/Distância: calcule a distância entre duas instâncias de dados.
3. Vizinhos: localize k instâncias de dados mais semelhantes.
4. Resposta: Gere uma resposta de um conjunto de instâncias de dados.
5. Acurácia: Resuma a acurácia das previsões.
6. Final: Junta tudo e corre pro almoço.
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 02- Regressão Linear e Logística
17
● SupportVector Machine (SVM):
● “Support Vector Machine” (SVM) é um algoritmo de aprendizado de máquina
supervisionado que pode ser usado para desafios de classificação ou regressão. No
entanto, é usado principalmente em problemas de classificação.
● Nesse algoritmo, representamos cada item de dados como um ponto no espaço
n-dimensional (onde n é o número de características que você possui), com o valor de
cada recurso sendo o valor de uma determinada coordenada. Então, realizamos a
classificação encontrando o hiperplano que separa as duas classes.
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 02- Regressão Linear e Logística
18
● Support Vector Machine (SVM):
○ Como achar esse “Hiper-Plano” ?
Cenário 1 :
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico
Qual a Regra ?
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 02- Regressão Linear e Logística
19
● Support Vector Machine (SVM):
○ Como achar esse “Hiper-Plano” ?
Cenário 1 :
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico
Qual a Regra ? Fazer a Separação total das classes.
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 02- Regressão Linear e Logística
20
● Support Vector Machine (SVM):
○ Como achar esse “Hiper-Plano” ?
Cenário 2 :
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico
Qual a Regra ?
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 02- Regressão Linear e Logística
21
● Support Vector Machine (SVM):
○ Como achar esse “Hiper-Plano” ?
Cenário 2 :
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico
Qual a Regra ? Maximizar a distância dos pontos de cada classe para com o hiperplano.
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 02- Regressão Linear e Logística
22
● Support Vector Machine (SVM):
○ Como achar esse “Hiper-Plano” ?
Cenário 3 :
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico
Vish !?
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 02- Regressão Linear e Logística
23
● Support Vector Machine (SVM):
○ Como achar esse “Hiper-Plano” ?
Cenário 4 :
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico
E agora Jesus ?
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 02- Regressão Linear e Logística
24
● Support Vector Machine (SVM):
○ Como achar esse “Hiper-Plano” ?
Cenário 4 :
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 02- Regressão Linear e Logística
25
● Support Vector Machine (SVM):
○ Como achar esse “Hiper-Plano” ?
Cenário 5 :
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 02- Regressão Linear e Logística
26
● Support Vector Machine (SVM):
○ Como achar esse “Hiper-Plano” ?
Cenário 5 :
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico
O SVM pode resolver esse
problema. Facilmente!
Ele resolve esse problema
introduzindo uma característica
adicional.
Aqui, adicionaremos um novo
recurso z = x ^ 2 + y ^ 2. Agora,
vamos plotar os pontos de dados
nos eixos x e z:
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 02- Regressão Linear e Logística
27
● Support Vector Machine (SVM):
○ Como achar esse “Hiper-Plano” ?
Cenário 5 :
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico
Combinando as características
originais x e y em uma
característica z, de modo que :
z = x² + y²
Obtemos o seguinte
comportamento :
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 02- Regressão Linear e Logística
28
● Support Vector Machine (SVM):
○ Como combinar características ?
Devemos adicionar esse recurso manualmente para ter um hiperplano. Não, o SVM tem uma
técnica chamada truque do kernel.
Estas são funções que recebem características em um espaço dimensional inferior e o
transformam em um espaço dimensional superior, isto é, ele converte um problema não separável em
baixas dimensões em um problema possivelmente separável nas dimensões superiores. Esse truque é
especialmente útil em problemas de separação não linear.
Simplificando, ele faz algumas transformações de dados extremamente complexas e, em
seguida, descobre o processo para separar os dados com base nos rótulos ou nas saídas que você
definiu.
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 02- Regressão Linear e Logística
29
● Resumindo:
○ O SVM é um algoritmo construído para encontrar a melhor fronteira de decisão (as vezes
chamada de superfície de decisão) que separa duas únicas classes (A e B) a partir das
amostras de treinamento.
○ Ele faz isso por um processo de otimização contínua em que busca encontrar o hiperplano
que mais bem separa as duas classes. Esse hiperplano é aquele cuja distância dos
exemplos das classes é a maior possível (de modo a ficar o mais bem separado possível!).
○ Note que nem todos os exemplos das classes A e B são necessários para se calcular essa
distância e obter esse hiperplano (apenas aqueles mais próximos da área de confusão), e
são justamente esses pontos (ou vetores, em termos geométricos utilizados na
fundamentação matemática do algorítmo) que importam. Eles são chamados de "vetores
de suporte" porque caracterizam o hiperplano separador, e é daí justamente que vem o
nome do algoritmo.
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 02- Regressão Linear e Logística
30
● Resumindo:
○ Não iremos entrar em detalhes na implementação desse processo de otimização porque
ele requer muito mais informações, e também porque você não precisa saber de tais
detalhes para utilizar as bibliotecas como a do Scikit-Learn (Python) e o libSVM (C++).
○ O que você precisa saber é que os Kernels usados pelo SVM servem apenas para permitir
flexibilizar a fronteira de decisão, permitindo outras opções além de um separador linear.
○ Outro detalhe é que, para a classificação entre mais do que duas classes, o algoritmo
simplesmente utiliza um conjunto de classificadores binários, treinados para cada
combinação de pares (1, n-1): as amostras da classe A são consideradas normalmente e
as demais amostras (de todas as outras classes) são consideradas como amostras de uma
classe B - esse classificador individual apenas indica se uma amostra é ou não da classe A
- com um desses para cada classe, pode-se separá-las pela melhor resposta dentre os
classificadores para cada amostra.
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 02- Regressão Linear e Logística
31
● Resumindo:
○ Diferentes hiper-planos relativos a diferentes kernels :
Módulo 03 - Machine Learning Professor: Me. Lucas da Silva Assis
Aula 03- Machine Learning Clássico