Buscar

Apresentação do Caso N1

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Aprendizagem de Máquinas não supervisionadas 
Introdução
Aqui vamos falar um pouco sobre o aprendizado em máquinas não supervisionadas baseado no algoritmo kNN, para resolução de um cenário de estratégia para o Banco Beta lidar com as questões relacionadas a seu negócio.
O algoritmo kNN (K Nearest Neighbor) é um dos mais utilizados em Machine Learning, modelo de estrutura que usamos através de datasets, ele também é conhecido como aprendizagem lento ou preguiçoso. Esse algoritmo pode ser aplicado em diversos segmentos de negócio, pois possibilita de utilização do mesmo tanto de classificação 
quanto para regressão.
Como funciona o algoritmo 
Para a resposta que o Banco Beta precisa, iremos utilizar o aprendizado em máquinas não supervisionadas baseado no algoritmo kNN, usada também para explorar dados desconhecidos não rotulados permitindo assim que algoritmo atuei sobre os dados.
Primeiro passo é coletar e tratar os dados que serão utilizados no modelo desse algoritmo. Com os dados prontos iremos realizar a separação da base e validação, classificar e segmentar o público de cliente, selecionar as K de menores distancias, verificar classes dos dados que tiveram as K de menores distâncias e contabiliza a quantidade de vezes que cada classe apareceu; classificar esse novo dado como pertencente à classe que mais apareceu.
Então seguindo os seguintes passos: calcular distância entre um ponto e outro, encontrar os pontos /vizinhos, mas próximos, voltar a label para o ponto a ser previsto. Então teremos uma segmentação de público-alvo.
Lembrando que o algoritmo kNN se baseiam em medidas de distância.
Conclusão
O algoritmo kNN é modelo simples e eficaz que tem boa precisão na maioria dos casos aplicados. A utilização de datasets possibilita uma boa performance na conclusão dos dados final.
Referencias e Bibliografia
https://pythonistaplanet.com/applications-of-unsupervised-learning/
https://medium.com/@srishtisawla/iris-flower-classification-fb6189de3fff
https://aprenderdatascience.com/aprendizagem-nao-supervisionada/

Outros materiais