Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 CURSO DE SISTEMA DE INFORMAÇÃO JÔNATAS EDWARDS COSTA DE ABREU USO DA INTELIGÊNCIA ARTIFICIAL NO MERCADO DE INTRUMENTOS MUSICAIS PARA MAXIMIZAR VENDAS FORTALEZA 2022 2 JÔNATAS EDWARDS COSTA DE ABREU USO DA INTELIGÊNCIA ARTIFICIAL NO MERCADO DE INTRUMENTOS MUSICAIS PARA MAXIMIZAR VENDAS Trabalho de Conclusão de curso apresentado ao curso de Sistema de Informação do Centro Universitário Estácio do Ceará como requisito para a obtenção do título de bacharel em Sistema de Informação. Orientador: Prof. Dr. Wellington Sousa Aguiar FORTALEZA 2022 3 AGRADECIMENTOS A Deus, mesmo diante as dificuldades existentes da vida, Ele sempre me deu forças para jamais desistir dos meus objetivos. Aos meus pais, Erialdo França de Abreu e minha querida mãe Fernanda Costa de Abreu que mesmo diante das dificuldades financeiras, batalharam duro para que tivesse o melhor estudo possível. A minha amada esposa Prisciliane da Silva Carneiro que esteve ao meu lado em todos os momentos difíceis e sempre me mostrou que é possível conquistar o mundo, basta ter dedicação força de vontade. Ao meu orientador, Prof. Dr. Wellington Sousa Aguiar, pela sua forma única de compartilhar conhecimento e por motivar seus alunos em todas as suas aulas a sermos seres humanos melhores. 4 RESUMO A comercialização de instrumentos musicais nos últimos anos teve um crescimento exponencial, pois a diversidade de públicos tem aumentado cada vez mais, fazendo com que grandes varejistas do mercado musical realizem ações de vendas estratégicas para cada público. Graças ao grande avanço no campo das pesquisas com a inteligência artificial é possível usar técnicas de inteligência artificial para avaliar grandes volumes de informações e através de um determinado algoritmo decifrar aspectos comportamentais dos consumidores. Essa pesquisa tem como objetivo utilizar técnicas avançadas de IA desenvolvidas em Python para auxiliar aos varejistas de instrumentos musicais a identificar corretamente os grupos de clientes e suas necessidades, baseado no algoritmo KNN (K - Nearest Neighbors). A metodologia utilizada é a quantitativa para apresentar os resultados estatísticos apurados pelos algoritmos de IA. Como principais resultados, conseguimos definir 5 grupos de clientes onde foi possível identificar qual ação de venda seria mais assertiva. Concluindo, podemos afirmar que o uso de IA na clusterização (agrupamento) de clientes pode gerar uma vantagem estratégica e competitiva para as empresas que utilizam esses métodos modernos. Palavras-chave: instrumentos musicais; inteligência artificial, knn; música; mercado musical. 5 ABSTRACT Years of sales of musical instruments in recent years has had an exponential growth, as the diversity of audiences has increased more and more, causing major presentations in the music market to carry out strategic actions for each audience. Thanks to the great advance in the field of research with artificial intelligence, it is possible to use artificial intelligence techniques for large volumes of information and through an animal to decipher behavioral behaviors of consumers. This aims to use advanced IAN techniques in Python to help research groups on musical instruments and correctly defined, based on the KN (K - Nearest Neighbors) project. The methodology used is accessible to present the statistical results of AI. As main results, 5 groups of customers were defined in a more assertive series. We can say that the use of AI in the clustering (grouping) of customers can generate a strategic and competitive advantage to conclude that they use these modern methods. Keywords: musical instruments; artificial intelligence; knn; music; music market. 6 LISTA DE FIGURAS Figura 1 - Instrumento Musical Alaúde..................................................................14. Figura 2 - Fórmula Distância Euclidiana................................................................16. Figura 3 - Legenda de dados convertidos. ................................................ ...........17. 7 LISTA DE GRÁFICOS Gráfico 1 - Gráficos estatísticos gerado pelo script..............................................21. Gráfico 2 - Matriz de correlação...........................................................................21. Gráfico 3 - Mapeamento das vendas no plano cartesiano...................................22. Gráfico 4 - Curva de cotovelo...............................................................................23. Gráfico 6 - Agrupamento por sexo........................................................................26. Gráfico 7 - Agrupamento por faixa etária..............................................................26. Gráfico 8 - Agrupamento por grau de instrução....................................................27. 8 LISTA DE TABELAS Tabela 1 - Amostra de 28 registros retirada da tabela de vendas.........................19. Tabela 2 - Amostra de 28 registros convertido... .................................................. 20. Tabela 3 - Legenda de dados convertidos. ............................................... ...........20. Tabela 4 - Resultado da Clusterização.................................................................. 25. Tabela 5 - Correlação representada forma estatística...........................................28. 9 LISTA DE ABREVIATURAS E SIGLAS IA INTELIGÊNCIA ARTIFICIAL KNN K — Nearest Neighbors ML Machine Learning 10 SUMÁRIO 1 INTRODUÇÃO ..................................................................................................11. 1.2 OBJETIVOS ...................................................................................................13. 1.2.1 Objetivo geral ..............................................................................................13. 1.2.2 Objetivos Específicos ..................................................................................13. 2 FUNDAMENTAÇÃO TEÓRICA..........................................................................13. 2.1 Definições importantes....................................................................................13. 2.1.1 Mercado de Instrumentos musicais..............................................................13. 2.2 Curva ABC ......................................................................................................14. 2.3 Inteligência Artificial.........................................................................................14. 2.4 Cluster.............................................................................................................15. 2.5 Algoritmo KNN.................................................................................................16. 2.6 Distância Euclidiana ........................................................................................16. 2.7 Pyton ...............................................................................................................17. 3 METODOLOGIA.................................................................................................18. 4 LEVANTAMENTO DE DADOS ..........................................................................19. 4.1 Coleta dos dados ............................................................................................19. 4.2 O Script ...........................................................................................................20.4.3 Categorização dos dados................................................................................21. 4.4 Reduções dos dados de uma venda em um par de informações (X, Y).........22. 4.5 Curva de cotovelo............................................................................................23. 4.5 Classificação dos dados em clusters...............................................................23. 5 ANÁLISE DE DADOS.........................................................................................25. 6 CONCLUSÃO.....................................................................................................29. 7 PROJETOS FUTUROS......................................................................................30. REFERÊNCIAS ....................................................................................................30. 11 1 INTRODUÇÃO A prática de tocar um instrumento musical tem aumentado cada vez mais, pois além de proporcionar a satisfação pessoal, ela promove ao indivíduo seja qual for a sua idade diversos benefícios, como: Coordenação motora, raciocínio lógico, concentração entre outros benefícios. O uso de instrumentos musicais é indicado para todas as idades, em especial para crianças, pois seu estímulo auxilia na resolução de problemas matemáticos como relata Susan Halla em seu artigo sobre:” Psicologia da música na educação: O poder da música na aprendizagem”. Por promover uma série de benefícios mentais e físicos, a procura por instrumentos musicais em lojas especializadas tem crescido cada vez mais, de forma que o público praticante tem se diversificado, onde crianças, homens, mulheres e idosos possuem interesse totalmente distintos na hora de escolher seu instrumento. Atualmente, o comércio de instrumentos musicais possui uma grande dificuldade em conseguir realizar ações efetivas de vendas, pois não conseguem identificar as predisposições de seus clientes. De modo geral, quando uma empresa promove uma ação de venda em um determinado produto essa decisão muitas vezes é tomada a partir de informações corriqueiras como por exemplo: produtos que estão por muito tempo no estoque ou uma quantidade considerável do mesmo produto. Criar promoções com base nesse tipo de dados normalmente não retornam os resultados desejados, pois quem garante que os clientes dessa empresa têm interesse nesse tipo de produto ofertado? Acreditamos que é bem mais válido e assertivo criar promoções com base nos gostos e características de cada cliente, mas como podemos identificar um padrão de interesses para cada grupo de clientes? Essa pesquisa tem como objetivo central identificar padrões de compras com base em “Clusterização” ou agrupamento de clientes. Hoje a tecnologia tem avançado de forma exponencial onde conceitos como: inteligente artificial ou Machine Learning tem se tornado cada vez mais acessível ao mercado geral, onde antes esses conhecimentos computacionais eram usados apenas em pesquisas cientificas, agora estão disponíveis também para pequenas e médias empresas. Quando falamos em (IA) Inteligência Artificial, podemos imaginar “n” informações, mas de forma bem resumida e usual, IA nada mais é do que a máquina 12 simulando a inteligência humana na tomada de decisões. O conceito de Inteligência Artificial está mais relacionado ao processo, capacidade de processamento e a análise de dados do que a qualquer formato ou função em particular. Embora a mídia traga a IA com imagens de robôs parecidos com os humanos dominando o mundo, a IA não pretende substituir os seres humanos, seu objetivo é melhorar as habilidades e contribuições humanas. Mas como podemos ensinar a máquina a tomar decisões? Existem duas formas de aplicar o aprendizado de máquina: O supervisionado que se baseia em conhecimentos prévios para predizer futuros acontecimentos, metodologia abordada pelo Prof. Dr. Wellington Aguiar em sua tese de Doutorado sobre “O DESENVOLVIMENTO DE MODELOS PREDITIVOS DE MORTALIDADE INFANTIL COM BASE EM INTELIGÊNCIA ARTIFICIAL NO ESTADO DO CEARÁ”, onde foi utilizado dados históricos sobre a mortalidade infantil para predizer futuros casos de mortalidade infantil; E o não-supervisionado que através de uma massa de dados é possível extrair as informações e agrupá-las por características semelhantes (AGUIAR, 2019). Na corrida comercial sai na frente quem utiliza técnicas modernas para otimizar e maximizar os resultados, essa pesquisa mostrará através de gráficos e resultados estatísticos como usar a inteligência artificial para agrupar os clientes por interesse de compra e comportamento, e dessa forma promover ações de vendas mais assertivas. O uso de Inteligência Artificial tem se tornado uma ferramenta crucial para as grandes corporações. Empresas como Facebook e Google, utilizam cada vez mais esse recurso, pois através da IA conseguem identificar os interesses de seus clientes fazendo com que seus produtos sejam mais assertivos quando oferecido. O objetivo principal dessa pesquisa é levar esse recurso tecnológico para empresa de pequeno porte, pois sabemos que nem toda empresa possui um setor voltado para pesquisas de IA. A utilização dessa tecnologia permitirá que essas empresas de pequeno porte tenham informações sobre seus clientes e consequentemente otimizando suas ações de vendas. 13 1.2 OBJETIVOS 1.2.1 Objetivo geral O objetivo principal desta pesquisa é utilizar técnicas avançadas de IA para auxiliar varejistas de instrumentos musicais a maximizar suas ações estratégicas de vendas através do conhecimento detalhado dos seus grupos de clientes. 1.2.2 Objetivos Específicos a) Descrever conceitos de inteligência artificial. b) Aplicar o algoritmo KNN e K-Means em base de dados reais. c) Aplicar técnicas de desenvolvimento de software estudadas na graduação. 2 FUNDAMENTAÇÃO TEÓRICA 2.1 Definições importantes Por se tratar de uma pesquisa científica, antes de seguimos no estudo apresentado é necessária uma breve explicação de alguns conceitos prévios como: Mercado de Instrumentos musicais, Curva ABC, Inteligência artificial, Cluster, KNN, Distância Euclidiana, Phyton etc. 2.2 Mercado de Instrumentos musicais O ato de tocar um instrumento musical é uma prática bastante antiga, onde os primeiros indícios foram relatados período antes do Nascimento de Cristo pelos povos Hebreus. No livro da Bíblia sagrada, mais precisamente no antigo testamento, relata que os Hebreus foram os pioneiros a fabricar um instrumento musical que tinha por nome alaúde, como apresenta a Figura 1, um instrumento de cordas que possuía uma caixa de ressonância que permitia ecoar o som das notas musicais (BIBLIA 1° CRONICAS, A.C). 14 Figura 1 – Instrumento Musical Alaúde. Fonte: Alaúde, construído por Matheus Buchenberg, século XVII. Nos dias atuais, a compra e venda de instrumentos musicais tem crescido de forma exponencial, pois com o advento das vendas online, permitiu que o consumidor tenha uma nova forma de adquirir seu instrumento, que até então só era possível comprar através de uma loja física. 2.2 Curva ABC O crescente aumento da competitividade leva as organizações a buscarem maneiras de otimizar seus processos com a finalidade de reduzir custos. Uma das formas para se obter essa redução está na melhoria do controle e gerenciamento de estoque. Neste contexto, aplica-se a curva ABC como um método usado para controle de estoques nas empresas, possibilitando aos gerentes uma visão geral de todos os produtos, classificando-os com base em seu valor monetário. Nessa metodologia podemos classificar os intens. em 3 níveis de relevância onde A é a maior importância, valor ou quantidade, correspondendo a 20% do total – podem ser itens do estoque com uma demanda de 65% num dado período; B com importância,quantidade ou valor intermediário, correspondendo a 30% do total – podem ser itens do estoque com uma demanda de 25% num dado período; C de menor importância, valor ou quantidade, correspondendo a 50% do total – podem ser itens do estoque com uma demanda de 10% num dado período (CARVALHO, 2002). 2.3 Inteligência Artificial. Por diversos anos, o termo Inteligência Artificial era observado como algo futurístico, onde sempre foi passado na imagem de um robô com forma de humano onde tentava realizar ações e sentimentos humanos, como podemos observar no 15 filme “O homem bicentenário” dirigido por Chris Columbus, atuado por Robin Williams onde protagonista executava tarefas do dia a dia (O homem bicentenário, 2000). Como bem sabemos, a inteligência artificial vai muito além de uma simples história de ficção cientifica, com ela é possível compilar uma grande massa de dados que outrora era impossível aos olhos da inteligência humana. Com os grandes avanços das pesquisas em IA, através de um algoritmo, é possível obter diversas informações sobre um levantamento de dados, até mesmo predições de possíveis acontecimentos com base em informações anteriores. Mas calma, IA não é uma simples “bola de cristal” que com um passe mágico advinha as informações futuras, por trás da IA existe uma serie de cálculos matemáticos e estatísticos que são encarregados de solucionar as predições. 2.4 Cluster Você já parou para pensar que em meio a uma grande massa de dados é quase impossível para o ser humano identificar padrões de semelhanças? Imagine que você está em um veículo parado em frente uma faixa de pedestre e enquanto você aguarda o semáforo abrir, diversas pessoas trafegam pela faixa de pedestre cada uma carrega consigo um cartaz escrito diversos dados como: peso, idade, sexo, ocupação e tipo sanguíneos. Em alguns segundos você fica exposto a uma série de informações que aos olhos humanos, é impossível agrupar os pedestres como base nos dados semelhantes. O conceito de cluster está atrelado fortemente ao aprendizado não- supervisionado, pois seu objetivo principal é desvendar a organização dos padrões existentes nos dados através de clusters (agrupamentos) encontrados (Pro: Fabio Faria, 2015). Ensinar ao algoritmo como ele deve encontrar os padrões de semelhanças sem uma informação anterior, é necessário seguir algumas etapas divididas em: seleção de atributos; medida de proximidade; critério de agrupamento, algoritmo de agrupamento; verificação dos resultados e interpretação dos resultados. Cada parte do processo precisa ser executado a risco para que as informações resultantes se tornem mais precisas. 16 2.5 KNN O algoritmo KNN (K Nearest Neighbor) é um dos algoritmos mais utilizados em Machine Learning pois sua usabilidade é consideravelmente simples e prática. A utilização desse algoritmo vem ganhando cada vez mais força, pois sua usabilidade está atraindo outros campos de pesquisas como áreas da saúde, finanças, ciência política e reconhecimento de imagem. Neste algoritmo possuímos uma variável chamada de K, a qual é parte do nome do modelo e o principal parâmetro a ser selecionado. Este parâmetro direcionará a quantidade de vizinhos (neighborn em inglês). Em casos de modelos binários, onde possuímos apenas duas classes, em geral aplicasse valores ímpares a K, mas lembre-se que cada caso é um caso, “No free lunch”. Imagine que temos um valor P1 o qual queremos predizer, entre um grupo de duas classes aonde o valor atribuído a K foi 1 (K=1), primeiro iremos identificar o ponto mais próximo a ele e depois qual a label que o identifica, classe A por exemplo, como apresenta a Figura 2 (LUZ; FELIPE, 2019). Figura 2 - Algoritmo KNN. Fonte: Felipe Luz, 2019. 2.6 Distância Euclidiana A distância euclidiana é uma das medidas de dissimilaridade entre comunidades mais utilizadas na prática (GAUCH, 1982). De acordo com Brower e Zar (1977), quanto menor o valor da distância euclidiana entre duas comunidades, 17 mais próximas elas se apresentam em termos de parâmetros quantitativos por classe, logo, quanto menor a distância euclidiana, maior a eficiência do procedimento. A Figura 3 abaixo, apresenta fórmula de cálculo. Figura 3 - Fórmula Distância Euclidiana. Fonte: Prof. Ricardo J. G. B. Campello, 2012. Na Figura 3 acima podemos identificar como é realizado o cálculo matemático, onde DE representa Distância Euclidiana dos pontos cartesianos X e Y. Logo após o sinal de igual temos um sinal de raiz quadrada onde dentro da racionalização possui um somatório e por fim entre parênteses os pontos X e Y elevado ao quadrado. Para executarmos a equação é necessário que primeiramente realize a subtração entre os dois pontos X e Y dentro de um parêntese, onde o resultado será elevado ao quadrado seguido por um somatório que logo após será racionalizado gerando o resultado da equação. 2.7 Python Se pudéssemos definir Phyton é uma única palavra, com certeza seria flexibilidade, que por sinal, essa característica vem atraindo diversos programadores a desenvolverem suas aplicações em Phyton, onde através de uma única sintaxe é possível criar diversos projetos desde a construção de web site até aplicações mais complexas utilizando inteligência artificial. Nessa pesquisa, Phyton será a linguagem de programação que irá reger todo o projeto, onde incialmente faremos a leitura dos dados através de uma tabela que contém uma série de informações relacionadas a vendas de uma empresa e logo após, executaremos um script baseado em Distância Euclidiana que irá relacionar os produtos comprados com os tipos de clientes. 18 3 METODOLOGIA O estudo apresentado nessa tese caracteriza-se como pesquisa aplicada, onde o principal objetivo é a geração de conhecimento para aplicação prática e imediata, dirigidos à solução de problemas específicos envolvendo os interesses locais, financeiros e comerciais. A fim de contribuir para fins práticos, essa pesquisa visa solucionar problemas encontrados na realidade no mercado varejista de instrumentos musicais. A natureza desta pesquisa é de caráter quantitativo. A metodologia quantitativa necessita de números para que seja possível ser mensurada (DALFOVO et al., 2008). Essa metodologia usa técnicas estatísticas para a elaboração de seus dados, objetivando resultados que não tragam distorções de análise e interpretação, trazendo uma maior margem de segurança. Nesta pesquisa foi utilizada a metodologia de pesquisa bibliográfica, onde os estudos para aplicação foram retirados de artigos científicos, sites governamentais e livros. O motivo de usar a pesquisa bibliográfica, foi pelo fato de possibilitar um maior alcance das informações, pois com ela foi possível ter um maior embasamento teórico em determinados assuntos que não era de meu conhecimento, como foi o caso da Curva ABC, onde esse tipo de conteúdo é visto em outros graduações como Logística, Administração e afins. Para a elaboração desse estudo, foi necessário compreender o funcionamento dos processos de vendas de instrumentos em uma loja física, pois era de suma importância conhecer a logística de compra e vendas dos produtos. Após realizar uma pesquisa de campo nos processos de uma determinada empresa, foi necessário desenvolver um script em Phyton para processar e interpretar as informações de uma tabela de vendas a fim gerar um relatório estatístico com os produtos vendidos com base nos perfis. É importante ressaltar que os dados utilizados nessa pesquisa foram simulados a partir da experiencia do pesquisador que trabalha em uma loja de instrumentos musicais. 19 4 LEVANTAMENTO DE DADOS Para o levantamento dos dados dessa pesquisa foi necessário elaborar uma tabela de vendas com o máximo de informações verídicas sobre os fatos (vendas). Foi executado um scriptem Python com várias fases, que leu, tratou e processou os dados dessa tabela. O Script leu e interpretou uma tabela com duzentos e sessenta e dois registros que simulavam as informações referentes as vendas efetuadas no período do estudo, conforme apresenta a Tabela 1 abaixo. Tabela 1 – Amostra de 28 registros retirada da tabela de vendas. Fonte: Elaborada pelo autor. Na Tabela 1 acima podemos observar como são organizados os itens vendidos em uma loja de instrumento. Cada linha dessa tabela registra informações de suma importância, que se estende desde o item adquirido até o motivo que levou o cliente a compra. Cada coluna dessa tabela é uma variável que foi utilizada pelo script, isso nos leva a entender que quanto maior for o número de variáveis explicativas existente em nossa base de dados melhor será o resultado. 4.1 Coleta dos dados Para que fosse possível interpretar os dados da tabela representada na Tabela 1, foi necessário converter (categorizar) as informações de cada coluna em número (categoria) como mostra a Tabela 2 abaixo. 20 Tabela 2 – Amostra de 28 registros convertido. Fonte: Elaborada pelo autor. A tabela 3 abaixo apresenta como os dados foram categorizados após a conversão dos dados. Tabela 3 – Legenda de dados convertidos. Fonte: Elaborada pelo autor. 4.2 O Script Após realizar a conversão dos dados, o script foi executado a fim de ler em um primeiro momento todas as informações contidas na tabela. Em seguida, foi necessário inserir uma coluna chamada de ID (identificador) que permitisse a identificação de cada venda realizada. Em um terceiro estágio do processo, o script executou uma rotina estatística que gerou o histograma de todas as variáveis do modelo para uma avaliação individual de cada variável, conforme podemos observar abaixo no gráfico 1. 21 Gráfico 1 – Gráficos estatísticos gerado pelo script Fonte: Elaborada pelo autor. 4.3 Categorização dos dados. Nessa pesquisa o objetivo é identificar as correlações das variáveis com as vendas realizadas para assim definirmos os perfis dos clientes. Para facilitar esse entendimento, foi gerado uma matriz de correlação entre todas as variáveis. Na estatística chamamos de Matriz de Correlação. Nessa etapa, colocamos as variáveis frente a frente. Isso nos permitiu identificar se alguma vaiável tinha forte correlação com outra, como mostra a Gráfico 2 abaixo. Gráfico 2 – Matriz de correlação. Fonte: Elaborada pelo autor. 22 Na matriz de correlação representada pelo Gráfico 2 acima, podemos analisar que quanto mais claro for o quadrado, maior é a correlação. Claro que quando comparamos as variáveis contra elas mesma, a relação será máxima, mas ao colocar contra outra variável diferente começamos a observar onde se localizam as verdadeiras correlações que poderão ser utilizadas no estudo. Como é o caso da variável DIA_COMP e EST_CIVIL onde podemos notar uma correlação mais forte por meio da matriz. 4.4 Reduções dos dados de uma venda em um par de informações (X, Y) Para que fosse possível utilizar as 11 (onze) variáveis em um plano cartesiano, foi necessário simplificar todas elas em um par de valores (X, Y) conforme a Gráfico 3 abaixo, em que cada ponto representa uma compra da base de dados. O plano cartesiano é um objeto matemático plano e composto por duas retas numéricas perpendiculares, ou seja, retas que possuem apenas um ponto em comum, formando um ângulo de 90°. Esse ponto comum é conhecido como origem e é nele que é marcado o número zero de ambas as retas (SILVA, Luiz 2022). Gráfico 3 - Mapeamento das vendas no plano cartesiano. Fonte: Elaborada pelo autor. https://brasilescola.uol.com.br/o-que-e/matematica/o-que-e-reta-numerica.htm https://brasilescola.uol.com.br/o-que-e/matematica/o-que-e-reta-numerica.htm https://brasilescola.uol.com.br/matematica/retas-perpendiculares.htm https://brasilescola.uol.com.br/o-que-e/matematica/o-que-e-angulo.htm 23 4.5 Curva de cotovelo Antes de executamos o script do K-mens para “clusterizar” os dados, precisamos definir em quando grupos será a divisão. O gráfico: Curva de cotovelo é utilizado como guia para definir a quantidade agrupamentos. Esse gráfico indica que quanto mais próximo do vértice (x, y), deve-se colher o valor de X, que será a quantidade ideal de Cluster. No caso desta pesquisa, a “curva” se encontrou entre 5 e 6 do plano cartesiano como mostra o Gráfico 4 abaixo. Gráfico 4 – Curva de cotovelo. Fonte: Elaborada pelo autor. 4.6 Classificação dos dados em clusters Com a quantidade de grupos já definido pelo gráfico de cotovelo, escolhemos K = 5, chegamos na última etapa do levantamento dos dados. Nessa etapa, os dados foram processados pelo algoritmo K-means que é o responsável por calcular a distância Euclidiana entre os pontos e assim definir os 5 (cinco) grupos. Em um primeiro o momento, o algoritmo foi executado e selecionou 5 cluster aleatórios para utilizar como centroide (ponto referencial) e agrupou os demais pontos. O K-means utilizou cálculos matemáticos baseado em Distância Euclidiana 24 para calcular as semelhanças entres as vendas efetuadas. Para conseguimos chegar ao resultado mais assertivo possível. O Algoritmo K-means executa laços diversas vezes, pois a cada execução do laço, os pontos são recalculados e redirecionados para outros centroides. O algoritmo realizou uma serie de repetição até chegarmos a uma condição em que não havia mais movimentações entre pontos, chegando ao resultado onde foi possível identificar cada venda realizada agrupada em um único centroide, como podemos verificar no Gráfico 5 abaixo. Gráfico 5 – Dados clusterizados Fonte: Elaborada pelo autor. No Gráfico 5 acima, é possível identificar visualmente todas as 262 vendas simuladas no estudo já definidas em cada grupo. É válido ressaltar que os 5 cluster definidos pela curva de cotovelo, são numeradas de 0 a 4 como demonstra a legenda. Com cada venda já agrupada ao seu cluster, foram realizadas várias análises que serão vistas no tópico a seguir. 25 5 - ANÁLISE DE DADOS Após o processamento do algoritmo do K-means, cada venda foi marcada com o seu respectivo Cluster calculado pelo algoritmo. Na Tabela 4 já podemos ver algumas vendas com seu respectivo cluster definido. Após o processamento foi adicionado uma nova coluna chamada, CLUSTER como pode ser observado abaixo. Tabela 4 – Resultado da Clusterização. Fonte: Elaborada pelo autor. Após a base ser agrupada aplicamos a estatística descritiva nas principais variáveis explicativas. Na primeira variável SEXO, podemos observar que o grupo 0, é composto por 35% de pessoas do sexo feminino, seguido por 35% no grupo 1, e o restante nos demais grupos. Com essa informação inicial já possível perceber que se fossemos definir uma ação de venda para o público feminino, os grupos 0 e1 seriam os mais propícios a adquirir um determinado tipo de produtos como podemos observar no Gráfico 6 abaixo. 26 Gráfico 6 – Agrupamento por sexo. Fonte: Elaborada pelo autor. No gráfico acima podemos ter uma virão geral sobre como estão distribuídos os clientes entre os cluster, onde a maior parte dos clientes se encontram nos grupos 0 e 1. Sobre a variável FX ETÁRIA (Faixa Etária), observamos que 46% dos clientes do grupo 4 são constituídos por pessoas de até 22 anos. Já no grupo 3, verificamos que os clientes possuem idade entre 22 e 32 anos totalizando 17%. Entretanto, no grupo 2 os dados foram inferiores a 1% em todas as faixas etárias. Todavia, o grupo 1 apresentou uma grande concentração totalizando seu público entres 22 e 63 anos ficando atrás apenas do grupo 0, que atingiu todas as faixas etárias, conforme o Gráfico 7 abaixo. Gráfico 7 – Agrupamento por faixa etária. Fonte: Elaborada pelo autor.27 Quando observamos os agrupamentos e analisamos o grau de instrução dos clientes, observamos que No grupo 0, temos a maior parte do público formado por pessoas GRADUADAS, totalizando 59%. Já no grupo 1, temos seu público voltado para pessoas que concluíram o ensino básico somando cerca de 82%. Novamente no grupo 2 não tivemos uma definição correta do público, não gerando dados suficientes para construir uma estatística. Já nos grupos 3 e 4, são formadas por indivíduos que possui o ensino médio completo totalizando 13% e 28% respectivamente como podemos analisar no Gráfico 8 abaixo. Gráfico 8 – Agrupamento por grau de instrução Fonte: Elaborada pelo autor. Com a coluna CLUESTER adicionada aos dados, foi possível gerar uma segunda tabela que serviu como a base dessa pesquisa, com ela conseguimos analisar e entender melhor cada grupo gerado. A partir dessa tabela foi possível identificar os perfis de cada grupo, caso fosse necessário realizar uma ação de venda onde o objetivo fosse vender violões para pessoas do sexo feminino, com idade entre 33 e 42 anos, com certeza o grupo 0 seria o perfil ideal para essa ação. Esse é apenas uma das aplicações possíveis através desse estudo, pois com ele conseguimos visualizar até qual produto performaria de forma positiva em um determinado grupo. Por exemplo, se fossemos selecionar um determinado produto para ofertamos ao grupo 1, o instrumento 28 bateria seria o mais indicado, pois ele teve 100% de vendas com base na tabela simulada. A Tabela 5 baixo, nos apresenta todos os dados sumarizados nesse estudo. Com esse resumo é possível extrair insights e conhecimentos para apoiar a definição das ações de vendas, pois em cada grupo podemos observar as características de maior destaque, como Faixa etária, sexo, Grau de Instrução, Ocupação, entre outros. Tabela 4 – Correlação representada forma estatística Fonte: Elaborada pelo autor. 29 6 CONCLUSÕES A presente pesquisa teve o objetivo de otimizar o trabalho dos profissionais de vendas que se encontram alocados em empresas de instrumentos musicais utilizando uma das técnicas da Inteligência Artificial (Aprendizado Não- Supervisionado) para maximizar as vendas. Nessa pesquisa foram encontradas algumas restrições que impediram o estudo de levantar os dados com informações reais, pois no sistema utilizado na empresa usada como base, não foi possível disponibilizar os dados, isso exigiu a utilização de uma base de dados fictícia, que simulasse as vendas realizadas. A simulação dos dados nos permitiu executar a proposta da pesquisa. É válido ressaltar que esse estudo pode ser replicado em qualquer empresa de vendas varejo de pequeno ou médio porte, pois os dados necessários para execução dele, são possíveis de se obter no comércio varejista, não necessariamente de instrumentos musicais, tornando a pesquisa uma grande oportunidade para microempresários que desejam alavancar suas vendas. A estudo apresentado mostrou-se eficiente, pois foi possível conhecer de forma estatística os tipos de clientes, permitindo com que a equipe comercial proponha ações estratégicas de vendas mais assertivas como base nos interesses de cada grupo de clientes. Um dos principais resultados compreendidos nesse estudo, foi o fato de um determinado grupo de pessoas do sexo feminino, com idade entre 63 anos ou mais, com grau de instrução graduado, trabalhando, compraram uma guitarra como seu primeiro instrumento para aprender a tocar. Esse foi apenas um dos diversos levantamentos que foi possível obter através dessa pesquisa, a partir dele, é possível mapear de forma estratégica qual ação deve ser realizada para cada grupo de clientes. Em conclusão, a presente pesquisa abre um amplo caminho para soluções com inteligência artificial, pois com ela será possível levar o conhecimento das grandes corporações para âmbito das microempresas que poderão maximizar suas vendas gerando mais empregos e renda. 30 7 PROJETOS FUTUROS Em relação a projetos futuros, recomendaria executar o script novamente com apenas 4 cluster, pois como foi possível perceber na análise dos dados, o grupo 2 apresentou poucos dados nas inferências, o que nos leva a imaginar que se utilizássemos 4 grupos ao invés de 5, os resultados poderiam ser mais realistas. Isso faz parte do ajuste do modelo, normal nesse tipo de estudo. Agora com o estudo realizado, o passo seguinte é propor para a empresa base, o uso de seus dados reais para ter conclusões reais e aplicações reais. REFERÊNCIAS DALFOVO, Michael Samir; LANA, Rogério Adilson; SILVEIRA, Amélia. Título: Métodos quantitativos e qualitativos: um resgate teórico. Revista Interdisciplinar Científica Aplicada, Blumenau, 2008. Data Science Academy. POR QUE A LINGUAGEM PYTHON É TÃO POPULAR EM MACHINE LEARNING E INTELIGÊNCIA ARTIFICIAL?. [S.I.] [2020]. Disponível em: <http://datascienceacademy.com.br/blog/por-que-a-linguagem-python-e-tao- popular-em-machine-learning-e-inteligencia-artificial/>. Acesso em: 24 mai. de 2020. Lima, T. C. S., & Mioto, R. C. T. Título: Procedimentos metodológicos na construção do conhecimento científico: a pesquisa bibliográfica. Revista Katálysis, 10 (esp.), Florianópolis, [2007] Disponível em: <https://www.scielo.br/scielo.php?pid=S1414- 49802007000300004&script=sci_arttext> Acesso em: 20 mai. de 2022 WOLFF, D.O uso da música polifônica vocal renascentista no repertório do alaúde e vihuela. In: Em Pauta - Revista do Programa de Pós-Graduação em Música da Universidade Federal do Rio Grande do Sul, v. 14, n. 22, Porto Alegre,2003. GAUCH, H.G. Multivariate analysis in community ecology. Cambridge: Cambridge University Press, 1982. 298p. CAMPELLO, R. J. G. B. “SCC0173 – Mineração de Dados Biológicos - Preparação de Dados: Parte B”, disponível em http://wiki.icmc.usp.br/images/e/e1/Preparacao_Dados_II.pdf, acesso em 12 de novembro de 2012. SILVA, Luiz Paulo Moreira. "O que é plano cartesiano?"; Brasil Escola. Disponível em: https://brasilescola.uol.com.br/o-que-e/matematica/o-que-e-plano- cartesiano.htm. Acesso em 23 de junho de 2022. http://datascienceacademy.com.br/blog/por-que-a-linguagem-python-e-tao-popular-em-machine-learning-e-inteligencia-artificial/ http://datascienceacademy.com.br/blog/por-que-a-linguagem-python-e-tao-popular-em-machine-learning-e-inteligencia-artificial/ https://www.scielo.br/scielo.php?pid=S1414-49802007000300004&script=sci_arttext https://www.scielo.br/scielo.php?pid=S1414-49802007000300004&script=sci_arttext 31 HALLAM, S. "Psicologia da música na educação: O PODER DA MUSICA NA APRENDIZAGEM", disponível em https://www.apem.org.pt/docs/artigos-em- destaque/PsicologiaDaMusica_RPED_140_141_2014_2015.PDF, acesso em 01 de maio de 2022. FARIA, F. A “Aprendizagem não supervisionada Agrupamento (Clustering)", disponível em https://www.ic.unicamp.br/~ffaria/ia1s2017/class14/class14- Agrupamento.pdf, acesso em 17 de maio de 2022. CARVALHO, José Mexia Crespo de - Logística. 3ª ed. Lisboa: Edições Silabo, 2002. TELLES, EDUARDO SANTOS; BARONE, DANTE AUGUSTO COUTO; DA SILVA, ALEXANDRE MORAES. Inteligência Artificial no Contexto da Indústria 4.0. In: Anais do I Workshop sobre as Implicações da Computação na Sociedade. SBC, 2020. p. 130-136
Compartilhar