Buscar

FINAL-TCC_JONATAS-PESQUISA-IA_26062022_Final_Revisado

Prévia do material em texto

1 
 
 
 
 
CURSO DE SISTEMA DE INFORMAÇÃO 
 
 
 
 
JÔNATAS EDWARDS COSTA DE ABREU 
 
 
 
 
 
USO DA INTELIGÊNCIA ARTIFICIAL NO MERCADO DE 
INTRUMENTOS MUSICAIS PARA MAXIMIZAR VENDAS 
 
 
 
 
 
 
 
 
FORTALEZA 
2022 
 
2 
 
JÔNATAS EDWARDS COSTA DE ABREU 
 
 
USO DA INTELIGÊNCIA ARTIFICIAL NO MERCADO DE 
INTRUMENTOS MUSICAIS PARA MAXIMIZAR VENDAS 
 
 
Trabalho de Conclusão de curso apresentado 
ao curso de Sistema de Informação do Centro 
Universitário Estácio do Ceará como requisito 
para a obtenção do título de bacharel em 
Sistema de Informação. 
Orientador: Prof. Dr. Wellington Sousa Aguiar 
 
 
 
 
 
 
 
 
 
 
 
 
FORTALEZA 
2022 
 
3 
 
 
AGRADECIMENTOS 
A Deus, mesmo diante as dificuldades existentes da vida, Ele sempre me 
deu forças para jamais desistir dos meus objetivos. 
Aos meus pais, Erialdo França de Abreu e minha querida mãe Fernanda 
Costa de Abreu que mesmo diante das dificuldades financeiras, batalharam duro 
para que tivesse o melhor estudo possível. 
A minha amada esposa Prisciliane da Silva Carneiro que esteve ao meu lado 
em todos os momentos difíceis e sempre me mostrou que é possível conquistar o 
mundo, basta ter dedicação força de vontade. 
Ao meu orientador, Prof. Dr. Wellington Sousa Aguiar, pela sua forma única 
de compartilhar conhecimento e por motivar seus alunos em todas as suas aulas a 
sermos seres humanos melhores. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
4 
 
RESUMO 
A comercialização de instrumentos musicais nos últimos anos teve um crescimento 
exponencial, pois a diversidade de públicos tem aumentado cada vez mais, fazendo 
com que grandes varejistas do mercado musical realizem ações de vendas 
estratégicas para cada público. Graças ao grande avanço no campo das pesquisas 
com a inteligência artificial é possível usar técnicas de inteligência artificial para 
avaliar grandes volumes de informações e através de um determinado algoritmo 
decifrar aspectos comportamentais dos consumidores. Essa pesquisa tem como 
objetivo utilizar técnicas avançadas de IA desenvolvidas em Python para auxiliar 
aos varejistas de instrumentos musicais a identificar corretamente os grupos de 
clientes e suas necessidades, baseado no algoritmo KNN (K - Nearest Neighbors). 
A metodologia utilizada é a quantitativa para apresentar os resultados estatísticos 
apurados pelos algoritmos de IA. Como principais resultados, conseguimos definir 
5 grupos de clientes onde foi possível identificar qual ação de venda seria mais 
assertiva. Concluindo, podemos afirmar que o uso de IA na clusterização 
(agrupamento) de clientes pode gerar uma vantagem estratégica e competitiva para 
as empresas que utilizam esses métodos modernos. 
Palavras-chave: instrumentos musicais; inteligência artificial, knn; música; mercado 
musical. 
 
 
 
 
 
 
 
 
 
5 
 
ABSTRACT 
Years of sales of musical instruments in recent years has had an exponential growth, 
as the diversity of audiences has increased more and more, causing major 
presentations in the music market to carry out strategic actions for each audience. 
Thanks to the great advance in the field of research with artificial intelligence, it is 
possible to use artificial intelligence techniques for large volumes of information and 
through an animal to decipher behavioral behaviors of consumers. This aims to use 
advanced IAN techniques in Python to help research groups on musical instruments 
and correctly defined, based on the KN (K - Nearest Neighbors) project. The 
methodology used is accessible to present the statistical results of AI. As main 
results, 5 groups of customers were defined in a more assertive series. We can say 
that the use of AI in the clustering (grouping) of customers can generate a strategic 
and competitive advantage to conclude that they use these modern methods. 
Keywords: musical instruments; artificial intelligence; knn; music; music market. 
 
 
 
 
 
 
 
 
 
 
 
6 
 
 
LISTA DE FIGURAS 
Figura 1 - Instrumento Musical Alaúde..................................................................14. 
Figura 2 - Fórmula Distância Euclidiana................................................................16. 
Figura 3 - Legenda de dados convertidos. ................................................ ...........17. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
7 
 
LISTA DE GRÁFICOS 
Gráfico 1 - Gráficos estatísticos gerado pelo script..............................................21. 
Gráfico 2 - Matriz de correlação...........................................................................21. 
Gráfico 3 - Mapeamento das vendas no plano cartesiano...................................22. 
Gráfico 4 - Curva de cotovelo...............................................................................23. 
Gráfico 6 - Agrupamento por sexo........................................................................26. 
Gráfico 7 - Agrupamento por faixa etária..............................................................26. 
Gráfico 8 - Agrupamento por grau de instrução....................................................27. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
8 
 
 
LISTA DE TABELAS 
Tabela 1 - Amostra de 28 registros retirada da tabela de vendas.........................19. 
Tabela 2 - Amostra de 28 registros convertido... .................................................. 20. 
Tabela 3 - Legenda de dados convertidos. ............................................... ...........20. 
Tabela 4 - Resultado da Clusterização.................................................................. 25. 
Tabela 5 - Correlação representada forma estatística...........................................28. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
9 
 
 
LISTA DE ABREVIATURAS E SIGLAS 
IA INTELIGÊNCIA ARTIFICIAL 
KNN K — Nearest Neighbors 
ML Machine Learning 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
10 
 
 
 
SUMÁRIO 
1 INTRODUÇÃO ..................................................................................................11. 
1.2 OBJETIVOS ...................................................................................................13. 
1.2.1 Objetivo geral ..............................................................................................13. 
1.2.2 Objetivos Específicos ..................................................................................13. 
2 FUNDAMENTAÇÃO TEÓRICA..........................................................................13. 
2.1 Definições importantes....................................................................................13. 
2.1.1 Mercado de Instrumentos musicais..............................................................13. 
2.2 Curva ABC ......................................................................................................14. 
2.3 Inteligência Artificial.........................................................................................14. 
2.4 Cluster.............................................................................................................15. 
2.5 Algoritmo KNN.................................................................................................16. 
2.6 Distância Euclidiana ........................................................................................16. 
2.7 Pyton ...............................................................................................................17. 
3 METODOLOGIA.................................................................................................18. 
4 LEVANTAMENTO DE DADOS ..........................................................................19. 
4.1 Coleta dos dados ............................................................................................19. 
4.2 O Script ...........................................................................................................20.4.3 Categorização dos dados................................................................................21. 
4.4 Reduções dos dados de uma venda em um par de informações (X, Y).........22. 
4.5 Curva de cotovelo............................................................................................23. 
4.5 Classificação dos dados em clusters...............................................................23. 
5 ANÁLISE DE DADOS.........................................................................................25. 
6 CONCLUSÃO.....................................................................................................29. 
7 PROJETOS FUTUROS......................................................................................30. 
REFERÊNCIAS ....................................................................................................30. 
 
 
 
 
 
11 
 
1 INTRODUÇÃO  
A prática de tocar um instrumento musical tem aumentado cada vez mais, 
pois além de proporcionar a satisfação pessoal, ela promove ao indivíduo seja qual 
for a sua idade diversos benefícios, como: Coordenação motora, raciocínio lógico, 
concentração entre outros benefícios. O uso de instrumentos musicais é indicado 
para todas as idades, em especial para crianças, pois seu estímulo auxilia na 
resolução de problemas matemáticos como relata Susan Halla em seu artigo sobre:” 
Psicologia da música na educação: O poder da música na aprendizagem”.   
Por promover uma série de benefícios mentais e físicos, a procura por 
instrumentos musicais em lojas especializadas tem crescido cada vez mais, de 
forma que o público praticante tem se diversificado, onde crianças, homens, 
mulheres e idosos possuem interesse totalmente distintos na hora de escolher seu 
instrumento.  
Atualmente, o comércio de instrumentos musicais possui uma grande 
dificuldade em conseguir realizar ações efetivas de vendas, pois não conseguem 
identificar as predisposições de seus clientes. De modo geral, quando uma empresa 
promove uma ação de venda em um determinado produto essa decisão muitas 
vezes é tomada a partir de informações corriqueiras como por exemplo: produtos 
que estão por muito tempo no estoque ou uma quantidade considerável do mesmo 
produto. Criar promoções com base nesse tipo de dados normalmente não retornam 
os resultados desejados, pois quem garante que os clientes dessa empresa têm 
interesse nesse tipo de produto ofertado? Acreditamos que é bem mais válido e 
assertivo criar promoções com base nos gostos e características de cada cliente, 
mas como podemos identificar um padrão de interesses para cada grupo de 
clientes? Essa pesquisa tem como objetivo central identificar padrões de compras 
com base em “Clusterização” ou agrupamento de clientes.  
Hoje a tecnologia tem avançado de forma exponencial onde conceitos como: 
inteligente artificial ou Machine Learning tem se tornado cada vez mais acessível ao 
mercado geral, onde antes esses conhecimentos computacionais eram usados 
apenas em pesquisas cientificas, agora estão disponíveis também para pequenas e 
médias empresas.   
Quando falamos em (IA) Inteligência Artificial, podemos imaginar “n” 
informações, mas de forma bem resumida e usual, IA nada mais é do que a máquina 
 
12 
 
simulando a inteligência humana na tomada de decisões. O conceito de Inteligência 
Artificial está mais relacionado ao processo, capacidade de processamento e a 
análise de dados do que a qualquer formato ou função em particular. Embora a 
mídia traga a IA com imagens de robôs parecidos com os humanos dominando o 
mundo, a IA não pretende substituir os seres humanos, seu objetivo é melhorar as 
habilidades e contribuições humanas.  
Mas como podemos ensinar a máquina a tomar decisões? Existem duas 
formas de aplicar o aprendizado de máquina: O supervisionado que se baseia em 
conhecimentos prévios para predizer futuros acontecimentos, metodologia 
abordada pelo Prof. Dr. Wellington Aguiar em sua tese de Doutorado sobre “O 
DESENVOLVIMENTO DE MODELOS PREDITIVOS DE MORTALIDADE INFANTIL 
COM BASE EM INTELIGÊNCIA ARTIFICIAL NO ESTADO DO CEARÁ”, onde foi 
utilizado dados históricos sobre a mortalidade  infantil para predizer futuros casos 
de mortalidade infantil; E o não-supervisionado que através de uma massa de dados 
é possível extrair as informações e agrupá-las por características semelhantes 
(AGUIAR, 2019).  
Na corrida comercial sai na frente quem utiliza técnicas modernas para 
otimizar e maximizar os resultados, essa pesquisa mostrará através de gráficos e 
resultados estatísticos como usar a inteligência artificial para agrupar os clientes por 
interesse de compra e comportamento, e dessa forma promover ações de vendas 
mais assertivas.  
O uso de Inteligência Artificial tem se tornado uma ferramenta crucial para as 
grandes corporações. Empresas como Facebook e Google, utilizam cada vez mais 
esse recurso, pois através da IA conseguem identificar os interesses de seus 
clientes fazendo com que seus produtos sejam mais assertivos quando oferecido. 
O objetivo principal dessa pesquisa é levar esse recurso tecnológico para empresa 
de pequeno porte, pois sabemos que nem toda empresa possui um setor voltado 
para pesquisas de IA. A utilização dessa tecnologia permitirá que essas empresas 
de pequeno porte tenham informações sobre seus clientes e consequentemente 
otimizando suas ações de vendas. 
 
 
13 
 
1.2 OBJETIVOS 
1.2.1 Objetivo geral 
O objetivo principal desta pesquisa é utilizar técnicas avançadas de IA para 
auxiliar varejistas de instrumentos musicais a maximizar suas ações estratégicas de 
vendas através do conhecimento detalhado dos seus grupos de clientes. 
1.2.2 Objetivos Específicos 
a) Descrever conceitos de inteligência artificial. 
b) Aplicar o algoritmo KNN e K-Means em base de dados reais. 
c) Aplicar técnicas de desenvolvimento de software estudadas na 
graduação. 
2 FUNDAMENTAÇÃO TEÓRICA 
2.1 Definições importantes 
Por se tratar de uma pesquisa científica, antes de seguimos no estudo 
apresentado é necessária uma breve explicação de alguns conceitos prévios como: 
Mercado de Instrumentos musicais, Curva ABC, Inteligência artificial, Cluster, KNN, 
Distância Euclidiana, Phyton etc. 
2.2 Mercado de Instrumentos musicais 
 O ato de tocar um instrumento musical é uma prática bastante antiga, onde 
os primeiros indícios foram relatados período antes do Nascimento de Cristo pelos 
povos Hebreus. No livro da Bíblia sagrada, mais precisamente no antigo testamento, 
relata que os Hebreus foram os pioneiros a fabricar um instrumento musical que 
tinha por nome alaúde, como apresenta a Figura 1, um instrumento de cordas que 
possuía uma caixa de ressonância que permitia ecoar o som das notas musicais 
(BIBLIA 1° CRONICAS, A.C). 
 
 
 
 
 
 
14 
 
Figura 1 – Instrumento Musical Alaúde. 
 
 Fonte: Alaúde, construído por Matheus Buchenberg, século XVII. 
 Nos dias atuais, a compra e venda de instrumentos musicais tem crescido de 
forma exponencial, pois com o advento das vendas online, permitiu que o 
consumidor tenha uma nova forma de adquirir seu instrumento, que até então só 
era possível comprar através de uma loja física. 
2.2 Curva ABC 
O crescente aumento da competitividade leva as organizações a buscarem 
maneiras de otimizar seus processos com a finalidade de reduzir custos. Uma das 
formas para se obter essa redução está na melhoria do controle e gerenciamento 
de estoque. Neste contexto, aplica-se a curva ABC como um método usado para 
controle de estoques nas empresas, possibilitando aos gerentes uma visão geral de 
todos os produtos, classificando-os com base em seu valor monetário. 
Nessa metodologia podemos classificar os intens. em 3 níveis de relevância 
onde A é a maior importância, valor ou quantidade, correspondendo a 20% do total 
– podem ser itens do estoque com uma demanda de 65% num dado período; B com 
importância,quantidade ou valor intermediário, correspondendo a 30% do total – 
podem ser itens do estoque com uma demanda de 25% num dado período; C de 
menor importância, valor ou quantidade, correspondendo a 50% do total – podem 
ser itens do estoque com uma demanda de 10% num dado período (CARVALHO, 
2002). 
2.3 Inteligência Artificial. 
 Por diversos anos, o termo Inteligência Artificial era observado como algo 
futurístico, onde sempre foi passado na imagem de um robô com forma de humano 
onde tentava realizar ações e sentimentos humanos, como podemos observar no 
 
15 
 
filme “O homem bicentenário” dirigido por Chris Columbus, atuado por Robin 
Williams onde protagonista executava tarefas do dia a dia (O homem bicentenário, 
2000). 
 Como bem sabemos, a inteligência artificial vai muito além de uma simples 
história de ficção cientifica, com ela é possível compilar uma grande massa de 
dados que outrora era impossível aos olhos da inteligência humana. Com os 
grandes avanços das pesquisas em IA, através de um algoritmo, é possível obter 
diversas informações sobre um levantamento de dados, até mesmo predições de 
possíveis acontecimentos com base em informações anteriores. Mas calma, IA não 
é uma simples “bola de cristal” que com um passe mágico advinha as informações 
futuras, por trás da IA existe uma serie de cálculos matemáticos e estatísticos que 
são encarregados de solucionar as predições. 
2.4 Cluster 
 Você já parou para pensar que em meio a uma grande massa de dados é 
quase impossível para o ser humano identificar padrões de semelhanças? Imagine 
que você está em um veículo parado em frente uma faixa de pedestre e enquanto 
você aguarda o semáforo abrir, diversas pessoas trafegam pela faixa de pedestre 
cada uma carrega consigo um cartaz escrito diversos dados como: peso, idade, 
sexo, ocupação e tipo sanguíneos. Em alguns segundos você fica exposto a uma 
série de informações que aos olhos humanos, é impossível agrupar os pedestres 
como base nos dados semelhantes. 
O conceito de cluster está atrelado fortemente ao aprendizado não-
supervisionado, pois seu objetivo principal é desvendar a organização dos padrões 
existentes nos dados através de clusters (agrupamentos) encontrados (Pro: Fabio 
Faria, 2015). 
 Ensinar ao algoritmo como ele deve encontrar os padrões de semelhanças 
sem uma informação anterior, é necessário seguir algumas etapas divididas em: 
seleção de atributos; medida de proximidade; critério de agrupamento, algoritmo de 
agrupamento; verificação dos resultados e interpretação dos resultados. Cada parte 
do processo precisa ser executado a risco para que as informações resultantes se 
tornem mais precisas. 
 
16 
 
2.5 KNN 
O algoritmo KNN (K Nearest Neighbor) é um dos algoritmos mais utilizados 
em Machine Learning pois sua usabilidade é consideravelmente simples e prática. 
A utilização desse algoritmo vem ganhando cada vez mais força, pois sua 
usabilidade está atraindo outros campos de pesquisas como áreas da saúde, 
finanças, ciência política e reconhecimento de imagem. 
Neste algoritmo possuímos uma variável chamada de K, a qual é parte do 
nome do modelo e o principal parâmetro a ser selecionado. Este parâmetro 
direcionará a quantidade de vizinhos (neighborn em inglês). Em casos de modelos 
binários, onde possuímos apenas duas classes, em geral aplicasse valores ímpares 
a K, mas lembre-se que cada caso é um caso, “No free lunch”. Imagine que temos 
um valor P1 o qual queremos predizer, entre um grupo de duas classes aonde o 
valor atribuído a K foi 1 (K=1), primeiro iremos identificar o ponto mais próximo a ele 
e depois qual a label que o identifica, classe A por exemplo, como apresenta a 
Figura 2 (LUZ; FELIPE, 2019). 
Figura 2 - Algoritmo KNN. 
 
Fonte: Felipe Luz, 2019. 
2.6 Distância Euclidiana 
A distância euclidiana é uma das medidas de dissimilaridade entre 
comunidades mais utilizadas na prática (GAUCH, 1982). De acordo com Brower e 
Zar (1977), quanto menor o valor da distância euclidiana entre duas comunidades, 
 
17 
 
mais próximas elas se apresentam em termos de parâmetros quantitativos por 
classe, logo, quanto menor a distância euclidiana, maior a eficiência do 
procedimento. A Figura 3 abaixo, apresenta fórmula de cálculo. 
Figura 3 - Fórmula Distância Euclidiana. 
 
 Fonte: Prof. Ricardo J. G. B. Campello, 2012. 
Na Figura 3 acima podemos identificar como é realizado o cálculo 
matemático, onde DE representa Distância Euclidiana dos pontos cartesianos X e 
Y. Logo após o sinal de igual temos um sinal de raiz quadrada onde dentro da 
racionalização possui um somatório e por fim entre parênteses os pontos X e Y 
elevado ao quadrado. 
Para executarmos a equação é necessário que primeiramente realize a 
subtração entre os dois pontos X e Y dentro de um parêntese, onde o resultado será 
elevado ao quadrado seguido por um somatório que logo após será racionalizado 
gerando o resultado da equação. 
2.7 Python 
Se pudéssemos definir Phyton é uma única palavra, com certeza seria 
flexibilidade, que por sinal, essa característica vem atraindo diversos 
programadores a desenvolverem suas aplicações em Phyton, onde através de uma 
única sintaxe é possível criar diversos projetos desde a construção de web site até 
aplicações mais complexas utilizando inteligência artificial. 
Nessa pesquisa, Phyton será a linguagem de programação que irá reger todo 
o projeto, onde incialmente faremos a leitura dos dados através de uma tabela que 
contém uma série de informações relacionadas a vendas de uma empresa e logo 
após, executaremos um script baseado em Distância Euclidiana que irá relacionar 
os produtos comprados com os tipos de clientes. 
 
18 
 
3 METODOLOGIA 
 O estudo apresentado nessa tese caracteriza-se como pesquisa aplicada, 
onde o principal objetivo é a geração de conhecimento para aplicação prática e 
imediata, dirigidos à solução de problemas específicos envolvendo os interesses 
locais, financeiros e comerciais. A fim de contribuir para fins práticos, essa pesquisa 
visa solucionar problemas encontrados na realidade no mercado varejista de 
instrumentos musicais. 
A natureza desta pesquisa é de caráter quantitativo. A metodologia 
quantitativa necessita de números para que seja possível ser mensurada 
(DALFOVO et al., 2008). Essa metodologia usa técnicas estatísticas para a 
elaboração de seus dados, objetivando resultados que não tragam distorções de 
análise e interpretação, trazendo uma maior margem de segurança. 
Nesta pesquisa foi utilizada a metodologia de pesquisa bibliográfica, onde os 
estudos para aplicação foram retirados de artigos científicos, sites governamentais 
e livros. O motivo de usar a pesquisa bibliográfica, foi pelo fato de possibilitar um 
maior alcance das informações, pois com ela foi possível ter um maior 
embasamento teórico em determinados assuntos que não era de meu 
conhecimento, como foi o caso da Curva ABC, onde esse tipo de conteúdo é visto 
em outros graduações como Logística, Administração e afins. 
Para a elaboração desse estudo, foi necessário compreender o 
funcionamento dos processos de vendas de instrumentos em uma loja física, pois 
era de suma importância conhecer a logística de compra e vendas dos produtos. 
Após realizar uma pesquisa de campo nos processos de uma determinada 
empresa, foi necessário desenvolver um script em Phyton para processar e 
interpretar as informações de uma tabela de vendas a fim gerar um relatório 
estatístico com os produtos vendidos com base nos perfis. 
É importante ressaltar que os dados utilizados nessa pesquisa foram 
simulados a partir da experiencia do pesquisador que trabalha em uma loja de 
instrumentos musicais. 
 
 
19 
 
4 LEVANTAMENTO DE DADOS 
Para o levantamento dos dados dessa pesquisa foi necessário elaborar uma 
tabela de vendas com o máximo de informações verídicas sobre os fatos (vendas). 
Foi executado um scriptem Python com várias fases, que leu, tratou e processou 
os dados dessa tabela. 
O Script leu e interpretou uma tabela com duzentos e sessenta e dois 
registros que simulavam as informações referentes as vendas efetuadas no período 
do estudo, conforme apresenta a Tabela 1 abaixo. 
Tabela 1 – Amostra de 28 registros retirada da tabela de vendas. 
 
 Fonte: Elaborada pelo autor. 
 Na Tabela 1 acima podemos observar como são organizados os itens 
vendidos em uma loja de instrumento. Cada linha dessa tabela registra informações 
de suma importância, que se estende desde o item adquirido até o motivo que levou 
o cliente a compra. Cada coluna dessa tabela é uma variável que foi utilizada pelo 
script, isso nos leva a entender que quanto maior for o número de variáveis 
explicativas existente em nossa base de dados melhor será o resultado. 
4.1 Coleta dos dados 
 Para que fosse possível interpretar os dados da tabela representada na 
Tabela 1, foi necessário converter (categorizar) as informações de cada coluna em 
número (categoria) como mostra a Tabela 2 abaixo. 
 
 
20 
 
Tabela 2 – Amostra de 28 registros convertido. 
 Fonte: Elaborada pelo autor. 
A tabela 3 abaixo apresenta como os dados foram categorizados após a 
conversão dos dados. 
Tabela 3 – Legenda de dados convertidos. 
 
Fonte: Elaborada pelo autor. 
4.2 O Script 
 Após realizar a conversão dos dados, o script foi executado a fim de ler em 
um primeiro momento todas as informações contidas na tabela. Em seguida, foi 
necessário inserir uma coluna chamada de ID (identificador) que permitisse a 
identificação de cada venda realizada. 
 Em um terceiro estágio do processo, o script executou uma rotina estatística 
que gerou o histograma de todas as variáveis do modelo para uma avaliação 
individual de cada variável, conforme podemos observar abaixo no gráfico 1. 
 
 
21 
 
Gráfico 1 – Gráficos estatísticos gerado pelo script 
 
Fonte: Elaborada pelo autor. 
4.3 Categorização dos dados. 
 Nessa pesquisa o objetivo é identificar as correlações das variáveis com as 
vendas realizadas para assim definirmos os perfis dos clientes. Para facilitar esse 
entendimento, foi gerado uma matriz de correlação entre todas as variáveis. Na 
estatística chamamos de Matriz de Correlação. Nessa etapa, colocamos as 
variáveis frente a frente. Isso nos permitiu identificar se alguma vaiável tinha forte 
correlação com outra, como mostra a Gráfico 2 abaixo. 
Gráfico 2 – Matriz de correlação. 
 
Fonte: Elaborada pelo autor. 
 
22 
 
Na matriz de correlação representada pelo Gráfico 2 acima, podemos 
analisar que quanto mais claro for o quadrado, maior é a correlação. Claro que 
quando comparamos as variáveis contra elas mesma, a relação será máxima, mas 
ao colocar contra outra variável diferente começamos a observar onde se localizam 
as verdadeiras correlações que poderão ser utilizadas no estudo. Como é o caso 
da variável DIA_COMP e EST_CIVIL onde podemos notar uma correlação mais 
forte por meio da matriz. 
4.4 Reduções dos dados de uma venda em um par de informações (X, Y) 
 Para que fosse possível utilizar as 11 (onze) variáveis em um plano 
cartesiano, foi necessário simplificar todas elas em um par de valores (X, Y) 
conforme a Gráfico 3 abaixo, em que cada ponto representa uma compra da base 
de dados. 
O plano cartesiano é um objeto matemático 
plano e composto por duas retas 
numéricas perpendiculares, ou seja, retas que 
possuem apenas um ponto em comum, 
formando um ângulo de 90°. Esse ponto comum 
é conhecido como origem e é nele que é 
marcado o número zero de ambas as retas 
(SILVA, Luiz 2022). 
Gráfico 3 - Mapeamento das vendas no plano cartesiano. 
 
Fonte: Elaborada pelo autor. 
https://brasilescola.uol.com.br/o-que-e/matematica/o-que-e-reta-numerica.htm
https://brasilescola.uol.com.br/o-que-e/matematica/o-que-e-reta-numerica.htm
https://brasilescola.uol.com.br/matematica/retas-perpendiculares.htm
https://brasilescola.uol.com.br/o-que-e/matematica/o-que-e-angulo.htm
 
23 
 
4.5 Curva de cotovelo 
 Antes de executamos o script do K-mens para “clusterizar” os dados, 
precisamos definir em quando grupos será a divisão. O gráfico: Curva de cotovelo 
é utilizado como guia para definir a quantidade agrupamentos. Esse gráfico indica 
que quanto mais próximo do vértice (x, y), deve-se colher o valor de X, que será a 
quantidade ideal de Cluster. No caso desta pesquisa, a “curva” se encontrou entre 
5 e 6 do plano cartesiano como mostra o Gráfico 4 abaixo. 
Gráfico 4 – Curva de cotovelo. 
 
Fonte: Elaborada pelo autor. 
4.6 Classificação dos dados em clusters 
 Com a quantidade de grupos já definido pelo gráfico de cotovelo, escolhemos 
K = 5, chegamos na última etapa do levantamento dos dados. Nessa etapa, os 
dados foram processados pelo algoritmo K-means que é o responsável por calcular 
a distância Euclidiana entre os pontos e assim definir os 5 (cinco) grupos. 
 Em um primeiro o momento, o algoritmo foi executado e selecionou 5 cluster 
aleatórios para utilizar como centroide (ponto referencial) e agrupou os demais 
pontos. O K-means utilizou cálculos matemáticos baseado em Distância Euclidiana 
 
24 
 
para calcular as semelhanças entres as vendas efetuadas. Para conseguimos 
chegar ao resultado mais assertivo possível. O Algoritmo K-means executa laços 
diversas vezes, pois a cada execução do laço, os pontos são recalculados e 
redirecionados para outros centroides. O algoritmo realizou uma serie de repetição 
até chegarmos a uma condição em que não havia mais movimentações entre 
pontos, chegando ao resultado onde foi possível identificar cada venda realizada 
agrupada em um único centroide, como podemos verificar no Gráfico 5 abaixo. 
 Gráfico 5 – Dados clusterizados 
 
Fonte: Elaborada pelo autor. 
No Gráfico 5 acima, é possível identificar visualmente todas as 262 vendas 
simuladas no estudo já definidas em cada grupo. É válido ressaltar que os 5 cluster 
definidos pela curva de cotovelo, são numeradas de 0 a 4 como demonstra a 
legenda. Com cada venda já agrupada ao seu cluster, foram realizadas várias 
análises que serão vistas no tópico a seguir. 
 
 
25 
 
5 - ANÁLISE DE DADOS 
Após o processamento do algoritmo do K-means, cada venda foi marcada 
com o seu respectivo Cluster calculado pelo algoritmo. Na Tabela 4 já podemos ver 
algumas vendas com seu respectivo cluster definido. Após o processamento foi 
adicionado uma nova coluna chamada, CLUSTER como pode ser observado 
abaixo. 
Tabela 4 – Resultado da Clusterização. 
 
Fonte: Elaborada pelo autor. 
Após a base ser agrupada aplicamos a estatística descritiva nas 
principais variáveis explicativas. 
Na primeira variável SEXO, podemos observar que o grupo 0, é 
composto por 35% de pessoas do sexo feminino, seguido por 35% no grupo 
1, e o restante nos demais grupos. Com essa informação inicial já possível 
perceber que se fossemos definir uma ação de venda para o público 
feminino, os grupos 0 e1 seriam os mais propícios a adquirir um determinado 
tipo de produtos como podemos observar no Gráfico 6 abaixo. 
 
 
 
26 
 
Gráfico 6 – Agrupamento por sexo. 
 
Fonte: Elaborada pelo autor. 
No gráfico acima podemos ter uma virão geral sobre como estão 
distribuídos os clientes entre os cluster, onde a maior parte dos clientes se 
encontram nos grupos 0 e 1. 
Sobre a variável FX ETÁRIA (Faixa Etária), observamos que 46% dos 
clientes do grupo 4 são constituídos por pessoas de até 22 anos. Já no grupo 
3, verificamos que os clientes possuem idade entre 22 e 32 anos totalizando 
17%. Entretanto, no grupo 2 os dados foram inferiores a 1% em todas as 
faixas etárias. Todavia, o grupo 1 apresentou uma grande concentração 
totalizando seu público entres 22 e 63 anos ficando atrás apenas do grupo 0, 
que atingiu todas as faixas etárias, conforme o Gráfico 7 abaixo. 
Gráfico 7 – Agrupamento por faixa etária. 
 
Fonte: Elaborada pelo autor.27 
 
 Quando observamos os agrupamentos e analisamos o grau de instrução dos 
clientes, observamos que No grupo 0, temos a maior parte do público formado por 
pessoas GRADUADAS, totalizando 59%. Já no grupo 1, temos seu público voltado 
para pessoas que concluíram o ensino básico somando cerca de 82%. Novamente 
no grupo 2 não tivemos uma definição correta do público, não gerando dados 
suficientes para construir uma estatística. Já nos grupos 3 e 4, são formadas por 
indivíduos que possui o ensino médio completo totalizando 13% e 28% 
respectivamente como podemos analisar no Gráfico 8 abaixo. 
Gráfico 8 – Agrupamento por grau de instrução 
 
Fonte: Elaborada pelo autor. 
Com a coluna CLUESTER adicionada aos dados, foi possível gerar uma 
segunda tabela que serviu como a base dessa pesquisa, com ela conseguimos 
analisar e entender melhor cada grupo gerado. 
A partir dessa tabela foi possível identificar os perfis de cada grupo, caso 
fosse necessário realizar uma ação de venda onde o objetivo fosse vender violões 
para pessoas do sexo feminino, com idade entre 33 e 42 anos, com certeza o grupo 
0 seria o perfil ideal para essa ação. Esse é apenas uma das aplicações possíveis 
através desse estudo, pois com ele conseguimos visualizar até qual produto 
performaria de forma positiva em um determinado grupo. Por exemplo, se fossemos 
selecionar um determinado produto para ofertamos ao grupo 1, o instrumento 
 
28 
 
bateria seria o mais indicado, pois ele teve 100% de vendas com base na tabela 
simulada. 
A Tabela 5 baixo, nos apresenta todos os dados sumarizados nesse estudo. 
Com esse resumo é possível extrair insights e conhecimentos para apoiar a 
definição das ações de vendas, pois em cada grupo podemos observar as 
características de maior destaque, como Faixa etária, sexo, Grau de Instrução, 
Ocupação, entre outros. 
Tabela 4 – Correlação representada forma estatística 
 
Fonte: Elaborada pelo autor. 
 
 
 
29 
 
6 CONCLUSÕES 
A presente pesquisa teve o objetivo de otimizar o trabalho dos profissionais 
de vendas que se encontram alocados em empresas de instrumentos musicais 
utilizando uma das técnicas da Inteligência Artificial (Aprendizado Não-
Supervisionado) para maximizar as vendas. 
Nessa pesquisa foram encontradas algumas restrições que impediram o 
estudo de levantar os dados com informações reais, pois no sistema utilizado na 
empresa usada como base, não foi possível disponibilizar os dados, isso exigiu a 
utilização de uma base de dados fictícia, que simulasse as vendas realizadas. 
A simulação dos dados nos permitiu executar a proposta da pesquisa. É 
válido ressaltar que esse estudo pode ser replicado em qualquer empresa de 
vendas varejo de pequeno ou médio porte, pois os dados necessários para 
execução dele, são possíveis de se obter no comércio varejista, não 
necessariamente de instrumentos musicais, tornando a pesquisa uma grande 
oportunidade para microempresários que desejam alavancar suas vendas. 
A estudo apresentado mostrou-se eficiente, pois foi possível conhecer de 
forma estatística os tipos de clientes, permitindo com que a equipe comercial 
proponha ações estratégicas de vendas mais assertivas como base nos interesses 
de cada grupo de clientes. 
Um dos principais resultados compreendidos nesse estudo, foi o fato de um 
determinado grupo de pessoas do sexo feminino, com idade entre 63 anos ou mais, 
com grau de instrução graduado, trabalhando, compraram uma guitarra como seu 
primeiro instrumento para aprender a tocar. Esse foi apenas um dos diversos 
levantamentos que foi possível obter através dessa pesquisa, a partir dele, é 
possível mapear de forma estratégica qual ação deve ser realizada para cada grupo 
de clientes. 
Em conclusão, a presente pesquisa abre um amplo caminho para soluções 
com inteligência artificial, pois com ela será possível levar o conhecimento das 
grandes corporações para âmbito das microempresas que poderão maximizar suas 
vendas gerando mais empregos e renda. 
 
30 
 
 7 PROJETOS FUTUROS 
Em relação a projetos futuros, recomendaria executar o script novamente 
com apenas 4 cluster, pois como foi possível perceber na análise dos dados, o 
grupo 2 apresentou poucos dados nas inferências, o que nos leva a imaginar que 
se utilizássemos 4 grupos ao invés de 5, os resultados poderiam ser mais realistas. 
Isso faz parte do ajuste do modelo, normal nesse tipo de estudo. 
Agora com o estudo realizado, o passo seguinte é propor para a empresa 
base, o uso de seus dados reais para ter conclusões reais e aplicações reais. 
REFERÊNCIAS 
DALFOVO, Michael Samir; LANA, Rogério Adilson; SILVEIRA, Amélia. Título: 
Métodos quantitativos e qualitativos: um resgate teórico. Revista Interdisciplinar 
Científica Aplicada, Blumenau, 2008. 
Data Science Academy. POR QUE A LINGUAGEM PYTHON É TÃO POPULAR EM 
MACHINE LEARNING E INTELIGÊNCIA ARTIFICIAL?. [S.I.] [2020]. Disponível em: 
<http://datascienceacademy.com.br/blog/por-que-a-linguagem-python-e-tao-
popular-em-machine-learning-e-inteligencia-artificial/>. Acesso em: 24 mai. de 
2020. 
Lima, T. C. S., & Mioto, R. C. T. Título: Procedimentos metodológicos na construção 
do conhecimento científico: a pesquisa bibliográfica. Revista Katálysis, 10 (esp.), 
Florianópolis, [2007] Disponível em: <https://www.scielo.br/scielo.php?pid=S1414-
49802007000300004&script=sci_arttext> Acesso em: 20 mai. de 2022 
WOLFF, D.O uso da música polifônica vocal renascentista no repertório do alaúde 
e vihuela. In: Em Pauta - Revista do Programa de Pós-Graduação em Música da 
Universidade Federal do Rio Grande do Sul, v. 14, n. 22, Porto Alegre,2003. 
GAUCH, H.G. Multivariate analysis in community ecology. Cambridge: Cambridge 
University Press, 1982. 298p. 
CAMPELLO, R. J. G. B. “SCC0173 – Mineração de Dados Biológicos - Preparação 
de Dados: Parte B”, disponível em 
http://wiki.icmc.usp.br/images/e/e1/Preparacao_Dados_II.pdf, acesso em 12 de 
novembro de 2012. 
SILVA, Luiz Paulo Moreira. "O que é plano cartesiano?"; Brasil Escola. Disponível 
em: https://brasilescola.uol.com.br/o-que-e/matematica/o-que-e-plano-
cartesiano.htm. Acesso em 23 de junho de 2022. 
http://datascienceacademy.com.br/blog/por-que-a-linguagem-python-e-tao-popular-em-machine-learning-e-inteligencia-artificial/
http://datascienceacademy.com.br/blog/por-que-a-linguagem-python-e-tao-popular-em-machine-learning-e-inteligencia-artificial/
https://www.scielo.br/scielo.php?pid=S1414-49802007000300004&script=sci_arttext
https://www.scielo.br/scielo.php?pid=S1414-49802007000300004&script=sci_arttext
 
31 
 
HALLAM, S. "Psicologia da música na educação: O PODER DA MUSICA NA 
APRENDIZAGEM", disponível em https://www.apem.org.pt/docs/artigos-em-
destaque/PsicologiaDaMusica_RPED_140_141_2014_2015.PDF, acesso em 01 
de maio de 2022. 
FARIA, F. A “Aprendizagem não supervisionada Agrupamento (Clustering)", 
disponível em https://www.ic.unicamp.br/~ffaria/ia1s2017/class14/class14-
Agrupamento.pdf, acesso em 17 de maio de 2022. 
CARVALHO, José Mexia Crespo de - Logística. 3ª ed. Lisboa: Edições Silabo, 2002. 
TELLES, EDUARDO SANTOS; BARONE, DANTE AUGUSTO COUTO; DA SILVA, 
ALEXANDRE MORAES. Inteligência Artificial no Contexto da Indústria 4.0. In: Anais 
do I Workshop sobre as Implicações da Computação na Sociedade. SBC, 2020. p. 
130-136

Continue navegando