FINAL-TCC_JONATAS-PESQUISA-IA_26062022_Final_Revisado

•

ESTÁCIO

JE Produçoes

02/10/2022

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Tcc II

320 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

CURSO DE SISTEMA DE INFORMAÇÃO

JÔNATAS EDWARDS COSTA DE ABREU

USO DA INTELIGÊNCIA ARTIFICIAL NO MERCADO DE
INTRUMENTOS MUSICAIS PARA MAXIMIZAR VENDAS

FORTALEZA
2022

JÔNATAS EDWARDS COSTA DE ABREU

USO DA INTELIGÊNCIA ARTIFICIAL NO MERCADO DE
INTRUMENTOS MUSICAIS PARA MAXIMIZAR VENDAS

Trabalho de Conclusão de curso apresentado
ao curso de Sistema de Informação do Centro
Universitário Estácio do Ceará como requisito
para a obtenção do título de bacharel em
Sistema de Informação.
Orientador: Prof. Dr. Wellington Sousa Aguiar

FORTALEZA
2022

AGRADECIMENTOS
A Deus, mesmo diante as dificuldades existentes da vida, Ele sempre me
deu forças para jamais desistir dos meus objetivos.
Aos meus pais, Erialdo França de Abreu e minha querida mãe Fernanda
Costa de Abreu que mesmo diante das dificuldades financeiras, batalharam duro
para que tivesse o melhor estudo possível.
A minha amada esposa Prisciliane da Silva Carneiro que esteve ao meu lado
em todos os momentos difíceis e sempre me mostrou que é possível conquistar o
mundo, basta ter dedicação força de vontade.
Ao meu orientador, Prof. Dr. Wellington Sousa Aguiar, pela sua forma única
de compartilhar conhecimento e por motivar seus alunos em todas as suas aulas a
sermos seres humanos melhores.

RESUMO
A comercialização de instrumentos musicais nos últimos anos teve um crescimento
exponencial, pois a diversidade de públicos tem aumentado cada vez mais, fazendo
com que grandes varejistas do mercado musical realizem ações de vendas
estratégicas para cada público. Graças ao grande avanço no campo das pesquisas
com a inteligência artificial é possível usar técnicas de inteligência artificial para
avaliar grandes volumes de informações e através de um determinado algoritmo
decifrar aspectos comportamentais dos consumidores. Essa pesquisa tem como
objetivo utilizar técnicas avançadas de IA desenvolvidas em Python para auxiliar
aos varejistas de instrumentos musicais a identificar corretamente os grupos de
clientes e suas necessidades, baseado no algoritmo KNN (K - Nearest Neighbors).
A metodologia utilizada é a quantitativa para apresentar os resultados estatísticos
apurados pelos algoritmos de IA. Como principais resultados, conseguimos definir
5 grupos de clientes onde foi possível identificar qual ação de venda seria mais
assertiva. Concluindo, podemos afirmar que o uso de IA na clusterização
(agrupamento) de clientes pode gerar uma vantagem estratégica e competitiva para
as empresas que utilizam esses métodos modernos.
Palavras-chave: instrumentos musicais; inteligência artificial, knn; música; mercado
musical.

ABSTRACT
Years of sales of musical instruments in recent years has had an exponential growth,
as the diversity of audiences has increased more and more, causing major
presentations in the music market to carry out strategic actions for each audience.
Thanks to the great advance in the field of research with artificial intelligence, it is
possible to use artificial intelligence techniques for large volumes of information and
through an animal to decipher behavioral behaviors of consumers. This aims to use
advanced IAN techniques in Python to help research groups on musical instruments
and correctly defined, based on the KN (K - Nearest Neighbors) project. The
methodology used is accessible to present the statistical results of AI. As main
results, 5 groups of customers were defined in a more assertive series. We can say
that the use of AI in the clustering (grouping) of customers can generate a strategic
and competitive advantage to conclude that they use these modern methods.
Keywords: musical instruments; artificial intelligence; knn; music; music market.

LISTA DE FIGURAS
Figura 1 - Instrumento Musical Alaúde..................................................................14.
Figura 2 - Fórmula Distância Euclidiana................................................................16.
Figura 3 - Legenda de dados convertidos. ................................................ ...........17.

LISTA DE GRÁFICOS
Gráfico 1 - Gráficos estatísticos gerado pelo script..............................................21.
Gráfico 2 - Matriz de correlação...........................................................................21.
Gráfico 3 - Mapeamento das vendas no plano cartesiano...................................22.
Gráfico 4 - Curva de cotovelo...............................................................................23.
Gráfico 6 - Agrupamento por sexo........................................................................26.
Gráfico 7 - Agrupamento por faixa etária..............................................................26.
Gráfico 8 - Agrupamento por grau de instrução....................................................27.

LISTA DE TABELAS
Tabela 1 - Amostra de 28 registros retirada da tabela de vendas.........................19.
Tabela 2 - Amostra de 28 registros convertido... .................................................. 20.
Tabela 3 - Legenda de dados convertidos. ............................................... ...........20.
Tabela 4 - Resultado da Clusterização.................................................................. 25.
Tabela 5 - Correlação representada forma estatística...........................................28.

LISTA DE ABREVIATURAS E SIGLAS
IA INTELIGÊNCIA ARTIFICIAL
KNN K — Nearest Neighbors
ML Machine Learning

SUMÁRIO
1 INTRODUÇÃO ..................................................................................................11.
1.2 OBJETIVOS ...................................................................................................13.
1.2.1 Objetivo geral ..............................................................................................13.
1.2.2 Objetivos Específicos ..................................................................................13.
2 FUNDAMENTAÇÃO TEÓRICA..........................................................................13.
2.1 Definições importantes....................................................................................13.
2.1.1 Mercado de Instrumentos musicais..............................................................13.
2.2 Curva ABC ......................................................................................................14.
2.3 Inteligência Artificial.........................................................................................14.
2.4 Cluster.............................................................................................................15.
2.5 Algoritmo KNN.................................................................................................16.
2.6 Distância Euclidiana ........................................................................................16.
2.7 Pyton ...............................................................................................................17.
3 METODOLOGIA.................................................................................................18.
4 LEVANTAMENTO DE DADOS ..........................................................................19.
4.1 Coleta dos dados ............................................................................................19.
4.2 O Script ...........................................................................................................20.4.3 Categorização dos dados................................................................................21.
4.4 Reduções dos dados de uma venda em um par de informações (X, Y).........22.
4.5 Curva de cotovelo............................................................................................23.
4.5 Classificação dos dados em clusters...............................................................23.
5 ANÁLISE DE DADOS.........................................................................................25.
6 CONCLUSÃO.....................................................................................................29.
7 PROJETOS FUTUROS......................................................................................30.
REFERÊNCIAS ....................................................................................................30.

1 INTRODUÇÃO
A prática de tocar um instrumento musical tem aumentado cada vez mais,
pois além de proporcionar a satisfação pessoal, ela promove ao indivíduo seja qual
for a sua idade diversos benefícios, como: Coordenação motora, raciocínio lógico,
concentração entre outros benefícios. O uso de instrumentos musicais é indicado
para todas as idades, em especial para crianças, pois seu estímulo auxilia na
resolução de problemas matemáticos como relata Susan Halla em seu artigo sobre:”
Psicologia da música na educação: O poder da música na aprendizagem”.
Por promover uma série de benefícios mentais e físicos, a procura por
instrumentos musicais em lojas especializadas tem crescido cada vez mais, de
forma que o público praticante tem se diversificado, onde crianças, homens,
mulheres e idosos possuem interesse totalmente distintos na hora de escolher seu
instrumento.
Atualmente, o comércio de instrumentos musicais possui uma grande
dificuldade em conseguir realizar ações efetivas de vendas, pois não conseguem
identificar as predisposições de seus clientes. De modo geral, quando uma empresa
promove uma ação de venda em um determinado produto essa decisão muitas
vezes é tomada a partir de informações corriqueiras como por exemplo: produtos
que estão por muito tempo no estoque ou uma quantidade considerável do mesmo
produto. Criar promoções com base nesse tipo de dados normalmente não retornam
os resultados desejados, pois quem garante que os clientes dessa empresa têm
interesse nesse tipo de produto ofertado? Acreditamos que é bem mais válido e
assertivo criar promoções com base nos gostos e características de cada cliente,
mas como podemos identificar um padrão de interesses para cada grupo de
clientes? Essa pesquisa tem como objetivo central identificar padrões de compras
com base em “Clusterização” ou agrupamento de clientes.
Hoje a tecnologia tem avançado de forma exponencial onde conceitos como:
inteligente artificial ou Machine Learning tem se tornado cada vez mais acessível ao
mercado geral, onde antes esses conhecimentos computacionais eram usados
apenas em pesquisas cientificas, agora estão disponíveis também para pequenas e
médias empresas.
Quando falamos em (IA) Inteligência Artificial, podemos imaginar “n”
informações, mas de forma bem resumida e usual, IA nada mais é do que a máquina

simulando a inteligência humana na tomada de decisões. O conceito de Inteligência
Artificial está mais relacionado ao processo, capacidade de processamento e a
análise de dados do que a qualquer formato ou função em particular. Embora a
mídia traga a IA com imagens de robôs parecidos com os humanos dominando o
mundo, a IA não pretende substituir os seres humanos, seu objetivo é melhorar as
habilidades e contribuições humanas.
Mas como podemos ensinar a máquina a tomar decisões? Existem duas
formas de aplicar o aprendizado de máquina: O supervisionado que se baseia em
conhecimentos prévios para predizer futuros acontecimentos, metodologia
abordada pelo Prof. Dr. Wellington Aguiar em sua tese de Doutorado sobre “O
DESENVOLVIMENTO DE MODELOS PREDITIVOS DE MORTALIDADE INFANTIL
COM BASE EM INTELIGÊNCIA ARTIFICIAL NO ESTADO DO CEARÁ”, onde foi
utilizado dados históricos sobre a mortalidade infantil para predizer futuros casos
de mortalidade infantil; E o não-supervisionado que através de uma massa de dados
é possível extrair as informações e agrupá-las por características semelhantes
(AGUIAR, 2019).
Na corrida comercial sai na frente quem utiliza técnicas modernas para
otimizar e maximizar os resultados, essa pesquisa mostrará através de gráficos e
resultados estatísticos como usar a inteligência artificial para agrupar os clientes por
interesse de compra e comportamento, e dessa forma promover ações de vendas
mais assertivas.
O uso de Inteligência Artificial tem se tornado uma ferramenta crucial para as
grandes corporações. Empresas como Facebook e Google, utilizam cada vez mais
esse recurso, pois através da IA conseguem identificar os interesses de seus
clientes fazendo com que seus produtos sejam mais assertivos quando oferecido.
O objetivo principal dessa pesquisa é levar esse recurso tecnológico para empresa
de pequeno porte, pois sabemos que nem toda empresa possui um setor voltado
para pesquisas de IA. A utilização dessa tecnologia permitirá que essas empresas
de pequeno porte tenham informações sobre seus clientes e consequentemente
otimizando suas ações de vendas.

1.2 OBJETIVOS
1.2.1 Objetivo geral
O objetivo principal desta pesquisa é utilizar técnicas avançadas de IA para
auxiliar varejistas de instrumentos musicais a maximizar suas ações estratégicas de
vendas através do conhecimento detalhado dos seus grupos de clientes.
1.2.2 Objetivos Específicos
a) Descrever conceitos de inteligência artificial.
b) Aplicar o algoritmo KNN e K-Means em base de dados reais.
c) Aplicar técnicas de desenvolvimento de software estudadas na
graduação.
2 FUNDAMENTAÇÃO TEÓRICA
2.1 Definições importantes
Por se tratar de uma pesquisa científica, antes de seguimos no estudo
apresentado é necessária uma breve explicação de alguns conceitos prévios como:
Mercado de Instrumentos musicais, Curva ABC, Inteligência artificial, Cluster, KNN,
Distância Euclidiana, Phyton etc.
2.2 Mercado de Instrumentos musicais
O ato de tocar um instrumento musical é uma prática bastante antiga, onde
os primeiros indícios foram relatados período antes do Nascimento de Cristo pelos
povos Hebreus. No livro da Bíblia sagrada, mais precisamente no antigo testamento,
relata que os Hebreus foram os pioneiros a fabricar um instrumento musical que
tinha por nome alaúde, como apresenta a Figura 1, um instrumento de cordas que
possuía uma caixa de ressonância que permitia ecoar o som das notas musicais
(BIBLIA 1° CRONICAS, A.C).

Figura 1 – Instrumento Musical Alaúde.

Fonte: Alaúde, construído por Matheus Buchenberg, século XVII.
Nos dias atuais, a compra e venda de instrumentos musicais tem crescido de
forma exponencial, pois com o advento das vendas online, permitiu que o
consumidor tenha uma nova forma de adquirir seu instrumento, que até então só
era possível comprar através de uma loja física.
2.2 Curva ABC
O crescente aumento da competitividade leva as organizações a buscarem
maneiras de otimizar seus processos com a finalidade de reduzir custos. Uma das
formas para se obter essa redução está na melhoria do controle e gerenciamento
de estoque. Neste contexto, aplica-se a curva ABC como um método usado para
controle de estoques nas empresas, possibilitando aos gerentes uma visão geral de
todos os produtos, classificando-os com base em seu valor monetário.
Nessa metodologia podemos classificar os intens. em 3 níveis de relevância
onde A é a maior importância, valor ou quantidade, correspondendo a 20% do total
– podem ser itens do estoque com uma demanda de 65% num dado período; B com
importância,quantidade ou valor intermediário, correspondendo a 30% do total –
podem ser itens do estoque com uma demanda de 25% num dado período; C de
menor importância, valor ou quantidade, correspondendo a 50% do total – podem
ser itens do estoque com uma demanda de 10% num dado período (CARVALHO,
2002).
2.3 Inteligência Artificial.
Por diversos anos, o termo Inteligência Artificial era observado como algo
futurístico, onde sempre foi passado na imagem de um robô com forma de humano
onde tentava realizar ações e sentimentos humanos, como podemos observar no

filme “O homem bicentenário” dirigido por Chris Columbus, atuado por Robin
Williams onde protagonista executava tarefas do dia a dia (O homem bicentenário,
2000).
Como bem sabemos, a inteligência artificial vai muito além de uma simples
história de ficção cientifica, com ela é possível compilar uma grande massa de
dados que outrora era impossível aos olhos da inteligência humana. Com os
grandes avanços das pesquisas em IA, através de um algoritmo, é possível obter
diversas informações sobre um levantamento de dados, até mesmo predições de
possíveis acontecimentos com base em informações anteriores. Mas calma, IA não
é uma simples “bola de cristal” que com um passe mágico advinha as informações
futuras, por trás da IA existe uma serie de cálculos matemáticos e estatísticos que
são encarregados de solucionar as predições.
2.4 Cluster
Você já parou para pensar que em meio a uma grande massa de dados é
quase impossível para o ser humano identificar padrões de semelhanças? Imagine
que você está em um veículo parado em frente uma faixa de pedestre e enquanto
você aguarda o semáforo abrir, diversas pessoas trafegam pela faixa de pedestre
cada uma carrega consigo um cartaz escrito diversos dados como: peso, idade,
sexo, ocupação e tipo sanguíneos. Em alguns segundos você fica exposto a uma
série de informações que aos olhos humanos, é impossível agrupar os pedestres
como base nos dados semelhantes.
O conceito de cluster está atrelado fortemente ao aprendizado não-
supervisionado, pois seu objetivo principal é desvendar a organização dos padrões
existentes nos dados através de clusters (agrupamentos) encontrados (Pro: Fabio
Faria, 2015).
Ensinar ao algoritmo como ele deve encontrar os padrões de semelhanças
sem uma informação anterior, é necessário seguir algumas etapas divididas em:
seleção de atributos; medida de proximidade; critério de agrupamento, algoritmo de
agrupamento; verificação dos resultados e interpretação dos resultados. Cada parte
do processo precisa ser executado a risco para que as informações resultantes se
tornem mais precisas.

2.5 KNN
O algoritmo KNN (K Nearest Neighbor) é um dos algoritmos mais utilizados
em Machine Learning pois sua usabilidade é consideravelmente simples e prática.
A utilização desse algoritmo vem ganhando cada vez mais força, pois sua
usabilidade está atraindo outros campos de pesquisas como áreas da saúde,
finanças, ciência política e reconhecimento de imagem.
Neste algoritmo possuímos uma variável chamada de K, a qual é parte do
nome do modelo e o principal parâmetro a ser selecionado. Este parâmetro
direcionará a quantidade de vizinhos (neighborn em inglês). Em casos de modelos
binários, onde possuímos apenas duas classes, em geral aplicasse valores ímpares
a K, mas lembre-se que cada caso é um caso, “No free lunch”. Imagine que temos
um valor P1 o qual queremos predizer, entre um grupo de duas classes aonde o
valor atribuído a K foi 1 (K=1), primeiro iremos identificar o ponto mais próximo a ele
e depois qual a label que o identifica, classe A por exemplo, como apresenta a
Figura 2 (LUZ; FELIPE, 2019).
Figura 2 - Algoritmo KNN.

Fonte: Felipe Luz, 2019.
2.6 Distância Euclidiana
A distância euclidiana é uma das medidas de dissimilaridade entre
comunidades mais utilizadas na prática (GAUCH, 1982). De acordo com Brower e
Zar (1977), quanto menor o valor da distância euclidiana entre duas comunidades,

mais próximas elas se apresentam em termos de parâmetros quantitativos por
classe, logo, quanto menor a distância euclidiana, maior a eficiência do
procedimento. A Figura 3 abaixo, apresenta fórmula de cálculo.
Figura 3 - Fórmula Distância Euclidiana.

Fonte: Prof. Ricardo J. G. B. Campello, 2012.
Na Figura 3 acima podemos identificar como é realizado o cálculo
matemático, onde DE representa Distância Euclidiana dos pontos cartesianos X e
Y. Logo após o sinal de igual temos um sinal de raiz quadrada onde dentro da
racionalização possui um somatório e por fim entre parênteses os pontos X e Y
elevado ao quadrado.
Para executarmos a equação é necessário que primeiramente realize a
subtração entre os dois pontos X e Y dentro de um parêntese, onde o resultado será
elevado ao quadrado seguido por um somatório que logo após será racionalizado
gerando o resultado da equação.
2.7 Python
Se pudéssemos definir Phyton é uma única palavra, com certeza seria
flexibilidade, que por sinal, essa característica vem atraindo diversos
programadores a desenvolverem suas aplicações em Phyton, onde através de uma
única sintaxe é possível criar diversos projetos desde a construção de web site até
aplicações mais complexas utilizando inteligência artificial.
Nessa pesquisa, Phyton será a linguagem de programação que irá reger todo
o projeto, onde incialmente faremos a leitura dos dados através de uma tabela que
contém uma série de informações relacionadas a vendas de uma empresa e logo
após, executaremos um script baseado em Distância Euclidiana que irá relacionar
os produtos comprados com os tipos de clientes.

3 METODOLOGIA
O estudo apresentado nessa tese caracteriza-se como pesquisa aplicada,
onde o principal objetivo é a geração de conhecimento para aplicação prática e
imediata, dirigidos à solução de problemas específicos envolvendo os interesses
locais, financeiros e comerciais. A fim de contribuir para fins práticos, essa pesquisa
visa solucionar problemas encontrados na realidade no mercado varejista de
instrumentos musicais.
A natureza desta pesquisa é de caráter quantitativo. A metodologia
quantitativa necessita de números para que seja possível ser mensurada
(DALFOVO et al., 2008). Essa metodologia usa técnicas estatísticas para a
elaboração de seus dados, objetivando resultados que não tragam distorções de
análise e interpretação, trazendo uma maior margem de segurança.
Nesta pesquisa foi utilizada a metodologia de pesquisa bibliográfica, onde os
estudos para aplicação foram retirados de artigos científicos, sites governamentais
e livros. O motivo de usar a pesquisa bibliográfica, foi pelo fato de possibilitar um
maior alcance das informações, pois com ela foi possível ter um maior
embasamento teórico em determinados assuntos que não era de meu
conhecimento, como foi o caso da Curva ABC, onde esse tipo de conteúdo é visto
em outros graduações como Logística, Administração e afins.
Para a elaboração desse estudo, foi necessário compreender o
funcionamento dos processos de vendas de instrumentos em uma loja física, pois
era de suma importância conhecer a logística de compra e vendas dos produtos.
Após realizar uma pesquisa de campo nos processos de uma determinada
empresa, foi necessário desenvolver um script em Phyton para processar e
interpretar as informações de uma tabela de vendas a fim gerar um relatório
estatístico com os produtos vendidos com base nos perfis.
É importante ressaltar que os dados utilizados nessa pesquisa foram
simulados a partir da experiencia do pesquisador que trabalha em uma loja de
instrumentos musicais.

4 LEVANTAMENTO DE DADOS
Para o levantamento dos dados dessa pesquisa foi necessário elaborar uma
tabela de vendas com o máximo de informações verídicas sobre os fatos (vendas).
Foi executado um scriptem Python com várias fases, que leu, tratou e processou
os dados dessa tabela.
O Script leu e interpretou uma tabela com duzentos e sessenta e dois
registros que simulavam as informações referentes as vendas efetuadas no período
do estudo, conforme apresenta a Tabela 1 abaixo.
Tabela 1 – Amostra de 28 registros retirada da tabela de vendas.

Fonte: Elaborada pelo autor.
Na Tabela 1 acima podemos observar como são organizados os itens
vendidos em uma loja de instrumento. Cada linha dessa tabela registra informações
de suma importância, que se estende desde o item adquirido até o motivo que levou
o cliente a compra. Cada coluna dessa tabela é uma variável que foi utilizada pelo
script, isso nos leva a entender que quanto maior for o número de variáveis
explicativas existente em nossa base de dados melhor será o resultado.
4.1 Coleta dos dados
Para que fosse possível interpretar os dados da tabela representada na
Tabela 1, foi necessário converter (categorizar) as informações de cada coluna em
número (categoria) como mostra a Tabela 2 abaixo.

Tabela 2 – Amostra de 28 registros convertido.
Fonte: Elaborada pelo autor.
A tabela 3 abaixo apresenta como os dados foram categorizados após a
conversão dos dados.
Tabela 3 – Legenda de dados convertidos.

Fonte: Elaborada pelo autor.
4.2 O Script
Após realizar a conversão dos dados, o script foi executado a fim de ler em
um primeiro momento todas as informações contidas na tabela. Em seguida, foi
necessário inserir uma coluna chamada de ID (identificador) que permitisse a
identificação de cada venda realizada.
Em um terceiro estágio do processo, o script executou uma rotina estatística
que gerou o histograma de todas as variáveis do modelo para uma avaliação
individual de cada variável, conforme podemos observar abaixo no gráfico 1.

Gráfico 1 – Gráficos estatísticos gerado pelo script

Fonte: Elaborada pelo autor.
4.3 Categorização dos dados.
Nessa pesquisa o objetivo é identificar as correlações das variáveis com as
vendas realizadas para assim definirmos os perfis dos clientes. Para facilitar esse
entendimento, foi gerado uma matriz de correlação entre todas as variáveis. Na
estatística chamamos de Matriz de Correlação. Nessa etapa, colocamos as
variáveis frente a frente. Isso nos permitiu identificar se alguma vaiável tinha forte
correlação com outra, como mostra a Gráfico 2 abaixo.
Gráfico 2 – Matriz de correlação.

Fonte: Elaborada pelo autor.

Na matriz de correlação representada pelo Gráfico 2 acima, podemos
analisar que quanto mais claro for o quadrado, maior é a correlação. Claro que
quando comparamos as variáveis contra elas mesma, a relação será máxima, mas
ao colocar contra outra variável diferente começamos a observar onde se localizam
as verdadeiras correlações que poderão ser utilizadas no estudo. Como é o caso
da variável DIA_COMP e EST_CIVIL onde podemos notar uma correlação mais
forte por meio da matriz.
4.4 Reduções dos dados de uma venda em um par de informações (X, Y)
Para que fosse possível utilizar as 11 (onze) variáveis em um plano
cartesiano, foi necessário simplificar todas elas em um par de valores (X, Y)
conforme a Gráfico 3 abaixo, em que cada ponto representa uma compra da base
de dados.
O plano cartesiano é um objeto matemático
plano e composto por duas retas
numéricas perpendiculares, ou seja, retas que
possuem apenas um ponto em comum,
formando um ângulo de 90°. Esse ponto comum
é conhecido como origem e é nele que é
marcado o número zero de ambas as retas
(SILVA, Luiz 2022).
Gráfico 3 - Mapeamento das vendas no plano cartesiano.

Fonte: Elaborada pelo autor.
https://brasilescola.uol.com.br/o-que-e/matematica/o-que-e-reta-numerica.htm
https://brasilescola.uol.com.br/o-que-e/matematica/o-que-e-reta-numerica.htm
https://brasilescola.uol.com.br/matematica/retas-perpendiculares.htm
https://brasilescola.uol.com.br/o-que-e/matematica/o-que-e-angulo.htm

4.5 Curva de cotovelo
Antes de executamos o script do K-mens para “clusterizar” os dados,
precisamos definir em quando grupos será a divisão. O gráfico: Curva de cotovelo
é utilizado como guia para definir a quantidade agrupamentos. Esse gráfico indica
que quanto mais próximo do vértice (x, y), deve-se colher o valor de X, que será a
quantidade ideal de Cluster. No caso desta pesquisa, a “curva” se encontrou entre
5 e 6 do plano cartesiano como mostra o Gráfico 4 abaixo.
Gráfico 4 – Curva de cotovelo.

Fonte: Elaborada pelo autor.
4.6 Classificação dos dados em clusters
Com a quantidade de grupos já definido pelo gráfico de cotovelo, escolhemos
K = 5, chegamos na última etapa do levantamento dos dados. Nessa etapa, os
dados foram processados pelo algoritmo K-means que é o responsável por calcular
a distância Euclidiana entre os pontos e assim definir os 5 (cinco) grupos.
Em um primeiro o momento, o algoritmo foi executado e selecionou 5 cluster
aleatórios para utilizar como centroide (ponto referencial) e agrupou os demais
pontos. O K-means utilizou cálculos matemáticos baseado em Distância Euclidiana

para calcular as semelhanças entres as vendas efetuadas. Para conseguimos
chegar ao resultado mais assertivo possível. O Algoritmo K-means executa laços
diversas vezes, pois a cada execução do laço, os pontos são recalculados e
redirecionados para outros centroides. O algoritmo realizou uma serie de repetição
até chegarmos a uma condição em que não havia mais movimentações entre
pontos, chegando ao resultado onde foi possível identificar cada venda realizada
agrupada em um único centroide, como podemos verificar no Gráfico 5 abaixo.
Gráfico 5 – Dados clusterizados

Fonte: Elaborada pelo autor.
No Gráfico 5 acima, é possível identificar visualmente todas as 262 vendas
simuladas no estudo já definidas em cada grupo. É válido ressaltar que os 5 cluster
definidos pela curva de cotovelo, são numeradas de 0 a 4 como demonstra a
legenda. Com cada venda já agrupada ao seu cluster, foram realizadas várias
análises que serão vistas no tópico a seguir.

5 - ANÁLISE DE DADOS
Após o processamento do algoritmo do K-means, cada venda foi marcada
com o seu respectivo Cluster calculado pelo algoritmo. Na Tabela 4 já podemos ver
algumas vendas com seu respectivo cluster definido. Após o processamento foi
adicionado uma nova coluna chamada, CLUSTER como pode ser observado
abaixo.
Tabela 4 – Resultado da Clusterização.

Fonte: Elaborada pelo autor.
Após a base ser agrupada aplicamos a estatística descritiva nas
principais variáveis explicativas.
Na primeira variável SEXO, podemos observar que o grupo 0, é
composto por 35% de pessoas do sexo feminino, seguido por 35% no grupo
1, e o restante nos demais grupos. Com essa informação inicial já possível
perceber que se fossemos definir uma ação de venda para o público
feminino, os grupos 0 e1 seriam os mais propícios a adquirir um determinado
tipo de produtos como podemos observar no Gráfico 6 abaixo.

Gráfico 6 – Agrupamento por sexo.

Fonte: Elaborada pelo autor.
No gráfico acima podemos ter uma virão geral sobre como estão
distribuídos os clientes entre os cluster, onde a maior parte dos clientes se
encontram nos grupos 0 e 1.
Sobre a variável FX ETÁRIA (Faixa Etária), observamos que 46% dos
clientes do grupo 4 são constituídos por pessoas de até 22 anos. Já no grupo
3, verificamos que os clientes possuem idade entre 22 e 32 anos totalizando
17%. Entretanto, no grupo 2 os dados foram inferiores a 1% em todas as
faixas etárias. Todavia, o grupo 1 apresentou uma grande concentração
totalizando seu público entres 22 e 63 anos ficando atrás apenas do grupo 0,
que atingiu todas as faixas etárias, conforme o Gráfico 7 abaixo.
Gráfico 7 – Agrupamento por faixa etária.

Fonte: Elaborada pelo autor.27

Quando observamos os agrupamentos e analisamos o grau de instrução dos
clientes, observamos que No grupo 0, temos a maior parte do público formado por
pessoas GRADUADAS, totalizando 59%. Já no grupo 1, temos seu público voltado
para pessoas que concluíram o ensino básico somando cerca de 82%. Novamente
no grupo 2 não tivemos uma definição correta do público, não gerando dados
suficientes para construir uma estatística. Já nos grupos 3 e 4, são formadas por
indivíduos que possui o ensino médio completo totalizando 13% e 28%
respectivamente como podemos analisar no Gráfico 8 abaixo.
Gráfico 8 – Agrupamento por grau de instrução

Fonte: Elaborada pelo autor.
Com a coluna CLUESTER adicionada aos dados, foi possível gerar uma
segunda tabela que serviu como a base dessa pesquisa, com ela conseguimos
analisar e entender melhor cada grupo gerado.
A partir dessa tabela foi possível identificar os perfis de cada grupo, caso
fosse necessário realizar uma ação de venda onde o objetivo fosse vender violões
para pessoas do sexo feminino, com idade entre 33 e 42 anos, com certeza o grupo
0 seria o perfil ideal para essa ação. Esse é apenas uma das aplicações possíveis
através desse estudo, pois com ele conseguimos visualizar até qual produto
performaria de forma positiva em um determinado grupo. Por exemplo, se fossemos
selecionar um determinado produto para ofertamos ao grupo 1, o instrumento

bateria seria o mais indicado, pois ele teve 100% de vendas com base na tabela
simulada.
A Tabela 5 baixo, nos apresenta todos os dados sumarizados nesse estudo.
Com esse resumo é possível extrair insights e conhecimentos para apoiar a
definição das ações de vendas, pois em cada grupo podemos observar as
características de maior destaque, como Faixa etária, sexo, Grau de Instrução,
Ocupação, entre outros.
Tabela 4 – Correlação representada forma estatística

Fonte: Elaborada pelo autor.

6 CONCLUSÕES
A presente pesquisa teve o objetivo de otimizar o trabalho dos profissionais
de vendas que se encontram alocados em empresas de instrumentos musicais
utilizando uma das técnicas da Inteligência Artificial (Aprendizado Não-
Supervisionado) para maximizar as vendas.
Nessa pesquisa foram encontradas algumas restrições que impediram o
estudo de levantar os dados com informações reais, pois no sistema utilizado na
empresa usada como base, não foi possível disponibilizar os dados, isso exigiu a
utilização de uma base de dados fictícia, que simulasse as vendas realizadas.
A simulação dos dados nos permitiu executar a proposta da pesquisa. É
válido ressaltar que esse estudo pode ser replicado em qualquer empresa de
vendas varejo de pequeno ou médio porte, pois os dados necessários para
execução dele, são possíveis de se obter no comércio varejista, não
necessariamente de instrumentos musicais, tornando a pesquisa uma grande
oportunidade para microempresários que desejam alavancar suas vendas.
A estudo apresentado mostrou-se eficiente, pois foi possível conhecer de
forma estatística os tipos de clientes, permitindo com que a equipe comercial
proponha ações estratégicas de vendas mais assertivas como base nos interesses
de cada grupo de clientes.
Um dos principais resultados compreendidos nesse estudo, foi o fato de um
determinado grupo de pessoas do sexo feminino, com idade entre 63 anos ou mais,
com grau de instrução graduado, trabalhando, compraram uma guitarra como seu
primeiro instrumento para aprender a tocar. Esse foi apenas um dos diversos
levantamentos que foi possível obter através dessa pesquisa, a partir dele, é
possível mapear de forma estratégica qual ação deve ser realizada para cada grupo
de clientes.
Em conclusão, a presente pesquisa abre um amplo caminho para soluções
com inteligência artificial, pois com ela será possível levar o conhecimento das
grandes corporações para âmbito das microempresas que poderão maximizar suas
vendas gerando mais empregos e renda.

7 PROJETOS FUTUROS
Em relação a projetos futuros, recomendaria executar o script novamente
com apenas 4 cluster, pois como foi possível perceber na análise dos dados, o
grupo 2 apresentou poucos dados nas inferências, o que nos leva a imaginar que
se utilizássemos 4 grupos ao invés de 5, os resultados poderiam ser mais realistas.
Isso faz parte do ajuste do modelo, normal nesse tipo de estudo.
Agora com o estudo realizado, o passo seguinte é propor para a empresa
base, o uso de seus dados reais para ter conclusões reais e aplicações reais.
REFERÊNCIAS
DALFOVO, Michael Samir; LANA, Rogério Adilson; SILVEIRA, Amélia. Título:
Métodos quantitativos e qualitativos: um resgate teórico. Revista Interdisciplinar
Científica Aplicada, Blumenau, 2008.
Data Science Academy. POR QUE A LINGUAGEM PYTHON É TÃO POPULAR EM
MACHINE LEARNING E INTELIGÊNCIA ARTIFICIAL?. [S.I.] [2020]. Disponível em:
<http://datascienceacademy.com.br/blog/por-que-a-linguagem-python-e-tao-
popular-em-machine-learning-e-inteligencia-artificial/>. Acesso em: 24 mai. de
2020.
Lima, T. C. S., & Mioto, R. C. T. Título: Procedimentos metodológicos na construção
do conhecimento científico: a pesquisa bibliográfica. Revista Katálysis, 10 (esp.),
Florianópolis, [2007] Disponível em: <https://www.scielo.br/scielo.php?pid=S1414-
49802007000300004&script=sci_arttext> Acesso em: 20 mai. de 2022
WOLFF, D.O uso da música polifônica vocal renascentista no repertório do alaúde
e vihuela. In: Em Pauta - Revista do Programa de Pós-Graduação em Música da
Universidade Federal do Rio Grande do Sul, v. 14, n. 22, Porto Alegre,2003.
GAUCH, H.G. Multivariate analysis in community ecology. Cambridge: Cambridge
University Press, 1982. 298p.
CAMPELLO, R. J. G. B. “SCC0173 – Mineração de Dados Biológicos - Preparação
de Dados: Parte B”, disponível em
http://wiki.icmc.usp.br/images/e/e1/Preparacao_Dados_II.pdf, acesso em 12 de
novembro de 2012.
SILVA, Luiz Paulo Moreira. "O que é plano cartesiano?"; Brasil Escola. Disponível
em: https://brasilescola.uol.com.br/o-que-e/matematica/o-que-e-plano-
cartesiano.htm. Acesso em 23 de junho de 2022.
http://datascienceacademy.com.br/blog/por-que-a-linguagem-python-e-tao-popular-em-machine-learning-e-inteligencia-artificial/
http://datascienceacademy.com.br/blog/por-que-a-linguagem-python-e-tao-popular-em-machine-learning-e-inteligencia-artificial/
https://www.scielo.br/scielo.php?pid=S1414-49802007000300004&script=sci_arttext
https://www.scielo.br/scielo.php?pid=S1414-49802007000300004&script=sci_arttext

HALLAM, S. "Psicologia da música na educação: O PODER DA MUSICA NA
APRENDIZAGEM", disponível em https://www.apem.org.pt/docs/artigos-em-
destaque/PsicologiaDaMusica_RPED_140_141_2014_2015.PDF, acesso em 01
de maio de 2022.
FARIA, F. A “Aprendizagem não supervisionada Agrupamento (Clustering)",
disponível em https://www.ic.unicamp.br/~ffaria/ia1s2017/class14/class14-
Agrupamento.pdf, acesso em 17 de maio de 2022.
CARVALHO, José Mexia Crespo de - Logística. 3ª ed. Lisboa: Edições Silabo, 2002.
TELLES, EDUARDO SANTOS; BARONE, DANTE AUGUSTO COUTO; DA SILVA,
ALEXANDRE MORAES. Inteligência Artificial no Contexto da Indústria 4.0. In: Anais
do I Workshop sobre as Implicações da Computação na Sociedade. SBC, 2020. p.
130-136