Baixe o app para aproveitar ainda mais
Prévia do material em texto
SUMÁRIO 1 INTRODUÇÃO ......................................................................................................... 3 2 NAIVE BAYES ......................................................................................................... 3 3. RESOLUÇÃO DO CASO ........................................................................................ 4 4 CONCLUSÃO .......................................................................................................... 6 REFERÊNCIAS BIBLIOGRÁFICAS ........................................................................... 7 3 1 INTRODUÇÃO A análise preditiva é uma forma de usar o passado para projetar o futuro do seu negócio. Não se trata de futurologia, e sim de um cálculo preciso das probabilidades em qualquer cenário, com base no processamento de grandes volumes de dados. Para isso, essa técnica avançada utiliza tecnologias como a mineração de dados, machine learning e inteligência artificial para dar um passo além na estatística. Ao invés de tirar conclusões sobre ontem, você poderá antecipar tendências e prever os comportamentos do amanhã – tudo a partir de um histórico. 2 NAIVE BAYES O algoritmo “Naive Bayes” é um classificador probabilístico baseado no “Teorema de Bayes”, o qual foi criado por Thomas Bayes (1701 - 1761) para tentar provar a existência de Deus. Atualmente, o algoritmo se tornou popular na área de Aprendizado de Máquina (Machine Learning) para categorizar textos baseado na frequência das palavras usadas, e assim pode ser usado para identificar se determinado e-mail é um SPAM ou sobre qual assunto se refere determinado texto, por exemplo. Por ser muito simples e rápido, possui um desempenho relativamente maior do que outros classificadores. Além disso, o Naive Bayes só precisa de um pequeno número de dados de teste para concluir classificações com uma boa precisão. A principal característica do algoritmo, e também o motivo de receber “naive” (ingênuo) no nome, é que ele desconsidera completamente a correlação entre as variáveis (features). Ou seja, se determinada fruta é considerada uma “Maçã” se ela for “Vermelha”, “Redonda” e possui “aproximadamente 10cm de diâmetro”, o algoritmo não vai levar em consideração a correlação entre esses fatores, tratando cada um de forma independente (OrgânicaDigital,2019). 4 3. RESOLUÇÃO DO CASO No caso proposto foi apresentado um restaurante que possui dois pratos que se destacam todos os dias: a feijoada e o filé à parmegiana. Pensando em atender aos seus clientes com pratos sempre frescos, além de evitar desperdício de alimentos o proprietário fez um estudo durante 14 dias de qual prato foi o mais vendido em cada dia, além de os relacionar com a condição climática (Previsão x Temperatura x Humidade x Vento). Neste caso, devemos ajudar ao proprietário a prever por meio do uso da inteligência analítica e com base nos dados históricos das variáveis apresentadas, qual a tendência de prato para o próximo dia. Claro que para obter um resultado mais assertivo o proprietário precisará continuar alimentando essa tabela/base de dados, para que a probabilidade de acertar qual a tendência de prato para o próximo dia seja realmente alta. A planilha abaixo foi realizada pelo proprietário, e através dela será possível identificar qual a tendência de prato para o 15º dia conforme solicitado na descrição do caso: Previsão Temperatura Humudade Vento Vender x->1 chuva frio normal sim parmegiana x->2 chuva moderado alta sim parmegiana x->3 sol quente alta não parmegiana x->4 sol quente alta sim parmegiana x->5 sol moderado alta não parmegiana x->6 nublado frio normal sim feijoada x->7 nublado quente alta não feijoada x->8 nublado quente normal não feijoada x->9 nublado moderado alta sim feijoada x- >10 chuva frio normal não feijoada x- >11 chuva moderado alta não feijoada x- >12 chuva moderado normal não feijoada x- >13 sol frio normal não feijoada x- >14 sol moderado normal sim feijoada x- >15 sol frio normal sim x 5 Utilizando o algoritimo Naive Bayes, qual é o prato previsto mediante os cálculos realizados? Para identificar qual a tendência de prato para o próximo dia foi realizada o seguinte cálculo: Primeiramente foi identificado o valor de cada variável para os dias em que foi vendido mais feijoada: P (SOL | FEIJOADA) = 2/9 ou 22% P (FRIO | FEIJOADA) = 3/9 ou 33% P (UMIDADE NORMAL | FEIJOADA) = 6/9 ou 66% P (VENTO SIM | FEIJOADA) = 3/9 ou 33% P (FEIJOADA 14) = 9/14 ou 64% P (FEIJOADA 15) = X Em seguida, para se identificar o valor de X, multipliquei cada variável pelo número de feijoadas vendidas/número de dias, ou seja:(2/9 * 3/9 * 6/9 * 3/9) * (9/14) = 0,0105. Foi realizado o mesmo cálculo para o filé à parmegiana, ou seja. P ( SOL | FILÉ À PARMEGIANA) = 3/5 ou 60% P (FRIO | FILÉ A PARMEGIANA) = 1/5 ou 20% P (UMIDADE NORMAL | FILÉ A PARMEGIANA) = 1/5 ou 20% P (VENTO SIM | FILE A PARMEGIANA) = 3/5 ou 60% P (FILÉ A PARMEGIANA 14) = 5/14 ou 35% P (FILÉ A PARMEGIANA 15) = X Em seguida, para se identificar o valor de X, multipliquei cada variável pelo número de filé à parmegiana vendidas/número de dias, ou seja:(3/5 * 1/5 * 1/5 * 3/5) * (5/14) = 0,0051. Após o uso do algoritmo de Naive Bayes, a tendência de prato para o próximo dia (15º dia), é que a feijoada seja mais vendida que o filé à parmegiana. Visto que para a feijoada chegamos no valor de (0,0105) e para o filé à parmegiana chegamos no valor de (0,0051). 6 Vale ressaltar que a regra de associação, citada por Castro e Ferrari (2016), também se aplica ao caso, pois a cada dia que faz sol, vendem-se x pratos de filé à parmegiana e quando chove vendem x pratos de feijoada, o prato pode ser associado ao clima. Para que o restaurante possa lidar com uma grande quantidade de dados conforme o tempo for passando, a primeira etapa para a construção de um banco de dados, como exemplificado pela S.A.S, é continuar alimentando a planilha, essa será a base de dados crus do restaurante, e uma base de dados transacional. E, posteriormente, através da análise preditiva, ele conseguirá calcular a probabilidade do prato que será mais vendido no dia seguinte, ou seja, o restaurante irá utilizar os dados históricos registrados pelo proprietário todos os dias com a informação da previsão do tempo, assim como foi realizado na resolução do caso proposto. Contudo, para tornar a tarefa mais rápida o proprietário pode implementar um software para fazer a predição diária de forma automática. Na última, mas não menos importante, ele poderá saber o que irá fazer dado que ele já sabe o que provavelmente vai acontecer. Essa etapa se chama análise prescritiva. Essas funções podem ser realizadas após aplicar um algoritmo que, por exemplo, aplique Naive Bayes usando Scikit-learn na linguagem Python, como apresentado pelo Data Camp. 4 CONCLUSÃO Embora assuma independência entre as features e não proporcione estimativa de probabilidade muito boa, o classificador de Naive Bayes é um potente modelo de predição. Isso porque não necessita de muitos dados, e na prática, funciona mesmo em alguns casos onde não há independência entre as features. Por esses motivos, é frequentemente implementado em aplicações, desde analise de textos até mecanismos de recomendação. 7 REFERÊNCIAS BIBLIOGRÁFICAS OrgânicaDigital – Algoritmo de Classificação Naive Bayes. Disponível em https://www.organicadigital.com/blog/algoritmo-de-classificacao-naive-bayes/ Acesso em 06 mai. 2021. CASTRO, Leandro Nunes de e FERRARI, Daniel Gomes. Introdução à mineração de dados: conceitos básicos, algoritmos e aplicações. Saraiva. 2016. Disponível em: Biblioteca Virtual da Laureate. DATA CAMP – Naive Bayes Classification using Scikit-learn. Disponível em https://www.datacamp.com/community/tutorials/naive-bayes-scikit-learn/Acesso em 06 mai. 2021. SAS INSIGHT– Analytics O que é e qual sua importância?. Disponível em https://www.sas.com/pt_br/insights/analytics/analytics.html Acesso em 09 mai. 2021.
Compartilhar