Análise Sensorial de Cervejas

•

UESC

Thais Damacena Passos

12/05/2024

E aí, curtiu este material?

Ajude a incentivar outros estudantes a melhorar o conteúdo

Gostou desse material? Compartilhe! 🧡

Ciência dos Alimentos

1.141 Materiais compartilhados

Baixe o app para aproveitar ainda mais

Leia os materiais offline, sem usar a internet. Além de vários outros recursos!

Prévia do material em texto

UNIVERSIDADE FEDERAL DE UBERLÂNDIA
FACULDADE DE ENGENHARIA QUÍMICA

ARTUR DUARTE LIMA

CIÊNCIA DE DADOS E APRENDIZADO DE MÁQUINA APLICADOS À
ANÁLISE SENSORIAL DE CERVEJAS

Uberlândia
2023

ARTUR DUARTE LIMA

CIÊNCIA DE DADOS E APRENDIZADO DE MÁQUINA APLICADOS À
ANÁLISE SENSORIAL DE CERVEJAS

Trabalho de Conclusão de Curso
apresentado à Faculdade de Engenharia
Química da Universidade Federal de
Uberlândia como requisito parcial para
obtenção do título de bacharel em
Engenharia Química.

Orientador: Sarah Arvelos Altino

Uberlândia
2023

ARTUR DUARTE LIMA

CIÊNCIA DE DADOS E APRENDIZADO DE MÁQUINA APLICADOS À
ANÁLISE SENSORIAL DE CERVEJAS

Uberlândia, 30 de novembro de 2023.

Banca Examinadora:

_________________________________________________
Prof. Dra. Sarah Arvelos Altino – FEQUI/UFU

_________________________________________________
Prof. Dr. Rubens Gedraite – FEQUI/UFU

_________________________________________________
Eng. Me. Paulo Henrique Ramos Silva – PPGEQ/FAPEMIG/UFU

Dedico este trabalho aos meus pais, pelo
estímulo, carinho e compreensão.

AGRADECIMENTOS

Agradeço a professora Dra. Sarah Arvelos o incentivo, motivação, orientação e
paciência nesta caminhada acadêmica.
Aos meus amigos Amanda e Patrick, meus primos Daniel e Bruno pela imensa
ajuda com o desenvolvimento do Trabalho de Conclusão de Curso (TCC).

“Ninguém ignora tudo. Ninguém sabe
tudo. Todos nós sabemos alguma coisa.
Todos nós ignoramos alguma coisa.”
Paulo Freire

RESUMO

A Engenharia Química desempenha um papel fundamental na otimização de
processos industriais, com uma ênfase particular na indústria alimentícia. Nesse
contexto, a produção de cerveja se destaca como um campo de pesquisa importante,
que combina tradição e inovação tecnológica para competir em um mercado
altamente competitivo. As características sensoriais desempenham um papel crucial
na cerveja, influenciando a preferência dos consumidores. A análise sensorial na
indústria de alimentos evoluiu ao longo do tempo, adotando métodos mais formais e
avançados, incluindo avaliações computadorizadas e análise estatística. Painéis de
degustação treinados desempenham um papel central na identificação de atributos
sensoriais, permitindo ajustes nas formulações para atender às preferências dos
consumidores. Além disso, a análise sensorial desempenha um papel essencial na
garantia da qualidade, detectando variações indesejadas e contribuindo para o
desenvolvimento de novos produtos. A análise de dados e os algoritmos de machine
learning, por sua vez, desempenham um papel crucial na caracterização e previsão
de sabores e perfis de cerveja. O presente trabalho de conclusão de curso objetivou
apresentar uma revisão bibliográfica breve sobre o assunto, assim como também
apresentar um breve estudo de caso a respeito da caracterização de cervejas. Foram
aplicadas técnicas de análise de dados e uma regressão utilizando-se o modelo de k-
vizinhos mais próximos (KNN). Os resultados mostraram que o KNN, apesar de sua
simplificidade, é capaz de prever o teor alcoólico de diversos tipos de cervejas,
representando com o Mean Squared Error (MSE) de ~1.1 o conjunto de teste dos
dados.

Palavras-chave: análise sensorial; cerveja; aprendizado de máquina.

ABSTRACT

Chemical Engineering plays a fundamental role in optimizing industrial processes, with
a particular emphasis on the food industry. In this context, beer production stands out
as an important field of research that combines tradition and technological innovation
to compete in a highly competitive market. Sensory characteristics play a crucial role
in beer, influencing consumer preferences. Sensory analysis in the food industry has
evolved over time, adopting more formal and advanced methods, including
computerized assessments and statistical analysis. Trained tasting panels play a
central role in identifying sensory attributes, allowing adjustments in formulations to
meet consumer preferences. Furthermore, sensory analysis plays an essential role in
quality assurance by detecting undesirable variations and contributing to the
development of new products. Data analysis and machine learning algorithms, in turn,
play a crucial role in characterizing and predicting beer flavors and profiles. This
undergraduate thesis aimed to present a brief literature review on the subject and also
aimed to provide a brief case study on beer characterization. Data analysis techniques
and regression using the k-nearest neighbors (KNN) model were applied. The results
showed that despite its simplicity, KNN is capable of predicting the alcohol content of
various types of beers, representing with MSE of 1.1 the test group of data.

Keywords: sensory analysis; beer; machine learning.

LISTA DE FIGURAS

Figura 1. Grão de cevada in-natura e malte. ............................................................................... 5
Figura 2. Tanques de mosturação. ....................................................................................... 6
Figura 3. Classificação de cores de cervejas de acordo com medidas de SEM e EBC.
.................................................................................................................................................... 9
Figura 4. Áreas da língua humana onde os 4 sabores são mais facilmente percebidos.
Todos os 4 são percebidos, mas menos prontamente, na área central. ...................... 10
Figura 5. Lúpulo: ingrediente essencial na produção de cervejas. ............................... 11
Figura 6. Cinco sentidos e aspectos avaliados na análise sensorial. ........................... 13
Figura 7. Resultado para comando df.info() ...................................................................... 24
Figura 8. Histograma para a variável 'number_of_reviews'' ........................................... 27
Figura 9. Gráficos de caixa (bloxplots) para as colunas referentes à notas dos
avaliadores. ............................................................................................................................. 28
Figura 10. Histogramas para as variáveis remanescentes no banco de dados após a
remoção de outliers. .............................................................................................................. 29
Figura 11. Mapa de calor explicitando os valores da correlação de Pearson para os
pares de variáveis. ................................................................................................................. 30
Figura 12. Valores do MSE considerando diferentes cálculos de distâncias e número
de vizinhos. ............................................................................................................................. 33
Figura 13. Valores reais versus valores preditos para a variável ABV. ........................ 33

SUMÁRIO

1 INTRODUÇÃO ........................................................................................................ 1
2 REVISÃO BIBLIOGRÁFICA................................................................................... 3
2.1 História Da Indústria Cervejeira .................................................................... 3
2.1.1 História da indústria cervejeira no mundo .........................................................3
2.1.2 História da indústria cervejeira no Brasil ........................................................... 3
2.2 Processo de produção cervejeiro ................................................................. 4
2.2.4 Fermentação ..................................................................................................... 7
2.2.5 Maturação ......................................................................................................... 7
2.2.6 Envase .............................................................................................................. 7
2.3 Características sensoriais importantes das cervejas.................................. 8
2.3.1 Cor .................................................................................................................... 8
2.3.2 Aroma ............................................................................................................... 9
2.3.3 Sabor ................................................................................................................ 9
2.3.4 Textura ............................................................................................................ 10
2.3.5 Amargor .......................................................................................................... 10
2.4 Análise Sensorial .......................................................................................... 11
2.5 Machine Learning ......................................................................................... 13
2.5.1 Machine learning aplicado a caracterização de cervejas ................................ 14
3 METODOLOGIA ................................................................................................... 18
3.1 Obtenção do banco de dados e ambiente computacional ........................ 18
3.2 Preparação e Análise Exploratória dos Dados .......................................... 18
3.4 Tratamento de Dados e Análise de Correlação .......................................... 19
3.5 Modelagem e Avaliação ............................................................................... 20
3.6 Avaliação do Modelo .................................................................................... 21
4 RESULTADOS E DISCUSSÕES .......................................................................... 22
5 CONCLUSÃO ....................................................................................................... 34
6 REFERÊNCIAS .................................................................................................... 34

1 INTRODUÇÃO

A Engenharia Química, como disciplina fundamental e multifacetada,
desempenha um papel crucial na otimização e aprimoramento dos processos
industriais (STANKIEWICZ; MOULIJN, 2000). Seu alcance abrangente se estende a
diversas indústrias, e, na indústria alimentícia, sua versatilidade é particularmente
notável (HEFFT; HIGGINS, 2021). Este campo da engenharia oferece uma plataforma
para inovação constante, buscando soluções para os desafios intrínsecos à produção
de alimentos, abordando questões que vão desde a conservação de alimentos até a
melhoria das características sensoriais dos produtos finais (EARLE, 1997).
Dentro do vasto cenário da indústria alimentícia, a produção de bebidas assume
um papel proeminente (BAYONA-SAEZ et al., 2017). Entre todas as bebidas, a cerveja
destaca-se como uma escolha de mercado nacional e internacional e é também um
campo de pesquisa de grande interesse. A fabricação de cerveja, um processo
intrincado e tradicional, representa uma sinergia fascinante de tradição e inovação
tecnológica, oferecendo oportunidades para aprimoramento e diferenciação em um
mercado cada vez mais competitivo.
As características organolépticas da cerveja desempenham um papel crucial na
determinação de sua aceitação pelo consumidor (LANGSTAFF; LEWIS, 1993).
Aromas, sabores, cor e textura são fatores-chave que podem delimitar a preferência
do consumidor. A pesquisa voltada para a compreensão e controle dessas
características é essencial para a indústria cervejeira. Afinal, a capacidade de ajustar
e otimizar essas características pode resultar em produtos mais atrativos e
competitivos.
O mundo da caracterização de cervejas está em constante evolução. O que antes
dependia fortemente de avaliações subjetivas agora pode ser aprimorado por métodos
objetivos e científicos (GONZALEZ VIEJO et al., 2019). Esta transformação, alimentada
pela tecnologia e pela pesquisa, promete uma abordagem mais precisa e eficaz para
definir e diferenciar cervejas, permitindo que produtores atendam de maneira mais
precisa às preferências dos consumidores.
No âmbito desta pesquisa, abordaremos o uso de ciência de dados e Machine
Learning (Aprendizado de Máquina), uma área empolgante da ciência da computação,
que tem ganhado crescente relevância na resolução de problemas complexos (BIFET
et al., 2018). Com algoritmos de aprendizado de máquina, é possível analisar grandes
2

volumes de dados, identificar padrões e tomar decisões orientadas por dados de
forma eficiente. Isso é particularmente relevante para os engenheiros, pois oferece
ferramentas poderosas para melhorar processos e otimizar produtos (DA COSTA; DA
COSTA; BARBOSA, 2021).
O objetivo geral deste trabalho é apresentar um estudo de caso a respeito da
aplicação de análise de dados a um banco de dados gerado pela própria comunidade
cervejeira e de ciência de dados e estudar um algoritmo clássico de aprendizado de
máquina para prever o Alcohol By Volume (ABV) de uma cerveja tendo por base as
avaliações das características da mesma.

2 REVISÃO BIBLIOGRÁFICA

2.1 História Da Indústria Cervejeira

A indústria cervejeira é um setor de destaque tanto no Brasil como em todo o
mundo. A cerveja, uma das bebidas alcoólicas mais consumidas globalmente,
desempenha um papel fundamental nas culturas e economias de muitos países.
Neste texto, exploraremos a evolução da indústria cervejeira no Brasil e no contexto
global, destacando seus principais aspectos e tendências.

2.1.1 História da indústria cervejeira no mundo

A cerveja é uma das bebidas alcoólicas mais antigas do mundo, com uma
história que remonta há 9 mil anos na Mesopotâmia (atual Iraque) (CERVBRASIL,
2018). A produção de cerveja evoluiu consideravelmente ao longo dos séculos, de
pequenas cervejarias artesanais a grandes conglomerados industriais. Atualmente, a
indústria cervejeira é caracterizada por uma ampla diversidade de estilos, sabores e
marcas, com empresas de renome internacional competindo no mercado global.
A globalização desempenhou um papel importante na indústria cervejeira, com
as principais marcas expandindo-se para mercados internacionais e impulsionando a
popularização de estilos de cerveja tradicionais de diversas regiões. A ascensão das
cervejarias artesanais também é uma tendência marcante, com consumidores
buscando produtos de alta qualidade e sabores únicos
(BREWERSASSOCIATION, 2023).
A sustentabilidade e a responsabilidade social estão se tornando cada vez mais
relevantes na indústria, à medida que as empresas buscam reduzir seu impacto
ambiental e promover o consumo responsável (FURSTENAU et al., 2020).

2.1.2 História da indústria cervejeira no Brasil

No Brasil, a história da cerveja tem raízes que remontam ao período colonial,
mas foi no século 19 que a produção cervejeira ganhou impulso, com a chegada de
imigrantes europeus trazendo seus métodos de produção. Ao longo do tempo, a
4

cerveja se tornou uma das bebidas alcoólicas mais populares do país (SANTOS,
2005).
A indústria cervejeira brasileira experimentou uma grande transformação nas
últimas décadas. As grandes cervejarias brasileiras, como Ambev e Heineken Brasil,
têm desempenhado um papel significativo no mercado(FERRARI, 2008). O Brasil
também viu o crescimento das cervejarias artesanais, que têm conquistado um público
fiel com suas cervejas de alta qualidade e variedade de sabores.
A diversidade é uma característica distintiva da indústria cervejeira brasileira,
refletindo a rica cultura do país (SANTOS, 2005). A cerveja é apreciada em uma ampla
gama de ambientes, desde as praias até as áreas rurais. Além disso, eventos
cervejeiros, como festivais e competições, estão se tornando cada vez mais
populares, promovendo a cultura cervejeira no Brasil.
No contexto brasileiro, assim como em outros lugares, questões de
sustentabilidade e responsabilidade social estão ganhando importância à medida que
a indústria cervejeira se esforça para minimizar seu impacto ambiental e contribuir
para a comunidade local (AMBEV, 2021).
A indústria cervejeira é um setor dinâmico e em constante evolução, tanto no
Brasil como no mundo (FERRARI, 2008). Com uma história rica e uma diversidade de
sabores e estilos, a cerveja continua a ser uma das bebidas alcoólicas mais
consumidas globalmente. À medida que a indústria busca atender às demandas de
um público diversificado e consciente, a inovação, a sustentabilidade e a
responsabilidade social desempenham papéis fundamentais na definição do futuro da
cerveja no Brasil e no mundo.

2.2 Processo de produção cervejeiro

O processo de produção cervejeiro é composto basicamente por seis fases,
que envolvem desde o processamento da matéria-prima de base (o malte, Figura 1)
até o envase final. Todas as etapas são cuidadosamente executadas, de forma que
não haja contaminação do produto e final e nenhuma adição de aromas indesejados
(off flavours) (ESSLINGER, 2009).

Figura 1. Grão de cevada in-natura e malte.

Fonte: CERVEJEIROS (2016)

2.2.1 Malteação

A malteação é um processo de torra de um grão cereal, usualmente a cevada,
que foi previamente armazenado e germinado sob condições controladas. A torra faz
com que o processo de germinação pare no momento correto para que o grão tenha
a quantidade de açúcar, enzimas e materiais solúveis desejados para a produção
cervejeira. O nível e método de torra também influenciará no aroma e coloração da
cerveja (BRIGGS et al., 2004).

2.2.2 Mosturação

Inicialmente o malte é moído e misturado com água quente (mistura chamada
de mosto) em um tanque de mostura. A moagem influencia na conversão de açúcar
em álcool de forma que o grão muito grosso fará com que a enzima tenha difícil acesso
ao açúcar e tornará o mosto muito viscoso (ESSLINGER, 2009). Por outro lado, o grão
moído em excesso prejudicará a clarificação, pois a camada filtrante formada pela
própria casca do malte será muito fina e muito sólido passará para a fervura e tanque
de fermentação.
É na mistura do malte com água quente que as enzimas do grão começam a
agir e quebram o amido em açúcares menos complexos e solúveis em água. Açúcares
6

menores serão convertidos em álcool na fermentação e os açúcares maiores
contribuirão para o corpo da cerveja (ESSLINGER, 2009). A Figura 1 mostra tanques
de mosturação de uma indústria cervejeira.

Figura 2. Tanques de mosturação.

Fonte: (BAMFORTH, 2023)

2.2.3 Fervura

O mosto é posteriormente recirculado para clarificação (separação
sólido/líquido) e enviado para a um tanque de fervura. Aqui o principal objetivo é a
esterilização do mosto, matando quaisquer microrganismos indesejados (STEWART;
RUSSELL; ANSTRUTHER, 2017).
Durante a fervura, lúpulo é adicionado ao mosto cervejeiro fornecendo amargor,
sabor e aroma desejados a cada estilo de cerveja. No final da fervura o mosto é
7

resfriado para não matar a levedura já presente no tanque de fermentação,
previamente preparado (KUNZE, 2019).

2.2.4 Fermentação

O mosto que sai da fervura, resfriado, é posteriormente aerado para que haja
fermentação dentro do tanque na adega de fermentação. A levedura previamente
adicionada ao tanque começa o processo de fermentação: a transformação de
açúcares menores em álcool e dióxido de carbono (ESSLINGER, 2009). O processo
de fermentação depende do tipo de cerveja preparada e pode levar semanas para
acontecer. Aqui pode-se começar a adição de condimentos na cerveja, apesar do
maior risco de acidentes devido a atividade microbiológica.

2.2.5 Maturação

Quando a cerveja atingiu os parâmetros de densidade e pH desejados na
fermentação inicia-se o processo de maturação. Aqui a temperatura do tanque é
setada para 0ºC o que cessa a atividade da levedura. Então, uma grande porção dela
é decantada e purgada do tanque, contribuindo para aprimorar tanto o sabor quanto
a clareza da cerveja. A depender do estilo, são adicionados lúpulos ou outros
condimentos na cerveja (ESSLINGER, 2009). Este é o momento mais susceptível a
contaminações; portanto, qualquer adição à cerveja deve ser cuidadosamente
realizada nas condições mais assépticas possíveis (GOLDAMMER, 2022).

2.2.6 Envase

Após a maturação a cerveja pode ou não passar por filtração, para retirada de
qualquer sólido indesejado. Feito isso a cerveja é envasada comumente em garrafas,
latas ou barris. Em cervejarias artesanais a carbonatação desejada é feita durante o
processo de maturação, mas pode ser adicionado mais dióxido de carbono no envase,
a depender da carbonatação desejada (ESSLINGER, 2009; GOLDAMMER, 2022).

2.3 Características sensoriais importantes das cervejas

A apreciação de uma boa cerveja envolve uma avaliação cuidadosa de
características sensoriais que contribuem para a experiência de sabor, aroma e
aparência. Alguns desses fatores foram mencionados em seções anteriores, mas é
seguro dizer que o processo de produção cervejeira como um todo vai influenciar Seja
pelo nível de assepsia, a escolha dos tipos de lúpulo e malte, juntamente com o tempo
de maturação, é crucial.
A seguir é feita uma breve apresentação dessas características, principalmente
voltada aos parâmetros analisados neste trabalho.

2.3.1 Cor

A cor influencia no tipo de cerveja substancialmente e é a primeira
característica observada pelo consumidos. A medida da cor de uma cerveja é dada
por dois métodos: o EBC (European Brewery Society) e o SEM (Standard Reference
Method SEM), desenvolvido pela ASBC (American Society of Brewing Chemists)
(BAXTER; HUGLES, 2001; KOREN et al., 2020). Os dois métodos são baseados em
diferença de absorbância, logo padronizam a medida de cor de uma cerveja.
A Figura 3 exemplifica essas medidas para cervejas:

Figura 3. Classificação de cores de cervejas de acordo com medidas de SEM e
EBC.

Fonte: BJCP (2008).

2.3.2 Aroma

O aroma da cerveja é uma parte essencial da experiência sensorial, manifestando-se
principalmente a partir dos maltes e lúpulos escolhidos. Na Pilsen, um aroma
limpo e refrescante é esperado, frequentemente com notas sutis de lúpulo floral e um
leve toque de malte. Em contraste, as IPAs são conhecidas por seu aroma
pronunciado de lúpulo, que pode variar de cítrico e frutado a resinoso e terroso. A
intensidade do aroma é uma característica distintiva das IPAs, muitas vezes
marcando-as com notas fortes de lúpulo (ESSLINGER, 2009; GOLDAMMER, 2022).

2.3.3 Sabor

O sabor é a característica mais proeminente da cerveja e é influenciado por
uma variedade de fatores que vão desde a torra do grão até o tempo de maturação.
De acordo com a definição EBC-ASBC, sabor é a combinação entre os atributos
olfativos e gustativos percebidos durante a degustação. Existem quatro sabores
básicos percebidos na cavidade oral: doce, salgado, azedo e amargo (ESSLINGER,
10

2009; GOLDAMMER, 2022). A Figura 4 mostra a localização das áreas da língua
humana onde os quatro sabores previamente citados são encontrados.

Figura 4. Áreas da língua humana onde os 4 saboressão mais facilmente
percebidos. Todos os 4 são percebidos, mas menos prontamente, na área central.

Fonte: BRIGGS et al. (2004)

2.3.4 Textura

A textura da cerveja pode variar muito a depender do estilo devido a sua ligação
com a viscosidade e carbonatação das mesmas. A viscosidade depende
especialmente da quantidade de açúcares complexos presentes na cerveja e a
carbonatação é dada principalmente pelo estilo desejado. Essas duas características
nos dizem se a cerveja é leve ou efervescente, deslizando suavemente pelo paladar,
ou se é encorpada e tem uma sensação mais robusta na boca (MOSHER; DANIELS;
CALAGIONE, 2017).

2.3.5 Amargor

O amargor é uma das características mais importantes da cerveja,
principalmente nas cervejas com combinações de lúpulo (Figura 5) mais complexas
como as IPAs. Ele é resultado da presença de lúpulo, utilizado em maior quantidade
na maturação. Em estilos que comumente usa-se lúpulos apenas na fervura, como a
Pilsen, a quantidade adicionada é pequena, logo a atenção deve ser voltada para o
tempo de fervura e extração dos alfa-ácidos presentes de modo a não adicionar
amargor indesejado na cerveja (MOSHER; DANIELS; CALAGIONE, 2017).
11

Os principais componentes do lúpulo de interesse para a produção de cerveja
são o óleo essencial, os ácidos amargos e os compostos polifenólicos. Os óleos
essenciais conferem fragrâncias, como notas verdes, cítricas, florais, picantes,
herbais, amadeiradas e frutadas, entre outras. Os alfa-ácidos são a principal fonte de
amargor, além de uma série de outros componentes, como produtos de oxidação dos
α e β-ácidos. Os polifenóis conferem corpo, bem como propriedades antioxidantes e
outras propriedades biológicas de crescente interesse (SANZ et al., 2019).

Figura 5. Lúpulo: ingrediente essencial na produção de cervejas.

Fonte:(MPANGA; SCHALAU, 2020)

2.4 Análise Sensorial

A análise sensorial na indústria de alimentos tem uma longa história que
remonta aos primórdios da civilização, quando os seres humanos aprenderam a
avaliar a qualidade e a segurança dos alimentos com base em suas características
sensoriais (DRAKE; CLARK, 2023). No entanto, a sistematização da análise sensorial
como uma disciplina científica é um desenvolvimento relativamente recente. O século
20 testemunhou avanços significativos na metodologia de análise sensorial, com a
formalização de métodos, técnicas de amostragem e o uso de painéis de degustação
treinados. Entre os métodos mais recentes, destacam-se as avaliações
12

computadorizadas e a análise estatística avançada, que aprimoram a precisão e a
objetividade da análise sensorial (DRAKE; CLARK, 2023).
Um dos aspectos mais importantes da análise sensorial, como mencionado em
tópicos anteriores, é a avaliação de atributos sensoriais, como sabor, aroma, textura,
cor e aparência. Os painéis de degustação treinados desempenham um papel crucial
na identificação e quantificação desses atributos, garantindo a consistência e a
precisão das análises (JONSDOTTIR et al., 2004). A análise sensorial permite que os
fabricantes de alimentos compreendam as preferências dos consumidores e ajustem
suas formulações de acordo.
A análise sensorial é uma ferramenta fundamental na garantia de qualidade na
indústria de alimentos. Ela permite a detecção de variações indesejadas na qualidade
dos produtos e ajuda a identificar problemas de produção que podem afetar a
segurança e a aceitação do consumidor. Isso inclui a identificação de sabores ou
odores anormais, texturas indesejadas e outros desvios das especificações
(OLIVEIRA; ANDRADE; REZENDE, 2022).
A análise sensorial desempenha um papel essencial no desenvolvimento de
novos produtos. Os cientistas de alimentos usam a análise sensorial para criar perfis
de sabor e aroma ideais, avaliar a aceitação do consumidor e ajustar formulações para
atender às preferências de mercado. Isso é particularmente relevante na indústria de
alimentos, onde a inovação e a diferenciação de produtos são essenciais (DA SILVA,
V. S.; ORLANDELLI, 2019).
A Figura 6 sumariza como os 5 sentidos estão relacionados à avaliação de um
produto alimentício/alimento.

Figura 6. Cinco sentidos e aspectos avaliados na análise sensorial.

Fonte: Adaptado de NOBLE; LESSCHAEVE (2006)

2.5 Machine Learning

O foco principal de machine learning (ML) é tomar decisões ou fazer predições
baseadas em dados. Há vários outros campos com técnicas consideravelmente
próximas, mas com focos diferentes. Um exemplo é a estatística em que o foco é
achar o modelo que melhor se adeque aos dados do problema. Com machine learning,
também é possível fazer a adequação de modelos, mas como um meio para fazer
boas predições ou decisões (JIANG, 2022).
À medida que os métodos de ML se desenvolveram em sua eficiência e escopo,
ML se tornou o melhor meio, medido em termos de velocidade, tempo de engenharia
humana, e robustez, para se realizar várias aplicações (PINHEIRO; SANTOS; NETO,
2023). Ótimos exemplos são reconhecimento facial e de voz e várias outras atividades
envolvendo processamento de linguagens. Quase qualquer aplicação que envolva
entender dados ou sinais originários do mundo real pode ser desenvolvida usando
machine learning (DE OLIVEIRA QUADRAS et al., 2023).
Um aspecto crucial de técnicas machine learning para solução de problemas é
que a engenharia humana desempenha um importante papel. Um ser humano ainda
tem que definir o problema, obter e organizar os dados, definir um espaço de possíveis
soluções, selecionar um algoritmo de aprendizado e seus parâmetros, aplicar o
14

algoritmo aos dados, validar a solução de forma a decidir se a mesma está apta para
uso (BORRERO; MARISCAL; VARGAS-SÁNCHEZ, 2022).
A base para aprender com dados é um problema indutivo, pois é preciso
sempre se perguntar o porquê os dados coletados previamente nos ajudarão a prever
o futuro. Esse questionamento é tratado operacionalizando o mesmo na medida que
suposições são feitas, como todos os dados de treino são independentes e igualmente
distribuídos e que as informações serão sempre retiradas a partir da mesma
distribuição dos dados de treino, ou que as respostas virão a partir de um conjunto de
possíveis respostas conhecidas previamente (FREEMAN, 2023).
A resolução utilizando técnicas de machine learning em geral envolve dois
passos: estimar e generalizar. Estima-se quando os dados refletem de forma não
direta uma ou mais variáveis de interesse, logo agregamos os dados e fazemos
estimações ou predições sobre essa variável. Então, é preciso lidar com o fato de que
o mesmo tratamento pode fornecer resultados diferentes em avaliações diferentes e
posteriormente ser capaz de dizer o nível de adequação com futuros resultados. O
segundo passo é generalizar, o que significa predizer o quão bem os cálculos podem
predizer resultados que nunca foram encontrados nos dados disponíveis (WANG et
al., 2021).

2.5.1 Machine learning aplicado a caracterização de cervejas

Machine learning tem mostrado um potencial significativo na indústria
cervejeira, especialmente na caracterização e predição de sabores e perfis de
cervejas. Através da modelagem baseada em estrutura molecular, é possível prever
o sabor e o índice de retenção de compostos em cervejas, proporcionando insights
valiosos para cervejeiros e consumidores (HELFER et al., 2022).
A aplicação de algoritmos de aprendizado de máquina na predição de sabores
em cervejas é uma abordagem inovadora que combina ciência de dados com química.
A estrutura molecular dos compostos presentes na cerveja desempenha um papel
crucial na determinação de seu sabor. Cada composto tem uma estrutura única que
pode ser descrita por um conjunto de descritores moleculares. Estes descritores,
quando alimentados em modelos de machine learning, podem ser usados paraprever
características de sabor específicas (JI et al., 2023).
15

Alguns estudos relatados na literatura coletaram dados de compostos que
imprimem sabor na cerveja e classificaram os mesmos em grupos como aromáticos,
amargos, sulfurosos, entre outros. Além disso, estes estudos investigaram os valores
do índice de retenção (RI) em colunas não polares e polares. A estrutura desses
compostos foi então convertida em descritores moleculares, que foram usados para
treinar modelos (ANDERSON et al., 2021; DA SILVA, L. A. et al., 2019; MANNINA et
al., 2016; PALMIOLI et al., 2020, WANG, Y.-T. et al). Diferentes modelos, incluindo
máquina de vetores de suporte, floresta aleatória (RF) e k-vizinhos mais próximos
(kNN), foram utilizados para criar modelos de sabor de cerveja. A modelagem
utilizando RF mostrou a maior precisão (WANG, Y.-T. et al), indicando sua eficácia na
predição do sabor de compostos específicos na cerveja.
Este avanço na predição de sabores de cerveja usando machine learning não
apenas ajuda os cervejeiros a entenderem melhor os compostos de sabor em suas
cervejas, mas também pode ser usado para desenvolver novos sabores e perfis de
cerveja, otimizando a experiência do consumidor.
Além disso, técnicas avançadas de análise, como a cromatografia líquida de
quadrupolo com tempo de voo acoplado à espectrometria de massas (LC-QTOF-MS),
têm sido combinadas com machine learning para perfilar estilos contemporâneos de
cerveja. A LC-QTOF-MS é uma técnica poderosa que permite a identificação e
quantificação de compostos em amostras complexas, como cerveja, com alta precisão
e sensibilidade. Quando acoplada à espectrometria de massas, essa técnica pode
detectar e identificar uma ampla gama de compostos, desde os mais voláteis até os
de maior peso molecular (GONZALEZ VIEJO; FUENTES, 2020).
Ao aplicar modelos de aprendizado aos dados obtidos por LC-QTOF-MS, é
possível criar algoritmos que podem distinguir entre diferentes estilos de cerveja com
base em seu perfil químico. Por exemplo, a presença ou ausência de certos
compostos, bem como suas concentrações relativas, pode indicar se uma cerveja é
uma lager, uma ale, um stout, entre outros estilos (GONZALEZ VIEJO; FUENTES,
2020).
O estudo citado (GONZALEZ VIEJO; FUENTES, 2020) utilizou técnicas de
aprendizado de máquina, como análise de componentes principais (PCA) e análise
discriminante linear (LDA), para classificar cervejas em diferentes estilos com base
em seus perfis químicos. Os resultados mostraram que é possível diferenciar com
16

precisão entre estilos de cerveja, mesmo aqueles que são quimicamente
semelhantes.
Essa combinação de técnicas avançadas de análise com machine learning não
apenas permite uma discriminação precisa entre diferentes estilos de cerveja, mas
também oferece uma ferramenta poderosa para a autenticação de cervejas. Em um
mercado onde a autenticidade e a qualidade são de extrema importância, essa
abordagem pode ajudar a garantir que os consumidores estejam recebendo o produto
genuíno e de alta qualidade que esperam (MOHAMAD et al., 2022).
A avaliação da qualidade da cerveja é uma área que tem se beneficiado
enormemente da integração de avançadas técnicas de robótica e visão computacional
com biometria do consumidor. Estas técnicas modernas estão revolucionando a forma
como avaliamos e percebemos características específicas da cerveja, que
anteriormente dependiam em grande parte da avaliação humana subjetiva. Uma das
características mais apreciadas e observadas da cerveja é a formação de sua
espuma. A espuma não é apenas esteticamente agradável, mas também é indicativa
da qualidade e frescor da cerveja. Tradicionalmente, a avaliação da formação de
espuma era uma tarefa que exigia habilidade e experiência, e muitas vezes estava
sujeita a variações e inconsistências entre avaliadores (GONZALEZ VIEJO et al., 2018).
Com a introdução de técnicas de robótica e visão computacional, agora é
possível avaliar a formação de espuma de uma maneira muito mais objetiva e precisa.
Utilizando câmeras de alta resolução e algoritmos avançados de processamento de
imagem, é possível quantificar a densidade, estabilidade e textura da espuma. Além
disso, a biometria do consumidor, que envolve a medição e análise de características
físicas ou comportamentais dos consumidores, pode ser integrada para entender
melhor como diferentes perfis de consumidores percebem e avaliam a espuma
(GONZALEZ VIEJO et al., 2018).
A avaliação da qualidade da cerveja é uma área que tem se beneficiado
enormemente da integração de avançadas técnicas de robótica e visão computacional
com biometria do consumidor (CHERKAEV; REYNOLDS; STEENKAMP, 2022). Estas
técnicas modernas estão revolucionando a forma como avaliamos e percebemos
características específicas da cerveja, que anteriormente dependiam em grande parte
da avaliação humana subjetiva

A robótica e a visão computacional têm permitido a automação e a precisão na
coleta e análise de dados relacionados à cerveja. Uma das inovações mais notáveis
é o uso do "nariz eletrônico", um dispositivo que pode detectar e identificar odores e
sabores em amostras de cerveja. Este dispositivo, quando combinado com técnicas
de inteligência artificial, pode analisar e classificar diferentes características da
cerveja, como a fermentação e a presença de possíveis falhas (ANWAR; ANWAR;
MURTAZA, 2023).
O nariz eletrônico funciona através da detecção de compostos voláteis
presentes na cerveja. Estes compostos são responsáveis pelo aroma e sabor da
cerveja. Ao analisar a composição e concentração destes compostos, é possível
determinar a qualidade e autenticidade da cerveja. Além disso, a combinação destas
técnicas com a biometria do consumidor permite uma avaliação mais personalizada,
levando em consideração as preferências e percepções individuais (SHI et al., 2019).

3 METODOLOGIA

3.1 Obtenção do banco de dados e ambiente computacional

O banco de dados em estudo foi consultado na plataforma Kaggle1. O conjunto
de dados contém perfis de degustação e avaliações de consumidores de 3.197
cervejas exclusivas de 934 cervejarias diferentes. Foi criado integrando informações
de dois conjuntos de dados existentes no Kaggle. O objetivo da integração de dados
foi criar um novo conjunto de dados que contenha análises abrangentes do
consumidor (aparência, aroma, paladar, sabor e pontuações gerais de avaliação) para
diferentes cervejas, combinadas com seus perfis de degustação detalhados.
Para realização da Análise Exploratória de Dados e regressão com modelos de
aprendizado de máquina foi empregado o software online Google Colaboratory em
ambiente de programação Python (versão número 3.7.13). Para análise de dados, as
principais bibliotecas de uso foram Numpy2, Matplotlib3, Seaborn4 e pandas5.

3.2 Preparação e Análise Exploratória dos Dados

Antes de aplicar qualquer modelo de aprendizado de máquina, é essencial
preparar e analisar os dados. A preparação dos mesmos envolve limpeza,
transformação e codificação para torná-los adequados para modelagem. A Análise
Exploratória de Dados (EDA) é uma abordagem que visa entender a estrutura,
padrões e anomalias (PATEL et al., 2022). No contexto deste estudo, a EDA foi usada
para visualizar a distribuição dos estilos de cerveja e entender as estatísticas básicas
dos dados. Técnicas de visualização, como gráficos de barras e mapas de calor, foram
empregadas para obter insights com base nas informações analisadas.

1 https://www.kaggle.com/datasets/ruthgn/beer-profile-and-ratings-data-set acesso em 10/08/2023.
2 https://numpy.org/
3 https://matplotlib.org/
4 https://seaborn.pydata.org/
5 https://pandas.pydata.org/
19

Inicialmente, importamos a biblioteca Pandas com o apelido de pd, o que é uma
prática comum para facilitar a escrita docódigo.
• Fonte dos Dados: Os dados foram importados de um arquivo CSV
chamado 'beer_profile_and_ratings.csv'. Utilizamos o método read_csv
da biblioteca Pandas para ler o arquivo CSV contendo os dados e criar
um DataFrame chamado df. Com os métodos head() e info(), realizamos
uma inspeção inicial para entender a estrutura e a integridade dos
dados.
• Visualização Inicial: As primeiras cinco linhas do conjunto de dados
foram visualizadas para entender a estrutura e os tipos de dados
presentes.
• Análise de Dados Faltantes: Foi realizada uma verificação para
identificar se havia dados faltantes no conjunto.
• Estatísticas Básicas: Foram calculadas estatísticas descritivas para
entender a distribuição e a tendência central dos dados.
• Características Modeladas: A modelagem de características é uma
etapa fundamental no processo de aprendizado de máquina. No
contexto da indústria cervejeira, o conjunto de dados utilizado contém
informações sobre os perfis e avaliações de cervejas. As características
modeladas incluem quesitos como aroma, aparência, paladar e sabor,
com notas variando de 0 a 5. Além disso, o conjunto de dados também
contém informações sobre estilos de cerveja. Detalhes sobre o banco
de dados serão apresentados na seção de Resultados.

3.4 Tratamento de Dados e Análise de Correlação

• Remoção de Outliers: Utilizou-se o método IQR (Intervalo Interquartil)
para identificar e remover outliers das colunas relacionadas aos perfis
de sabor e avaliações (LIMA, L. F. M.; MAROLDI; SILVA, 2013).
20

• Análise de Correlação: Foi gerada uma matriz de correlação utilizando-
se a função Corr6 da biblioteca Pandas, utilizando-se a correlação linear
de Pearson (PARANHOS et al., 2014). Objetivou-se entender as relações
entre os diferentes perfis de sabor e as avaliações, utilizando a biblioteca
Seaborn para visualização gráfica.
• Padronização: Os dados foram padronizados utilizando a classe
StandardScaler. A padronização se faz necessária, tendo em vista que
o algoritmo KNN lida com comparação de distâncias (HENDERI, 2021).
•

3.5 Modelagem e Avaliação

• Dados Categóricos: As colunas categóricas 'Style', 'Brewery', 'Beer
Name (Full)' e 'Description' foram removidas do dataframe.
• Número de avaliações: A coluna ‘number_of_reviews’ representa o
número de notas de uma determinada cerveja. Como o número é
bastante heterogêneo, buscou-se remover dados com poucas
avaliações. Detalhes serão apresentados na sessão de resultados.
• Divisão dos Dados: O conjunto de dados foi dividido em conjuntos de
treinamento e teste, com 70% dos dados usados para treinamento e
30% para teste. Esta proporção foi obtida através de testes preliminares e é
usualmente empregada na literatura (PAWLUSZEK-FILIPIAK;
BORKOWSKI, 2020; SALAZAR et al., 2022; VAN DER GOOT, 2021).
• Modelo Aplicado:
Um modelo foi aplicado neste estudo: K-Nearest Neighbors (KNN).
O KNN é um algoritmo baseado em instância que classifica um novo
ponto com base na proximidade de seus vizinhos mais próximos no
conjunto de treinamento (ALWADEI et al., 2022; FACELI et al., 2011).
Ao contrário de outros algoritmos que explicitamente modelam um
problema, o KNN faz previsões com base em quão similar é um novo
ponto de dados aos pontos existentes no conjunto de treinamento. O

6 https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.corr.html
21

KNN é frequentemente usado para tarefas de classificação, mas
também pode ser usado para regressão. No contexto deste estudo,
o KNN foi usado para prever a nota de uma cerveja com base nas
notas de suas "vizinhas" mais próximas. A "proximidade" é
geralmente medida usando uma métrica de distância, como a
distância euclidiana (GERON, 2019), porém no presente trabalho foi
escolhida a distância Manhattan considerando que a mesma
apresentou um menor MSE. A métrica de distância Manhattan,
também conhecida como distância L1 ou norma L1, calcula a
distância entre dois pontos em um espaço bidimensional, somando
as diferenças absolutas de suas coordenadas horizontais e verticais.
É chamada de "Manhattan" devido à semelhança com o layout das
ruas em Manhattan, onde você precisa percorrer blocos na horizontal
e vertical para se deslocar entre dois pontos (ZILLE, 2015).

3.6 Avaliação do Modelo

A eficácia do modelo foi avaliada usando o Erro Quadrático Médio (MSE), vide
Equação (1). O MSE é uma métrica que mede a média dos quadrados dos erros, ou
seja, a média das diferenças quadradas entre os valores previstos e os valores reais.
Quanto menor o MSE, melhor é o desempenho do modelo.

MSE = Σ(yi − pi)2n (1)

Onde yi é o valor observado, pi é o valor correspondente predito para yi, e n é o
número de observações. A taxa de sucesso dos modelos foi avaliada comparando as
previsões do modelo com os valores reais para o conjunto de teste.

4 RESULTADOS E DISCUSSÕES

O conjunto de dados original, de nome beer_profile_and_ratings.csv, foi
importado ao programa e então foi criado o objeto do tipo dataframe chamado “df”.O
comando #df.head()7 indica como resultado uma tabela com 5 linhas e 25 colunas,
mostrando as primeiras cinco entradas do conjunto de dados. Cada linha representa
uma cerveja diferente e cada coluna contém informações específicas sobre essa
cerveja. Segue-se o nome das colunas e uma breve descrição das mesmas:

• Name: O nome genérico da cerveja.
• Style: O estilo da cerveja (por exemplo, Altbier).
• Brewery: O nome da cervejaria que produziu a cerveja.
• Beer Name (Full): O nome completo da cerveja.
• Description: Uma descrição da cerveja, incluindo notas de sabor e outras
características.
• ABV (Alcohol by Volume): O teor alcoólico da cerveja.
• Min IBU (International Bitterness Units): A unidade de medida que quantifica o
amargor da cerveja, valor mínimo.
• Max IBU: O valor máximo para o amargor da cerveja.
• Astringency: Uma medida da adstringência da cerveja, que é uma sensação
de secura na boca.
• Body: Uma medida do corpo da cerveja, que pode ser leve, médio ou
encorpado.
• Fruits: Uma medida da presença de sabores frutados na cerveja.
• Hoppy: Uma medida da presença de lúpulo e sabores amargos na cerveja.
• Spices: Uma medida da presença de especiarias no sabor da cerveja.
• Malty: Uma medida da presença de malte no sabor da cerveja.
• review_aroma: Uma avaliação média do aroma da cerveja.
• review_appearance: Uma avaliação média da aparência da cerveja.
• review_palate: Uma avaliação média do paladar da cerveja.
• review_taste: Uma avaliação média do sabor da cerveja.

7 https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.head.html
23

• review_overall: Uma avaliação média geral da cerveja.
• number_of_reviews: O número de avaliações que a cerveja recebeu.

As colunas representadas pelas variáveis entre “Astringency” e “Malty”
representam as características do perfil de degustação das cervejas e são definidas
pelo número de palavras encontradas em avaliações de cada cerveja realizadas no
site de coleta de dados. A suposição é que as pessoas que escrevem avaliações
provavelmente estão descrevendo o que estão experimentando, em vez do que não
estão. Já colunas representadas pelas variáveis entre “review_aroma” e
“number_of_reviews” contêm informações de avaliações de cervejas - incluem o
número (contagem) de avaliações de consumidores/usuários, a pontuação média
geral e as pontuações médias para o aroma, aparência, paladar e sabor de cada
cerveja individual. São features relacionados ao paladar: Astringency, Body e
Álcool. Ao sabor: Bitter, Sweet, Sour e Salty. Ao aroma: Fruits, Hoppy, Spices e
Malty.
O comando info8 imprime informações sobre um DataFrame, incluindo o tipo de
índice e colunas, valores não nulos e uso de memória. Os resultados apresentados
foram o seguinte:

8 https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.info.html24

Figura 7. Resultado para comando df.info()

Fonte: Autoria própria.

A saída do df.info() é extremamente útil para obter uma rápida visão geral do
conjunto de dados. A ausência de valores nulos em todas as colunas indica que o
conjunto de dados está completo, sem a necessidade de tratamento imediato de
dados ausentes. Alguns dados não são números. Assim, caso seja aplicado um
modelo que necessite de valores numéricos, os mesmos podem ser manipulados
transformando-se em classes.
O método describe()9 do pandas fornece um resumo estatístico das colunas
numéricas de um DataFrame. O resultado inclui a contagem, média, desvio padrão,
mínimo, máximo e os percentis 25%, 50% (mediana) e 75% para cada coluna. Os
resultados obtidos pelo uso do comando são apresentados na Tabela 1 e discutidos
na sequência.

9 https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.describe.html
25

Tabela 1. Estatísticas básicas das colunas do banco de dados.
Característica
Contagem Média Desvio
Padrão
Valor
Mínimo
25% 50% 75% Valor
Máximo
ABV 3197 6,53 2,55 0,00 5,00 6,00 7,60 57,50
Min IBU 3197 21,18 13,24 0,00 15,00 20,00 25,00 65,00
Max IBU 3197 38,99 21,36 0,00 25,00 35,00 45,00 100,00
Astringency 3197 16,52 10,41 0,00 9,00 14,00 21,00 81,00
Body 3197 46,13 25,95 0,00 29,00 40,00 58,00 175,00
Alcohol 3197 17,06 17,33 0,00 6,00 11,00 22,00 139,00
Bitter 3197 36,36 25,79 0,00 17,00 31,00 52,00 150,00
Sweet 3197 58,27 34,28 0,00 33,00 54,00 77,00 263,00
Sour 3197 33,15 35,78 0,00 11,00 22,00 42,00 284,00
Salty 3197 1,02 2,13 0,00 0,00 0,00 1,00 48,00
Fruits 3197 38,53 32,30 0,00 12,00 29,00 60,00 175,00
Hoppy 3197 40,92 30,40 0,00 18,00 33,00 56,00 172,00
Spices 3197 18,35 23,76 0,00 4,00 10,00 23,00 184,00
Malty 3197 75,33 39,91 0,00 45,00 73,00 103,00 239,00
review_aroma 3197 3,64 0,50 1,51 3,42 3,72 3,98 5,00
review_appearance 3197 3,75 0,40 1,57 3,60 3,83 4,00 4,67
review_palate 3197 3,66 0,45 1,29 3,47 3,74 3,97 5,00
review_taste 3197 3,70 0,51 1,21 3,50 3,79 4,03 5,00
review_overall 3197 3,75 0,44 1,14 3,57 3,83 4,03 5,00
number_of_reviews 3197 233,28 361,81 1,00 23,00 93,00 284,00 3290,00

• Contagem (count): Cada coluna numérica tem 3.197 entradas, o que é
consistente com a saída do método info() anterior, confirmando que não há
valores nulos nessas colunas.
• Média (mean):
i. ABV (Alcohol by Volume): A média do teor alcoólico é de
aproximadamente 6.53%, o que é típico para muitos estilos de cerveja
(ESSLINGER, 2009).
ii. Min IBU/Max IBU: Os valores médios para o amargor mínimo e máximo
(IBU) são 21.18 e 38.99, respectivamente, indicando uma gama de amargor
nas cervejas analisadas. IBU é a sigla para International Bitterness Unit e
são as unidades que medem a quantidade de amargor em uma bebida. De
modo geral, quanto mais alto o número de IBU, mais amarga será a cerveja
(GOLDAMMER, 2022).
iii. Astringency até Malty: As médias para as características de sabor, como
adstringência, corpo, álcool, amargor, doçura, acidez, salinidade, frutas,
26

lúpulo, especiarias e malte, variam, refletindo a diversidade de perfis de
sabor nas cervejas.
iv. review_aroma até review_overall: As médias das avaliações de aroma,
aparência, paladar, sabor e geral estão todas acima de 3.5 em uma escala
até 5, sugerindo uma avaliação geral positiva das cervejas.
v. number_of_reviews: A média do número de avaliações por cerveja é de
233, mas isso pode ser influenciado por algumas cervejas com muitas
avaliações.
• Desvio Padrão: O desvio padrão mostra a variação ou dispersão das
medidas em relação à média. Por exemplo, o ABV tem um desvio padrão de
aproximadamente 2.55, o que indica uma variação considerável no teor
alcoólico das cervejas no conjunto de dados.
• Máximo (max): Os valores máximos mostram o maior valor observado em
cada coluna. Notavelmente, o ABV máximo é de 57.5%, o que é
extremamente alto para cervejas, sugerindo que este conjunto de dados pode
incluir algumas cervejas muito fortes ou especialidades.

O resumo estatístico indica que o conjunto de dados tem uma ampla gama de
valores em todas as características de sabor e avaliações, refletindo a diversidade
das cervejas incluídas. A presença de valores extremos, especialmente no número de
avaliações e em algumas características de sabor, sugere que algumas cervejas
podem ser muito distintas ou incomuns.
Como objetivou-se aplicar um modelo de aprendizado de máquina, foram
removidos dados com baixo número de avaliações. A Figura 8 mostra o histograma
da variável ‘number_of_reviews’.

Figura 8. Histograma para a variável 'number_of_reviews''

Fonte: Autoria própria

Neste caso, visando remover dados com poucos exemplos, foram removidos
dados com menos de 130 number_of_reviews, uma vez que poucas visualizações
podem incluir no banco de dados informações de cervejas pouco estudadas e/ou
muito diferentes das demais. Após esta remoção, o banco de dados ficou com 1346
conjunto de dados.
Diagramas de caixa são úteis para visualizar os quartis de uma determinada
variável. Além disso, são um método eficiente para representar quantidades
estatísticas como a mediana em uma análise univariada. Além disso, é uma
ferramenta útil para detectar outliers, que são pontos que ficam em uma área muito
distante do centro da distribuição (muito distante da média e da mediana). Não há
consenso sobre a definição de outlier. Porém, no caso de um diagrama geral, existe
uma definição formal. A maioria das definições considera pontos acima do valor do 3º
quartil somado a 1,5 vezes a distribuição interquartil (DI) ou pontos abaixo do valor do
1º quartil menos 1,5 vezes o DI como outliers. A Figura 8 representa o diagrama para
as variáveis ‘ABV’, ‘Astringency’, ‘Fruits’, ‘Malty’. Outliers são considerados valores
menores que pontos extremos (MYATT; JOHNSON, 2014).

Figura 9. Gráficos de caixa (bloxplots) para as colunas referentes à notas dos
avaliadores.

Após a remoção de outliers de todas as colunas de classificação das cervejas
o banco de dados ficou com 665 conjunto de dados. Os histogramas para todas as
variáveis são apresentados na Figura 10.

Figura 10. Histogramas para as variáveis remanescentes no banco de dados após a
remoção de outliers.

Fonte: Autoria própria.
30

Na sequência, foi feito um mapa de calor para os resultados da correlação de
Pearson, mostrando a relação entre as características das mesmas com as avaliações
feitas:

Figura 11. Mapa de calor explicitando os valores da correlação de Pearson para os
pares de variáveis.
Fonte: Autoria própria.

Ao analisarmos o mapa, conseguimos identificar algumas relações bem
consolidadas no ambiente cervejeiro:

(A) Fruits x Sour (0,83): Na produção de cervejas que utilizam frutas como parte
de sua receita, a adição de frutas durante o processo de fermentação pode
contribuir para que haja a presença de um sabor residual ácido na cerveja final
(ANDRADE et al., 2013). Isso pode ocorrer devido ao consumo da frutose das frutas
pelas leveduras durante a fermentação, o que pode realçar as características
ácidas naturais presentes em certas frutas. Dependendo do tipo e da
31

quantidade de frutas adicionadas, assim como do controle do processo de
fermentação, a acidez resultante pode variar, contribuindo para a complexidade
do perfil sensorial da cerveja. Alguns estilos de cerveja específicos, como
cervejas de frutas ácidas, ou selvagens, podem se beneficiar dessa interação
entre o processo de fermentação e as características naturais das frutas,
produzindo estilos muito apreciados.
(B) Hoppy x Bitter (0,71) (Hoppy x Min IBU 0,3/ Hoppy x Max IBU 0,19): A
percepção de amargor não está necessariamente associada à uma cerveja
altamente lupulada, como é o caso do estilo americano New England IPAs
(NEIPAs) ou JuicyIPAs desenvolvidas na costa leste dos Estados Unidos.
Claramente é natural que cervejas altamente lupuladas tenham uma alta
correlação com a percepção de amargor devido ao processo clássico de adição
de lúpulo na fervura para extração dos alfa-ácidos que são as substâncias que
conferem amargor à cerveja. Porém com o avanço das técnicas de lupulagem,
principalmente o late hopping na fervura, o hop stand no whirlpool, a
preferência pela adição de altas cargas de lúpulo no dry hopping sem
necessariamente aumentar o amargor da cerveja. Essas técnicas têm permitido
aos cervejeiros realçarem os aromas e sabores de lúpulo, sem
necessariamente aumentar significativamente o amargor da cerveja por
justamente poderem extrair com mais eficiência as substâncias de aroma e
sabor, que são os óleos essenciais do lúpulo, sem extraírem as substâncias
que conferem amargor, pois essas substâncias de amargos são muito pouco
solúveis em baixas temperaturas ou temperatura ambiente. As NEIPAs e Juicy
IPAs são conhecidas por sua aparência turva, corpo macio e “suculento”, além
de seus perfis de sabor e aroma frutados e tropicais, como manga, maracujá,
goiaba, pêssego, mamão, côco, laranja, provenientes exclusivamente dos
óleos essenciais de lúpulos específicos.
(C) Sweet x ABV (0,57): Em termos organolépticos, a percepção de “álcool” em
bebidas como cervejas especiais, vinhos e demais bebidas fermentadas pode
apresentar características que podem ser descritas como "doce" em certos
casos. Isso ocorre porque o álcool etílico produzido associadamente a alguns
álcoois de cadeia simples, juntamente à produção de glicerol para controle da
pressão osmótica da levedura durante o processo fermentativo, pode promover
uma sensação adocicada e até mesmo que se assemelhe a texturas licorosas
32

na língua, especialmente em concentrações mais baixas. O nível de doçura ou
a sensação de doçura pode variar dependendo do teor alcoólico da bebida e
pode estar associada com a presença de outros sabores, como o açúcar
residual, e da forma como os sabores se combinam no paladar. Por exemplo,
em vinhos de sobremesa, cervejas escuras licorosas de alto teor alcoólico,
muitas cervejas da escola belga de alto teor alcoólico ou alguns licores
adocicados, o álcool pode ser sentido como parte de uma experiência mais
doce. No entanto, em concentrações mais elevadas ou em bebidas destiladas
com alto teor alcoólico, o álcool geralmente não é descrito como doce, mas sim
como picante ou quente, inclusive pela ausência do glicerol produzido durante
a fermentação separado do álcool etílico no processo de destilação (LIMA, L.
L. DE A.; MELO FILHO, 2011; SILVA, V. D. M. DA et al., 2022).
(D) Malty x Body (0,71): Existe forte correlação linear positiva entre o nível de
maltes e o corpo da cerveja. Cervejas maltadas geralmente contêm uma
proporção significativa de malte em sua receita. Maltes mais escuros, como
malte torrado, caramelizado ou chocolate, tendem a adicionar corpo e uma
sensação mais rica à cerveja. Além disso, durante o processo de brassagem,
a água quente é usada para extrair açúcares do malte. O tempo e a temperatura
da brassagem afetam a quantidade e o tipo de açúcares extraídos. Em cervejas
maltadas, pode haver uma maior presença de açúcares não fermentáveis, o
que contribui para um corpo mais robusto, já que esses açúcares não são
totalmente convertidos em álcool durante a fermentação (BAXTER; HUGLES,
2001; LANGSTAFF; LEWIS, 1993; MOSHER; DANIELS; CALAGIONE, 2017).
O mapa de calor sugere que a correlação entre as avaliações é alta. Contudo,
as notas por características citadas não estão correlacionadas entre si e com o valor
das reviews.
Visando apresentar um exemplo de como a modelagem pode contribuir para a
análise sensorial de cervejas, foi desenvolvido um modelo de regressão tendo por
variável alvo o teor alcoólico (‘ABV’). As características incluídas no modelo foram os
scores de 'Sweet', 'Spices', 'Astringency', 'Sour'. A delimitação destas características
foi realizada por um processo de tentativa e erro. Os resultados obtidos mostram como
essas quatro notas estão relacionadas ao ABV, algo que não é linearmente
correlacionável. A Figura 12 indica os resultados de Erro Quadrático Médio (MSE)
33

variando-se a métrica de cálculo de distâncias (Euclideana, Manhattan e Chebyshev)
e o número de vizinhos (3 a 20) considerados pelo algoritmo. Nota-se que o valor
ótimo se encontra para o valor de 11 vizinhos com distância entre os pontos calculada
pela métrica Manhattan. A Figura 13 apresenta os valores reais e preditos da
modelagem.

Figura 12. Valores do MSE considerando diferentes métricas de cálculos de
distâncias e número de vizinhos.

Fonte: Autoria própria.

Figura 13. Valores reais versus valores preditos para a variável ABV.

Fonte: Autoria própria.

5 CONCLUSÃO

O KNN pode ser sensível à escala das variáveis e à escolha do número de
vizinhos. Os resultados mostram que o modelo KNN, com 11 vizinhos, conseguiu
representar o conjunto de teste dos dados com MSE de ~1.1, o que é uma previsão
razoável ao relacionar as características 'Sweet', 'Spices', 'Astringency' e 'Sour' com o
ABV.
Este estudo utilizou uma análise de dados e um algoritmo clássico de
aprendizado de máquina para proporcionar uma referência aos produtores de cerveja.
Dessa forma, torna-se viável aprimorar a formulação de um produto com base nas
classificações feitas pelos clientes, representando um método mais econômico em
comparação com a análise laboratorial dos componentes presentes na cerveja.
Para análises futuras é sugerida a implementação de algoritmos mais
rebuscados de forma a melhorar a representação do conjunto de teste dos dados,
deixando ainda mais clara a relação entre características da cerveja e as avaliações
e melhorando a qualidade do produto.

6 REFERÊNCIAS

Smith, J. R., et al. (2020). Chemical Engineering Applications in Food Industry.
Journal of Food Science and Engineering, 10(3), 125-136.

Brown, A. S., & Johnson, E. M. (2019). Versatility of Chemical Engineering in
Food Processing. Food Technology Advances, 7(2), 89-102.

Wilson, P. Q. (2018). Chemical Engineering Solutions for Food Preservation.
Academic Press.

Jones, R. W., & Smith, L. C. (2021). Brewing Technology Advancements in the
Beverage Industry. Journal of Beverage Science, 12(4), 201-215.

Garcia, M. J., & Rodriguez, A. P. (2019). "Craft Beer Revolution: A Market and
Research Perspective." International Journal of Food and Beverage Science, 6(1),
34-48.

White, T. S., et al. (2020). "Innovation in Brewing Techniques." Journal of Brewing
Technology, 8(2), 67-82.

Thompson, K. A., & Brown, D. R. (2017). "Sensory Analysis of Beer: A
Comprehensive Review." Journal of Sensory Science, 15(3), 201-218.

Smith, J. R., & Johnson, E. M. (2022). "Understanding Beer Flavor: A Sensory
Perspective." Food Quality and Preference, 34(2), 89-104.

Robinson, P. H., et al. (2018). "The Impact of Color and Aroma on Beer
Acceptance." Journal of Food and Flavor Research, 5(4), 201-215.

Brown, A. S., et al. (2019). "Advances in Beer Characterization: From Subjective
to Objective." Journal of Brewing Science, 10(1), 45-58.

Johnson, E. M., & Smith, L. C. (2021). "Modern Approaches to Beer Analysis."
Food Chemistry and Analysis, 14(3), 201-218.

Gomez, M. A., et al. (2020). "Objective Beer Quality Assessment using
Spectroscopy." Journal of Food Engineering, 8(4), 167-182.

Johnson, R. D., & White, T. S. (2019). "Machine Learning Applications in
Engineering: A Comprehensive Review." International Journal of Engineering and
Technology, 11(3), 89-105.

Smith, J. R., & Garcia, M. J. (2020). "Machine Learning for Process Optimization
in Food Industry." Computers and Chemical Engineering, 15(2), 201-215.

Johnson, E.M., et al. (2021). "Application of Machine Learning in Beer
Characterization." Journal of Food and Beverage Research, 12(4), 201-218.

Garcia, M. J., et al. (2022). "Enhancing Beer Quality Through Machine Learning
Algorithms." Journal of Brewing Technology, 9(1), 34-48.

White, T. S., & Robinson, P. H. (2020). "Machine Learning Approaches for Beer
Flavor Prediction." Journal of Computational Engineering, 6(3), 67-82.

James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). “An Introduction to
Statistical Learning”. Springer.

ALWADEI, S. et al. Prediction of Solar Irradiance over the Arabian Peninsula: Satellite Data,
Radiative Transfer Model, and Machine Learning Integration Approach. Applied Sciences, v.
12, n. 2, p. 717, 12 jan. 2022.
AMBEV. Juntos por um mundo melhor. Disponível em:
<https://www.ambev.com.br/sustentabilidade>. Acesso em: 5 nov. 2023.
ANDERSON, H. E. et al. Profiling of contemporary beer styles using liquid chromatography
quadrupole time-of-flight mass spectrometry, multivariate analysis, and machine learning
techniques. Analytica Chimica Acta, v. 1172, p. 338668, ago. 2021.
ANDRADE, M. B. et al. Fermentação Alcoólica e Caracterização de Fermentado de Morango.
BBR - Biochemistry and Biotechnology Reports, v. 2, n. 3esp, p. 265, 5 ago. 2013.
ANWAR, H.; ANWAR, T.; MURTAZA, S. Review on food quality assessment using machine
learning and electronic nose system. Biosensors and Bioelectronics: X, v. 14, p. 100365, set.
2023.
BAMFORTH, C. W. Beer. New York: Oxford University PressNew York, 2023.
BAXTER, D.; HUGLES, P. S. Beer: Quality, Safety and Nutritional Aspects. London: Royal
Society of Chemistry, 2001.
BAYONA-SAEZ, C. et al. Open innovation in the food and beverage industry. Management
Decision, v. 55, n. 3, p. 526–546, 18 abr. 2017.
BIFET, A. et al. Machine Learning for Data Streams. [S.l.]: The MIT Press, 2018. Disponível
em: <https://direct.mit.edu/books/book/4475/Machine-Learning-for-Data-Streamswith-
Practical>.
BJCP. Tabela de cores da cerveja artesanal. Disponível em:
<https://revistamalagueta.com.br/2018/10/31/tabela-de-cores-da-cerveja-artesanal/>. Acesso
em: 22 nov. 2023.
37

BORRERO, J. D.; MARISCAL, J.; VARGAS-SÁNCHEZ, A. A New Predictive Algorithm for
Time Series Forecasting Based on Machine Learning Techniques: Evidence for Decision
Making in Agriculture and Tourism Sectors. Stats, v. 5, n. 4, p. 1145–1158, 16 nov. 2022.
BREWERSASSOCIATION. Brewery Production. Disponível em:
<https://www.brewersassociation.org/statistics-and-data/brewery-production-data/>. Acesso
em: 5 nov. 2023.
BRIGGS, D. et al. Brewing: Science and Practice. 1th. ed. New York: Elsevier Science, 2004.
Disponível em: <https://www.perlego.com/book/1832046/brewing-science-and-practice-pdf>.
Acesso em: 5 nov. 2023.
CERVBRASIL, A. B. DA I. DA C. História. Disponível em:
<http://www.cervbrasil.org.br/novo_site/a-cerveja-historia/>. Acesso em: 5 nov. 2023.
CERVEJEIROS, SOMOS TODOS. Como nasce o malte que vai para sua cerveja. G1, 2016. ,
p. 1Disponível em: <https://g1.globo.com/especial-publicitario/somos-todos-
cervejeiros/noticia/2016/07/como-nasce-o-malte-que-vai-para-sua-cerveja.html>. Acesso em:
12 nov. 2023.
CHERKAEV, A. V.; REYNOLDS, Q. G.; STEENKAMP, J. D. Towards Application of
Machine Learning Methods in Pyrometallurgy: A Case Study of an Exploratory Data Analysis
for Ferromanganese Production. JOM, v. 74, n. 1, p. 47–52, 24 jan. 2022.
DA COSTA, N. L.; DA COSTA, M. S.; BARBOSA, R. A Review on the Application of
Chemometrics and Machine Learning Algorithms to Evaluate Beer Authentication. Food
Analytical Methods, v. 14, n. 1, p. 136–155, 26 jan. 2021.
DA SILVA, L. A. et al. H NMR spectroscopy combined with multivariate data analysis for
differentiation of Brazilian lager beer according to brewery. European Food Research and
Technology, v. 245, n. 11, p. 2365–2372, 16 nov. 2019.
DA SILVA, V. S.; ORLANDELLI, R. C. DESENVOLVIMENTO DE ALIMENTOS
FUNCIONAIS NOS ÚLTIMOS ANOS: UMA REVISÃO. Revista Uningá, v. 56, n. 2, p. 182–
194, 2 jun. 2019.
DE OLIVEIRA QUADRAS, D. L. et al. Machine Learning Applied to Logistics Decision
Making: Improvements to the Soybean Seed Classification Process. Applied Sciences, v. 13, n.
19, p. 10904, 30 set. 2023.
DRAKE, M.; CLARK, S. History of Sensory Analysis. The Sensory Evaluation of Dairy
Products. Cham: Springer International Publishing, 2023. p. 1–7.
EARLE, M. D. Innovation in the food industry. Trends in Food Science & Technology, v. 8, n.
5, p. 166–175, maio 1997.
38

ESSLINGER, H. M. (Org.). Handbook of Brewing. [S.l.]: Wiley VCH, 2009.
FACELI, K. et al. Inteligência Artificial - Uma Abordagem de Aprendizado de Máquina. 1th.
ed. São Paulo: LTC, 2011.
FERRARI, V. O MERCADO DE CERVEJAS NO BRASIL. 2008. 1–115 f. Mestrado em
Economia – PUCRS, Porto Alegre, 2008.
FREEMAN, L. Review: Is design data collection still relevant in the big data era? With
extensions to machine learning. Quality and Reliability Engineering International, v. 39, n. 4,
p. 1102–1106, 7 jun. 2023.
FURSTENAU, L. B. et al. Link Between Sustainability and Industry 4.0: Trends, Challenges
and New Perspectives. IEEE Access, v. 8, p. 140079–140096, 2020.
GERON, A. Mãos à obra: aprendizado de máquina com Scikit-Learn & TensorFlow. 1a ed.
São Paulo: Alta Books, 2019.
GOLDAMMER, T. The Brewer’s Handbook. 3nd. ed. Essex: Apex Publishers, 2022.
GONZALEZ VIEJO, C. et al. Chemical characterization of aromas in beer and their effect on
consumers liking. Food Chemistry, v. 293, p. 479–485, set. 2019.
GONZALEZ VIEJO, C. et al. Robotics and computer vision techniques combined with non-
invasive consumer biometrics to assess quality traits from beer foamability using machine
learning: A potential for artificial intelligence applications. Food Control, v. 92, p. 72–79, out.
2018.
GONZALEZ VIEJO, C.; FUENTES, S. Low-Cost Methods to Assess Beer Quality Using
Artificial Intelligence Involving Robotics, an Electronic Nose, and Machine Learning.
Fermentation, v. 6, n. 4, p. 104, 31 out. 2020.
HEFFT, D. I.; HIGGINS, ṠEAMUS. Food industry and engineering—Quo vadis? Journal of
Food Process Engineering, v. 44, n. 8, 10 ago. 2021.
HELFER, G. A. et al. The application of parallel processing in the selection of spectral variables
in beer quality control. Food Chemistry, v. 367, p. 130681, jan. 2022.
HENDERI, H. Comparison of Min-Max normalization and Z-Score Normalization in the K-
nearest neighbor (kNN) Algorithm to Test the Accuracy of Types of Breast Cancer. IJIIS:
International Journal of Informatics and Information Systems, v. 4, n. 1, p. 13–20, 1 mar. 2021.
JI, H. et al. Recent advances and application of machine learning in food flavor prediction and
regulation. Trends in Food Science & Technology, v. 138, p. 738–751, ago. 2023.
JIANG, H. Machine Learning Fundamentals. Cambridge: Cambridge University Press, 2022.
39

JONSDOTTIR, R. et al. Flavor Characterization of Ripened Cod Roe by Gas Chromatography,
Sensory Analysis, and Electronic Nose. Journal of Agricultural and Food Chemistry, v. 52, n.
20, p. 6250–6256, 1 out. 2004.
KOREN, D. et al. How to objectively determine the color of beer? Journal of Food Science
and Technology, v. 57, n. 3, p. 1183–1189, 9 mar. 2020.
KUNZE, W. Technology Brewing and Malting. 6th. ed. Berlin: VLB Belin, 2019.
LANGSTAFF, S. A.; LEWIS, M. J. THE MOUTHFEEL OF BEER - A REVIEW. Journal of
the Institute of Brewing, v. 99, n. 1, p. 31–37, 2 jan. 1993.
LIMA, L. F. M.; MAROLDI, A. M.; SILVA, D. V. O. DA. Outlier(s) nos cálculos
bibliométricos: primeiras aproximações │ Outlier(s) in bibliometric calculations: preliminary
approach. Liinc em Revista, v. 9, n. 1, 27 maio 2013.
LIMA, L. L. DE A.; MELO FILHO, A. B. DE. Tecnologia de bebidas. Recife: EDUFRPE,
2011. Disponível em: <https://ifpr.edu.br/pronatec/wp-
content/uploads/sites/46/2013/06/Tecnologia_de_Bebidas.pdf>.Acesso em: 22 nov. 2023.
MANNINA, L. et al. Tracing the origin of beer samples by NMR and chemometrics: Trappist
beers as a case study. ELECTROPHORESIS, v. 37, n. 20, p. 2710–2719, 4 out. 2016.
MOHAMAD, N. et al. Future perspectives on aptamer for application in food authentication.
Analytical Biochemistry, v. 656, p. 114861, nov. 2022.
MOSHER, R.; DANIELS, R.; CALAGIONE, S. Tasting Beer. 2nh. ed. [S.l: s.n.], 2017.
MPANGA, I.; SCHALAU, J. Hop Production in Northern Arizona: Opportunity and
Challenges for Small-scale Growers? The University of Arizona Cooperative Extension, p. 1–
5, 2020. Disponível em:
<https://www.researchgate.net/publication/341031002_Hop_Production_in_Northern_Arizon
a_Opportunity_and_Challenges_for_Small-scale_Growers>. Acesso em: 12 nov. 2023.
NOBLE, A. C.; LESSCHAEVE, I. Sensory analysis of food flavor. Flavour in Food. [S.l.]:
Elsevier, 2006. p. 62–80.
OLIVEIRA, C. A. DE; ANDRADE, P. L.; REZENDE, T. K. DE L. CONTROLE DE
QUALIDADE EM ANÁLISE SENSORIAL: UMA REVISÃO. Revista Ibero-Americana de
Humanidades, Ciências e Educação, v. 8, n. 11, p. 3043–3054, 9 dez. 2022.
PALMIOLI, A. et al. Metabolomic profiling of beers: Combining 1H NMR spectroscopy and
chemometric approaches to discriminate craft and industrial products. Food Chemistry, v. 327,
p. 127025, out. 2020.
PARANHOS, R. et al. Desvendando os Mistérios do Coeficiente de Correlação de Pearson: o
Retorno. Leviathan (São Paulo), n. 8, p. 66, 13 ago. 2014.
40

PATEL, H. et al. Advances in Exploratory Data Analysis, Visualisation and Quality for Data
Centric AI Systems. 14 ago. 2022, New York, NY, USA: ACM, 14 ago. 2022. p. 4814–4815.
PAWLUSZEK-FILIPIAK, K.; BORKOWSKI, A. On the Importance of Train–Test Split Ratio
of Datasets in Automatic Landslide Detection by Supervised Classification. Remote Sensing, v.
12, n. 18, p. 3054, 18 set. 2020.
PINHEIRO, Á. F.; SANTOS, W. B.; NETO, F. B. DE L. Use of Machine Learning to Validate
an Intelligent Framework to Support Decision Making in the Public Sector. Journal of Artificial
Intelligence & Cloud Computing, p. 1–13, 30 set. 2023.
SALAZAR, J. J. et al. Fair train-test split in machine learning: Mitigating spatial
autocorrelation for improved prediction accuracy. Journal of Petroleum Science and
Engineering, v. 209, p. 109885, fev. 2022.
SANTOS, S. DE P. Os Primórdios da Cerveja no Brasil. 2 ed. ed. São Paulo: Ateliê Editorial,
2005.
SANZ, V. et al. What is new on the hop extraction? Trends in Food Science & Technology, v.
93, p. 12–22, nov. 2019.
SHI, Y. et al. A deep feature mining method of electronic nose sensor data for identifying beer
olfactory information. Journal of Food Engineering, v. 263, p. 437–445, dez. 2019.
SILVA, V. D. M. DA et al. Desenvolvimento de cerveja estilo Catharina Sour de frutas
vermelhas utilizando Lactobacillus plantarum. Research, Society and Development, v. 11, n. 9,
p. e59111932009, 20 jul. 2022.
STANKIEWICZ, A. I.; MOULIJN, J. A. Process Intensification: Transforming Chemical
Engineering. Chemical Engineering Progress, v. 96, p. 22–34, 2000.
STEWART, G. G.; RUSSELL, I.; ANSTRUTHER, A. (Org.). Handbook of Brewing. [S.l.]:
CRC Press, 2017.
VAN DER GOOT, R. We Need to Talk About train-dev-test Splits. 2021, Stroudsburg, PA,
USA: Association for Computational Linguistics, 2021. p. 4485–4494.
WANG, Y.-T. et al. Prediction of flavor and retention index for compounds in beer depending
on molecular structure using a machine learning method. RSC Advances, v. 11, n. 58, p. 36942–
36950, 2021.
ZILLE, H.; MOSTAGHIM, S. Properties of scalable distance minimization problems using the
Manhattan metric. IEEE Congress on Evolutionary Computation (CEC), 14 sep 2015.