Buscar

TCC MCR ALS BRIX CORRIGIDO

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 3, do total de 35 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 6, do total de 35 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você viu 9, do total de 35 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Prévia do material em texto

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE
CENTRO DE CIÊNCIAS EXATAS E DA TERRA
INSTITUTO DE QUÍMICA
 Antônio Marcos de Azevedo Bezerra
UTILIZAÇÃO DO MCR-ALS ALIADO AO INFRAVERMELHO PRÓXIMO (NIR), PARA DETERMINAÇÃO DE BRIX NA CANA DE AÇÚCAR
NATAL – RN
2017
Antônio Marcos de Azevedo Bezerra
UTILIZAÇÃO DO MCR-ALS ALIADO AO INFRAVERMELHO PRÓXIMO (NIR), PARA DETERMINAÇÃO DE BRIX NA CANA DE AÇÚCAR
Monografia apresentada junto ao curso de Química Bacharelado da Universidade Federal do Rio Grande do Norte, como requisito obrigatório à obtenção do título de bacharel.
 Orientador: Prof. Dr. Kássio Michell Gomes de Lima
A todos que sempre me apoiaram, incentivaram, especialmente aos meus pais e irmã, durante esse período de graduação.
 A vocês, dedico.
AGRADECIMENTOS
Aos meus familiares, especialmente meus pais, Lúcia Maria e Marcos Antônio e minha irmã, Daiana Carolina, por sempre estarem ao meu lado e por todo suporte que me depositaram.
Ao meu orientador, Prof. Dr. Kássio Michell Gomes de Lima, pelo apoio, incentivo, e por ter me ajudado durante o período curto, porém produtivo no laboratório de química biológica e quimiometria (QBQ) da UFRN.
Ao mestrando Camilo de Lelis, por ter me ajudado no manuseio do MCR-ALS.
A todos os meus colegas de curso que convivi durante o período da graduação.
 
 “Inteligência é a capacidade de se adaptar a mudança”
 Stephen Hawking
RESUMO
 Brix (sólidos solúveis) é um parâmetro importante no controle de qualidade de indústrias de açúcar.
O objetivo deste trabalho foi demonstrar como método de resolução multivariada com mínimos quadrados alternantes (MCR-ALS) junto com o infravermelho próximo (NIR) podem ser utilizados para determinar o brix da cana de açúcar.
Um total de 1258 amostras compôs os conjuntos de calibração e 270 amostras compôs os conjuntos de validação e previsão, sendo a divisão realizada pelo algoritmo de Kennard-Stone.
 O MCR-ALS apresentou resultados satisfatórios tanto em relação aos coeficientes de correlação (R²=0.953) quanto para os valores de erro quadrático médio de previsão (RMSEP=6.7%), erro quadrático médio da calibração (RMSEC=6.6%) e erro quadrático médio da validação (RMSEV=6.6%).
Portanto com esses valores foi possível determinar que o método possui alta exatidão, e indicam que o MCR-ALS junto com o infravermelho próximo (NIR) podem ser utilizados na indústria açucareira para determinação de brix.
Palavras chave: MCR-ALS, infravermelho próximo, brix, cana de açúcar.
ABSTRACT
 Brix (soluble solids) is a important propertie in the quality control of sugar industry. The goal of this study was to demonstrate how Multivariate curve resolution with alternating least squares (MCR-ALS) together with the near-infrared (NIR) can be used to determination of brix from sugarcane.
 A total of 1258 samples constitute calibration sets and 270 samples constitute validation and prediction sets, divided by Kennard-Stone algorithm.
The MCR-ALS showed satisfactory results for the correlation coefficients (R²=0.953) and for the values of root mean square error of prediction (RMSEP=6.7%), root mean square error of calibration (RMSEC=6.6%) and root mean square error of prediction (RMSEP=6.6%).
Therefore with these values ​​it was possible to determine that the method has high accuracy, And indicate that the MCR-ALS together with the near infrared (NIR) can be used in the sugar industry for determination of brix.
Keywords: MCR-ALS, Near-infrared, brix, sugarcane
LISTA DE SIGLAS E ABREVIATURAS
ALS Mínimos quadrados alternantes (Alternating Least Squares)
ANVISA Agência nacional de vigilância sanitária
Copt Perfil de concentração do MCR-ALS
INMETRO Instituto Nacional de Metrologia e Normalização
LOF Falta de ajuste (Lack of fit)
MCR-ALS Resolução de Curva Multivariada por Mínimos Quadrados Alternados (Multivariate Curve Resolution Alternating Least Squares)
MSC Correção de sinal multiplicativa (multiplicative signal correction)
MPCA Análises de componentes principais multi-modo (Multi-way principal components analysis)
NIR Infravermelho próximo (Near-infrared) 
PCA Análise de componentes principais (Principal components analysis)
r² Variância explicada 
R² Coeficiente de correlação
RE Erro relativo (Relative error)
Sopt Perfil espectral do MCR-ALS
SVD Decomposição em valores singulares (Singular values decomposition) 
SNV Variável normal padrão (Standard Normal Variate) 
RMSEC Raiz quadrada do erro quadrático médio de calibração (Root mean squared error of calibration) 
RMSEP Raiz quadrada do erro quadrático médio de previsão (Root mean squared error of prediction) 
RMSEV Raiz quadrada do erro quadrático médio de validação (Root mean squared error of validation)
LISTA DE TABELAS 
TABELA 1 Valores da otimização ALS para o modelo sem pré-processamento
TABELA 2 Valores de figura de mérito para o conjunto de calibração
TABELA 3 Valores de figura de mérito para o conjunto de previsão
TABELA 4 Valores de figura de mérito para o conjunto de validação
TABELA 5 Valores da otimização ALS para o modelo com pré-processamento
LISTA DE FIGURAS
Figura 1 Refratômetro utilizado para medir o Brix na cana de açúcar. 
Figura 2 Espectro do NIR para todas as amostras do caldo de cana de açúcar. 
Figura 3 Componentes selecionadas no SVD para o modelo sem pré- processamento. 
Figura 4 Espectro do NIR para todas as amostras utilizando o pré-processamento SNV.
Figura 5 Componentes selecionadas no SVD para o modelo com pré-processamento.
Figura 6 Valores da concentração do Brix previsto e estimado na cana de açúcar, em %(m/m).
Figura 7 Curva de calibração do Brix na cana de açúcar utilizando o refratômetro.
 
1 INTRODUÇÃO
1.1 CANA DE AÇÚCAR
 A cana de açúcar (nome cientifico, Saccharum officinarum L.) é o principal cultivo para produção de açúcar ou álcool. A produção atual situa-se em torno de 1450 milhões de toneladas de cana, a partir de 22 milhões de hectares em todo o mundo. O Brasil e a Índia são os países mais importantes do mundo no segmento de produção de cana de açúcar, representando quase 60% da produção mundial[1].
 No Brasil a indústria da cana de açúcar constitui a atividade econômica mais antiga do Brasil (desde o período colonial), apresentando indústrias de cana de açúcar principalmente em todo território nacional, destacando nas regiões nordeste e sudeste, com destaque ao estado de são Paulo que possui cerca de 60% da produção de açúcar no Brasil, segundo dados da união da agroindústria canavieira de são Paulo[2].
 A produção de cana de açúcar representa 2,2% do PIB (produto interno bruto) brasileiro, sendo o Brasil o maior exportador do produto, boa parte da produção de açúcar no Brasil, é exportada para países como os Estados unidos, Canadá entre outros (Abreu, D. et. al. 2011)
 Haja vista, que a cana de açúcar é a principal matéria prima para produção de açúcar, é necessário avaliarmos a qualidade da cana de açúcar, através de alguns indicadores, como por exemplo:
 Açúcares redutores: é a quantidade de glicose e de frutose presentes na cana, que afetam diretamente a sua pureza, já que refletem em uma menor eficiência na recuperação da sacarosepela fábrica.
 Pol: teor de sacarose aparente na cana. Para a indústria canavieira, quanto mais elevados os teores de sacarose, melhor.
 Brix: é a porcentagem em massa de sólidos solúveis contidos em uma solução de sacarose quimicamente pura[3].
 A cultura da cana de açúcar apresenta sua maturidade estabelecida no momento em que se observa redução do foto-período e da temperatura ambiente, período do ano representado pela transição outono-inverno e inverno-primavera. É nessa época do ano que os produtores utilizam essa fonte de volumoso para o corte diário ou para ensilagem, tendo como padrão para a determinação do ponto de corte, simplesmente o tempo de crescimento da planta, que geralmente é colhida com 12 meses de crescimento vegetativo.[4]
 A avaliação da maturidade da planta pode ser realizada em relação à quantidade de açúcares presente no colmo da cana de açúcar. A maneira para proceder essa avaliação é por meio da leitura do valor de graus Brix que o colmo apresenta, sendo essa medida obtida por refratômetro de campo.
(Figura 1: Refratômetro utilizado para medir o Brix na cana de açúcar)
 Os colmos da cana-de-açúcar são constituídos por caldo e fibra (sólidos insolúveis em água). O caldo contém a água e os sólidos solúveis totais (açúcares e não-açúcares) representados pelo Brix. O caldo possui em sua composição basicamente sacarose, glicose e frutose. Outros compostos não-açúcares como aminoácidos, gorduras, ceras, pigmentos e diversos minerais também compõe o caldo absoluto, entretanto, de forma bastante reduzida.[4]
1.2 QUIMIOMETRIA
 Quimiometria é a ciência da química em que utiliza - se de ferramentas estatísticas e matemáticas para o planejamento e otimização das condições experimentais, e para a extração de informação química relevante de dados químicos multivariados[5].
A quimiometria pode ser dividida em análise univariada e análise multivariada.
Na análise univariada os resultados são feitos por observação do comportamento de uma única variável de cada vez, por exemplo, a concentração de uma espécie de interesse ou uma propriedade físico-química (densidade, viscosidade, ponto de fusão, ponto de ebulição). Na análise multivariada, é possível analisar mais de uma variável simultaneamente, e assim identificar a correlação entre elas. Este tipo de análise permite um entendimento mais completo e sistematizado dos resultados analíticos[5].
Neste trabalho foi utilizado uma análise multivariada.
1.3 MCR-ALS
 O método de resolução multivariada de curvas com mínimos quadrados alternantes (MCR), do inglês, Multivariare curve resolution), é um método de resolução multivariado que tornou - se um método quimiométrico popular e de grande eficácia, principalmente para realizar análises onde as amostras possuem muitas espécies, ou quando possuem muitos interferentes nas amostras (Março, P.H. et. al. 2014)
 O MCR têm como seu principal objetivo resolver misturas de sinais, a partir de uma matriz de dados que tenha previamente os valores das variáveis a serem analisadas, o MCR irá recuperar os valores da concentração relativa e dos espectros puros dos componentes relacionados as concentrações dentro da amostra, o MCR pode ser feito tanto por uma única matriz de dados, que denominamos como dados de primeira ordem, ou sobre matriz de dados para cada amostra, no qual é chamado de dados de segunda ordem. (Valderrama, P. et. al. 2014)
 Matematicamente o MCR é expresso na seguinte equação 1:
 (1)
 Onde temos que:
D corresponde a matriz de espectros medidos durante o experimento;
C corresponde a matriz de concentração relativa;
S corresponde a matriz de espectros puro;
T corresponde a matriz transposta de S;
E corresponde a matriz não explicado pelo modelo e, idealmente, deve estar próximo do erro.
 O método de resolução multivariada de curvas com mínimos quadrados alternantes (MCR–ALS, do inglês, Multivariate curve resolution with alternating least-squares), resolve iterativamente a equação 1, por meio dos mínimos quadrados alternantes, no qual esse processo é chamado de otimização (este algoritmo irá otimizar as matrizes C e/ou ST, que se inicia a partir das estimativas das matrizes C e ST, por meio de restrições), permitindo recuperar perfis de concentrações individuais e sinais (comprimento de onda, por exemplo) de espécies que estejam mais variando nos dados das matrizes. (Alexandrino, G.L. et. al. 2014).
 Inicialmente para que o MCR – ALS possa a ser executado, é necessário que o mesmo obedeça duas condições, a primeira delas é a que o sinal analítico tem que obedecer uma relação linear com a concentração, ou seja, semelhante a equação de Beer-Lambert, a outra condição é que o posto da matriz deve ser igual ao número de espécies que produzem sinal analítico presentes nas misturas. Esse posto da matriz corresponde ao número de linhas ou colunas que linearmente independentes, em outras palavras, o número de vetores que não podem ser escritos como uma combinação linear dos outros. (Jaumot, J. et. al. 2004).
 Para realizar as estimativas iniciais, o MCR-ALS utiliza-se de duas ferramentas de análise exploratória não supervisionada, o uso de cada uma está ligado diretamente aos dados de primeira ou segunda ordem, caso a matriz a ser analisada seja de primeira ordem (nos quais se tem um vetor de resposta instrumental por amostra organizados no formato de uma matriz) é recomendável que a estimativa do posto seja realizada por meio da percentagem de variância explicada por decomposição em valores singulares (SVD, do inglês, Singular values decomposition) ou também por análise de componentes principais (PCA, do inglês principal componentes analysis) Caso contrário, ou seja, se a matriz a ser analisada for de segunda ordem, estima-se os dados por análise de componentes principais multi – modo (MPCA, do inglês Multi-way principal componentes analysis). (Poppi, R.S. et. al. 2014).
 Para o processo de otimização no MCR – ALS, seja realizado é preciso ter conhecimento das matrizes C e ST, ou seja, ter conhecimento prévio dos sinais ou das concentrações dos componentes puros, caso não se tenha conhecimento dessas duas matrizes (C e ST) é recomendável utilizar-se de ferramentas iterativas para estimar os perfis, podendo utilizar o método baseado na aproximação da variável pura, o PURE ou por analises de fatores evolucionários, o EFA, no qual o PURE é geralmente mais usado.
 Quando se obtém as estimativas iniciais, o processo de otimização no MCR –ALS é iniciado, onde as matrizes C e ST são calculadas (aplica-se restrições nessa etapa) em ciclos iterativos, por mínimos quadrados alternantes, nesta etapa, com os valores das matrizes C e ST, é calculado uma nova matriz D é posteriormente é comparado com a matriz D original, o processo de otimização é encerrado com se chega num critério de convergência, O critério de convergência é alcançado quando a variação de resultados entre iterações consecutivas apresentar valor abaixo de um valor limite predefinido, ou quando um certo número de iterações for excedido. (Tauller, R. et. al. 2014)
 Para saber a qualidade do processo de otimização, duas figuras de mérito são utilizadas, a percentagem de falta de ajuste (% LOF, do inglês Lack of Fit) e percentagem de variância explicada (R2).
 (2)
 (3)
 Onde dij é o elemento da matriz de dados de entrada D e eij é o resíduo relacionado obtido a partir da diferença entre o elemento de entrada e a reprodução do MCR-ALS.
1.4 TÉCNICAS DE PRÉ-PROCESSAMENTO
 Quando o espectro MCR-ALS apresentar um alto grau de ruído é recomendável utilizar ferramentas chamadas de pré-processamento com o intuito de remover variabilidades indesejáveis do espectro, causados pelo espalhamento da luz ou variações entre os equipamentos(Honorato, F.A. et. al. 2008)
Um dos pré-processamentos mais utilizados no MCR-ALS é a derivação. A primeira derivada remove deslocamentos sistemáticos da linha de base ("offsets"); com a segunda derivada, é possível eliminar uma variação linear da linha de base, normalmente devida a efeitos de espalhamento da luz. Como o cálculo das derivadas é feito a partir de diferenças entre valores de pontos adjacentes, a relação sinal-ruído torna-se pior com esse tipo de pré-processamento. Por isto, antes da diferenciação é comum aplicar-se aos dados algum tipo de suavização. O algoritmo mais utilizado para este fim é o de Savitzky-Golay. (Savitzky, A et. al. 1964).
 Outro pré-processamento utilizado é o MSC (correção de sinal multiplicativa, do inglês, Multiplicative signal correction), este processamento faz uma regressão de cada espectro contra um espectro de referência, que normalmente é o espectro médio do conjunto de calibração. Os espectros são então corrigidos subtraindo-se dos valores originais os coeficientes lineares das respectivas retas de regressão e dividindo-se o resultado pelos coeficientes angulares dessas mesmas retas. Para uma dada calibração, a MSC produz dois efeitos importantes: simplifica o modelo, por reduzir o número de componentes, e melhora a sua linearidade. Entretanto, por admitir que as diferenças entre linhas de base e inclinações não se alteram ao longo de toda a região espectral empregada, esta técnica não traz muitos benefícios para resultados de transferências de modelos de calibração. (Naes, T. 2002).
A Transformada Wavelet (WT) tem sido bastante usada como método de processamento alternativo para transferência de calibração, Utilizando - se a WT os sinais originais são decompostos em coeficientes "wavelet" com diferentes frequências, o que permite a remoção de certas frequências. Em geral, os coeficientes de baixa frequência estão relacionados a diferenças instrumentais e os de alta frequência, a ruídos de medida, que correspondem à informação irrelevante para a análise. (Leung, A.K. 1998).
 Vale ressaltar que existe vários outros pré-processamentos, além desses três citados neste trabalho.
 
1.5 ALGORITMO KENNARD-STONE
O algoritmo Kennard-Stone tem como seu principal objetivo separar as amostras em calibração, validação e previsão, o KS inicialmente seleciona as duas amostras com a maior distância Euclidiana entre si no espaço X. Para cada uma das amostras restantes, calcula-se a distância mínima com respeito às amostras já selecionadas. Feito isso, a amostra com a maior distância mínima é retida, e o procedimento é repetido até que um determinado número de amostras seja selecionado. (Kennard, R. W.; Stone, L. A. 1969)
1.6 FIGURAS DE MÉRITO
O desempenho de qualquer técnica analítica depende exclusivamente de dois parâmetros. A qualidade das medidas instrumentais e a confiabilidade estatística dos cálculos envolvidos no seu processamento. Uma forma de assegurar a aplicabilidade e o alcance de um método durante as operações de rotina de um laboratório é estabelecendo os limites destes parâmetros por meio da estimativa das figuras de mérito, numa etapa conhecida como validação (Schneider, R.P. et. al. 2008).
 Portanto as figuras de mérito tem como função servir de indicadores quantitativos para indicar a qualidade do modelo utilizada.
A maneira pela qual essas figuras de mérito devem ser determinadas geralmente e estabelecida por órgãos de fiscalização e encontra-se descrita em normas específicas. (Valderrama, P. et. al. 2009).
 Existem no Brasil, dois órgãos que regulamentam a validação de métodos analíticos são eles a ANVISA (a Agência Nacional de Vigilância Sanitária) e o INMETRO (Instituto Nacional de Metrologia, Normalização e Qualidade Instrumental).
 As principais figuras de mérito são:
 - Exatidão: Podemos definir exatidão, como o grau de concordância entre o valor estimado pelo modelo multivariado e o valor de referência. Em análise multivariada a exatidão pode ser expressa através da RMSEP (Raiz quadrada do erro médio quadrático da previsão). 
 - Precisão: A precisão pode ser descrita como a dispersão de resultados entre ensaios independentes, repetidos de uma mesma amostra, amostras semelhantes ou padrões, sob condições definidas.
 - Sensibilidade: Expressa a fração de sinal que é acrescentado quando a concentração da espécie de interesse tem seu valor elevado em uma unidade.
 - Seletividade: É a capacidade de determinar uma espécie de interesse em misturas ou matrizes na presença de componentes que possam interferir com a sua determinação em uma amostra
 - Linearidade: é expressa pela sua habilidade em gerar resultados que sejam diretamente proporcionais às concentrações do analito em amostras, correspondente à uma determinada faixa de concentração.
 - Razão sinal/ruído: É definida pela razão do sinal do analito de interesse e o sinal do ruído instrumental.
 - Limite de detecção (LD): pode ser definido como a mais baixa concentração de analito que pode ser detectado de forma confiável e distinto de zero (ou a nível de ruído do sistema), mas não necessariamente quantificado na concentração em que um valor medido for maior que a incerteza associada a ele.
Pode ser calculado, por exemplo através da relação sinal-ruído ou por outras técnicas
 - Limite de quantificação (LQ): Representa a menor concentração da substância de interesse que pode ser medida com uma incerteza máxima de 10%.
Também pode ser determinado utilizando a relação sinal-ruído, assim como o limite de detecção.
 - Robustez: medida da suscetibilidade do método frente a pequenas variações de determinados fatores a que o método pode estar sujeito como, por exemplo, temperatura, umidade, analista etc. O método é dito robusto quando não é afetado por essas variações. 
 - Intervalos de confiança: É o intervalo onde pode-se confirmar com certo grau de confiança, ou probabilidade, que inclui o valor verdadeiro da propriedade de interesse.
Neste trabalho foi utilizado algumas figuras de mérito, tais como:
RMSEP (raiz quadrada do erro quadrático médio para previsão), (equação 4);
RMSEC (raiz quadrada do erro quadrático médio para calibração), (equação 5);
RMSEV (raiz quadrada do erro quadrático médio para validação), (equação 6);
BIAS, Valor atribuído ao erro sistemático (equação 7);
Erro relativo (%), Valor atribuído a presença de erro relativo percentual (equação 8).
 (4)
 (5)
 (6)
 (7)
 (8)
Onde é a concentração experimental; a concentração prevista para os modelos de calibração, validação e previsão; é o número de amostras.
2 OBJETIVO
 
O objetivo deste trabalho é utilizar o algoritmo MCR-ALS aliado ao infravermelho próximo (NIR) para determinação de BRIX na produção de cana de açúcar e também mostrar a importância deste algoritmo para realizar análises qualitativas e quantitativas.
 
3 METODOLOGIA
3.1 SOFTWARE
 O software utilizado neste trabalho foi o MCR-ALS GUI 2.0 (baixado diretamente do site: www.mcrals.info).
 O MCR-ALS foi realizado no ambiente MATLAB R2011a e com auxílio do toolbox MCR-ALS Toolbox 2.0
 Os conjuntos de dados utilizados neste trabalho foram obtidos através do seguinte site: http://www.models.life.ku.dk/
3.2 CONJUNTOS DE DADOS
 
 Trata-se de um conjunto de dados em formato MATLAB, onde utliza-se do infravermelho próximo (NIR) para determinar o BRIX durante a produção de açúcar. Os dados são originários de quatro etapas do processo em uma fábrica de açúcar: moagem (suco), evaporação (xarope), cristalização e centrifugação (melaço). Os dois últimos passos consistiram em três sub-etapas.1797 amostras foram medidas a 400 - 1888nm com um incremento de 2 nm. Os valores de referência Brix (teor de sólidos solúveis) foram medidos como porcentagem em massa.
O conjunto de dados contém efeitos não lineares devido a mudanças na constituição física e química do processo durante a produção, tais como temperatura, pH, viscosidade, composição da amostra e cristais.
4 RESULTADOS E DISCUSSÃO
4.1.1 MCR-ALS SEM PRÉ-PROCESSAMENTO
 
 O primeiro passo foi ter conhecimento do conjunto de dados, onde os valores de Y da matriz corresponde a concentração de Brix, e os valores de X da matriz corresponde ao espectro de absorbância.
 A figura 2 mostra os espectros, na região do infravermelho próximo (NIR), do caldo de cana de açúcar para todas as amostras (1797). 
(Figura 2: Espectro do NIR para todas as amostras do caldo de cana de açúcar)
 De acordo com a figura 7, podemos observar uma forte absorção referente a água (ligação O-H) na região de 1400nm a 1600nm, todavia não foi preciso a eliminação dessa região, pois não houve interferência dos resultados obtidos nesse trabalho. 
 Utilizando o MCR-ALS foi possível determinar a matriz de concentração relativa (C) e a matriz de espectros puros (S). 
 Inicialmente, para determinação de componentes iniciais, foi utilizado o SVD (foi utilizado o SVD, pois a principio não tinhamos conhecimento da matriz de concentração relativa (C) e nem da matriz de espectros puros (S) ), onde foi selecionado um conjunto de 6 componentes que mais variavam, como podem ser vistos na figura 3.
 Esses componentes podem ser açúcares (glicose, frutose e sacarose) e também não-açúcares (aminoácidos, gorduras) que constituem o caldo de cana de açúcar.
Figura 3: Componentes selecionadas no SVD para o modelo sem pré-processamento)
 Foi possível observar que das 6 componentes que mais variavam no SVD a única que apresentou relação linear entre o copt (concentração) e o sopt (espectro) foi a segunda componente (as outras componentes deram um alto grau de não linearidade), ou seja, obedeceu uma das condições em que o MCR – ALS possa a ser aplicado, é a que o sinal analítico tem que obedecer uma relação linear com a concentração, sendo semelhante a equação de Beer- Lambert a outra condição é que o posto da matriz deve ser igual ao número de espécies que produzem sinal analítico presentes nas misturas. Esse posto da matriz corresponde ao número de linhas ou colunas que linearmente independentes, em outras palavras, o número de vetores que não podem ser escritos como uma combinação linear dos outros.
 Sendo assim foi aplicado o MCR-ALS, para a determinação do Brix na cana de açúcar, utilizando a segunda componente, das dez escolhidas no SVD. Utilizando a restrição de não negatividade (utiliza-se este tipo de restrição com o objetivo de evitar as ambiguidades presentes no MCR-ALS), em modo linha, ou seja, referente a concentração, a implementação escolhida foi a fnnls (Fast non-negativity last squares) e o número de espécies com perfis de não negatividade escolhidas foram 6, para o modo coluna, referente ao espectro, também foi selecionado a restrição de não negatividade, a implementação escolhida foi a fnnls, e o número de espécies com perfis de não negatividade também foram 6, vale ressaltar que neste trabalho não foi aplicado restrições mais avançadas, como por exemplo as restrições de correlação, pois os resultados obtidos utilizando as restrição de não negatividade foram satisfatórios. 
 A normalização escolhida foi a norma euclidiana, com o objetivo de evitar instabilidades da escala durante a evolução da otimização ALS e corrigir as possíveis ambiguidades de intensidade.
 O critério de convergência escolhido foi de 0,1 e o número de interações selecionados foram 200, Os valores das figuras de mérito obtidas através da otimização ALS, apresentaram ótimos resultados, principalmente a porcentagem de variância explica (r2) obtendo um valor próximo do ideal, como mostra a tabela 1 abaixo:
 
	Porcentagem de variância explicada (r2)
	 99,999%
	 Falta de ajuste (LOF) em PCA
	 0,99255%
	 Falta de ajuste (LOF)
	 0,31756%
(Tabela 1: Figuras de mérito para otimização ALS)
 Foi utilizado o algoritmo Kennard-Stone com o objetivo de separar as amostras em calibração, previsão e validação, Para a calibração, utilizou-se 70% do conjunto total de amostras (1797 amostras), ou seja, foi separado conjunto de 1258 amostras, para a previsão e validação foi selecionado 15% do conjunto total de amostras (1797 amostras), ou seja, um conjunto de 270 amostras para cada uma.
 O algoritmo calculou o valor das figuras de mérito para os 3 conjuntos, apresentando resultados satisfatórios, como mostra a tabela 2,3 e 4, respectivamente:
	 Calibração
	Analyte
	1,0
	RMSEC (%)
	6,6
	SEP
	5,5
	Bias
	3,7
	Erro relativo (%)
	7,9
	Slope
	1,0
	Offset
	-1,8
	Corcoef
	0,966
	Sdres
	194
(Tabela 2: Figuras de mérito para o conjunto de calibração)
	 Previsão
	Analyte
	1,0
	RMSEP (%)
	6,7
	SEP
	6,1
	Bias
	2,8
	Erro relativo (%)
	9,1
	Slope
	1,1
	Offset
	-8,4
	Corcoef
	0,97
	Sdres
	94
(Tabela 3: Figuras de mérito para o conjunto de previsão)
	 Validação
	Analyte
	1,0
	RMSEV (%)
	6,6
	SEP
	5,7
	Bias
	3,4
	Erro relativo (%)
	9,2
	Slope
	1,1
	Offset
	-8,1
	Corcoef
	0,981
	Sdres
	88
(Tabela 4: Figuras de mérito para o conjunto de validação)
Foi possível observar que os valores das figuras de mérito foram satisfatórios como mostram as tabelas acima, o valor do erro relativo dos conjuntos de validação, previsão e calibração, deram abaixo de 10%, como também os valores de RMSEP, RMSEV, RMSEC e SEP, também é possível salientar que o baixo valor de bias implica que há inexistência do efeito da matriz.
Baixos valores (abaixo de 10%) de RMSEP, RMSEV e RMSEC, implicam que o modelo possui alta exatidão.
4.1.2 MCR-ALS COM PRÉ PROCESSAMENTO
 Com o objetivo de remover a presença de ruídos e de espalhamento da luz, foi utilizado o pré-processamento SNV (Standard Normal Variate) para obter melhores resultados em relação ao modelo sem pré-processamento.
 O espectro do NIR para todas as 1797 amostras utilizando o pré-processamento SNV pode ser visto na seguinte figura:
(Figura 4: Espectro do NIR para todas as amostras utilizando o pré-processamento SNV)
Utilizando o MCR-ALS com pré-processamento SNV foi possível determinar a matriz de concentração relativa (C) e a matriz de espectros puros (S). 
 Inicialmente, para determinação de componentes iniciais, foi utilizado o SVD (Decomposição em Valores Singulares), onde foi selecionados um conjunto de 6 componentes que mais variaram, como pode ser visto na figura 5.
(Figura 5: Componentes selecionadas no SVD para o modelo com pré-processamento)
 Em seguida foi utilizando a restrição de não negatividade em modo linha, ou seja, referente a concentração, a implementação escolhida foi a fnnls (fast non-negativity least squares), e o número de espécies com perfis de não negatividade escolhidas foram 6, para o modo coluna, referente ao espectro, também foi selecionado a restrição de não negatividade, a implementação escolhida também foi a fnnls, e o número de espécies com perfis de não negatividade também foram 6.
 A normalização escolhida foi a norma euclidiana, com o objetivo de evitar instabilidades da escala durante a evolução da otimização ALS e corrigir as possíveis ambiguidades de intensidade.
 O critério de convergência escolhido foi de 0,1 e o número de interações selecionados foram 200, Os valores das figuras de mérito obtidasatravés 4 interações, podem ser vistos na seguinte tabela:
	Porcentagem de variância explicada (r2)
	60,8756%
	Falta de ajuste (LOF) em PCA
	62,5295%
	Falta de ajuste (LOF)
	62,5495%
(Tabela 5: Figuras de mérito para otimização ALS, para o modelo com pré-processamento)
 Podemos observar que os valores das figuras de mérito para o modelo utilizando o pré-processamento não foram satisfatórios, o valor de porcentagem de variância explicada deu abaixo do modelo sem pré-processamento e o valor de falta de ajuste obtido foi acima do esperado, portanto com os valores da otimização ALS, podemos concluir que a utilização do pré-processamento foi ineficaz e consequentemente é um modelo que apresenta uma alta porcentagem de erro.
 Logo podemos concluir que o modelo que apresenta melhores resultados é o modelo sem a utilização de pré-processamento.
4.2 DETERMINAÇÃO DE BRIX UTILIZANDO MCR-ALS
 Os valores de concentração medido e previsto do Brix na cana de açúcar utilizando o MCR-ALS junto com o algoritmo Kennard–stone, para os conjuntos de calibração, validação e previsão podem ser vistos na figura 3 abaixo:
(Figura 6: Valores da concentração do Brix previsto e estimado na cana de açúcar para os conjuntos de validação, calibração e previsão, em %(m/m))
 Foi possível observar que o coeficiente de correlação (R²) deu um bom valor (0.953), para a curva de calibração dos valores medidos e previstos do Brix, para os valores de calibração, validação e previsão.
 Esse valor de coeficiente de correlação conclui que há uma linearidade entre os valores de Brix medido e previsto no MCR-ALS.
4.3 DETERMINAÇÃO DE BRIX UTILIZANDO REFRATÔMETRO
 A curva de calibração do Brix na cana de açúcar utilizando o refratômetro, pode ser visto na seguinte figura:
(Figura 7: Curva de calibração do Brix na cana de açúcar utilizando o refratômetro[4])
 Apesar do refratômetro ser um aparelho bem mais barato em relação a um infravermelho próximo e sua medição do Brix ser mais simples, Podemos notar que utilizando o refratômetro para medir o Brix na cana de açúcar, temos um baixo valor do coeficiente de correlação (R=0,65), ou seja, é uma técnica bem menos exata comparando-a com o infravermelho próximo aliado ao MCR-ALS, isso implicará em uma resposta menos precisa para determinação de sólidos solúveis na cana de açúcar e consequentemente uma resposta menos precisa em relação a maturidade da cana de açúcar.
5 CONCLUSÃO
 
 De acordo com os resultados obtidos, podemos concluir que a utilização do infravermelho próximo (NIR) aliado com um modelo de análise multivariada, que neste trabalho foi utilizado a resolução multivariada de curvas com mínimos quadrados alternantes (MCR-ALS), mostrou-se bastante eficaz para determinação de brix (teor de sólido solúveis) na cana de açúcar em relação ao refratômetro.
 Com o auxílio do algoritmo Kennard-Stone, as amostras foram separadas em conjuntos de validação, previsão e calibração.
 Com a utilização de figuras de mérito, foi possível determinar uma alta linearidade entre os valores de brix previsto e brix medido, através do valor do coeficiente de correlação (R²), e com os valores de RMSEP, RMSEV e RMSEC (todos abaixo de 10%), foi possível analisar que método possui alta exatidão, e com o valor obtido do bias, foi comprovado a inexistência do efeito da matriz.
 
6 REFERÊNCIAS
[1] http://www.netafim.com.br/crop/sugarcane acesso em 26/06/2017
[2] https://www.novacana.com/cana-de-acucar/ acesso em 26/06/2017
[3]http://www.agencia.cnptia.embrapa.br/gestor/cana-de-acucar/arvore/CONTAG01_138_22122006154842.html acesso em 26/06/2017
[4] https://www.milkpoint.com.br/radar-tecnico/conservacao-de-forragens/como-definir-o-ponto-de-colheita-da-canadeacucar-67828n.aspx acesso em 12/07/2017 
[5] http://www.crq4.org.br/informativomat_235 acesso em 26/06/2017
[6] D. de Abreu, L.H. de Moraes; E.N. Nascimento, R.A. de Oliveira, A produção da cana-de-açúcar no Brasil e a saúde do trabalhador rural, Publicação 6 de setembro de 2011, acesso 26/06/2017
[7] R. Tange, M.A. Rasmussem, E. Taira, R. Bro, Application of support vector regression for simultaneous modelling of near infrared spectra from multiple process steps, Publicação: 30 de março 2015, acesso em 25/06/2017
[8] J. Jaumot, R. Gargallo, A. de Juan, R. Tauler, A graphical user-friendly interface for MCR-ALS: a new tool for multivariate curve resolution in MATLAB, Publicação: 21 de dezembro 2004, acesso em 25/06/2017
[9] J. Jaumot, A de juan, R. Tauler, MCR-ALS GUI 2.0: New features and applications, Publicação: 24 de outubro de 2014, acesso em 25/06/2017
[10] P.H. Março, P. Valderrama, G.L. Alexandrino, R.J. Poppi, R. Tauller, Resolução multivariada de curvas com mínimos quadrados alternantes: descrição, funcionamento e aplicações, Publicação: 2014, acesso em 25/06/2017
[11] P. Valderrama, J.W.B. Braga, R.J. Poppi, Estado da arte de figuras de mérito em calibração multivariada, Publicação: 28 de maio de 2009, acesso em 25/06/2017
[12] http://www.abq.org.br acesso 25/06/2017
[13]http://www.agencia.cnptia.embrapa.br/gestor/cana-de-acucar/arvore/ acesso em 25/06/2017
[14] http://www.udop.com.br acesso em 25/06/2017
[15] F.A.L. Ribeiro, M.M.C Ferreira, S.C. Morano, L.R. Silva, R.P. Schneider Planilha de validação: uma nova ferramenta para estimar figuras de mérito na validação de métodos analíticos univariados. 2008, acesso em 25/06/2017
[16] F.A. Honorato, B.B Barros, M.N. Martins, R.K.H. Galvão, M.F. Pimentel Transferência de calibração em métodos multivariados. 2007, acesso em 25/06/2017
[17] M.M.C. Ferreira, A.M. Antunes, M.S. Melgo, P.L.O. Volpe, Quimiometria I: calibração multivariada, um tutorial, 1999, acesso em 25/06/2017
[18] Savitzky, A.; Golay, M. J. E.; Anal. Chem. 1964, 36, 1627, acesso em 25/06/2017
[19] Naes, T, Isaksson, T, Fearn, T, Davies, T.; A user-friendly guide to Multivariate Calibration and Classification, NIR Publications: Chichester - UK, 2002, acesso em 25/06/2017 
[20] Kennard, R. W.; Stone, L. A. Computer aided desing of experiments, Technometrics. 1969, acesso em 25/06/2017

Outros materiais