Baixe o app para aproveitar ainda mais
Prévia do material em texto
Análise Inteligente de Imagens Digitais no Monitoramento da Requeima em Tomateiros Gizelle Kupac Vianna, Sérgio Manuel Serra da Cruz Instituto de Ciências Exatas – Departamento de Matemática Universidade Federal Rural do Rio de Janeiro (UFRRJ) BR 465 – Km 7 – CEP 23890-000 –– Seropédica – RJ – Brasil { kupac, serra }@ufrrj.br Abstract. The Brazilian tomato production chain permeates several sectors and provides opportunities for technological innovation that can be applied to environmental, social and economic segments. This paper presents a technological approach focused on the organic tomatoes crops. Computational strategies that support early detection of diseases and pests in tomato are discussed. We present the first results, which consorts field experiments with experiments based on neural networks. Resumo. A cadeia produtiva do tomate do Brasil permeia diversos setores, oferecendo oportunidades de inovação tecnológica que podem ser aplicadas aos segmentos ambientais, sociais e econômicos. Este trabalho apresenta uma abordagem de manejo tecnológico voltado para culturas orgânicas de tomates. Nele são discutidas estratégias computacionais inteligentes que oferecem apoio à detecção precoce de doenças e pragas em tomateiros. Apresentamos os primeiros resultados, que consorcia experimentos de campo e experimentos baseados em redes neurais. 1. Introdução O tomate (Solanum lycopersicon) é a mais importante dentre todas as hortaliças cultivadas no Brasil e o Rio de Janeiro é hoje o terceiro maior produtor nacional. Em 2010 foram produzidos 75 milhões de quilos, movimentando aproximadamente R$ 73 milhões [FAPERJ 2012] em sua comercialização. Devido ao grande número de pragas e doenças que afetam os tomateiros, sua cultura ocupa o segundo lugar em consumo de agrotóxicos por área plantada [Neves 2003]. O uso indiscriminado de agrotóxicos gera consideráveis problemas de saúde pública e contaminação do meio ambiente, além de altas taxas residuais de agrotóxicos nos frutos. O tomate também é uma cultura extremamente exigente em termos de adubação e tratos culturais e a soma de todos esses fatores, aliados aos elevados custos de produção, tornam sua lavoura uma cultura de alto risco [Macedo et al. 2005]. Portanto, é fundamental buscar novas soluções tecnológicas que reduzam os custos operacionais, o uso de agrotóxicos e o impacto ambiental, além de viabilizarem produtos de melhor qualidade. O objetivo deste trabalho é desenvolver técnicas de inteligência computacional, sob a forma de reconhecimento de padrões baseados em redes neurais do tipo Multilayer Perceptron (MLP), que apoiem o desenvolvimento de ferramentas automáticas de detecção de alterações foliares em tomateiros. O presente trabalho está inserido em outro projeto mais abrangente, financiado pela FAPERJ, que visa incrementar a produtividade das lavouras orgânicas de tomates do estado do Rio de Janeiro. Essa é uma proposta bastante desafiadora, ainda mais se considerarmos os desafios envolvidos na detecção precoce de doenças e pragas. Este trabalho está organizado da seguinte forma: a seção 2 caracteriza as doenças da hortaliça; a seção 3 apresenta os experimentos e resultados obtidos, envolvendo o reconhecimento de padrões da doença prevalente nos tomateiros brasileiros, através do uso de técnicas de redes neurais (RNA’s); a seção 4 apresenta os trabalhos relacionados e os compara com a nossa abordagem, e a seção 5 conclui o artigo. 2. Doenças em Tomateiros e Manejo Tecnológico O tomate é classificado como um fruto climatérico de grande perecibilidade e o rendimento final de sua cultura está condicionado ao desenvolvimento de doenças e pragas [DISQUAL 2010]. No tomateiro, as doenças são de freqüência ou intensidade variadas, em função de diversos fatores ou condições, como: clima, localização da área plantada, modo de implantação e de condução da lavoura, entre outros [Macedo et al. 2005]. Já foram relatadas mais de 200 doenças que podem afetar os tomateiros, sendo que, no Brasil, a mais comum é a requeima. Essa doença é causada pelo oomiceto Phytophthora infestans e resulta em perda significativa nas culturas, principalmente nos períodos mais frios e úmidos do ano, época de prevalência das epidemias de requeima. A doença é reconhecida visualmente pelo surgimento de pontos escuros em suas folhas, cujos matizes variam do cinza ao verde- pálido, freqüentemente localizadas nas bordas da folha, podendo evoluir para grandes áreas necrosadas marrons [Filgueira 2008]. Essas lesões podem causar desde a perda de folhas até a morte da planta, nos casos mais severos. Apesar de tipicamente observados nas folhas, os sintomas também podem aparecer em caules, frutos e brotos [Correa 2009]. Na próxima seção apresentamos os experimentos e primeiros resultados sobre o reconhecimento de padrões da doença através do uso de técnicas de RNA´s. 3. Reconhecimento Digital de Padrões de Doenças Até o momento, os pequenos agricultores brasileiros não dispõem de muitas opções de ferramentas que os auxiliem na detecção precoce da requeima. Uma abordagem utilizada é a chave de classificação manual definida por Correa (2009). Essa chave está baseada em imagens estilizadas de folhas de tomates que quantificam o grau de infestação por P. infestans, permitindo avaliar visualmente o grau de contaminação do tomateiro. Porém, essa detecção precoce de doenças é realizada, manualmente, por especialistas, o que nem sempre é uma opção economicamente viável. Uma alternativa seria automatizar o processo de avaliação das culturas, acelerando a identificação das amostras ao separá-las em dois conjuntos: um contendo amostras de plantas em bom estado e outro com as amostras que devem passar por um exame mais detalhado, a ser feito por especialistas. Neste trabalho, foram realizados dois processamentos sobre cada amostra digital colorida de tomateiros, cultivados sob os princípios da agricultura orgânica: a aplicação de um filtro vermelho/verde e a conversão para imagem em tons de cinza. A seguir, sobre cada amostra, são realizadas contagens dos pixels que se encontram dentro de faixas de cores ou tons de cinza relevantes. O conjunto total de amostras disponibilizado nesta investigação perfaz um total de 226 imagens digitais de folhas obtidas de amostras de 66 tipos diferentes de genótipos, plantados em campos experimentais do setor de horticultura do Departamento de Fitotecnia do IA/UFRRJ, uma área historicamente associada com a ocorrência natural da requeima. Os genótipos incluem um cultivar comercial suscetível à doença, dois resistentes e 63 ainda sob avaliação na Universidade [Correa 2009]. 3.1. Filtragem vermelho/verde A identificação de áreas foliares atingidas pela doença utilizou imagens reais das plantas. A filtragem consiste de um procedimento automatizado simples que considera o princípio de que a cor da planta saudável é o verde intenso (Figura 1). Em seguida, é realizada a análise do tom de cada pixel da imagem, classificando-o dentro de uma das seguintes opções: (i) um pixel é classificado como doente e será convertido para a cor vermelha pura (255,0,0), no sistema RGB, caso seja de um tom amarelado ou marrom, indicativos de algum tipo de lesão. (ii) um pixel é classificado como sadio e será convertido para a cor verde pura (0,255,0) caso seja de um tom esverdeado, podendo ir de uma matiz mais clara até um verde mais escuro; (iii) um pixel de qualquer tom diferente dos anteriores será considerado como fundo da imagem e será convertido para preto. Figura 1. Exemplos de imagens de tomateiros (do campo experimental do IA/UFRRJ) contaminados porP. infestans antes e depois a filtragem vermelho/verde. 3.2. Imagens em tons de cinza De forma semelhante ao processamento descrito na sessão anterior, as imagens coloridas, foram convertidas para imagens em tons de cinza, usando um procedimento padrão. A seguir, cada imagem gerada passou por um processo de análise que consistia em realizar uma contagem dos pixels que se encontravam dentro de uma determinada faixa de tom de cinza. Essas faixas foram definidas analisando-se o valor de cada pixel, onde cada um é classificado da forma descrita a seguir: ( ) { ) ) ) (1) Além dessas faixas de valores, também foi contabilizado o valor médio de todos os tons classificados como cinzas (escuros, médios e claros). 3.3. Experimentos apoiados por redes neuronais artificiais Além das contagens de pixels realizadas sobre as imagens obtidas pelos filtros vermelho/verde e em tons de cinza, também foram contabilizados os valores médios dos componentes RGB das imagens originais. Como cada imagem coletada possuía um tamanho diferente, em pixels, os valores obtidos de cada imagem poderiam se encontrar em faixas de intervalo distintas. A fim de homogeneizar o intervalo de valores possíveis dentro do conjunto de variáveis, estas sofreram um processo de normalização linear. Somente após essa fase, o conjunto de dados foi disponibilizado para o treinamento das RNA´s. Os experimentos iniciais utilizaram todos os dados extraídos das contagens de pixels realizadas sobre as imagens digitais e não apresentaram desempenho satisfatório. De fato, em sistemas de reconhecimento baseados em RNA´s, diferentes formatos de representação dos dados podem trazer mudanças significativas para o desempenho do sistema. A solução encontrada foi reduzir a dimensão das amostras através de uma análise de relevância das variáveis disponíveis, chegando-se a um subconjunto de variáveis mais significativas [Vianna 2000]. O primeiro passo foi separar, manualmente, o conjunto de amostras em dois grupos: um contendo as que apresentassem indícios visuais de problemas na planta e outro contendo aquelas que foram consideradas sadias. Os grupos serão identificados como G1 e G0, respectivamente. Analisaram-se, a seguir, os momentos de 1 a e 2 a ordem de cada variável, em cada um dos grupos G1 e G0, com o objetivo de verificar sua capacidade de discriminação [Spiegel 1978]. De uma maneira geral, a avaliação desses momentos pode servir de orientação para a seleção das variáveis com maior potencial para discriminação por um sistema de redes neurais. O poder de discriminação de cada variável foi avaliado levando-se em consideração a separação espacial dos conjuntos G1 e G0. Assim, dada a variável X, para esta ser considerada uma variável discriminadora D, ela deverá obedecer à seguinte condição: { X | ( ) ( ) ( ( ) ( ) ( )) ( ) ( ) ( ( ) ( ) ( )) (2) O valor de tol é usado no processo de decisão automatizado que avalia o grau de separação necessário entre G1 e G0, que define se uma variável será, ou não, considerada discriminadora. O valor de tol controla a quantidade de variáveis selecionadas e depende das características gerais do conjunto de imagens disponível, sendo sua definição um processo empírico. Assim, diferentes conjuntos podem selecionar diferentes variáveis discriminadoras, dependendo da qualidade das imagens (em termos de luz, contraste, ruído, etc.). Para o conjunto usado nos experimentos realizados, foi utilizado um valor de tol de 0,06 que conduziu à seleção de oito variáveis, listadas na Tabela 1, onde cada uma contém informações sobre quantidades de pixels em uma determinada faixa de cor ou tom de cinza. Tabela 1: Variáveis selecionadas através da análise da distribuição. Variáveis Disponíveis Variáveis Selecionadas Pretas Pretas Cinza Escuro Cinza Escuro Cinza Médio Cinza Médio Cinza Claro Cinza Claro Brancos Vermelhas Tom Médio de Cinzas Verdes Vermelhas Pretas Filtro Vermelho/Verde Verdes Blue Médio Pretas Filtro Vermelho/Verde Red Médio1 Green Médio2 Blue Médio3 1,2,3 Valor médio dos componentes R da representação RGB. Foram realizados 890 experimentos com as RNA’s, utilizando em cada um deles uma arquitetura de rede contendo 8-2-1 neurônios, valores diversos de taxa de aprendizado e momentum e um máximo de 50.000 epochs. O treinamento do do conjunto completo de experimentos consumiu cerca de seis horas para ser concluído, em um processador de 64 bits, Intel Core i5 com 6Gb RAM. O melhor desempenho, de 94,1% de acertos, foi obtido quando utilizada uma taxa de aprendizado de 0,3 e momentum de 0,8. Os conjuntos de treinamento e validação foram divididos em uma proporção de 9:1, tomando-se o cuidado de usar, em cada conjunto de validação, amostras não apresentadas anteriormente à rede neural durante sua etapa de treinamento. 4. Trabalhos Relacionados Sanyal e Patel (2008) conduziram um estudo de análise de textura e cor das folhas de arroz (Oryza sp.) para identificação dados doenças brown spots e blast diseases. A simulação realizada pelo autor baseou-se em 400 amostras e a classificação foi realizada por uma rede MLP. Foram utilizadas imagens de folhas doentes e normais e chegou-se a um desempenho de 89,26% de acertos na classificação individual dos pixels das imagens, que poderiam ser considerados como lesões ou não. Logo, nem a folha como um todo, nem a planta, foram avaliadas, mas apenas a cor dos pixels. Camargo (2009) definiu um classificador baseado em uma máquina de vetor de suporte (SVM) para operar sobre as imagens coloridas de algodão (Gossypium sp.). Foram utilizadas 127 imagens de culturas de algodão. O melhor modelo de classificação foi encontrado com 45 características, chegando a 93,1% de desempenho. Vieira (2011) utilizou uma rede neural MLP para detectar as lesões ocasionadas em folhas de tomate. No entanto, sua taxa de acerto foi de apenas 77,8% na identificação de lesões por requeima. Além disso, dentre os testes conduzidos, foram utilizadas poucas amostras (apenas 9 amostras de folhas com lesões da doença de um conjunto total de 65 amostras de folhas lesionadas por três tipos diferentes de doenças). Neste estudo, existe um fator limitante quando comparado a nossa abordagem, uma vez que as imagens digitais sofreram pré-processamento manual, onde o usuário delimita as manchas mais relevantes da imagem original. Além disso, não há informações sobre o tipo de cultivo associado aos tomateiros, nem sobre o processo de aquisição das imagens. Verfica-se que existem poucos trabalhos voltados para a detecção de doenças e pragas em tomateiros no Brasil. Nossa abordagem, diferentemente de Vieira (2011), utilizou amostras digitais, coletadas de um campo experimental que dispunha de 66 tipos de genótipos distintos e condições ambientais típicas dos tomateiros brasileiros. A fim de simular uma situação real, as imagens colhidas in loco possuem folhas, chão, frutos e, alguma vezes, partes do céu. Além disso, nosso estudo utilizou mais amostras e obteve taxa de acertos superior. 5. Conclusão Este trabalho apresentou uma primeira abordagem direcionada à detecção precoce da requeima nos tomateiros em pequenas propriedades agrícolas, no qual relatamos os primeiros experimentos e resultados sobre o reconhecimento de padrões da requeima, através do uso de técnicas de redes neurais. Os possíveis benefícios decorrentesdesta pesquisa são de ordem ambiental (preservação do solo e dos lençóis freáticos, decorrentes da redução do uso de agrotóxicos) e econômica (aumento do volume de produção da hortaliça, redução de custos operacionais da lavoura e produto de melhor qualidade). Como trabalhos futuros serão avaliados melhorias nos algoritmos de processamento digital de imagens, uma vez que a qualidade dos dados de entrada é o fator de maior impacto para o desempenho de um sistema de reconhecimento baseado em RNA’s. Estuda- se a possibilidade de inclusão de um módulo de lógica nebulosa para melhorar o desempenho do reconhecimento inteligente. Também é necessário avaliar em detalhe os resultados das RNA´s, de forma a definir limiares mais precisos para a classificação de cada amostra. Neste trabalho, empregamos o limiar de 0,5 (acima de 0,5 a saída era considerada como 1 e a amostra, doente), mas o desempenho do sistema poderia ser melhorado com uma análise mais detalhada das distribuições das respostas das RNA´s. Agradecimentos À FAPERJ pelo financiamento (E-26/112.588/2012). Ao IA/UFRRJ e aos professores Antonio Carlos de Souza Abboud e Margarida Goréte Ferreira do Carmo. Referências Camargo, A., Smith, J.S., (2009) “Image Pattern Classification for the Identification of Disease Causing Agents in Plants”, Computers and Eletronics in Agriculture 66, p.121-125. Correa, F.M., Bueno Filho, J.S.S., Carmo, M.G.F., (2009) “Comparison of Three Diagrammatic Keys for the Quantification of Late Blight in Tomato Leaves”, Plant Pathology 58, p.1128-1133. DISQUAL (2010), “Otimização da qualidade e redução de custos na cadeia de distribuição de produtos hortofrutícolas frescos – Manual de Boas Práticas”. http://www2.esb.ucp.pt/twt/disqual/pdfs/disqual_tomate.pdf. FAPERJ (2012), “Estudo testa método natural de fertilização para o cultivo do tomate orgânico”. http://www.faperj.br/boletim_interna.phtml?obj_id=7947. Filgueira, F. A. R. (2008) “O novo manual de olericultura”, Editora da UFV. 3a edição Macedo, J. R., et al., (2005) “Recomendações Técnicas para a Produção do Tomate Ecologicamente Cultivado, Circular Técnica 33. Neves, E. et al., (2003) “Bataticultura: dispêndios com defensivos agrícolas no quinquênio 1997-2001”. Batata show, n 6, p 22-23. Sanyal, P.; Patel, S. C. (2008), “Pattern recognition method to detect two diseases in rice plants” Imaging Science Journal, v.56, n.6, p. 319-325. Spiegel, M. R. (1978) “Probabilidade e Estatística - Coleção Schaum”, McGraw-Hill do Brasil. p.435-449. Vianna, G. K., Thomé, A. C. (2000) “Neuro-Fuzzy System for Diagnosis of Engines, Based on Oil Samples Analysis”. 4th World Multiconference On Systemics, Cybernetics And Informatics. Flórida. p.290-295. Vieira, F. S. et. al., (2011) “Utilização de Processamento Digital de Imagens e Redes Neurais Artificiais para Diagnosticar Doenças Fúngicas na Cultura do Tomate”. Anais do XX Seminário de Computação, p. 58-69.
Compartilhar