Baixe o app para aproveitar ainda mais
Prévia do material em texto
�������������������� �������������������������������������������������������������������������������������������� INSTITUTO DE COMPUTAÇÃO UNIVERSIDADE ESTADUAL DE CAMPINAS Uso de técnicas de aprendizagem para classi�cação automática de moscas-das-frutas (Diptera, Tephritidae) F. A. Faria P. Perre R. A. Zucchi T. Lewinsohn A. Rocha R. da S. Torres Technical Report - IC-12-10 - Relatório Técnico April - 2012 - Abril The contents of this report are the sole responsibility of the authors. O conteúdo do presente relatório é de única responsabilidade dos autores. Uso de técnicas de aprendizagem para classificação automática de moscas-das-frutas (Diptera, Tephritidae) F. A. Faria∗ P. Perre, R. A. Zucchi† T. Lewinsohn‡ A. Rocha, R. da S. Torres§ Resumo As moscas-das-frutas são pragas de importância quarentenária a ńıvel mundial, dentre as quais se destacam algumas espécies de Anastrepha, que atacam um grande número de frut́ıferas e estão amplamente distribúıdas pelo Brasil. A identificação das espécies de moscas-das frutas é baseada nos caracteres morfológicos do mesonoto, asa e acúleo. Nos últimos anos, têm sido de- senvolvidas ferramentas que complementam a taxonomia tradicional na identificação de algumas espécies de insetos. Além de diminuir o tempo gasto pelos especialistas, essas novas ferramentas podem permitir que um número maior de pesquisadores estude e/ou identifique esses insetos. Sendo assim, o presente estudo tem como objetivo testar a eficácia de novas técnicas para iden- tificação de três espécies de moscas-das-frutas. Neste trabalho, foram aplicadas e comparadas técnicas de análise de imagens e aprendizagem de máquina na tarefa de classificação de moscas- das-frutas, visando obter dados que possam futuramente servir de base para o desenvolvimento de sistemas de identificação automática dessas espécies utilizando imagens de asas e acúleos. 1 Introdução A identificação de organismos até o ńıvel de espécie é uma parte fundamental da maioria dos traba- lhos em diferentes ramos da Biologia. A demanda pela identificação de organismos vem aumentando dia a dia. Profissionais que trabalham com pragas agŕıcolas ou com segurança fitossanitária entre fronteiras, por exemplo, necessitam cada vez mais identificar espécies de pragas potenciais, além de conhecer suas caracteŕısticas biológicas, como, onde e quando podem encontrá-las [7]. A taxonomia (ciência que classifica os organismos) é uma ciência que está encolhendo, apesar da demanda sobre ela estar aumentando continuamente. Atualmente, há apenas cerca de 4.000 a 6.000 taxonomistas profissionais no mundo [18]. A taxonomia clássica - baseada nas caracteŕısticas morfológicas dos organismos - é feita predominantemente por taxonomistas especializados [34]. Para um pesquisador não acostumado com a rotina taxonômica, a identificação desses organismos geralmente não é sim- ples, uma vez que as chaves taxonômicas tradicionais são quase imposśıveis de serem usadas sem uma coleção de referência e sem um extenso conhecimento dos organismos [33]. Dessa maneira, a taxonomia tem se tornado uma barreira para o desenvolvimento de diversos ramos da Biologia, impossibilitando-os de crescer e desenvolverem-se autonomamente [34]. Uma forma de atenuar esse “impedimento taxonômico” é desenvolver alternativas para que os pesquisadores não-taxonomistas possam realizar suas pesquisas sem depender totalmente do trabalho de um taxonomista [10]. Al- gumas alternativas estão sendo testadas, como a identificação genética de espécimes a partir de ∗Instituto de Computação, Universidade Estadual de Campinas. Pesquisa desenvolvida com apoio financeiro FAPESP, processo 2010/14910-0. †Escola Superior de Agricultura “Luiz de Queiroz”, Universidade de São Paulo. ‡Instituto de Biologia, Universidade Estadual de Campinas. §Instituto de Computação, Universidade Estadual de Campinas. 1 2 Faria, Perre, Zucchi, Lewinsohn, Rocha and Torres um “código de barras”molecular [11, 12]; o acesso on-line a chaves de identificação simplificadas, com imagens detalhadas de estruturas importantes para a identificação da espécie [9]; técnicas de morfometria (multivariada e/ou geométrica) [3]; e técnicas de análise de imagens com uso de ferra- mentas de identificação computadorizadas [33]. Uma das vantagens de se automatizar a identificação de espécies, utilizando tecnologias como reconhecimento de padrões, inteligência artificial e apren- dizado de máquina, é que a identificação de espécies passaria de uma função dependente de poucos especialistas a uma ciência acesśıvel a quem necessite reconhecer espécimes, independentemente de ser especialista ou não [26, 18]. A técnica de análise de imagens digitalizadas, em particular, tem avançado muito nos últimos anos, aumentando a possibilidade da automatização, ou semiautomatização, de grande parte da rotina da identificação taxonômica [9]. Há uma expectativa de que as técnicas de análise de imagens representem um caminho rumo a um sistema de grande escala de identificação taxonômica baseada em imagens computadorizadas [33]. Atualmente, não há um sistema robusto o suficiente quanto a sua eficácia e amplo domı́nio de aplicação, porém algumas técnicas estão sendo desenvolvidas e avaliadas [18]. As ferramentas alternativas de identificação são importantes, quando se trabalha principalmente com grupos de dif́ıcil identificação, como é o caso das moscas-das-frutas do gênero Anastrepha do grupo fraterculus. As ferramentas computacionais podem ser muito vantajosas na identificação de espécies de Anastrepha, uma vez que são consideradas espécies pragas de grande importância econômica e quarentenária. O gênero Anastrepha tem como principal caráter para identificação de espécies a diferença na morfologia do acúleo (“ovipositor” da fêmea) [35]. A dificuldade de análise morfológica do acúleo está desde o processo de extração dessa estrutura de alguns miĺımetros à exigência de treinamento a priori para a tarefa de reconhecimento da espécie. O presente estudo tem como objetivo testar a eficácia de uma nova abordagem de análise de imagens para identificação de três espécies de grande importncia econômica no Brasil (Anastrepha), visando o desenvolvimento de um sistema de identificação automático de moscas-das-frutas, que possa ser utilizado por um pesquisador não-especialista na taxonomia desses insetos. As con- tribuições desse trabalho são: (1) A exploração de diferentes técnicas de descrição de imagens de moscas-das-frutas; (2) Avaliação de diferentes técnicas de aprendizagem para reconhecimento de espécies de moscas-das-frutas; (3) Implementação de um protótipo para reconhecimento de espécies de moscas-das-frutas. O restante do texto é organizado como segue: trabalhos relacionados (Seção 2); metodologia experimental utilizada (Seção 3); resultados obtidos (Seção 4); considerações finais (Seção 5). 2 Trabalhos Correlatos A seção apresenta os conceitos básicos e trabalhos correlatos. 2.1 Moscas-das-frutas - Gênero Anastrepha As moscas-das-frutas (Diptera, Tephritidae) estão entre as principais pragas da fruticultura mundial e estão amplamente distribúıdas no Brasil. As moscas-das-frutas de importância econômica no Brasil são representadas por quatro gêneros: Anastrepha, Bactrocera, Ceratitis e Rhagoletis. O gênero Anastrepha é o mais abundante, com 112 espécies registradas no páıs [36], mas apenas sete são economicamente importantes: A. fraterculus (Wied.), A. grandis (Macquart), A. obliqua (Macquart), A. pseudoparallela (Loew), A. sororcula Zucchi, A. striata (Schiner) e A. zenildae Zucchi [35]. Apesar de o gênero ser composto por aproximadamente 215 espécies distribúıdas por Uso de técnicas de aprendizagem para classificação automática de moscas-das-frutas (Diptera, Tephritidae)3 toda região Neotropicale parte da Neártica, a taxonomia de alguns grupos de espécies, como o grupo fraterculus, ainda não está adequadamente resolvida [21]. A taxonomia das espécies do gênero Anastrepha é baseada principalmente no padrão alar e na morfologia do ápice do acúleo (“ovipositor”). No grupo fraterculus, por exemplo, diferenças morfológicas sutis separam as espécies e muitas vezes os limites entre uma espécies e outra são dif́ıceis de serem reconhecidos [1, 27]. Nos últimos anos, foram realizados vários estudos sobre a identificação de espécies de Anastrepha, que não se restringiram apenas aos aspectos morfológicos, mas inclúıram também análises genéticas [28, 2] e de morfometria [1]. Entretanto, nenhuma técnica de análise de imagens computadorizada foi testada para a identificação de espécies de Anastrepha. As três espécies de Anastrepha estudadas - A. fraterculus, A.obliqua e A. sororcula - pertencem ao grupo fraterculus e diferem entre si principalmente pela morfologia do acúleo (Figura 5). São consideradas espécies-praga de importância quarentenária, encontradas com frequência no estado de São Paulo e são as que estão associadas com o maior número de plantas hospedeiras [36], isto é, são as que atacam um maior número de espécies de frutos. O uso de técnicas eficientes de identificação dessas espécies é de grande importância tanto para o desenvolvimento de novas abordagens de controle quanto para a solução de problemas quarentenários [27, 35]. 2.2 Classificação de Imagens A tarefa de classificação de imagens supervisionada consiste em categorizar novas imagens em classes previamente definidas. O fator determinante para que imagens pertençam a uma mesma classe é que tenham as mesmas propriedades visuais entre si. O problema central está em treinar um classificador de forma que indique a classe correta para um conjunto de imagens não conhecidas. Na classificação de imagens, existe a necessidade de uma coleção de imagens pré-classificadas e rotuladas, chamado de conjunto de treinamento. Esta coleção é utilizada no processo de apren- dizagem das caracteŕısticas que definem cada classe. Uma vez realizado esse aprendizado, podem-se classificar ou rotular imagens de interesse. As etapas do processo de classificação de imagens são: • Aquisição de imagem: inicialmente, deve-se construir uma base de dados de imagens de interesse; • pré-processamento: nesta etapa, utilizam-se técnicas de processamento de imagem para preparar todas as imagens da base de dados. Essas técnicas incluem, por exemplo, cropping (remover as partes que não interessam), realce e equalização do histograma (para acentuar propriedades visuais de interesse). • extração de caracteŕısticas: esta fase utiliza as imagens pré-processadas, ou seja, já tratadas na etapa anterior, e as organizam na forma de transações. As transações são registros de dados na forma {IdImage, Classlabel, F1, F2, ......Fn} em que F1, F2, ......Fn, são n vetores de caracteŕısticas extráıdos da imagem. As transações servirão de entrada para alguma técnica de classificação. Ao final deste processo, um modelo de classificação é gerado. • classificação: esta fase é a classificação propriamente dita, realizando a rotulação das novas imagens nas suas respectivas classes. 2.3 Técnicas de Classificação Esta seção apresenta as técnicas de aprendizagem que foram utilizadas nos experimentos realizados. 4 Faria, Perre, Zucchi, Lewinsohn, Rocha and Torres 2.3.1 Support Vector Machine (SVM) Support Vector Machine é uma técnica de aprendizagem de máquina, introduzida por [4] e funda- mentada em teorias estat́ısticas, em que são necessários exemplos previamente identificados para construir um modelo de classificação. O objetivo desta técnica é construir um hiperplano ótimo que separa o espaço n-dimensional (em que n é o número de caracteŕısticas da entidade que está sendo classificada, i.e., a dimensionalidade), tal que maximiza uma margem entre as duas classes. A margem pode ser interpretada como uma medida de separação entre duas classes e representa o grau de separabilidade entre elas (medida de qualidade da classificação). Os pontos sobre as fronteiras entre as classes são chamados de vetores de suporte (support vectors), e o meio da margem é o hiperplano de separação ótima. Quando não é posśıvel achar um separador linear entre as classes, os dados (caracteŕısticas) são mapeados em um espaço com alta dimensionalidade utilizando um mapeamento não linear. Segundo teorema de Cover [6], toda amostra que não é separável em um espaço pode ser mapeada em um outro espaço de maior dimensionalidade a partir de transfomações não lineares e tornando-se linearmente separáveis. A Figura 1 ilustra o uso do SVM para “separar” duas classes. Para maiores detalhes, sugere-se a consulta das referências [4, 13, 17, 5, 14] Figura 1: O classificador SVM encontra o hiperplano que separa as duas classes (quadrados e ćırculos) pela máxima margem posśıvel. 2.3.2 k-nearest neighbor (kNN) É a técnica mais simples de classificação de objetos que se baseia nos exemplos de treinamento mais próximos no espaço de caracteŕısticas [8]. A Equação 1 mostra o ajuste do kNN definido para x. kNN(x) = ∑ xi∈Nk(x) yi (1) em que Nk(x) são os k vizinhos mais próximos de x no conjunto de treinamento, yi é o valor de distância entre x e o vizinho xi atual (a função de distância usualmente utilizada é a distância Eu- clideana). A tarefa de classificação é decidida pela votação majoritária dos vizinhos mais próximos. A Figura 2 ilustra um exemplo de classificação usando kNN. 2.3.3 Bootstrap Aggregation (BAGG) Esta abordagem conhecida como Bootstrap aggregation ou Bagging consiste em avaliar as predições sobre uma coleção de amostras (bootstrap samples). Dado um conjunto inicial de treinamento Uso de técnicas de aprendizagem para classificação automática de moscas-das-frutas (Diptera, Tephritidae)5 Figura 2: (a) Amostras de duas classes (quadrado e ćırculo) no espaço de caracteŕısticas. (b) Dado um novo objeto desconhecido, os k = 5 vizinhos mais próximos a ele definirão sua classe. Neste caso, o ponto verde será classificado como pertencente à classe vermelha. T , este é dividido em B partes ou amostras iguais denotadas por Zi, i = 1, 2, ..., B [8]. Cada uma dessas amostras é usada no treinamento de B classificadores que, geralmente, são os mesmos. Após o treinamento, cada classificador obtém um coeficiente (α) que será utilizado na etapa de classificação. Dado um novo objeto a ser testado, os coeficientes referentes a cada um dos classificadores são usados e a classe atribúıda ao objeto será o resultado da votação majoritária entre os B classificadores [25]. Para cada elemento x, a predição ~f i(x) de cada classificador é armazenada e o resultado calculado: ~fbag(x) = 1 B B∑ i=1 ~f i(x) (2) A Figura 3 ilustra o treinamento e a classificação da abordagem Bagging. Figura 3: Treinamento e Classificação utilizando a abordagem Bagging. Retirado de [25]. 3 Metodologia Experimental Esta seção detalha a metodologia experimental empregada durante os experimentos realizados neste trabalho. 6 Faria, Perre, Zucchi, Lewinsohn, Rocha and Torres 3.1 Base de Imagens Foi utilizada a base ASAS com 146 imagens de asas de moscas-das-frutas (vide Figura 4) e base ACULEOS com 150 imagens de acúleos (vide Figura 5), representando 50 espécimes de cada uma das três espécies de moscas. Estas asas, e os respectivos acúleos, são provenientes de espécimes criados de amostras de árvores frut́ıferas de pomares experimentais e comerciais do Estado de São Paulo, depositados em coleções cient́ıficas do Depto. de Entomologia e Acarologia da ESALQ, USP, Piracicaba, SP (Prof. Dr. Roberto Zucchi), e do Instituto Biológico, Campinas, SP (Dr. Miguel Francisco de Souza Filho). (a) A. fraterculus(b) A. obliqua (c) A. sororcula Figura 4: Asas das três espécies de Anastrepha estudadas. (a) A. fraterculus (b) A. obliqua (c) A. sororcula Figura 5: Acúleos das três espécies de Anastrepha estudadas. 3.2 Cross Validation Foi utilizado o protocolo k-fold cross-validation. Neste protocolo, a base de dados original é separada aleatoriamente em k subconjuntos, sem repetição de imagens entre eles. Um subconjunto é escolhido para ser o conjunto de teste e os k − 1 subconjuntos são usados para treinar uma técnica de aprendizagem. O processo é repetido k vezes e cada subconjunto é “testado” apenas uma vez. O resultado final ou acurácia na tarefa de classificação pode ser a média aritmética entre todas as k classificações. Ao realizar as k repetições (rodadas) o protocolo garante que toda a base de dados será testada e o ideal é que a variabilidade dos acertos entre rodadas seja menor posśıvel. Nestes experimentos foi utilizado o protocolo 5-fold cross validation, com 80% das imagens para o conjunto de treinamento e 20% para teste. A medida de avaliação utilizada foi a média aritmética das porcentagens de acerto de cada classificação nas cinco rodadas do cross validation. 3.3 Descritor de Imagens Os descritores de imagens são utilizados para caracterizar ou descrever propriedades visuais (e.g., cor, textura e forma) dos dados da base. Um descritor é caracterizado por duas funções [32]: (1) um algoritmo de extração de caracteŕısticas ou evidências que codifica as propriedades dos dados Uso de técnicas de aprendizagem para classificação automática de moscas-das-frutas (Diptera, Tephritidae)7 em um vetor de caracteŕısticas; e (2) uma medida de similaridade (função de distância) que calcula a similaridade entre dois dados utilizando os vetores de caracteŕısticas correspondentes. A Tabela 1 mostra uma lista dos descritores utilizados nos experimentos. Esses descritores foram escolhidos levando em conta a boa eficácia que cada um deles obteve quando usados em outros tipos de imagens [24]. Descritor Tipo ACC [16] Cor BIC [29] Cor CCV [23] Cor GCH[30] Cor LCH[30] Cor EOAC [19] Forma HTD [20] Textura LAS [31] Textura QCCH [15] Textura Tabela 1: Descritores de imagem usados nos experimentos com imagens de moscas-das-frutas. 3.4 Segmentação de Imagens utilizando método Otsu O método Otsu [22] é usado para obter um limiar (threshold) ótimo que separa duas classes (e.g., objeto e fundo) buscando minimizar a variância intra-classe. Uma vez conseguido esse limiar, realiza-se a binarização/segmentação da imagem atribuindo valor “0” para os pixels com valores abaixo do limiar e “1” para valores maiores ou iguais ao limiar. A Figura 6 mostra imagens de asas antes e depois da segmentação/binarização. (a) Asa (b) Máscara - MASK (c) OTSU Figura 6: (a) Exemplo de imagem de asa de Anastrepha da coleção utilizada para desenvolvimento do presente trabalho. (b) Imagem de uma máscara genérica sem parte do fundo das imagens originais. (c) Imagem da asa após a segmentação utilizando método Otsu [22]. 4 Resultados Esta seção detalha os experimentos realizados para classificação de espécies de moscas-das-frutas utilizando imagens de asas e acúleos. 8 Faria, Perre, Zucchi, Lewinsohn, Rocha and Torres 4.1 Classificação Automática de Espécies de moscas-das-frutas Nestes os experimentos foram comparadas as técnicas de classificação k-nearest neighbor (kNN), Bagging (BAGG) e Support Vector Machine (SVM). Além disso, descritores de imagens (e.g., cor, textura e forma) foram utilizados com objetivo de encontrar a propriedade visual que melhor de- screvesse tais imagens. 4.1.1 Classificação utilizando asas Nos experimentos realizados na base ASAS, a técnica que obteve melhor acurácia (porcentagem de acerto) foi a SVM com 91,76% utilizando o descritor LCH (cor) e uma segmentação baseada no método Otsu (vide Figura 6 (c)). Da segunda à quarta posição ficou o kNN com diferentes valores de k utilizando descritor GCH e uma máscara genérica (vide Figura 6 (b)). Note que somente na sexta posição está o SVM utilizando o descritor GCH simples, demostrando a importância do uso de máscara nesse tipo de imagem (Tabela 2). Classificador Descritor Acurácia Desvio SVM LCH+OTSU 91,77 5,26 KNN-1 GCH+MASK 85,65 3,83 KNN-3 GCH+MASK 85,65 2,46 KNN-5 GCH+MASK 87,06 3,34 SVM LCH+MASK 87,06 3,95 SVM GCH 85,88 4,83 KNN-7 GCH 85,88 6,38 KNN-11 GCH 85,88 8,68 SVM CCV 85,29 3,6 BAGG-17 GCH+MASK 85,29 7,5 SVM GCH+MASK 85,29 8,32 Tabela 2: Melhores resultados de classifcação utilizando a base ASAS. 4.1.2 Classificação utilizando acúleos A técnica que obteve melhor acurácia (porcentagem de acerto) na base ACULEOS foi a SVM com 93,75% utilizando o descritor EOAC (forma). De segunda a sexta posição ficou o kNN com diferentes valores de k utilizando descritor EOAC. Note que os melhores resultados utilizaram o mesmo descritor de imagem (EOAC), demostrando a importância da propriedade “forma” nas imagens de acúleos (Tabela 3). 5 Considerações Finais Nos experimentos realizados neste trabalho foram identificadas algumas caracteŕısticas interessantes em cada um dos tipos de imagens analisadas. Nas imagens de asas a propriedade visual que mais se destacou foi um descritor de cor (LCH) alcançando 91,77% de acurácia. Já nas imagens de acúleos a propriedade visual que melhor descreveu foi um descritor de forma (EOAC), o qual alcançou 93,75% de acurácia. Para os dois tipos de imagens, a técnica de aprendizagem SVM foi a que obteve os melhores resultados de acurácia. Estes ńıveis de acurácia são equivalentes à expectativa de identificação visual por entomólogos experientes que não são especialistas no gênero Uso de técnicas de aprendizagem para classificação automática de moscas-das-frutas (Diptera, Tephritidae)9 Classificador Descritor Acurácia Desvio SVM EOAC 93,75 5,08 kNN-1 EOAC 91,91 5,37 kNN-3 EOAC 91,02 3,53 kNN-11 EOAC 90,48 5,90 kNN-7 EOAC 90,22 2,40 kNN-9 EOAC 89,56 4,04 SVM CCV 89,25 6,29 SVM LAS 88,97 3,60 SVM GCH 85,61 6,26 SVM BIC 84,29 5,68 Tabela 3: Melhores resultados de classifcação utilizando a base ACULEOS. Anastrepha, valendo-se de documentação publicada e coleções de referência (R. Zucchi, observação não publicada). Os posśıveis trabalhos futuros abrangem desde investigação de outros descritores de imagens e técnicas de aprendizagem à fusão de evidências e classificadores de imagens. Pretende-se também desenvolver um sistema computacional que possa ser utilizado por pesquisadores não-especialistas da biologia que necessitam realizar identificação de espécies em suas rotinas. Referências [1] E. L. Araujo. Estudo morfométrico no acúleo de cinco espécies de anastrepha schiner, 1868 (diptera: Tephritidae) do grupo fraterculus. Master’s thesis, Escola Superior de Agricultura Luiz de Queiroz, Universidade de São Paulo, Piracicaba, SP, Brazil, 1997. [2] Smith-Caldas M. R. B., Mcpheron B. A., J. G. Silva, and R. A. Zucchi. Phylogenetic relation- ships among species of the fraterculus group (anastrepha: Diptera: Tephritidae) inferred from dna sequences of mitochondrial cytochrome oxidase i. 2004. [3] M. Baylac, C. Villemant, and G. Simbolotti. Combining geometric morphometrics with pattern recognition for the investigation of species complexes. Biological Journal of the Linnean Society, 80(1):89–98, 2003. [4] Bernhard E. Boser, Isabelle M. Guyon, and Vladimir N. Vapnik. A training algorithm for opti- mal margin classifiers. In Proceedings of the fifth annual workshop on Computational learning theory, COLT ’92, pages 144–152, 1992. [5] Y. Cao, X. Jun, T. Liu, H. Li, Y. Huang, and H. Hon. Adapting ranking svm to document retrieval. In Proceedings of the 29th annual international ACM SIGIR conference on Research and development in information retrieval, pages 186–193, 2006. [6] T. M. Cover. Geometrical and statistical properties ofsystems of linear inequalities with appli- cations in pattern recognition. Electronic Computers, IEEE Transactions on, EC-14(3):326– 334, 1965. [7] P Fedor, I Malenovsk, J Vanhara, W Sierka, and J Havel. Thrips (thysanoptera) identification using artificial neural networks. Bulletin of Entomological Research, 98(5):437–447, 2008. 10 Faria, Perre, Zucchi, Lewinsohn, Rocha and Torres [8] J. Friedman, T. Hastie, and R. Tibshirani. The Elements of Statistical Learning. Springer, 1 edition, 2001. [9] K. J. Gaston and M. A. O’Neill. Automated species identification: why not? Philosophical Transactions of the Royal Society of London. Series B: Biological Sciences, 359(1444):655–667, April 2004. [10] Godfray. Challenges for taxonomy. Nature, 417(6884):17–19, May 2002. [11] P. D. N. Hebert, A. Cywinska, S. L. Ball, and J. R. Dewaard. Biological Identifications through DNA Barcodes. Proceedings of Biological Sciences, 270:313–321, 2003. [12] P. D. N. Hebert and T. R. Gregory. The Promise of DNA Barcoding for Taxonomy. Systematic Biology, 54(5):852–859, October 2005. [13] R. Herbrich, T. Graepel, and K. Obermayer. Large Margin Rank Boundaries for Ordinal Regression, pages 115–132. MIT Press, Cambridge, MA, 2000. [14] P. Hong, Q. Tian, and T. S. Huang. Incorporate support vector machines to content-based image retrieval with relevant feedback. In International Conference on Image Processing, pages 750–753, 2000. [15] C. Huang and Q. Liu. An orientation independent texture descriptor for image retrieval. In International Conference on Computational Science, pages 772–776, 2007. [16] J. Huang, R. Kumar, M. Mitra, W. Zhu, and R. Zabih. Image indexing using color correlograms. In Conference on Computer Vision and Pattern Recognition, pages 762–768, 1997. [17] Thorsten Joachims. Optimizing search engines using clickthrough data. In International Con- ference on Knowledge Discovery and Data Mining, pages 133–142, 2002. [18] Norman MacLeod, Mark Benfield, and Phil Culverhouse. Time to automate identification. Nature, 467(7312):154–155, September 2010. [19] F. Mahmoudi, J. Shanbehzadeh, A. Eftekhari-Moghadam, and H. Soltanian-Zadeh. Image retrieval based on shape similarity by edge orientation autocorrelogram. Pattern Recognition, 36(8):1725–1736, 2003. [20] B.S. Manjunath and W.Y. Ma. Texture features for browsing and retrieval of image data. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 18(8):837 –842, aug 1996. [21] A.L. Norrbon, R.A. Zucchi, and V. Hernandez-Ortiz. Phylogeny of the genera Anastrepha and Toxotrypana (Trypetinae: Toxotrypanini) based on morphology. Fruit flies (Tephritidae): phylogeny and evolution of behavior. Boca Raton: CRC Pressp, 299-342, 1999. [22] N. Otsu. A threshold selection method from gray-level histograms. Systems, Man and Cyber- netics, IEEE Transactions on, 9(1):62 –66, jan. 1979. [23] G. Pass, R. Zabih, and J. Miller. Comparing images using color coherence vectors. In ACM Multimedia, pages 65–73, 1996. [24] O. A. B. Penatti, E. Valle, and R. da S. Torres. Comparative study of global color and texture descriptors for web image retrieval. Journal of Visual Communication and Image Representation, 23(2):359–380, 2012. Uso de técnicas de aprendizagem para classificação automática de moscas-das-frutas (Diptera, Tephritidae)11 [25] A. Rocha. Randomização progressiva para esteganálise. Master’s thesis, Campinas, SP, Brazil, 2006. [26] J. L A Salle, Q. Wheeler, P. Jackway, and S. Winterton. Accelerating taxonomic discovery through automated character extraction. Zootaxa, 55(2217):43 – 55, 2009. [27] D. Selivon, A. Malavasi, and R. A. Zucchi. Relações com plantas hospedeiras. Moscas-das-frutas de importância econômica no Brasil: conhecimento básico e aplicado. pages 87–92, 2000. [28] O. L. R. Silva, A. Malavasi, and R. A. Zucchi. Controle do trânsito de hospedeiros de moscas- das-frutas. Moscas-das-frutas de importância econômica no Brasil: conhecimento básico e apli- cado. pages 29–40, 2000. [29] R. Stehling, M. Nascimento, and A. Falcao. A compact and efficient image retrieval approach based on border/interior pixel classification. In International Conference on Information and Knowledge Management, pages 102–109, 2002. [30] M. Swain and D. Ballard. Color indexing. International Journal of Computer Vision, 7(1):11– 32, 1991. [31] B. Tao and B. Dickinson. Texture recognition and image retrieval using gradient indexing. Journal of Visual Communication and Image Representation, 11(3):327–342, 2000. [32] R. Torres and A. X. Falcão. Content-based image retrieval: Theory and applications. Revista de Informática Teórica e Aplicada, 13(2):161–185, 2006. [33] P. J. D. Weeks, M. A. Oneill, K. J. Gaston, and I. D. Gauld. Automating insect identification: exploring the limitations of a prototype system. Journal of Applied Entomology, 123(1):1–8, 1999. [34] Quentin D. Wheeler, Peter H. Raven, and Edward O. Wilson. Taxonomy: impediment or expedient?: Science. 303(5656):285, 2004. [35] R. A. Zucchi. Taxonomia. Moscas-das-frutas de importância econômica no Brasil: conheci- mento básico e aplicado. pages 13–24, 2000. [36] Zucchi, R. A. Fruit flies in Brazil:Anastrephaspecies and their host plants and parasitoids. URL http://www.lea.esalq.usp.br/anastrepha/. Acessado em 09/02/2012.
Compartilhar