Buscar

12-10

Prévia do material em texto

�������������������� ��������������������������������������������������������������������������������������������
INSTITUTO DE COMPUTAÇÃO
UNIVERSIDADE ESTADUAL DE CAMPINAS
Uso de técnicas de aprendizagem para
classi�cação automática de moscas-das-frutas
(Diptera, Tephritidae)
F. A. Faria P. Perre R. A. Zucchi
T. Lewinsohn A. Rocha R. da S. Torres
Technical Report - IC-12-10 - Relatório Técnico
April - 2012 - Abril
The contents of this report are the sole responsibility of the authors.
O conteúdo do presente relatório é de única responsabilidade dos autores.
Uso de técnicas de aprendizagem para classificação automática de
moscas-das-frutas (Diptera, Tephritidae)
F. A. Faria∗ P. Perre, R. A. Zucchi† T. Lewinsohn‡ A. Rocha, R. da S. Torres§
Resumo
As moscas-das-frutas são pragas de importância quarentenária a ńıvel mundial, dentre as
quais se destacam algumas espécies de Anastrepha, que atacam um grande número de frut́ıferas
e estão amplamente distribúıdas pelo Brasil. A identificação das espécies de moscas-das frutas é
baseada nos caracteres morfológicos do mesonoto, asa e acúleo. Nos últimos anos, têm sido de-
senvolvidas ferramentas que complementam a taxonomia tradicional na identificação de algumas
espécies de insetos. Além de diminuir o tempo gasto pelos especialistas, essas novas ferramentas
podem permitir que um número maior de pesquisadores estude e/ou identifique esses insetos.
Sendo assim, o presente estudo tem como objetivo testar a eficácia de novas técnicas para iden-
tificação de três espécies de moscas-das-frutas. Neste trabalho, foram aplicadas e comparadas
técnicas de análise de imagens e aprendizagem de máquina na tarefa de classificação de moscas-
das-frutas, visando obter dados que possam futuramente servir de base para o desenvolvimento
de sistemas de identificação automática dessas espécies utilizando imagens de asas e acúleos.
1 Introdução
A identificação de organismos até o ńıvel de espécie é uma parte fundamental da maioria dos traba-
lhos em diferentes ramos da Biologia. A demanda pela identificação de organismos vem aumentando
dia a dia. Profissionais que trabalham com pragas agŕıcolas ou com segurança fitossanitária entre
fronteiras, por exemplo, necessitam cada vez mais identificar espécies de pragas potenciais, além de
conhecer suas caracteŕısticas biológicas, como, onde e quando podem encontrá-las [7]. A taxonomia
(ciência que classifica os organismos) é uma ciência que está encolhendo, apesar da demanda sobre
ela estar aumentando continuamente. Atualmente, há apenas cerca de 4.000 a 6.000 taxonomistas
profissionais no mundo [18]. A taxonomia clássica - baseada nas caracteŕısticas morfológicas dos
organismos - é feita predominantemente por taxonomistas especializados [34]. Para um pesquisador
não acostumado com a rotina taxonômica, a identificação desses organismos geralmente não é sim-
ples, uma vez que as chaves taxonômicas tradicionais são quase imposśıveis de serem usadas sem
uma coleção de referência e sem um extenso conhecimento dos organismos [33]. Dessa maneira,
a taxonomia tem se tornado uma barreira para o desenvolvimento de diversos ramos da Biologia,
impossibilitando-os de crescer e desenvolverem-se autonomamente [34]. Uma forma de atenuar esse
“impedimento taxonômico” é desenvolver alternativas para que os pesquisadores não-taxonomistas
possam realizar suas pesquisas sem depender totalmente do trabalho de um taxonomista [10]. Al-
gumas alternativas estão sendo testadas, como a identificação genética de espécimes a partir de
∗Instituto de Computação, Universidade Estadual de Campinas. Pesquisa desenvolvida com apoio financeiro
FAPESP, processo 2010/14910-0.
†Escola Superior de Agricultura “Luiz de Queiroz”, Universidade de São Paulo.
‡Instituto de Biologia, Universidade Estadual de Campinas.
§Instituto de Computação, Universidade Estadual de Campinas.
1
2 Faria, Perre, Zucchi, Lewinsohn, Rocha and Torres
um “código de barras”molecular [11, 12]; o acesso on-line a chaves de identificação simplificadas,
com imagens detalhadas de estruturas importantes para a identificação da espécie [9]; técnicas de
morfometria (multivariada e/ou geométrica) [3]; e técnicas de análise de imagens com uso de ferra-
mentas de identificação computadorizadas [33]. Uma das vantagens de se automatizar a identificação
de espécies, utilizando tecnologias como reconhecimento de padrões, inteligência artificial e apren-
dizado de máquina, é que a identificação de espécies passaria de uma função dependente de poucos
especialistas a uma ciência acesśıvel a quem necessite reconhecer espécimes, independentemente de
ser especialista ou não [26, 18].
A técnica de análise de imagens digitalizadas, em particular, tem avançado muito nos últimos
anos, aumentando a possibilidade da automatização, ou semiautomatização, de grande parte da
rotina da identificação taxonômica [9]. Há uma expectativa de que as técnicas de análise de imagens
representem um caminho rumo a um sistema de grande escala de identificação taxonômica baseada
em imagens computadorizadas [33]. Atualmente, não há um sistema robusto o suficiente quanto
a sua eficácia e amplo domı́nio de aplicação, porém algumas técnicas estão sendo desenvolvidas e
avaliadas [18].
As ferramentas alternativas de identificação são importantes, quando se trabalha principalmente
com grupos de dif́ıcil identificação, como é o caso das moscas-das-frutas do gênero Anastrepha do
grupo fraterculus. As ferramentas computacionais podem ser muito vantajosas na identificação
de espécies de Anastrepha, uma vez que são consideradas espécies pragas de grande importância
econômica e quarentenária.
O gênero Anastrepha tem como principal caráter para identificação de espécies a diferença na
morfologia do acúleo (“ovipositor” da fêmea) [35]. A dificuldade de análise morfológica do acúleo
está desde o processo de extração dessa estrutura de alguns miĺımetros à exigência de treinamento
a priori para a tarefa de reconhecimento da espécie.
O presente estudo tem como objetivo testar a eficácia de uma nova abordagem de análise de
imagens para identificação de três espécies de grande importncia econômica no Brasil (Anastrepha),
visando o desenvolvimento de um sistema de identificação automático de moscas-das-frutas, que
possa ser utilizado por um pesquisador não-especialista na taxonomia desses insetos. As con-
tribuições desse trabalho são: (1) A exploração de diferentes técnicas de descrição de imagens de
moscas-das-frutas; (2) Avaliação de diferentes técnicas de aprendizagem para reconhecimento de
espécies de moscas-das-frutas; (3) Implementação de um protótipo para reconhecimento de espécies
de moscas-das-frutas.
O restante do texto é organizado como segue: trabalhos relacionados (Seção 2); metodologia
experimental utilizada (Seção 3); resultados obtidos (Seção 4); considerações finais (Seção 5).
2 Trabalhos Correlatos
A seção apresenta os conceitos básicos e trabalhos correlatos.
2.1 Moscas-das-frutas - Gênero Anastrepha
As moscas-das-frutas (Diptera, Tephritidae) estão entre as principais pragas da fruticultura mundial
e estão amplamente distribúıdas no Brasil. As moscas-das-frutas de importância econômica no
Brasil são representadas por quatro gêneros: Anastrepha, Bactrocera, Ceratitis e Rhagoletis. O
gênero Anastrepha é o mais abundante, com 112 espécies registradas no páıs [36], mas apenas
sete são economicamente importantes: A. fraterculus (Wied.), A. grandis (Macquart), A. obliqua
(Macquart), A. pseudoparallela (Loew), A. sororcula Zucchi, A. striata (Schiner) e A. zenildae
Zucchi [35]. Apesar de o gênero ser composto por aproximadamente 215 espécies distribúıdas por
Uso de técnicas de aprendizagem para classificação automática de moscas-das-frutas (Diptera, Tephritidae)3
toda região Neotropicale parte da Neártica, a taxonomia de alguns grupos de espécies, como o
grupo fraterculus, ainda não está adequadamente resolvida [21].
A taxonomia das espécies do gênero Anastrepha é baseada principalmente no padrão alar e
na morfologia do ápice do acúleo (“ovipositor”). No grupo fraterculus, por exemplo, diferenças
morfológicas sutis separam as espécies e muitas vezes os limites entre uma espécies e outra são
dif́ıceis de serem reconhecidos [1, 27]. Nos últimos anos, foram realizados vários estudos sobre a
identificação de espécies de Anastrepha, que não se restringiram apenas aos aspectos morfológicos,
mas inclúıram também análises genéticas [28, 2] e de morfometria [1]. Entretanto, nenhuma técnica
de análise de imagens computadorizada foi testada para a identificação de espécies de Anastrepha.
As três espécies de Anastrepha estudadas - A. fraterculus, A.obliqua e A. sororcula - pertencem
ao grupo fraterculus e diferem entre si principalmente pela morfologia do acúleo (Figura 5). São
consideradas espécies-praga de importância quarentenária, encontradas com frequência no estado de
São Paulo e são as que estão associadas com o maior número de plantas hospedeiras [36], isto é, são
as que atacam um maior número de espécies de frutos. O uso de técnicas eficientes de identificação
dessas espécies é de grande importância tanto para o desenvolvimento de novas abordagens de
controle quanto para a solução de problemas quarentenários [27, 35].
2.2 Classificação de Imagens
A tarefa de classificação de imagens supervisionada consiste em categorizar novas imagens em classes
previamente definidas. O fator determinante para que imagens pertençam a uma mesma classe é
que tenham as mesmas propriedades visuais entre si. O problema central está em treinar um
classificador de forma que indique a classe correta para um conjunto de imagens não conhecidas.
Na classificação de imagens, existe a necessidade de uma coleção de imagens pré-classificadas
e rotuladas, chamado de conjunto de treinamento. Esta coleção é utilizada no processo de apren-
dizagem das caracteŕısticas que definem cada classe. Uma vez realizado esse aprendizado, podem-se
classificar ou rotular imagens de interesse.
As etapas do processo de classificação de imagens são:
• Aquisição de imagem: inicialmente, deve-se construir uma base de dados de imagens de
interesse;
• pré-processamento: nesta etapa, utilizam-se técnicas de processamento de imagem para
preparar todas as imagens da base de dados. Essas técnicas incluem, por exemplo, cropping
(remover as partes que não interessam), realce e equalização do histograma (para acentuar
propriedades visuais de interesse).
• extração de caracteŕısticas: esta fase utiliza as imagens pré-processadas, ou seja, já
tratadas na etapa anterior, e as organizam na forma de transações. As transações são registros
de dados na forma {IdImage, Classlabel, F1, F2, ......Fn} em que F1, F2, ......Fn, são n vetores de
caracteŕısticas extráıdos da imagem. As transações servirão de entrada para alguma técnica
de classificação. Ao final deste processo, um modelo de classificação é gerado.
• classificação: esta fase é a classificação propriamente dita, realizando a rotulação das novas
imagens nas suas respectivas classes.
2.3 Técnicas de Classificação
Esta seção apresenta as técnicas de aprendizagem que foram utilizadas nos experimentos realizados.
4 Faria, Perre, Zucchi, Lewinsohn, Rocha and Torres
2.3.1 Support Vector Machine (SVM)
Support Vector Machine é uma técnica de aprendizagem de máquina, introduzida por [4] e funda-
mentada em teorias estat́ısticas, em que são necessários exemplos previamente identificados para
construir um modelo de classificação. O objetivo desta técnica é construir um hiperplano ótimo
que separa o espaço n-dimensional (em que n é o número de caracteŕısticas da entidade que está
sendo classificada, i.e., a dimensionalidade), tal que maximiza uma margem entre as duas classes. A
margem pode ser interpretada como uma medida de separação entre duas classes e representa o grau
de separabilidade entre elas (medida de qualidade da classificação). Os pontos sobre as fronteiras
entre as classes são chamados de vetores de suporte (support vectors), e o meio da margem é o
hiperplano de separação ótima. Quando não é posśıvel achar um separador linear entre as classes,
os dados (caracteŕısticas) são mapeados em um espaço com alta dimensionalidade utilizando um
mapeamento não linear. Segundo teorema de Cover [6], toda amostra que não é separável em um
espaço pode ser mapeada em um outro espaço de maior dimensionalidade a partir de transfomações
não lineares e tornando-se linearmente separáveis. A Figura 1 ilustra o uso do SVM para “separar”
duas classes. Para maiores detalhes, sugere-se a consulta das referências [4, 13, 17, 5, 14]
Figura 1: O classificador SVM encontra o hiperplano que separa as duas classes (quadrados e
ćırculos) pela máxima margem posśıvel.
2.3.2 k-nearest neighbor (kNN)
É a técnica mais simples de classificação de objetos que se baseia nos exemplos de treinamento mais
próximos no espaço de caracteŕısticas [8]. A Equação 1 mostra o ajuste do kNN definido para x.
kNN(x) =
∑
xi∈Nk(x)
yi (1)
em que Nk(x) são os k vizinhos mais próximos de x no conjunto de treinamento, yi é o valor de
distância entre x e o vizinho xi atual (a função de distância usualmente utilizada é a distância Eu-
clideana). A tarefa de classificação é decidida pela votação majoritária dos vizinhos mais próximos.
A Figura 2 ilustra um exemplo de classificação usando kNN.
2.3.3 Bootstrap Aggregation (BAGG)
Esta abordagem conhecida como Bootstrap aggregation ou Bagging consiste em avaliar as predições
sobre uma coleção de amostras (bootstrap samples). Dado um conjunto inicial de treinamento
Uso de técnicas de aprendizagem para classificação automática de moscas-das-frutas (Diptera, Tephritidae)5
Figura 2: (a) Amostras de duas classes (quadrado e ćırculo) no espaço de caracteŕısticas. (b) Dado
um novo objeto desconhecido, os k = 5 vizinhos mais próximos a ele definirão sua classe. Neste
caso, o ponto verde será classificado como pertencente à classe vermelha.
T , este é dividido em B partes ou amostras iguais denotadas por Zi, i = 1, 2, ..., B [8]. Cada uma
dessas amostras é usada no treinamento de B classificadores que, geralmente, são os mesmos. Após o
treinamento, cada classificador obtém um coeficiente (α) que será utilizado na etapa de classificação.
Dado um novo objeto a ser testado, os coeficientes referentes a cada um dos classificadores são usados
e a classe atribúıda ao objeto será o resultado da votação majoritária entre os B classificadores [25].
Para cada elemento x, a predição ~f i(x) de cada classificador é armazenada e o resultado calculado:
~fbag(x) =
1
B
B∑
i=1
~f i(x) (2)
A Figura 3 ilustra o treinamento e a classificação da abordagem Bagging.
Figura 3: Treinamento e Classificação utilizando a abordagem Bagging. Retirado de [25].
3 Metodologia Experimental
Esta seção detalha a metodologia experimental empregada durante os experimentos realizados neste
trabalho.
6 Faria, Perre, Zucchi, Lewinsohn, Rocha and Torres
3.1 Base de Imagens
Foi utilizada a base ASAS com 146 imagens de asas de moscas-das-frutas (vide Figura 4) e base
ACULEOS com 150 imagens de acúleos (vide Figura 5), representando 50 espécimes de cada uma
das três espécies de moscas. Estas asas, e os respectivos acúleos, são provenientes de espécimes
criados de amostras de árvores frut́ıferas de pomares experimentais e comerciais do Estado de São
Paulo, depositados em coleções cient́ıficas do Depto. de Entomologia e Acarologia da ESALQ, USP,
Piracicaba, SP (Prof. Dr. Roberto Zucchi), e do Instituto Biológico, Campinas, SP (Dr. Miguel
Francisco de Souza Filho).
(a) A. fraterculus(b) A. obliqua (c) A. sororcula
Figura 4: Asas das três espécies de Anastrepha estudadas.
(a) A. fraterculus (b) A. obliqua (c) A. sororcula
Figura 5: Acúleos das três espécies de Anastrepha estudadas.
3.2 Cross Validation
Foi utilizado o protocolo k-fold cross-validation. Neste protocolo, a base de dados original é separada
aleatoriamente em k subconjuntos, sem repetição de imagens entre eles. Um subconjunto é escolhido
para ser o conjunto de teste e os k − 1 subconjuntos são usados para treinar uma técnica de
aprendizagem. O processo é repetido k vezes e cada subconjunto é “testado” apenas uma vez. O
resultado final ou acurácia na tarefa de classificação pode ser a média aritmética entre todas as k
classificações. Ao realizar as k repetições (rodadas) o protocolo garante que toda a base de dados
será testada e o ideal é que a variabilidade dos acertos entre rodadas seja menor posśıvel.
Nestes experimentos foi utilizado o protocolo 5-fold cross validation, com 80% das imagens para
o conjunto de treinamento e 20% para teste. A medida de avaliação utilizada foi a média aritmética
das porcentagens de acerto de cada classificação nas cinco rodadas do cross validation.
3.3 Descritor de Imagens
Os descritores de imagens são utilizados para caracterizar ou descrever propriedades visuais (e.g.,
cor, textura e forma) dos dados da base. Um descritor é caracterizado por duas funções [32]: (1)
um algoritmo de extração de caracteŕısticas ou evidências que codifica as propriedades dos dados
Uso de técnicas de aprendizagem para classificação automática de moscas-das-frutas (Diptera, Tephritidae)7
em um vetor de caracteŕısticas; e (2) uma medida de similaridade (função de distância) que calcula
a similaridade entre dois dados utilizando os vetores de caracteŕısticas correspondentes. A Tabela
1 mostra uma lista dos descritores utilizados nos experimentos. Esses descritores foram escolhidos
levando em conta a boa eficácia que cada um deles obteve quando usados em outros tipos de
imagens [24].
Descritor Tipo
ACC [16] Cor
BIC [29] Cor
CCV [23] Cor
GCH[30] Cor
LCH[30] Cor
EOAC [19] Forma
HTD [20] Textura
LAS [31] Textura
QCCH [15] Textura
Tabela 1: Descritores de imagem usados nos experimentos com imagens de moscas-das-frutas.
3.4 Segmentação de Imagens utilizando método Otsu
O método Otsu [22] é usado para obter um limiar (threshold) ótimo que separa duas classes (e.g.,
objeto e fundo) buscando minimizar a variância intra-classe. Uma vez conseguido esse limiar,
realiza-se a binarização/segmentação da imagem atribuindo valor “0” para os pixels com valores
abaixo do limiar e “1” para valores maiores ou iguais ao limiar. A Figura 6 mostra imagens de asas
antes e depois da segmentação/binarização.
(a) Asa (b) Máscara - MASK (c) OTSU
Figura 6: (a) Exemplo de imagem de asa de Anastrepha da coleção utilizada para desenvolvimento
do presente trabalho. (b) Imagem de uma máscara genérica sem parte do fundo das imagens
originais. (c) Imagem da asa após a segmentação utilizando método Otsu [22].
4 Resultados
Esta seção detalha os experimentos realizados para classificação de espécies de moscas-das-frutas
utilizando imagens de asas e acúleos.
8 Faria, Perre, Zucchi, Lewinsohn, Rocha and Torres
4.1 Classificação Automática de Espécies de moscas-das-frutas
Nestes os experimentos foram comparadas as técnicas de classificação k-nearest neighbor (kNN),
Bagging (BAGG) e Support Vector Machine (SVM). Além disso, descritores de imagens (e.g., cor,
textura e forma) foram utilizados com objetivo de encontrar a propriedade visual que melhor de-
screvesse tais imagens.
4.1.1 Classificação utilizando asas
Nos experimentos realizados na base ASAS, a técnica que obteve melhor acurácia (porcentagem de
acerto) foi a SVM com 91,76% utilizando o descritor LCH (cor) e uma segmentação baseada no
método Otsu (vide Figura 6 (c)). Da segunda à quarta posição ficou o kNN com diferentes valores
de k utilizando descritor GCH e uma máscara genérica (vide Figura 6 (b)). Note que somente na
sexta posição está o SVM utilizando o descritor GCH simples, demostrando a importância do uso
de máscara nesse tipo de imagem (Tabela 2).
Classificador Descritor Acurácia Desvio
SVM LCH+OTSU 91,77 5,26
KNN-1 GCH+MASK 85,65 3,83
KNN-3 GCH+MASK 85,65 2,46
KNN-5 GCH+MASK 87,06 3,34
SVM LCH+MASK 87,06 3,95
SVM GCH 85,88 4,83
KNN-7 GCH 85,88 6,38
KNN-11 GCH 85,88 8,68
SVM CCV 85,29 3,6
BAGG-17 GCH+MASK 85,29 7,5
SVM GCH+MASK 85,29 8,32
Tabela 2: Melhores resultados de classifcação utilizando a base ASAS.
4.1.2 Classificação utilizando acúleos
A técnica que obteve melhor acurácia (porcentagem de acerto) na base ACULEOS foi a SVM
com 93,75% utilizando o descritor EOAC (forma). De segunda a sexta posição ficou o kNN com
diferentes valores de k utilizando descritor EOAC. Note que os melhores resultados utilizaram o
mesmo descritor de imagem (EOAC), demostrando a importância da propriedade “forma” nas
imagens de acúleos (Tabela 3).
5 Considerações Finais
Nos experimentos realizados neste trabalho foram identificadas algumas caracteŕısticas interessantes
em cada um dos tipos de imagens analisadas. Nas imagens de asas a propriedade visual que mais
se destacou foi um descritor de cor (LCH) alcançando 91,77% de acurácia. Já nas imagens de
acúleos a propriedade visual que melhor descreveu foi um descritor de forma (EOAC), o qual
alcançou 93,75% de acurácia. Para os dois tipos de imagens, a técnica de aprendizagem SVM
foi a que obteve os melhores resultados de acurácia. Estes ńıveis de acurácia são equivalentes à
expectativa de identificação visual por entomólogos experientes que não são especialistas no gênero
Uso de técnicas de aprendizagem para classificação automática de moscas-das-frutas (Diptera, Tephritidae)9
Classificador Descritor Acurácia Desvio
SVM EOAC 93,75 5,08
kNN-1 EOAC 91,91 5,37
kNN-3 EOAC 91,02 3,53
kNN-11 EOAC 90,48 5,90
kNN-7 EOAC 90,22 2,40
kNN-9 EOAC 89,56 4,04
SVM CCV 89,25 6,29
SVM LAS 88,97 3,60
SVM GCH 85,61 6,26
SVM BIC 84,29 5,68
Tabela 3: Melhores resultados de classifcação utilizando a base ACULEOS.
Anastrepha, valendo-se de documentação publicada e coleções de referência (R. Zucchi, observação
não publicada).
Os posśıveis trabalhos futuros abrangem desde investigação de outros descritores de imagens e
técnicas de aprendizagem à fusão de evidências e classificadores de imagens. Pretende-se também
desenvolver um sistema computacional que possa ser utilizado por pesquisadores não-especialistas
da biologia que necessitam realizar identificação de espécies em suas rotinas.
Referências
[1] E. L. Araujo. Estudo morfométrico no acúleo de cinco espécies de anastrepha schiner, 1868
(diptera: Tephritidae) do grupo fraterculus. Master’s thesis, Escola Superior de Agricultura
Luiz de Queiroz, Universidade de São Paulo, Piracicaba, SP, Brazil, 1997.
[2] Smith-Caldas M. R. B., Mcpheron B. A., J. G. Silva, and R. A. Zucchi. Phylogenetic relation-
ships among species of the fraterculus group (anastrepha: Diptera: Tephritidae) inferred from
dna sequences of mitochondrial cytochrome oxidase i. 2004.
[3] M. Baylac, C. Villemant, and G. Simbolotti. Combining geometric morphometrics with pattern
recognition for the investigation of species complexes. Biological Journal of the Linnean Society,
80(1):89–98, 2003.
[4] Bernhard E. Boser, Isabelle M. Guyon, and Vladimir N. Vapnik. A training algorithm for opti-
mal margin classifiers. In Proceedings of the fifth annual workshop on Computational learning
theory, COLT ’92, pages 144–152, 1992.
[5] Y. Cao, X. Jun, T. Liu, H. Li, Y. Huang, and H. Hon. Adapting ranking svm to document
retrieval. In Proceedings of the 29th annual international ACM SIGIR conference on Research
and development in information retrieval, pages 186–193, 2006.
[6] T. M. Cover. Geometrical and statistical properties ofsystems of linear inequalities with appli-
cations in pattern recognition. Electronic Computers, IEEE Transactions on, EC-14(3):326–
334, 1965.
[7] P Fedor, I Malenovsk, J Vanhara, W Sierka, and J Havel. Thrips (thysanoptera) identification
using artificial neural networks. Bulletin of Entomological Research, 98(5):437–447, 2008.
10 Faria, Perre, Zucchi, Lewinsohn, Rocha and Torres
[8] J. Friedman, T. Hastie, and R. Tibshirani. The Elements of Statistical Learning. Springer, 1
edition, 2001.
[9] K. J. Gaston and M. A. O’Neill. Automated species identification: why not? Philosophical
Transactions of the Royal Society of London. Series B: Biological Sciences, 359(1444):655–667,
April 2004.
[10] Godfray. Challenges for taxonomy. Nature, 417(6884):17–19, May 2002.
[11] P. D. N. Hebert, A. Cywinska, S. L. Ball, and J. R. Dewaard. Biological Identifications through
DNA Barcodes. Proceedings of Biological Sciences, 270:313–321, 2003.
[12] P. D. N. Hebert and T. R. Gregory. The Promise of DNA Barcoding for Taxonomy. Systematic
Biology, 54(5):852–859, October 2005.
[13] R. Herbrich, T. Graepel, and K. Obermayer. Large Margin Rank Boundaries for Ordinal
Regression, pages 115–132. MIT Press, Cambridge, MA, 2000.
[14] P. Hong, Q. Tian, and T. S. Huang. Incorporate support vector machines to content-based
image retrieval with relevant feedback. In International Conference on Image Processing, pages
750–753, 2000.
[15] C. Huang and Q. Liu. An orientation independent texture descriptor for image retrieval. In
International Conference on Computational Science, pages 772–776, 2007.
[16] J. Huang, R. Kumar, M. Mitra, W. Zhu, and R. Zabih. Image indexing using color correlograms.
In Conference on Computer Vision and Pattern Recognition, pages 762–768, 1997.
[17] Thorsten Joachims. Optimizing search engines using clickthrough data. In International Con-
ference on Knowledge Discovery and Data Mining, pages 133–142, 2002.
[18] Norman MacLeod, Mark Benfield, and Phil Culverhouse. Time to automate identification.
Nature, 467(7312):154–155, September 2010.
[19] F. Mahmoudi, J. Shanbehzadeh, A. Eftekhari-Moghadam, and H. Soltanian-Zadeh. Image
retrieval based on shape similarity by edge orientation autocorrelogram. Pattern Recognition,
36(8):1725–1736, 2003.
[20] B.S. Manjunath and W.Y. Ma. Texture features for browsing and retrieval of image data.
Pattern Analysis and Machine Intelligence, IEEE Transactions on, 18(8):837 –842, aug 1996.
[21] A.L. Norrbon, R.A. Zucchi, and V. Hernandez-Ortiz. Phylogeny of the genera Anastrepha
and Toxotrypana (Trypetinae: Toxotrypanini) based on morphology. Fruit flies (Tephritidae):
phylogeny and evolution of behavior. Boca Raton: CRC Pressp, 299-342, 1999.
[22] N. Otsu. A threshold selection method from gray-level histograms. Systems, Man and Cyber-
netics, IEEE Transactions on, 9(1):62 –66, jan. 1979.
[23] G. Pass, R. Zabih, and J. Miller. Comparing images using color coherence vectors. In ACM
Multimedia, pages 65–73, 1996.
[24] O. A. B. Penatti, E. Valle, and R. da S. Torres. Comparative study of global color and
texture descriptors for web image retrieval. Journal of Visual Communication and Image
Representation, 23(2):359–380, 2012.
Uso de técnicas de aprendizagem para classificação automática de moscas-das-frutas (Diptera, Tephritidae)11
[25] A. Rocha. Randomização progressiva para esteganálise. Master’s thesis, Campinas, SP, Brazil,
2006.
[26] J. L A Salle, Q. Wheeler, P. Jackway, and S. Winterton. Accelerating taxonomic discovery
through automated character extraction. Zootaxa, 55(2217):43 – 55, 2009.
[27] D. Selivon, A. Malavasi, and R. A. Zucchi. Relações com plantas hospedeiras. Moscas-das-frutas
de importância econômica no Brasil: conhecimento básico e aplicado. pages 87–92, 2000.
[28] O. L. R. Silva, A. Malavasi, and R. A. Zucchi. Controle do trânsito de hospedeiros de moscas-
das-frutas. Moscas-das-frutas de importância econômica no Brasil: conhecimento básico e apli-
cado. pages 29–40, 2000.
[29] R. Stehling, M. Nascimento, and A. Falcao. A compact and efficient image retrieval approach
based on border/interior pixel classification. In International Conference on Information and
Knowledge Management, pages 102–109, 2002.
[30] M. Swain and D. Ballard. Color indexing. International Journal of Computer Vision, 7(1):11–
32, 1991.
[31] B. Tao and B. Dickinson. Texture recognition and image retrieval using gradient indexing.
Journal of Visual Communication and Image Representation, 11(3):327–342, 2000.
[32] R. Torres and A. X. Falcão. Content-based image retrieval: Theory and applications. Revista
de Informática Teórica e Aplicada, 13(2):161–185, 2006.
[33] P. J. D. Weeks, M. A. Oneill, K. J. Gaston, and I. D. Gauld. Automating insect identification:
exploring the limitations of a prototype system. Journal of Applied Entomology, 123(1):1–8,
1999.
[34] Quentin D. Wheeler, Peter H. Raven, and Edward O. Wilson. Taxonomy: impediment or
expedient?: Science. 303(5656):285, 2004.
[35] R. A. Zucchi. Taxonomia. Moscas-das-frutas de importância econômica no Brasil: conheci-
mento básico e aplicado. pages 13–24, 2000.
[36] Zucchi, R. A. Fruit flies in Brazil:Anastrephaspecies and their host plants and parasitoids.
URL http://www.lea.esalq.usp.br/anastrepha/. Acessado em 09/02/2012.

Continue navegando