12-10

Administração

•
Humanas / Sociais

Aprendendo na Facul
22/01/2023
E aí, curtiu este material?
Ajude a incentivar outros estudantes a melhorar o conteúdo
Gostou desse material? Compartilhe! 🧡
Administração

601.184 Materiais compartilhados
Baixe o app para aproveitar ainda mais
Leia os materiais offline, sem usar a internet. Além de vários outros recursos!
Prévia do material em texto
�������������������� ��������������������������������������������������������������������������������������������
INSTITUTO DE COMPUTAÇÃO
UNIVERSIDADE ESTADUAL DE CAMPINAS
Uso de técnicas de aprendizagem para
classi�cação automática de moscas-das-frutas
(Diptera, Tephritidae)
F. A. Faria P. Perre R. A. Zucchi
T. Lewinsohn A. Rocha R. da S. Torres
Technical Report - IC-12-10 - Relatório Técnico
April - 2012 - Abril
The contents of this report are the sole responsibility of the authors.
O conteúdo do presente relatório é de única responsabilidade dos autores.
Uso de técnicas de aprendizagem para classificação automática de
moscas-das-frutas (Diptera, Tephritidae)
F. A. Faria∗ P. Perre, R. A. Zucchi† T. Lewinsohn‡ A. Rocha, R. da S. Torres§
Resumo
As moscas-das-frutas são pragas de importância quarentenária a ńıvel mundial, dentre as
quais se destacam algumas espécies de Anastrepha, que atacam um grande número de frut́ıferas
e estão amplamente distribúıdas pelo Brasil. A identificação das espécies de moscas-das frutas é
baseada nos caracteres morfológicos do mesonoto, asa e acúleo. Nos últimos anos, têm sido de-
senvolvidas ferramentas que complementam a taxonomia tradicional na identificação de algumas
espécies de insetos. Além de diminuir o tempo gasto pelos especialistas, essas novas ferramentas
podem permitir que um número maior de pesquisadores estude e/ou identifique esses insetos.
Sendo assim, o presente estudo tem como objetivo testar a eficácia de novas técnicas para iden-
tificação de três espécies de moscas-das-frutas. Neste trabalho, foram aplicadas e comparadas
técnicas de análise de imagens e aprendizagem de máquina na tarefa de classificação de moscas-
das-frutas, visando obter dados que possam futuramente servir de base para o desenvolvimento
de sistemas de identificação automática dessas espécies utilizando imagens de asas e acúleos.
1 Introdução
A identificação de organismos até o ńıvel de espécie é uma parte fundamental da maioria dos traba-
lhos em diferentes ramos da Biologia. A demanda pela identificação de organismos vem aumentando
dia a dia. Profissionais que trabalham com pragas agŕıcolas ou com segurança fitossanitária entre
fronteiras, por exemplo, necessitam cada vez mais identificar espécies de pragas potenciais, além de
conhecer suas caracteŕısticas biológicas, como, onde e quando podem encontrá-las [7]. A taxonomia
(ciência que classifica os organismos) é uma ciência que está encolhendo, apesar da demanda sobre
ela estar aumentando continuamente. Atualmente, há apenas cerca de 4.000 a 6.000 taxonomistas
profissionais no mundo [18]. A taxonomia clássica - baseada nas caracteŕısticas morfológicas dos
organismos - é feita predominantemente por taxonomistas especializados [34]. Para um pesquisador
não acostumado com a rotina taxonômica, a identificação desses organismos geralmente não é sim-
ples, uma vez que as chaves taxonômicas tradicionais são quase imposśıveis de serem usadas sem
uma coleção de referência e sem um extenso conhecimento dos organismos [33]. Dessa maneira,
a taxonomia tem se tornado uma barreira para o desenvolvimento de diversos ramos da Biologia,
impossibilitando-os de crescer e desenvolverem-se autonomamente [34]. Uma forma de atenuar esse
“impedimento taxonômico” é desenvolver alternativas para que os pesquisadores não-taxonomistas
possam realizar suas pesquisas sem depender totalmente do trabalho de um taxonomista [10]. Al-
gumas alternativas estão sendo testadas, como a identificação genética de espécimes a partir de
∗Instituto de Computação, Universidade Estadual de Campinas. Pesquisa desenvolvida com apoio financeiro
FAPESP, processo 2010/14910-0.
†Escola Superior de Agricultura “Luiz de Queiroz”, Universidade de São Paulo.
‡Instituto de Biologia, Universidade Estadual de Campinas.
§Instituto de Computação, Universidade Estadual de Campinas.
1
2 Faria, Perre, Zucchi, Lewinsohn, Rocha and Torres
um “código de barras”molecular [11, 12]; o acesso on-line a chaves de identificação simplificadas,
com imagens detalhadas de estruturas importantes para a identificação da espécie [9]; técnicas de
morfometria (multivariada e/ou geométrica) [3]; e técnicas de análise de imagens com uso de ferra-
mentas de identificação computadorizadas [33]. Uma das vantagens de se automatizar a identificação
de espécies, utilizando tecnologias como reconhecimento de padrões, inteligência artificial e apren-
dizado de máquina, é que a identificação de espécies passaria de uma função dependente de poucos
especialistas a uma ciência acesśıvel a quem necessite reconhecer espécimes, independentemente de
ser especialista ou não [26, 18].
A técnica de análise de imagens digitalizadas, em particular, tem avançado muito nos últimos
anos, aumentando a possibilidade da automatização, ou semiautomatização, de grande parte da
rotina da identificação taxonômica [9]. Há uma expectativa de que as técnicas de análise de imagens
representem um caminho rumo a um sistema de grande escala de identificação taxonômica baseada
em imagens computadorizadas [33]. Atualmente, não há um sistema robusto o suficiente quanto
a sua eficácia e amplo domı́nio de aplicação, porém algumas técnicas estão sendo desenvolvidas e
avaliadas [18].
As ferramentas alternativas de identificação são importantes, quando se trabalha principalmente
com grupos de dif́ıcil identificação, como é o caso das moscas-das-frutas do gênero Anastrepha do
grupo fraterculus. As ferramentas computacionais podem ser muito vantajosas na identificação
de espécies de Anastrepha, uma vez que são consideradas espécies pragas de grande importância
econômica e quarentenária.
O gênero Anastrepha tem como principal caráter para identificação de espécies a diferença na
morfologia do acúleo (“ovipositor” da fêmea) [35]. A dificuldade de análise morfológica do acúleo
está desde o processo de extração dessa estrutura de alguns miĺımetros à exigência de treinamento
a priori para a tarefa de reconhecimento da espécie.
O presente estudo tem como objetivo testar a eficácia de uma nova abordagem de análise de
imagens para identificação de três espécies de grande importncia econômica no Brasil (Anastrepha),
visando o desenvolvimento de um sistema de identificação automático de moscas-das-frutas, que
possa ser utilizado por um pesquisador não-especialista na taxonomia desses insetos. As con-
tribuições desse trabalho são: (1) A exploração de diferentes técnicas de descrição de imagens de
moscas-das-frutas; (2) Avaliação de diferentes técnicas de aprendizagem para reconhecimento de
espécies de moscas-das-frutas; (3) Implementação de um protótipo para reconhecimento de espécies
de moscas-das-frutas.
O restante do texto é organizado como segue: trabalhos relacionados (Seção 2); metodologia
experimental utilizada (Seção 3); resultados obtidos (Seção 4); considerações finais (Seção 5).
2 Trabalhos Correlatos
A seção apresenta os conceitos básicos e trabalhos correlatos.
2.1 Moscas-das-frutas - Gênero Anastrepha
As moscas-das-frutas (Diptera, Tephritidae) estão entre as principais pragas da fruticultura mundial
e estão amplamente distribúıdas no Brasil. As moscas-das-frutas de importância econômica no
Brasil são representadas por quatro gêneros: Anastrepha, Bactrocera, Ceratitis e Rhagoletis. O
gênero Anastrepha é o mais abundante, com 112 espécies registradas no páıs [36], mas apenas
sete são economicamente importantes: A. fraterculus (Wied.), A. grandis (Macquart), A. obliqua
(Macquart), A. pseudoparallela (Loew), A. sororcula Zucchi, A. striata (Schiner) e A. zenildae
Zucchi [35]. Apesar de o gênero ser composto por aproximadamente 215 espécies distribúıdas por
Uso de técnicas de aprendizagem para classificação automática de moscas-das-frutas (Diptera, Tephritidae)3
toda região Neotropicale parte da Neártica, a taxonomia de alguns grupos de espécies, como o
grupo fraterculus, ainda não está adequadamente resolvida [21].
A taxonomia das espécies do gênero Anastrepha é baseada principalmente no padrão alar e
na morfologia do ápice do acúleo (“ovipositor”). No grupo fraterculus, por exemplo, diferenças
morfológicas sutis separam as espécies e muitas vezes os limites entre uma espécies e outra são
dif́ıceis de serem reconhecidos [1, 27]. Nos últimos anos, foram realizados vários estudos sobre a
identificação de espécies de Anastrepha, que não se restringiram apenas aos aspectos morfológicos,
mas inclúıram também análises genéticas [28, 2] e de morfometria [1]. Entretanto, nenhuma técnica
de análise de imagens computadorizada foi testada para a identificação de espécies de Anastrepha.
As três espécies de Anastrepha estudadas - A. fraterculus, A.obliqua e A. sororcula - pertencem
ao grupo fraterculus e diferem entre si principalmente pela morfologia do acúleo (Figura 5). São
consideradas espécies-praga de importância quarentenária, encontradas com frequência no estado de
São Paulo e são as que estão associadas com o maior número de plantas hospedeiras [36], isto é, são
as que atacam um maior número de espécies de frutos. O uso de técnicas eficientes de identificação
dessas espécies é de grande importância tanto para o desenvolvimento de novas abordagens de
controle quanto para a solução de problemas quarentenários [27, 35].
2.2 Classificação de Imagens
A tarefa de classificação de imagens supervisionada consiste em categorizar novas imagens em classes
previamente definidas. O fator determinante para que imagens pertençam a uma mesma classe é
que tenham as mesmas propriedades visuais entre si. O problema central está em treinar um
classificador de forma que indique a classe correta para um conjunto de imagens não conhecidas.
Na classificação de imagens, existe a necessidade de uma coleção de imagens pré-classificadas
e rotuladas, chamado de conjunto de treinamento. Esta coleção é utilizada no processo de apren-
dizagem das caracteŕısticas que definem cada classe. Uma vez realizado esse aprendizado, podem-se
classificar ou rotular imagens de interesse.
As etapas do processo de classificação de imagens são:
• Aquisição de imagem: inicialmente, deve-se construir uma base de dados de imagens de
interesse;
• pré-processamento: nesta etapa, utilizam-se técnicas de processamento de imagem para
preparar todas as imagens da base de dados. Essas técnicas incluem, por exemplo, cropping
(remover as partes que não interessam), realce e equalização do histograma (para acentuar
propriedades visuais de interesse).
• extração de caracteŕısticas: esta fase utiliza as imagens pré-processadas, ou seja, já
tratadas na etapa anterior, e as organizam na forma de transações. As transações são registros
de dados na forma {IdImage, Classlabel, F1, F2, ......Fn} em que F1, F2, ......Fn, são n vetores de
caracteŕısticas extráıdos da imagem. As transações servirão de entrada para alguma técnica
de classificação. Ao final deste processo, um modelo de classificação é gerado.
• classificação: esta fase é a classificação propriamente dita, realizando a rotulação das novas
imagens nas suas respectivas classes.
2.3 Técnicas de Classificação
Esta seção apresenta as técnicas de aprendizagem que foram utilizadas nos experimentos realizados.
4 Faria, Perre, Zucchi, Lewinsohn, Rocha and Torres
2.3.1 Support Vector Machine (SVM)
Support Vector Machine é uma técnica de aprendizagem de máquina, introduzida por [4] e funda-
mentada em teorias estat́ısticas, em que são necessários exemplos previamente identificados para
construir um modelo de classificação. O objetivo desta técnica é construir um hiperplano ótimo
que separa o espaço n-dimensional (em que n é o número de caracteŕısticas da entidade que está
sendo classificada, i.e., a dimensionalidade), tal que maximiza uma margem entre as duas classes. A
margem pode ser interpretada como uma medida de separação entre duas classes e representa o grau
de separabilidade entre elas (medida de qualidade da classificação). Os pontos sobre as fronteiras
entre as classes são chamados de vetores de suporte (support vectors), e o meio da margem é o
hiperplano de separação ótima. Quando não é posśıvel achar um separador linear entre as classes,
os dados (caracteŕısticas) são mapeados em um espaço com alta dimensionalidade utilizando um
mapeamento não linear. Segundo teorema de Cover [6], toda amostra que não é separável em um
espaço pode ser mapeada em um outro espaço de maior dimensionalidade a partir de transfomações
não lineares e tornando-se linearmente separáveis. A Figura 1 ilustra o uso do SVM para “separar”
duas classes. Para maiores detalhes, sugere-se a consulta das referências [4, 13, 17, 5, 14]
Figura 1: O classificador SVM encontra o hiperplano que separa as duas classes (quadrados e
ćırculos) pela máxima margem posśıvel.
2.3.2 k-nearest neighbor (kNN)
É a técnica mais simples de classificação de objetos que se baseia nos exemplos de treinamento mais
próximos no espaço de caracteŕısticas [8]. A Equação 1 mostra o ajuste do kNN definido para x.
kNN(x) =
∑
xi∈Nk(x)
yi (1)
em que Nk(x) são os k vizinhos mais próximos de x no conjunto de treinamento, yi é o valor de
distância entre x e o vizinho xi atual (a função de distância usualmente utilizada é a distância Eu-
clideana). A tarefa de classificação é decidida pela votação majoritária dos vizinhos mais próximos.
A Figura 2 ilustra um exemplo de classificação usando kNN.
2.3.3 Bootstrap Aggregation (BAGG)
Esta abordagem conhecida como Bootstrap aggregation ou Bagging consiste em avaliar as predições
sobre uma coleção de amostras (bootstrap samples). Dado um conjunto inicial de treinamento
Uso de técnicas de aprendizagem para classificação automática de moscas-das-frutas (Diptera, Tephritidae)5
Figura 2: (a) Amostras de duas classes (quadrado e ćırculo) no espaço de caracteŕısticas. (b) Dado
um novo objeto desconhecido, os k = 5 vizinhos mais próximos a ele definirão sua classe. Neste
caso, o ponto verde será classificado como pertencente à classe vermelha.
T , este é dividido em B partes ou amostras iguais denotadas por Zi, i = 1, 2, ..., B [8]. Cada uma
dessas amostras é usada no treinamento de B classificadores que, geralmente, são os mesmos. Após o
treinamento, cada classificador obtém um coeficiente (α) que será utilizado na etapa de classificação.
Dado um novo objeto a ser testado, os coeficientes referentes a cada um dos classificadores são usados
e a classe atribúıda ao objeto será o resultado da votação majoritária entre os B classificadores [25].
Para cada elemento x, a predição ~f i(x) de cada classificador é armazenada e o resultado calculado:
~fbag(x) =
1
B
B∑
i=1
~f i(x) (2)
A Figura 3 ilustra o treinamento e a classificação da abordagem Bagging.
Figura 3: Treinamento e Classificação utilizando a abordagem Bagging. Retirado de [25].
3 Metodologia Experimental
Esta seção detalha a metodologia experimental empregada durante os experimentos realizados neste
trabalho.
6 Faria, Perre, Zucchi, Lewinsohn, Rocha and Torres
3.1 Base de Imagens
Foi utilizada a base ASAS com 146 imagens de asas de moscas-das-frutas (vide Figura 4) e base
ACULEOS com 150 imagens de acúleos (vide Figura 5), representando 50 espécimes de cada uma
das três espécies de moscas. Estas asas, e os respectivos acúleos, são provenientes de espécimes
criados de amostras de árvores frut́ıferas de pomares experimentais e comerciais do Estado de São
Paulo, depositados em coleções cient́ıficas do Depto. de Entomologia e Acarologia da ESALQ, USP,
Piracicaba, SP (Prof. Dr. Roberto Zucchi), e do Instituto Biológico, Campinas, SP (Dr. Miguel
Francisco de Souza Filho).
(a) A. fraterculus(b) A. obliqua (c) A. sororcula
Figura 4: Asas das três espécies de Anastrepha estudadas.
(a) A. fraterculus (b) A. obliqua (c) A. sororcula
Figura 5: Acúleos das três espécies de Anastrepha estudadas.
3.2 Cross Validation
Foi utilizado o protocolo k-fold cross-validation. Neste protocolo, a base de dados original é separada
aleatoriamente em k subconjuntos, sem repetição de imagens entre eles. Um subconjunto é escolhido
para ser o conjunto de teste e os k − 1 subconjuntos são usados para treinar uma técnica de
aprendizagem. O processo é repetido k vezes e cada subconjunto é “testado” apenas uma vez. O
resultado final ou acurácia na tarefa de classificação pode ser a média aritmética entre todas as k
classificações. Ao realizar as k repetições (rodadas) o protocolo garante que toda a base de dados
será testada e o ideal é que a variabilidade dos acertos entre rodadas seja menor posśıvel.
Nestes experimentos foi utilizado o protocolo 5-fold cross validation, com 80% das imagens para
o conjunto de treinamento e 20% para teste. A medida de avaliação utilizada foi a média aritmética
das porcentagens de acerto de cada classificação nas cinco rodadas do cross validation.
3.3 Descritor de Imagens
Os descritores de imagens são utilizados para caracterizar ou descrever propriedades visuais (e.g.,
cor, textura e forma) dos dados da base. Um descritor é caracterizado por duas funções [32]: (1)
um algoritmo de extração de caracteŕısticas ou evidências que codifica as propriedades dos dados
Uso de técnicas de aprendizagem para classificação automática de moscas-das-frutas (Diptera, Tephritidae)7
em um vetor de caracteŕısticas; e (2) uma medida de similaridade (função de distância) que calcula
a similaridade entre dois dados utilizando os vetores de caracteŕısticas correspondentes. A Tabela
1 mostra uma lista dos descritores utilizados nos experimentos. Esses descritores foram escolhidos
levando em conta a boa eficácia que cada um deles obteve quando usados em outros tipos de
imagens [24].
Descritor Tipo
ACC [16] Cor
BIC [29] Cor
CCV [23] Cor
GCH[30] Cor
LCH[30] Cor
EOAC [19] Forma
HTD [20] Textura
LAS [31] Textura
QCCH [15] Textura
Tabela 1: Descritores de imagem usados nos experimentos com imagens de moscas-das-frutas.
3.4 Segmentação de Imagens utilizando método Otsu
O método Otsu [22] é usado para obter um limiar (threshold) ótimo que separa duas classes (e.g.,
objeto e fundo) buscando minimizar a variância intra-classe. Uma vez conseguido esse limiar,
realiza-se a binarização/segmentação da imagem atribuindo valor “0” para os pixels com valores
abaixo do limiar e “1” para valores maiores ou iguais ao limiar. A Figura 6 mostra imagens de asas
antes e depois da segmentação/binarização.
(a) Asa (b) Máscara - MASK (c) OTSU
Figura 6: (a) Exemplo de imagem de asa de Anastrepha da coleção utilizada para desenvolvimento
do presente trabalho. (b) Imagem de uma máscara genérica sem parte do fundo das imagens
originais. (c) Imagem da asa após a segmentação utilizando método Otsu [22].
4 Resultados
Esta seção detalha os experimentos realizados para classificação de espécies de moscas-das-frutas
utilizando imagens de asas e acúleos.
8 Faria, Perre, Zucchi, Lewinsohn, Rocha and Torres
4.1 Classificação Automática de Espécies de moscas-das-frutas
Nestes os experimentos foram comparadas as técnicas de classificação k-nearest neighbor (kNN),
Bagging (BAGG) e Support Vector Machine (SVM). Além disso, descritores de imagens (e.g., cor,
textura e forma) foram utilizados com objetivo de encontrar a propriedade visual que melhor de-
screvesse tais imagens.
4.1.1 Classificação utilizando asas
Nos experimentos realizados na base ASAS, a técnica que obteve melhor acurácia (porcentagem de
acerto) foi a SVM com 91,76% utilizando o descritor LCH (cor) e uma segmentação baseada no
método Otsu (vide Figura 6 (c)). Da segunda à quarta posição ficou o kNN com diferentes valores
de k utilizando descritor GCH e uma máscara genérica (vide Figura 6 (b)). Note que somente na
sexta posição está o SVM utilizando o descritor GCH simples, demostrando a importância do uso
de máscara nesse tipo de imagem (Tabela 2).
Classificador Descritor Acurácia Desvio
SVM LCH+OTSU 91,77 5,26
KNN-1 GCH+MASK 85,65 3,83
KNN-3 GCH+MASK 85,65 2,46
KNN-5 GCH+MASK 87,06 3,34
SVM LCH+MASK 87,06 3,95
SVM GCH 85,88 4,83
KNN-7 GCH 85,88 6,38
KNN-11 GCH 85,88 8,68
SVM CCV 85,29 3,6
BAGG-17 GCH+MASK 85,29 7,5
SVM GCH+MASK 85,29 8,32
Tabela 2: Melhores resultados de classifcação utilizando a base ASAS.
4.1.2 Classificação utilizando acúleos
A técnica que obteve melhor acurácia (porcentagem de acerto) na base ACULEOS foi a SVM
com 93,75% utilizando o descritor EOAC (forma). De segunda a sexta posição ficou o kNN com
diferentes valores de k utilizando descritor EOAC. Note que os melhores resultados utilizaram o
mesmo descritor de imagem (EOAC), demostrando a importância da propriedade “forma” nas
imagens de acúleos (Tabela 3).
5 Considerações Finais
Nos experimentos realizados neste trabalho foram identificadas algumas caracteŕısticas interessantes
em cada um dos tipos de imagens analisadas. Nas imagens de asas a propriedade visual que mais
se destacou foi um descritor de cor (LCH) alcançando 91,77% de acurácia. Já nas imagens de
acúleos a propriedade visual que melhor descreveu foi um descritor de forma (EOAC), o qual
alcançou 93,75% de acurácia. Para os dois tipos de imagens, a técnica de aprendizagem SVM
foi a que obteve os melhores resultados de acurácia. Estes ńıveis de acurácia são equivalentes à
expectativa de identificação visual por entomólogos experientes que não são especialistas no gênero
Uso de técnicas de aprendizagem para classificação automática de moscas-das-frutas (Diptera, Tephritidae)9
Classificador Descritor Acurácia Desvio
SVM EOAC 93,75 5,08
kNN-1 EOAC 91,91 5,37
kNN-3 EOAC 91,02 3,53
kNN-11 EOAC 90,48 5,90
kNN-7 EOAC 90,22 2,40
kNN-9 EOAC 89,56 4,04
SVM CCV 89,25 6,29
SVM LAS 88,97 3,60
SVM GCH 85,61 6,26
SVM BIC 84,29 5,68
Tabela 3: Melhores resultados de classifcação utilizando a base ACULEOS.
Anastrepha, valendo-se de documentação publicada e coleções de referência (R. Zucchi, observação
não publicada).
Os posśıveis trabalhos futuros abrangem desde investigação de outros descritores de imagens e
técnicas de aprendizagem à fusão de evidências e classificadores de imagens. Pretende-se também
desenvolver um sistema computacional que possa ser utilizado por pesquisadores não-especialistas
da biologia que necessitam realizar identificação de espécies em suas rotinas.
Referências
[1] E. L. Araujo. Estudo morfométrico no acúleo de cinco espécies de anastrepha schiner, 1868
(diptera: Tephritidae) do grupo fraterculus. Master’s thesis, Escola Superior de Agricultura
Luiz de Queiroz, Universidade de São Paulo, Piracicaba, SP, Brazil, 1997.
[2] Smith-Caldas M. R. B., Mcpheron B. A., J. G. Silva, and R. A. Zucchi. Phylogenetic relation-
ships among species of the fraterculus group (anastrepha: Diptera: Tephritidae) inferred from
dna sequences of mitochondrial cytochrome oxidase i. 2004.
[3] M. Baylac, C. Villemant, and G. Simbolotti. Combining geometric morphometrics with pattern
recognition for the investigation of species complexes. Biological Journal of the Linnean Society,
80(1):89–98, 2003.
[4] Bernhard E. Boser, Isabelle M. Guyon, and Vladimir N. Vapnik. A training algorithm for opti-
mal margin classifiers. In Proceedings of the fifth annual workshop on Computational learning
theory, COLT ’92, pages 144–152, 1992.
[5] Y. Cao, X. Jun, T. Liu, H. Li, Y. Huang, and H. Hon. Adapting ranking svm to document
retrieval. In Proceedings of the 29th annual international ACM SIGIR conference on Research
and development in information retrieval, pages 186–193, 2006.
[6] T. M. Cover. Geometrical and statistical properties ofsystems of linear inequalities with appli-
cations in pattern recognition. Electronic Computers, IEEE Transactions on, EC-14(3):326–
334, 1965.
[7] P Fedor, I Malenovsk, J Vanhara, W Sierka, and J Havel. Thrips (thysanoptera) identification
using artificial neural networks. Bulletin of Entomological Research, 98(5):437–447, 2008.
10 Faria, Perre, Zucchi, Lewinsohn, Rocha and Torres
[8] J. Friedman, T. Hastie, and R. Tibshirani. The Elements of Statistical Learning. Springer, 1
edition, 2001.
[9] K. J. Gaston and M. A. O’Neill. Automated species identification: why not? Philosophical
Transactions of the Royal Society of London. Series B: Biological Sciences, 359(1444):655–667,
April 2004.
[10] Godfray. Challenges for taxonomy. Nature, 417(6884):17–19, May 2002.
[11] P. D. N. Hebert, A. Cywinska, S. L. Ball, and J. R. Dewaard. Biological Identifications through
DNA Barcodes. Proceedings of Biological Sciences, 270:313–321, 2003.
[12] P. D. N. Hebert and T. R. Gregory. The Promise of DNA Barcoding for Taxonomy. Systematic
Biology, 54(5):852–859, October 2005.
[13] R. Herbrich, T. Graepel, and K. Obermayer. Large Margin Rank Boundaries for Ordinal
Regression, pages 115–132. MIT Press, Cambridge, MA, 2000.
[14] P. Hong, Q. Tian, and T. S. Huang. Incorporate support vector machines to content-based
image retrieval with relevant feedback. In International Conference on Image Processing, pages
750–753, 2000.
[15] C. Huang and Q. Liu. An orientation independent texture descriptor for image retrieval. In
International Conference on Computational Science, pages 772–776, 2007.
[16] J. Huang, R. Kumar, M. Mitra, W. Zhu, and R. Zabih. Image indexing using color correlograms.
In Conference on Computer Vision and Pattern Recognition, pages 762–768, 1997.
[17] Thorsten Joachims. Optimizing search engines using clickthrough data. In International Con-
ference on Knowledge Discovery and Data Mining, pages 133–142, 2002.
[18] Norman MacLeod, Mark Benfield, and Phil Culverhouse. Time to automate identification.
Nature, 467(7312):154–155, September 2010.
[19] F. Mahmoudi, J. Shanbehzadeh, A. Eftekhari-Moghadam, and H. Soltanian-Zadeh. Image
retrieval based on shape similarity by edge orientation autocorrelogram. Pattern Recognition,
36(8):1725–1736, 2003.
[20] B.S. Manjunath and W.Y. Ma. Texture features for browsing and retrieval of image data.
Pattern Analysis and Machine Intelligence, IEEE Transactions on, 18(8):837 –842, aug 1996.
[21] A.L. Norrbon, R.A. Zucchi, and V. Hernandez-Ortiz. Phylogeny of the genera Anastrepha
and Toxotrypana (Trypetinae: Toxotrypanini) based on morphology. Fruit flies (Tephritidae):
phylogeny and evolution of behavior. Boca Raton: CRC Pressp, 299-342, 1999.
[22] N. Otsu. A threshold selection method from gray-level histograms. Systems, Man and Cyber-
netics, IEEE Transactions on, 9(1):62 –66, jan. 1979.
[23] G. Pass, R. Zabih, and J. Miller. Comparing images using color coherence vectors. In ACM
Multimedia, pages 65–73, 1996.
[24] O. A. B. Penatti, E. Valle, and R. da S. Torres. Comparative study of global color and
texture descriptors for web image retrieval. Journal of Visual Communication and Image
Representation, 23(2):359–380, 2012.
Uso de técnicas de aprendizagem para classificação automática de moscas-das-frutas (Diptera, Tephritidae)11
[25] A. Rocha. Randomização progressiva para esteganálise. Master’s thesis, Campinas, SP, Brazil,
2006.
[26] J. L A Salle, Q. Wheeler, P. Jackway, and S. Winterton. Accelerating taxonomic discovery
through automated character extraction. Zootaxa, 55(2217):43 – 55, 2009.
[27] D. Selivon, A. Malavasi, and R. A. Zucchi. Relações com plantas hospedeiras. Moscas-das-frutas
de importância econômica no Brasil: conhecimento básico e aplicado. pages 87–92, 2000.
[28] O. L. R. Silva, A. Malavasi, and R. A. Zucchi. Controle do trânsito de hospedeiros de moscas-
das-frutas. Moscas-das-frutas de importância econômica no Brasil: conhecimento básico e apli-
cado. pages 29–40, 2000.
[29] R. Stehling, M. Nascimento, and A. Falcao. A compact and efficient image retrieval approach
based on border/interior pixel classification. In International Conference on Information and
Knowledge Management, pages 102–109, 2002.
[30] M. Swain and D. Ballard. Color indexing. International Journal of Computer Vision, 7(1):11–
32, 1991.
[31] B. Tao and B. Dickinson. Texture recognition and image retrieval using gradient indexing.
Journal of Visual Communication and Image Representation, 11(3):327–342, 2000.
[32] R. Torres and A. X. Falcão. Content-based image retrieval: Theory and applications. Revista
de Informática Teórica e Aplicada, 13(2):161–185, 2006.
[33] P. J. D. Weeks, M. A. Oneill, K. J. Gaston, and I. D. Gauld. Automating insect identification:
exploring the limitations of a prototype system. Journal of Applied Entomology, 123(1):1–8,
1999.
[34] Quentin D. Wheeler, Peter H. Raven, and Edward O. Wilson. Taxonomy: impediment or
expedient?: Science. 303(5656):285, 2004.
[35] R. A. Zucchi. Taxonomia. Moscas-das-frutas de importância econômica no Brasil: conheci-
mento básico e aplicado. pages 13–24, 2000.
[36] Zucchi, R. A. Fruit flies in Brazil:Anastrephaspecies and their host plants and parasitoids.
URL http://www.lea.esalq.usp.br/anastrepha/. Acessado em 09/02/2012.