Baixe o app para aproveitar ainda mais
Prévia do material em texto
Capítulo 7 – SEGMENTAÇÃO E CLASSIFICAÇÃO 7.1 SEGMENTAÇÃO DE IMAGENS 7.1.1 Crescimento de regiões 7.1.2 Segmentação baseada em bordas 7.1.3 Detecção de bacias 7.2 CLASSIFICAÇÃO 7.2.1 Classificação supervisionada 7.2.1.1 Treinamento 7.2.1.2 Classificação por Máxima Verosimilhança 7.2.1.3 MAXVER-ICM 7.2.1.4 Distância Euclidiana 7.2.1.5 Método do Paralelepípedo 7.2.2 Pós Classificação 7.2.3 Classificação Não-Supervisionada 7.2.3.1 Classificador Isoseg Processamento Digital de Imagens92 7.1 Segmentação de Imagens Segmentação de imagens é uma tarefa básica no processo de análise de imagens: a imagem é particionada em regiões que devem corresponder às áreas de interesse da aplicação. Entende-se por regiões um conjunto de pixels contíguos, que se espalham bidimensionalmente e que apresentam uniformidade em relação a um dado atributo. Atributos das regiões tais como área, forma, parâmetros estatísticos e textura podem ser extraídos e usados posteriormente no processo de análise. O particionamento da imagem pode ser realizado, basicamente, de três formas: (1) por crescimento de regiões; (2) detecção de bordas e (3) combinação das outras duas. A técnica de crescimento de regiões divide a imagem em um número de regiões homogêneas, cada uma identificada por um rótulo. O resultado final é uma imagem rotulada. No método de deteção de bordas, as bordas entre regiões homogêneas são extraídas gerando como resultado um mapa de bordas. Cada técnica é afetada diferentemente por vários fatores. Para algumas aplicações o método de deteção de bordas não funciona bem devido a presença de “buracos” nas bordas, as quais permitem que duas regiões diferentes sejam agregadas. Outra desvantagem é que esta técnica é sensível às variações locais dos níveis de cinza e , então, os contornos geralmente não são fechados. Por outro lado, o método por crescimento de regiões sempre gera regiões com contornos fechados. Este método é muito simples e efetivo em várias aplicações. A principal desvantagem são os erros nos contornos das regiões: pixels de borda podem ser agregados à uma das regiões vizinhas de forma aleatória. A seleção de uma destas abordagens ou a combinação delas depende fortemente do tipo de dados usados na análise e da área de aplicação. 7.1.1 Crescimento de regiões A técnica por crescimento de regiões é um processo iterativo em que as regiões espacialmente adjacentes são agrupadas segundo algum critério de similaridade. No início do processo de segmentação a região pode ser um pixel ou um conjunto de pixels. Para cada região, são calculados atributos espectrais como por exemplo média, variância e textura. A agregação das regiões é feita usando algum critério de similaridade e um limiar, que pode ser definido pelo usuário. Geralmente o critério de similaridade baseia-se em um teste de hipótese estatístico que testa a média entre as regiões. De um modo simplificado o processo pode ser descrito pelos seguintes passos: 1. Particione toda imagem em células padrões ( 1 ou mais pixels). 2. Cada célula padrão é comparada com as suas células vizinhas para determinar se elas são similares, usando uma medida de similaridade. Se elas são similares, agrupe as células para formar um segmento e atualize as propriedades usadas na comparação. 3. Continue o crescimento do segmento examinando todas os seus vizinhos até que não exista regiões que possam ser agrupadas ao segmento. Rotule o segmento como uma região completa. 4. Processe a próxima célula não completa, e repita estes passos até que todas as células sejam rotuladas. CAPÍTULO 7 – Segmentação e Classificação 93 No segmentador, implementado no sistema SPRING, duas regiões adjacentes A e B são agrupadas se e somente se: · a média das regiões A e B são similares; · a medida de similaridade satisfaz o limiar estabelecido; · A e B são mutuamente próximas (dentre os vizinhos de A, B é a mais próxima de A, e dentre os vizinhos de B, A é a mais próxima de B). A Figura 7.1 mostra os contornos das regiões, obtidos através do algoritmo de crescimento de regiões implementado no SPRING, sobrepostos à imagem original. Fig. 7.1 - Imagem segmentada sobreposta à imagem original. 7.1.2 Segmentação baseada em bordas As bordas na imagem caracterizam os contornos dos objetos e são bastante úteis para segmentação e identificação de objetos na cena. Pontos de borda podem ser entendidos como as posições dos pixels com variações abruptas de níveis de cinza. Os pontos de borda caracterizam as transições entre objetos diferentes. Existem várias técnicas de segmentação baseadas em bordas. As mais simples são aquelas em que as bordas são detetados pelos operadores gradiente (Sobel, Roberts, Laplaciano) seguidos de uma limiarização. A Figura 6.2 mostra o mapa de bordas obtido pelo operador laplaciano da gaussiana (Gonzalez, 1992). Processamento Digital de Imagens94 Fig. 7.2 - Mapa de bordas gerado pelo operador Laplaciano da gaussiana. 7.1.3 Detecção de bacias A segmentação por detecção de bacias é feita sobre uma imagem resultante da extração de bordas (mapa de bordas). A extração de bordas é realizada por um algoritmo de detecção de bordas, que pode ser, por exemplo, um filtro Sobel. Este algoritmo considera os gradientes de nível de cinza da imagem original, para gerar uma imagem gradiente ou imagem de intensidade de borda. O algoritmo calcula um limiar para a perseguição de bordas. Quando ele encontra um pixel com valor superior ao limiar estabelecido, tem-se início o processo de perseguição da borda. Observa-se a vizinhança para identificar o próximo pixel de maior valor de nível digital e segue-se nesta direção até que se encontre outra borda ou a fronteira da imagem, identificado no mapa de bordas. Deste processo, gera-se uma imagem binária com os valores de 1 referentes às bordas e 0, a regiões de não-bordas. A imagem binária será rotulada de modo que as porções da imagem com valores 0 constituirão regiões limitadas pelos valores 1 da imagem, constituindo a imagem rotulada. O procedimento de segmentação por detecção de bacias pressupõe uma representação topográfica para a imagem, ou seja, para uma dada imagem gradiente, o valor de nível digital de cada pixel eqüivale a um valor de elevação naquele ponto. A imagem equivaleria a uma superfície topográfica com feições de relevo ou uma região com bacias de diferentes profundidades. O crescimento de uma região eqüivaleria à imersão da superfície topográfica em um lago. Define-se um altura inicial (nível digital) para o preenchimento das bacias (limiar). A "água" preencherá progressivamente as diferentes bacias da imagem até um limiar definido pela topografia (valor de nível digital). Ao alcançar o limite, define-se uma barreira entre duas regiões. O processo de preenchimento continua em outra direção até atingir um novo limite topográfico, definindo-se mais uma barreira, e assim sucessivamente até que todas as barreiras tenham sido definidas. CAPÍTULO 7 – Segmentação e Classificação 95 O resultado é uma imagem rotulada, cada região apresentando um rótulo (valor de nível digital), que podem ser classificadas por classificadores baseados em regiões. 7.2 Classificação Classificação é o processo de extração de informação em imagens para reconhecer padrões e objetos homogêneos com o objetivo de mapear as áreas da superfície terrestre. O resultado final de uma classificação de uma imagem é uma imagem temática (mapa), onde os pixels classificados são representados por símbolos gráficos ou cores. Cada cor ou símbolo está associado à uma classe (área urbana, tipos de florestas, tipos de solo, etc.) definida pelo usuário. A Figura 7.3(b) ilustra como seria o resultado de uma classificação. Fig. 7.3 - (a) Imagem original; (b) imagem classificada. A classificação automática (feita por computador) envolve a análise individual dosatributos numéricos de cada pixel na imagem, por isso é considerada uma análise quantitativa. Uma outra forma de classificação não automática é conhecida como fotointerpretação onde, um especialista humano extrai as informações baseando-se na inspeção visual da imagem. Essas duas abordagens são importantes e muitas vezes complementares. Na classificação automática, o computador é capaz de produzir medidas de áreas mais precisas que o fotointérprete, porque cada pixel é tratado isoladamente. Além disso, ao contrário do especialista humano, a classificação automática pode ser realizada usando mais do que três bandas espectrais. A saída de um processo de classificação é um mapa temático; um grande número de níveis de cinza nas diversas bandas espectrais são transformados em um pequeno número de classes em uma única imagem. Uma forma de se representar uma imagem multi-espectral é através do espaço de atributos, ou espaço vetorial multi-espectral, com tantas dimensões quantas forem o número de bandas disponível para esse dado. Nesse espaço, cada pixel da imagem é plotado como um ponto cujas coordenadas são dadas pelos seus valores de intensidade em cada uma das bandas espectrais analisadas. Isso é exemplificado para o caso simples de duas bandas espectrais na Figura 7.4. Processamento Digital de Imagens96 V e g e t a ç ã o S o l o Á g u a ***** *** **** +++++ +++ ++++ ##### ### #### Veget . Solo. Água. Fig. 7.4 - Representação de uma imagem multi-espectral no espaço de atributos. (a) mapa temático; (b) espaço de atributos. Assumindo-se que as bandas espectrais fornecem uma boa discriminação entre as diversas coberturas da superfície (ou alvos), é razoável supor que os pixels pertencentes a um mesmo alvo irão agrupar-se formando nuvens no espaço de atributos. Essas nuvens ou agrupamentos são chamados de classes, as quais espera-se que o algoritmo de classificação automática seja capaz de detectar. O projeto de um classificador consiste em se dividir o espaço de atributos em regiões distintas, cada qual representando uma classe. Ou seja, deve se encontrar as fronteiras de decisão entre as classes. A Figura 7.5 ilustra como é o projeto de um classificador. ***** *** **** +++++ +++ ++++ ##### ### #### Fig. 7.5- Projeto de um classificador. Em relação ao tipo de treinamento, a classificação automática pode ser dividida em dois grupos: supervisionada e não supervisionada, as quais são descritas a seguir. Na classificação não supervisionada, cada pixel da imagem é associado a uma classe espectral sem que o usuário tenha um conhecimento prévio do número ou identificação das diferentes classes presentes na imagem. Isso é feito, basicamente, através de algoritmos de agrupamento. Na classificação supervisionada, o usuário seleciona amostras representativas para cada uma das classes que se deseja identificar na imagem. Geralmente, assume-se que as classes podem ser descritas por uma função densidade de probabilidade e, portanto, descritas por seus parâmetros estatísticos. Estes parâmetros são estimados através do conjunto de amostras de treinamento, previamente selecionados. A função densidade de probabilidade será, então, usada como um critério de decisão sobre a que classe um pixel CAPÍTULO 7 – Segmentação e Classificação 97 pertence. Existem ainda outros métodos que particionam o espaço de atributos utilizando superfícies otimamente localizadas. Os classificadores podem ainda ser divididos em classificadores pixel a pixel e classificadores por regiões. Os classificadores pixel a pixel utilizam apenas a informação espectral isolada de cada pixel para identificar as regiões homogêneas. A classificação por regiões é realizada, basicamente, em duas etapas. Primeiro, a imagem é particionada em regiões (segmentação). Posteriormente, cada região é associada à uma classe. Ou seja, todos os pixels pertencentes a uma dada região são mapeados para uma mesma classe. Este método simula o comportamento de um foto-intérprete, que reconhece as áreas homogêneas nas imagens, baseando-se nas propriedades espectrais e espaciais destas imagens. 7.2.1 Classificação supervisionada Do ponto de vista prático, e independentemente do algoritmo de classificação supervisionada utilizado, os passos a serem seguidos para realizar uma classificação supervisionada são: 1. seleciona-se as classes que se deseja identificar na imagem, por exemplo, água, cultura, solo exposto, área urbana, mata, etc; 2. Escolhe-se um conjunto de amostras (conjunto de pixels) representativo de cada uma das classes. Essas amostras formarão um conjunto de amostras de treinamento. Essas amostras podem ser definidas usando dados de campo, fotos aéreas ou ainda da interpretação visual da imagem a ser classificada; 3. Utiliza-se o conjunto de treinamento para estimar os parâmetros usados pelo algoritmo de classificação. Estes podem ser propriedades do modelo de probabilidade ou equações que definem o particionamento no espaço de atributos. Esse passo é conhecido como treinamento; 4. Rotula-se cada pixel ou região como pertencente a uma dentre o conjunto de classes definido no passo 1, usando os parâmetros estimados no passo 3; 5. Produz-se dados tabulares (por exemplo, área) ou mapas temáticos que mostram o resultado da classificação. 7.2.1.1 Treinamento Para executar o treinamento, o usuário deve identificar na imagem um conjunto de pixels (área) representativo de cada classe. É importante que a área seja uma amostra homogênea da classe correspondente, mas ao mesmo tempo deve-se incluir toda a variabilidade dos níveis de cinza para a classe. Recomenda-se que o usuário adquira mais do que uma área de treinamento, utilizando o maior número de informações disponíveis, como trabalhos de campo, mapas, etc. Para a obtenção de classes estatisticamente confiáveis, são necessários de 10 a 100 áreas de treinamento por classe. O número de pixels de treinamento necessário para a Processamento Digital de Imagens98 precisão do reconhecimento de uma classe aumenta com o aumento da variabilidade entre as classes. A Figura 7.6 ilustra um exemplo de amostras de treinamento: Figura 7.6 – Exemplo de amostras de treinamento. A seguir serão mostrados alguns classificadores supervisionados mais comuns. 7.2.1.2 Classificação por Máxima Verosimilhança MAXVER é o método de classificação "pixel a pixel" mais utilizado em dados de sensoriamento remoto. Suponha que as diferentes classes espectrais de uma imagem sejam: Miwi ,...1, = onde M é o número total de classes. A fim de se determinar a que classe um determinado pixel com um vetor espectral x (um vetor dos valores de intensidade em cada banda espectral) pertence, deve-se avaliar a probabilidade de que a classe iw seja a classe correta para um pixel x , ou seja: Mixwp i ,...,1),|( = (1) O critério de classificação será dado por: iwx Î se )|()|( xwpxwp ji > para todo ji ¹ (2) ou seja, um pixel é atribuído a classe de maior probabilidade. Apesar de ser um critério simples, tal probabilidade é desconhecida. No entanto a partir das amostras de treinamento é possível estimar a distribuição de probabilidade de cada classe. Esta probabilidade descreve a chance de encontrar um pixel da classe iw com um vetor espectral x , representada pela probabilidade )|( iwxp . Ou seja, para um pixel na posição x do espaço de atributos, pode-se calcular um conjunto de probabilidades de que o pixel pertença a cada uma das classes possíveis. CAPÍTULO 7 – Segmentação e Classificação 99 Essa nova probabilidade relaciona-se com aquela descrita em (1) da seguinte forma: )()|()|( iii wpwxpxwp = (3) Portanto, o critério de decisão descrito em (2) passa a ser: iwx Î se )()|()()|( jjii wpwxpwpwxp > para todo ji ¹ (4) )( iwp é a probabilidade de que a classeiw ocorra na imagem, e pode ser determinada pelo especialista de acordo com o conhecimento da área, ou ser assumida como igual para todas as classes sendo consideradas. O próximo passo é considerar que a distribuição de probabilidade para as classes são normais, essa suposição não é demonstrável, mas sim uma propriedade natural dos alvos. Partindo-se dessa suposição e com algumas simplificações matemáticas, o critério de decisão passa a ser: iwx Î se )()( xgxg ji > para todo ji ¹ (5) onde: )()(||ln)( 1 mxmxxg i t iii -S--S-= - (6) im e iS são o vetor média e a matriz de covariância, respectivamente, da classe i calculados a partir das amostras de treinamento. O critério de decisão deve ainda incorporar o conceito de limiar de decisão. Considere as curvas da distribuição de probabilidade de duas classes 1 e 2 mostradas na Figura 7.7 . Figura 7.7 - Limite de decisão. O limiar de decisão indica a % de pixels da distribuição de probabilidade de uma classe que será classificada como pertencente a esta classe. Um limite de 99%, por exemplo, engloba 99% dos pixels, sendo que 1% serão ignorados (os de menor probabilidade). Isto pode compensar a possibilidade de alguns pixels terem sido introduzidos no treinamento por engano, nesta classe, ou estarem no limite entre duas classes. Um limiar de 100% resultará em uma imagem classificada sem rejeição, ou seja, todos os pixels serão classificados. Para diminuir a confusão entre as classes, ou seja, reduzir a sobreposição entre as distribuições de probabilidades das classes, aconselha-se que a aquisição de amostras seja realizada com muito cuidado. Ou seja, as amostras escolhidas devem ser significativas de alvos distintos. Além disso, deve-se fazer uma avaliação das amostras através da matriz de Processamento Digital de Imagens100 análise das amostras, que mostra quais amostras resultaram em maior confusão. Estas amostras devem ser eliminadas ou refeitas. A matriz de classificação apresenta a distribuição de porcentagem de pixels classificados correta e erroneamente. No exemplo mostrado na Tabela 7.1, apresenta-se uma matriz de classificação com as porcentagens de 4 classes definidas na aquisição de amostras, os valores de desempenho médio, abstenção (quanto não foi classificado) e confusão média. A classe 1 corresponde à Floresta, a classe 2 ao Cerrado, a classe 3 ao Rio e a classe 4 ao Desmatamento. Tabela 7.1 – Exemplo de matriz de classificação. Não class. Floresta Cerrado Rio Desmat. Floresta 4.7 94.3 0.0 0.0 0.9 Cerrado 0.1 0.0 82.3 0.0 16.6 Rio 0.0 13.3 0.0 86.7 0.0 Desmat. 3.8 0.0 4.7 0.0 91.5 Desempenho médio: 89.37 Abstenção média: 3.15 Confusão média: 7.48 Uma matriz de classificação ideal deve apresentar os valores da diagonal principal próximos a 100%, indicando que não houve confusão entre as classes. Contudo esta é uma situação difícil em imagens com alvos de características espectrais semelhantes. O valor fora da diagonal principal, por exemplo 13.3 (linha 3 e coluna 1), significa que 13.3% da área da classe "Rio" amostrada foi classificada como classe 1 (Floresta). O mesmo raciocínio deve ser adotado para os outros valores. Para diminuir a confusão entre as classes, aconselha-se a análise das amostras. A Tabela 7.2 exemplifica a análise das amostras adquiridas para a classe Floresta. CAPÍTULO 7 – Segmentação e Classificação 101 Tabela 7.2 – Análise das amostras Am. 1 Am. 2 Am. 3 Floresta 90 0 87 Cerrado 5 50 3 Rio 5 0 0 Desmat. 0 0 10 Os valores em porcentagem indicam que na amostra 1, 90% dos pixels são classificados como floresta, 5% como cerrado e 5% como rio, o que resulta em uma amostra confiável. Por sua vez, a amostra 2 apresentou uma confusão de 50% entre as classes floresta e cerrado, indicando que esta deve ser eliminada. Os pixels dentro de uma área de treinamento são submetidos a um algoritmo de agrupamento ("clustering") que determina o agrupamento do dado, numa feição espacial de dimensão igual ao número de bandas presentes. Este algoritmo assume que cada agrupamento ("cluster") representa a distribuição de probabilidade de uma classe. Uma outra forma de se avaliar o desempenho da classificação é através do coeficiente Kappa, que foi originalmente definido por Cohen em 1960 (Hudson et al, 1987), como $k N x x x N x x ii i i i r i r i i i r= - - + + == + + = åå å 11 2 1 (7) onde r é o número de linhas ou colunas da matriz de confusão; xii é o número de observações dos elementos da diagonal da matriz; x xi ij j + = å é a soma dos valores da linha i ; x xi ji j + = å é a soma dos valores da coluna i ; e N corresponde ao número total de observações. Para propósitos computacionais apresenta-se, com frequência, a seguinte forma equivalente para o coeficiente Kappa (Hudson et al, 1987; Foody, 1992; Rosenfield et al, 1986) $k = - - q q q 1 2 21 (8) onde q1 1 1= = åN xiii r Processamento Digital de Imagens102 q2 2 1 1= + + = åN x xi ii r onde r, xii , xi+ , x i+ e N são os mesmos definidos acima. A variância do Kappa pode ser estimada por ( ) ( ) ( )( ) ( ) ( ) ( ) ( ) VAR Nk$ = - - + - - - + - - - é ë ê ê ù û ú ú 1 1 1 2 1 2 1 1 4 1 1 1 2 2 1 1 2 3 2 3 1 2 4 2 2 2 4 q q q q q q q q q q q q onde q1e q2 já foram definidos acima, ( )q3 2 1 1= ++ + = åN x x xii i ii r ( )q 4 3 2 11 1= ++ + == ååN x x xij j ij r i r Quando todos os elementos da matriz de confusão fora da diagonal possuem valor nulo, o coeficiente Kappa possui valor 1, o que significa um desempenho excelente. O coeficiente Kappa também pode assumir valores negativos indicando que o desempenho foi péssimo. A tabela a seguir apresenta o desempenho da classificação em relação ao valor de Kappa obtido. Tabela 7-3 : Índice do coeficiente Kappa e o correspondente conceito do desempenho da classificaçao Índice Kappa Desempenho da classificação < 0 Péssimo 0 0< £k ,2 Mau 0 0 4,2 ,< £k Razoável 0 4 0 6, ,< £k Bom 0 6 0 8, ,< £k Muito Bom 0 8 10, ,< £k Excelente 7.2.1.3 MAXVER-ICM Enquanto o classificador MAXVER associa classes considerando pontos individuais da imagem, o classificador MAXVER-ICM (Interated Conditional Modes) considera também a dependência espacial na classificação. Em uma primeira fase, a imagem é classificada pelo algoritmo MAXVER. Na fase seguinte, leva-se em conta a informação contextual da imagem. Ou seja, a classe atribuída depende tanto do valor observado nesse pixel, quanto das classes atribuídas aos seus vizinhos. CAPÍTULO 7 – Segmentação e Classificação 103 O algoritmo atribui classes a um determinado pixel, considerando a vizinhança iterativamente. Este processo é finalizado quando a % de mudança (porcentagem de pixels que são reclassificados) definida pelo usuário é satisfeita. 7.2.1.4 Distância Euclidiana Quando o número de amostras de treinamento por classe é limitado, e portanto a estimativa da média m e a matriz de covariância S não é bastante confiável, pode- se usar um algoritmo de classificação por distância euclidiana. Nesse método, as amostras de treinamento são usadas para calcular a média de cada classe. Cada pixel será atribuído a classe cuja distância entre o valor do pixel e a média da classe seja menor. Seja Mimi ,...1, = as médias das M classes escolhidas durante o treinamento, seja x o pixel a ser classificado. A medida de distância é dada por: )()(),( 2 i t ii mxmxmxd --= Mi ,...1= (6) O pixel será incorporado ao agrupamento que apresenta a menor distância Euclidiana. Este procedimento é repetido até que toda a imagem seja classificada.O método da distância Euclidiana possui a vantagem de ser, computacionalmente, mais simples. Um limiar de decisão pode também ser usado, de maneira análoga ao método da máxima verosimilhança. 7.2.1.5 Método do Paralelepípedo O método do paralelepípedo é um classificador bastante simples. O treinamento é feito com base nos histogramas das amostras das classes procuradas. Veja o exemplo de uma amostra bi-dimensional de uma classe C1 na Figura 7.8: 1x da cb Figura 7.8 – Histograma das amostras. Os valores mínimos e máximos dos histogramas em cada uma das bandas são identificados e usados para definir os vértices de um paralelepípedo no espaço de atributos (como mostrado na Figura 7.9) . Na classificação os pixels que se encontrarem dentro desse paralelepípedo serão rotulados como pertencentes a essa classe. Processamento Digital de Imagens104 2x b c 1x a d C1 C2 C3 Figura 7.9 – Método do paralelepípedo. Apesar de simples o método do paralelepípedo apresenta algumas limitações. Podem existir várias regiões não cobertas pelos paralelepípedos que não serão classificadas. No caso de dados correlacionados pode haver regiões de interesecção entre os paralelepípedos que definem as classes que não poderão ser separados. 7.2.2 Pós Classificação Aplica-se este procedimento em uma imagem classificada, com o objetivo de uniformizar os temas, eliminando pontos isolados que foram classificados diferentemente de sua vizinhança. Com isto, gera-se um imagem classificada com uma aparência menos ruidosa. Por exemplo, pode-se considerar uma janela de 3 x 3 pixels onde o ponto central é avaliado quanto à freqüência das classes (temas) em sua vizinhança. Esse processo deve ser feito com cautela por isso o usuário tem a opção de definir parâmetros com valores de peso e limiar, de forma a se ter um controle sobre o processo. O ponto central terá ou não sua classe substituída pela classe de maior freqüência na vizinhança de acordo com tais valores. O peso define o número de vezes que será considerada a freqüência do ponto central. O limiar define o valor de freqüência acima do qual o ponto central será modificado. 7.2.3 Classificação Não-Supervisionada Na classificação não supervisionada, o usuário não informa a priori o número nem quais são as classes que devem ser encontradas durante a classificação. Algoritmos de classificação supervisionada podem ser usados para gerar a classificação final, particularmente quando não se pode obter dados de treinamento confiáveis. Podem ainda ser usados para a determinação do número de classes distintas na imagem para um posterior processo de classificação supervisionada. Basicamente, os algoritmos de classificação não supervisionada são métodos de agrupamento baseados em alguma medida de similaridade, ou seja, pixels ou regiões serão agrupados (ou rotulados como pertencentes a mesma classe) se a medida de similaridade entre eles for satisfatória. Um exemplo desse tipo de algoritmo é apresentado a seguir. CAPÍTULO 7 – Segmentação e Classificação 105 7.2.3.1 Classificador Isoseg O classificador Isoseg é um algoritmo não supervisionado, aplicado sobre um conjunto de regiões (resultantes de uma segmentação), que por sua vez são caracterizadas por sua média, matriz de covariância e área. A medida de similaridade utilizada pelo classificador é conhecida como distância de Mahalanobis que utiliza atributos estatísticos como a média e a matriz de covariância das regiões avaliadas. Esse algoritmo é descrito a seguir: 1. Definição do limiar: o usuário define um limiar de aceitação, dado em porcentagem, com o qual calcula-se uma distância mínima entre as regiões pertences a mesma classe. Quanto maior o limiar, menor a distância entre as regiões (mais rigorosa a classificação) e portanto maior será o número de classes diferentes detectadas pelo algoritmo. 2. Detecção das classes: as regiões são ordenadas em ordem decrescente de área e inicia-se o procedimento para agrupá-las em classes. Atribui-se um novo rótulo a região de maior área que ainda não tenha sido classificada. Agrupa-se a ela todas as regiões cuja distância seja inferior ao valor mínimo definido pelo limiar de aceitação. Esta fase se repete até que todas regiões tenham recebido algum rótulo. 3. Competição entre classes: uma vez que a fase 2 é um processo sequencial que pode favorecer as classes que são detectadas em primeiro lugar.Visando eliminar este “favorecimento", procede-se uma "competição” entre classes. Esta competição consiste em reclassificar todas as regiões usando no calculo da distância as médias e matrizes de covariância dos agrupamentos obtidos na entapa anterior. O processo repete-se até que a média das classes não se altere (convergência). Ao término do processo, todas regiões estarão associadas a uma classe
Compartilhar