Prévia do material em texto
SIG: aplicação prática Apresentação O processamento de imagens pode ter diferentes motivações; as principais são favorecer a interpretação humana, realçar detalhes, agrupar classes e classificar padrões existentes. Com isso, mais informações com melhor qualidade podem ser obtidas a partir de imagens de satélites. O uso de imagens multiespectrais permite a extração de mais informações detalhadas, aumentando a complexidade do tratamento requerido e, até mesmo, exigindo maior esforço computacional na resolução de situações específicas. Vale ressaltar que classes de uso e ocupação do solo terrestre refletem ou absorvem de forma diferente em bandas espectrais, e isso figura como o princípio básico para aplicação de classificação das imagens. Nesta Unidade de Aprendizagem, você verá um pouco mais sobre ferramentas e técnicas de classificação a partir de imagens obtidas por satélites para criação de mapas temáticos e aplicações práticas pontuais. Bons estudos. Ao final desta Unidade de Aprendizagem, você deve apresentar os seguintes aprendizados: Descrever um SIG para classificação de imagens.• Diferenciar as amostras de treinamento.• Classificar imagens de sensoriamento.• Infográfico No contexto de aplicação de técnicas de geoprocessamento e sensoriamento remoto, muitos softwares podem ser utilizados — alguns de códigos livres e gratuitos, outros com diferentes funcionalidades, mas pagos. A dinâmica da criação de novas ferramentas se reflete, ainda, na forma de realizar procedimentos de análise. A classificação de imagens, por exemplo, comporta duas principais abordagens históricas (classificação supervisionada e não supervisionada) e uma mais recente (orientação a objetos), ainda em expansão. No Infográfico, você verá os softwares e ferramentas mais citadas por profissionais da área de classificação de imagens. Aponte a câmera para o código e acesse o link do conteúdo ou clique no código para acessar. Conteúdo do Livro É inegável que os sistemas de informações geográficas (SIGs) possibilitam o monitoramento adequado da superfície terrestre e o entendimento de fenômenos que ocorrem em diversas localidades em todo o globo. A classificação permite a evolução desse entendimento e o aproveitamento das ferramentas computacionais, buscando melhorar as imagens obtidas por meio de missões com satélites, diminuindo ruídos ou distorções, aumentando os realces e agrupando padrões. No capítulo SIG: aplicação prática, da obra Geoprocessamento, base teórica desta Unidade de Aprendizagem, você irá conhecer as principais formas de se classificar as imagens de satélite e poderá acompanhar a aplicação prática de um processo de classificação utilizando o software MultiSpec, da Universidade de Purdue. Boa leitura. GEOPROCESSAMENTO Natalia de Souza Pelinson SIG: aplicação prática Objetivos de aprendizagem Ao final deste texto, você deve apresentar os seguintes aprendizados: Descrever um SIG para classificação de imagens. Diferenciar as amostras de treinamento. Classificar imagens de sensoriamento remoto. Introdução Atualmente, existem diversas técnicas que são utilizadas para a deter- minação de classes a partir de imagens obtidas por satélites, de forma que a varredura resultante pode ser usada para criar mapas temáticos. Os principais tipos de classificação de imagens se distinguem entre as supervisionadas e as não supervisionadas. A primeira consiste na identi- ficação das classes de forma manual pelo usuário e envolve uma etapa de determinação de amostras de treinamento. Enquanto isso, a segunda consiste no agrupamento automático dos pixels em clusters, com base em suas propriedades. Outro fator importante a ser observado é a ava- liação da acurácia, na qual será realizada a verificação da performance da classificação de imagens adotada. Neste capítulo, portanto, você verá como descrever um sistema de informação geográfica (SIG) para classificar imagens, diferenciando amos- tras de treinamento. Além disso, você também conhecerá o MultiSpec, um software utilizado na análise de dados de imagens multiespectrais, por meio de uma aplicação prática envolvendo um exemplo de amos- tras de treinamento e posterior classificação de imagem por máxima verossimilhança. Amostras de treinamento: uma importante ferramenta da classificação de imagens Em um primeiro momento, a classifi cação de imagens de satélites propicia a criação de mapas temáticos e análises mais precisas de eventos. Na classifi cação de imagens, uma das ferramentas utilizadas é a imagem de treinamento. Vale ressaltar que técnicas de obtenção de amostras de treinamento podem ser utilizadas em outras áreas de aplicação computacional, como a geoestatística, e mesmo outros procedimentos de geoprocessamento, havendo sobreposição das defi nições e aplicações. Nesse sentido, esta seção abordará aspectos básicos da classifi cação de imagens e, posteriormente, você verá uma contextualização mais profunda sobre os tipos de classifi cação de imagens possíveis. No processo de treinamento por amostras, selecionam-se pixels que repre- sentam padrões que o usuário reconhece ou pode identificar com a ajuda de outras fontes. É necessário conhecimento dos dados, das classes desejadas e do algoritmo a ser usado antes do início da seleção das amostras de treinamento. Ao identificar padrões nas imagens, o usuário pode “treinar” o sistema do computador para identificar pixels com características semelhantes. Ao definir prioridades para essas classes, supervisiona-se a classificação dos pixels con- forme eles são atribuídos aos valores da classe. Se a classificação for precisa, cada classe resultante corresponderá a um padrão identificado originalmente. Borra, Thanki e Dey (2019) definem que as imagens pancromáticas são as imagens obtidas em uma banda larga cobrindo toda a faixa visível, enquanto imagens espectrais são representações de dados medidos correspondentes a refletância ou radiação em várias bandas espectrais do espectro eletromag- nético. Essas imagens podem ser combinadas de várias maneiras a partir de índices diferentes ou podem ser mapeadas em cores compostas (cores falsas ou pseudocores) para extração eficiente de recursos e para interpretação fácil e precisa dos dados. Imagens multiespectrais são um conjunto de imagens adquiridas por vários sensores que operam em faixas de comprimento de onda estreitas discretas ou contínuas (bandas ou espectros). Imagens espectrais obtidas de outras bandas que não as visíveis fornecem informações adicionais que o olho humano não consegue capturar sobre a cena. SIG: aplicação prática2 Para selecionar amostras confiáveis, o usuário deve aplicar informações (espaciais ou espectrais) sobre os pixels que deseja classificar. A localização de uma característica específica, como um tipo de cobertura do solo, pode ser conhecida a partir de observações de campo que adquirem conhecimento sobre a área de estudo a partir de observação em primeira mão, análise de fotografia aérea, experiência pessoal, etc. Os dados de campo são conside- rados os dados mais precisos (corretos) disponíveis sobre a área de estudo e devem ser coletados ao mesmo tempo que os dados detectados remotamente, de modo que os dados se correspondam o máximo possível. No entanto, nem todos os dados de campo podem ser completamente precisos devido a erros de observação, imprecisões do instrumento e deficiências humanas. Os receptores do sistema de posicionamento global são ferramentas úteis para conduzir estudos da verdade no solo e coletar conjuntos de treinamento. As amostras de treinamento são conjuntos de pixels que representam o que é reconhecido como um padrão discernível ou classe potencial. O sistema irá calcular as estatísticas dos pixels de amostra para criar uma assinatura paramétrica para a classe (PARECE; CAMPBELL; MCGEE, 2010). A Figura 1 apresenta um exemplo de (a) amostra de treinamento e (b) a imagem resultante da classificação deimagens (neste caso específico, super- viosionada). Os retângulos na ilustração correspondem à determinação das classes realizada pelo usuário na etapa de treinamento. Leitores do material impresso, para visualizar as figuras deste capítulo em cores, acessem o link ou o código QR a seguir. https://qrgo.page.link/8ujyK 3SIG: aplicação prática Figura 1. Aplicação da classificação por máxima verossimilhança. Fonte: Adaptada de North Carolina State University (2013). Em geral, não é possível atribuir todo valor de pixel a uma classe. Com os dados de treinamento, o usuário irá identificar muitos dos valores e irá atribuí-los a uma classe específica. Mas o que acontece com os pixels não atribuídos? Alguns valores de pixel podem se dividir em duas classes. Na classificação supervisionada, deve-se determinar o método/algoritmo que decide como esses pixels serão atribuídos. Dentre os métodos mais comuns de classificação supervisionada, estão a máxima verossimilhança e a classificação por distância mínima. O presente capítulo irá abordar com mais detalhamento a classificação por máxima verossimilhança (PARECE; CAMPBELL; MC- GEE, 2010) e apresentará brevemente outras possibilidades, além de abordar brevemente também a classificação não supervisionada e a orientada a objetos. Classificação de imagens e a utilização de sistemas de informações geográficas (SIG) Borra, Thanki e Dey (2019) dividem os sensores de satélite em dois tipos principais: sensores ópticos e sensores de micro-ondas. Os autores descrevem SIG: aplicação prática4 que os sensores ópticos visíveis coletam a intensidade dos raios de luz visíveis que são refl etidos pela Terra e a partir dos quais o usuário pode entender a natureza do objeto; esses sensores não funcionam bem em zonas escuras e em más condições atmosféricas. Complementarmente, os sensores ópticos infravermelhos coletam sinais que são irradiados (altas temperaturas) por objetos terrestres. Os sensores de micro-ondas, por outro lado, coletam micro- -ondas refl etidas pela terra, objetos independentes das condições atmosféricas. A imagem do satélite é como uma matriz de números digitais que são armazenados na forma de bits, cujo comprimento está relacionado ao número máximo de cores, intensidades e níveis de cinza usados para representar cada imagem (BORRA; THANKI; DEY, 2019). O uso de mais bandas espectrais fornece mais informações com detalhes, mas envolve complexidade de ar- mazenamento e transmissão. Diferentes classes de uso ou cobertura do solo refletem ou absorvem de modo diverso em diferentes bandas espectrais. A conversão de imagens a mapas temáticos envolve a classificação de dados brutos em diferentes classes, tais como as classes de uso e ocupação dos solos (por exemplo, agricultura, rural, urbana, deserto, água, floresta, entre outros). A classificação manual de imagens de satélites (Figura 2) envolve a análise visual das imagens para diferentes objetos ou coberturas do solo, com base em tamanho, forma, textura, padrão, cor e limites, por exemplo. Adicionalmente, a classificação automática de imagens (Figura 3) propicia a classificação de diferentes informações e torna um sistema de informações geográficas (SIG) utilizável para várias aplicações. Figura 2. Classificação manual de imagens de satélite. Fonte: Adaptada de Borra, Thanki e Dey (2019). 5SIG: aplicação prática Figura 3. Fluxograma para classificação automática de imagens de satélite. Fonte: Adaptada de Borra, Thanki e Dey (2019). Classificação supervisionada e não supervisionada de imagens A classifi cação da imagem pertence a um campo muito ativo na pesquisa em computação, o reconhecimento de padrões. Os pixels de uma imagem podem ser classifi cados por suas propriedades estatísticas multivariáveis, como o caso da classifi cação multiespectral, ou por segmentação, com base nas estatísticas e nas relações espaciais com os pixels vizinhos. Geralmente, a classifi cação estatística pode ser catalogada em dois ramos principais: classifi cações não supervisionadas e supervisionadas. Em geral, a classifi cação supervisionada é delineada pelo treinamento das amostras de forma manual, enquanto a classifi cação não supervisionada envolve uma ação automática do computador, como esquematizado na Figura 3 e discutido a seguir (LIU; MASON, 2016). Classificação supervisionada A classifi cação supervisionada baseia-se em estatísticas de áreas de treinamento que representam diferentes objetos de terreno selecionados subjetivamente pelos SIG: aplicação prática6 usuários com base em seu próprio conhecimento ou experiência. A classifi cação é controlada pelo conhecimento dos usuários, o que pode torná-la restrita e até enviesada por sua visão subjetiva. A classifi cação supervisionada pode, por- tanto, ser mal orientada por informações inadequadas ou imprecisas da área de treinamento e/ou conhecimento incompleto do usuário (LIU; MASON, 2016). Entretanto, Borra, Thanki e Dey (2019) citam como vantagens desse tipo de classificação a geração de classes informativas representando recursos no terreno e a reutilização das áreas de treinamento depois de coletadas (assumindo que elas não mudam com o tempo, como, por exemplo, plantações, estradas, florestas). Desse modo, como observado na Figura 4, uma das etapas fundamentais da classificação supervisionada é a etapa de coleta das amostras de treinamento, em que o analista identifica na imagem espectral as classes de interesse de cobertura/uso da terra e identifica locais de treinamento representativos, polígonos ou conjunto de pixels para cada classe de informação. Vale ressaltar que há diversos SIGs disponíveis e muitos apresentam programas associados que realizam funções específicas de acordo com a finalidade pretendida pelo usuário envolvido. Figura 4. Fluxograma das classificações supervi- sionada e não supervisionada. Fonte: Adaptada de ESRI (2019). 7SIG: aplicação prática O treinamento supervisionado requer informações já conhecidas sobre os dados, como (PARECE; CAMPBELL; MCGEE, 2010): quais informações precisam ser extraídas? (por exemplo, tipo de solo, uso da terra, vegetação); quais classes têm maior probabilidade de estar presentes nos dados (que tipos de cobertura da terra, solo ou vegetação — ou qualquer outra coisa — são representados pelos dados?). Podemos afirmar, portanto, que, na classificação supervisionada, o usu- ário depende de suas próprias habilidades de reconhecimento de padrões e conhecimento prévio dos dados para ajudar o sistema a determinar os crité- rios estatísticos (assinaturas) para a classificação dos dados. A seguir, serão apresentadas algumas das classificações, por máxima verossimilhança e por distância euclidiana, respetivamente. Classificação por máxima verossimilhança A classifi cação por máxima verossimilhança (CMV ou classifi cador MaxVer) é a classifi cação supervisionada mais amplamente usada e possui uma varie- dade de aplicações. A CMV pressupõe que as estatísticas de cada classe em cada banda são normalmente distribuídas e calcula a probabilidade de um determinado pixel de pertencer a uma classe específi ca. A menos que você selecione um limite de probabilidade, todos os pixels são classifi cados. Cada pixel é atribuído à classe que tem a maior probabilidade (ou seja, a máxima verossimilhança), como apresentado na Figura 5. Se a probabilidade mais alta for menor que o limite especifi cado, o pixel permanecerá não classifi cado (SISODIA; TIWARI; KUMAR, 2014; L3HARRIS, 2019). SIG: aplicação prática8 Figura 5. Conceito básico da classificação por máxima verossimilhança. Fonte: Adaptada de Sisodia, Tiwari e Kumar (2014). A regra de decisão máxima verossimilhança é baseada no teorema de Bayes e assume uma distribuição normal para todos os clusters. Nesta regra de decisão, a distância do espaço do recurso entre um pixel Yi e o cluster ωk é ponderada pela matriz de covariância Σk de ωk, com um deslocamento dado pelarazão entre Nk, o número de pixels em ωk, e N, o número total de pixels da imagem Y. Para todo i, atribui-se qualquer elemento Yi (Yi ∈ Y) ao cluster ωk, se (LIU; MASON, 2016): 9SIG: aplicação prática O MAXVER-ICM (Interated Conditional Modes) é um classificador que considera a depen- dência condicional espacial na determinação das classes de uma imagem. A imagem é classificada pelo algoritmo MAXVER e, depois, faz-se uma segunda “classificação” ou checagem da dependência do valor desse pixel já classificado em relação aos seus vizinhos (INPE, 2006), onde há uma reclassificação de acordo com o limite deter- minado pelo usuário (a reatribuição das classes pode ser definida, por exemplo, por uma porcentagem de mudanças), sendo, portanto, uma espécie de refinamento da classificação por máxima verossimilhança. Classificador por distância euclidiana A classifi cação de imagens por distância euclidiana é um procedimento super- visionado que associa a distância de um pixel para defi nição de uma classe. Tal método apresenta como principal vantagem a simplicidade computacional. O pixel é checado e incorporado ao agrupamento que apresenta a menor dis- tância euclidiana. Esse procedimento é repetido até que toda a imagem seja classifi cada (INPE, 2006). A análise da medida de similaridade de distância euclidiana é dada por (INPE, 2006): Onde x é o pixel a ser testado e a m é a média de um agrupamento. SIG: aplicação prática10 O INPE (2006) traz em seu manual várias curiosidades sobre os principais classificadores utilizados no software Spring. Acesse-o no link a seguir. https://qrgo.page.link/xaaVU A segmentação de imagens é um processo que pode ser inicial e simples na análise de imagens, mas que gera resultados que facilitam a identificação de objetos rele- vantes. Na segmentação, a imagem é dividida em regiões que devem corresponder às áreas de interesse da aplicação. As três formas mais comumente empregadas estão simplificadamente apresentadas a seguir. Segmentação por crescimento de regiões: ao empregar esta técnica, a imagem é dividida em um número de regiões “homogêneas”, cada uma identificada por um nome específico (rótulo). A imagem resultante é uma imagem então apenas rotulada, com contornos fechados. A agregação das regiões pode ser realizada utilizando critérios de similaridade, em geral, com base em testes de hipóteses (estatística). Segmentação por detecção das bordas: na técnica de detecção de bordas, evidencia-se a borda entre as regiões homogêneas, e essas são extraídas, gerando um mapa de bordas. Vale ressaltar que algumas imagens não possuem as bordas facilmente delimitadas e, então, imagens com erros de partição podem ser geradas, agrupando classes distintas. Segmentação combinando crescimento por regiões e detecção de bordas: simplificadamente, este método visa integrar os dois métodos anteriores, depen- dendo dos tipos de dados e da área a ser aplicada, podendo definir as bordas e realizar sua extração sequencialmente. Complementarmente, há um tipo de segmentação conhecido como detecção de bacias. Basicamente, a segmentação por detecção de bacias é realizada em um mapa de bordas. Nesse sentido, a extração ocorre por utilização de algoritmos de detecção de bordas, e uma ferramenta para isso pode ser a filtragem de imagens. Em geral, é um tipo de aplicação mista de segmentação. 11SIG: aplicação prática Classificação não supervisionada A classifi cação não supervisionada (Figura 6) é inteiramente baseada nas estatísticas da distribuição de dados da imagem e é frequentemente cha- mada de cluster. O processo é otimizado automaticamente de acordo com as estatísticas do cluster sem o uso de qualquer controle baseado em conheci- mento. O método é, portanto, objetivo e inteiramente orientado a dados. É particularmente adequado para imagens de alvos ou áreas nos quais não há conhecimento das características reais do solo ou onde essas informações não estão disponíveis, como no caso de imagens planetárias. Mesmo para uma área bem mapeada, a classifi cação não supervisionada pode revelar algumas características espectrais que não eram previamente aparentes. O resultado de uma classifi cação não supervisionada é uma imagem de agrupamentos estatísticos em que o conteúdo temático dos agrupamentos não é conhecido. Por fi m, essa imagem de classifi cação ainda precisa de interpretação com base em algum conhecimento do analista (LIU; MASON, 2016). Figura 6. Classificação não supervisionada. Fonte: Adaptado de Borra, Thanki e Dey (2019). SIG: aplicação prática12 Vários algoritmos de clustering (agrupamento) têm sido desenvolvidos para obter resultados ideais e facilitar a tomada de decisões. As etapas gerais são: identificação de possíveis clusters em uma imagem considerando a área do cluster, mesclando parâmetros, número de pixels avaliados e número de clusters identificados; estimativa da medida de distância em uma base de pixel por pixel, a fim de identificar o cluster de um determinado pixel; atribuição de rótulo ao cluster para análise adequada da imagem (BORRA; THANKI; DEY, 2019). Avaliação da acurácia A classifi cação de dados detectados remotamente em um mapa temático per- manece um desafi o, pois muitos fatores, como a complexidade da paisagem em uma área de estudo, dados selecionados remotamente detectados e abordagens de processamento e classifi cação de imagens, podem afetar o sucesso de uma classifi cação. Além dos erros da própria classifi cação, outras fontes de erros, como erros de posição resultantes do registro, erros de interpretação e baixa qualidade do treinamento ou amostras de testes, afetam a precisão da classifi cação. No processo de avaliação da precisão, geralmente, é assumido que a diferença entre um resultado de classifi cação de imagem e os dados de referência se deve ao erro de classifi cação (LU; WENG, 2007). A abordagem da matriz de contingência é a mais utilizada na avaliação da acurácia. Para gerar adequadamente uma matriz de erros, é necessário considerar os seguintes fatores: coleta de dados de referência; esquema de classificação; esquema de amostragem; autocorrelação espacial; tamanho da amostra e unidade da amostra. Após a geração de uma matriz de contingência, outros elementos impor- tantes da avaliação da precisão, como precisão geral, erro de omissão, erro de comissão e coeficiente Kappa, podem ser derivados (LU; WENG, 2007). Uma matriz de contingência é uma matriz quadrada de números organizados em linhas e colunas que expressam o número de unidades de amostra (pixels, agrupamentos de pixels ou polígonos) atribuídos a uma categoria específica 13SIG: aplicação prática em relação à categoria real, conforme indicado pelos dados da imagem de referência. As colunas normalmente representam os dados de referência e as linhas indicam o mapa gerado a partir dos dados detectados remotamente. As entradas diagonais representam classificações corretas ou concordância entre o mapa e os dados de referência, e as entradas fora da diagonal representam classificações incorretas ou falta de concordância espacial entre o mapa e os dados de referência (AGYEMANG et al., 2011). Um exemplo hipotético de uma matriz de contingência é apresentado no Quadro 1. Fonte: Adaptado de Borra, Thanki e Dey (2019). Classe de referência do uso real do solo Água Área residencial Agricul- tura Floresta Área aberta Saída do modelo de clas- sificação Água 256 0 20 20 0 Área residencial 0 250 40 10 10 Agricultura 20 5 400 25 0 Floresta 15 5 30 800 0 Área aberta 10 15 5 0 600 Quadro 1. Matriz de contingência Os parâmetros de precisão derivados da matriz incluem precisão geral, precisão do produtor, precisão do usuário e coeficiente Kappa. A precisão geral é calculada dividindo o total correto (ou seja, a soma da diagonal principal) pelo número total de unidades de amostra na matriz. Os parâmetros de precisão derivados da matrizde erros incluem precisão geral, precisão do produtor, precisão do usuário e coeficiente kappa. A precisão geral é calculada dividindo o total correto (a soma da diagonal principal) pelo número total de pixels na matriz de erros (BORRA; THANKI; DEY, 2019). Tradicionalmente, a divisão do número total de unidades de amostra corretas SIG: aplicação prática14 em uma categoria pelo número total de unidades de amostra dessa categoria a partir dos dados de referência (o total da coluna) é denominada precisão do produtor. Essa medida de precisão está relacionada à probabilidade de uma unidade de amostra de referência ser classificada corretamente e é realmente uma medida de erro de omissão. Por outro lado, se o número total de unidades de amostra corretas em uma categoria for dividido pelo número total de unidades de amostra que foram classificadas nessa categoria no mapa (ou seja, o total da linha), esse resultado será uma medida de comissão erro. Essa medida é chamada precisão ou confiabilidade do usuário e é indicativa da probabilidade de que uma unidade de amostra classificada no mapa realmente represente essa categoria no terreno (STORY; CONGALTON, 1986). Outra medida da precisão do mapa é o coeficiente Kappa, que é uma medida da melhoria proporcional (ou percentual) do classificador em relação a uma atribuição puramente aleatória às classes. Ele mostra até que ponto os valores corretos de uma matriz de erros são devidos ao acordo verdadeiro versus acaso. Como alternativa, é uma medida de concordância que compara a concordância observada à concordância esperada por acaso, se as classificações dos observa- dores forem independentes. Também expressa a redução proporcional no erro gerado por um processo de classificação, comparado com o erro gerado por uma classificação completamente aleatória (AGYEMANG et al., 2011). O coeficiente Kappa é determinado pela seguinte equação (BORRA; THANKI; DEY, 2019): Onde xi indica o total de observações na i-ésima linha, x.i indica o total de observações na i-ésima coluna, xii indica o número de observações diagonais principais na i-ésima linha e na i-ésima coluna, r representa o número de linhas na matriz de erros e n representa o número total de observações (BORRA; THANKI; DEY, 2019). Em resumo, o valor máximo do coeficiente Kappa k é 1, indicando perfeita concordância entre a classificação e os dados de referência, enquanto, para não concordância, k se torna negativo. O valor 0 indica que não há concordância entre a classificação e os dados de referência. Enquanto a faixa 0,4–0,8 indica uma precisão média, um valor baixo de κ indica aleatoriedade na classificação (LIU; MASON, 2016). 15SIG: aplicação prática A classificação baseada em objetos ou orientada a objetos se vale de informações espectrais e espaciais para classificação. O processo envolve a categorização de pixels com base em suas características espectrais com os pixels adjacentes. Os métodos de classificação baseados em objetos são relativamente recentes quando comparados às técnicas tradicionais de classificação baseada em pixels. Embora a classificação baseada em pixels seja baseada apenas nas informações espectrais de cada pixel, a classificação baseada em objetos é baseada nas informações de um conjunto de pixels semelhantes chamados objetos ou objetos de imagem. A classificação baseada em objetos é um processo composto por duas etapas: primeiro a imagem é segmentada ou dividida em objetos e, em seguida, cada objeto é classificado. SIG para classificação de imagens Dentre os vários SIGs existentes para classifi cação de imagens, o presente capítulo irá abordar o MultiSpec devido à simplicidade no seu manuseio. O MultiSpec é um software desenvolvido para fornecer meios rápidos e fáceis de análise de dados de imagens multiespectrais, tais como aqueles obtidos pelos satélites observacionais da Terra Landsat, SPOT, MODIS e IKONOS. Aplicação do MultiSpec para classificação de imagens O MultiSpec também permite a análise de dados hiperespectrais como os do espectrômetro de imagem por infravermelho visível no ar (AVIRIS) e do sistema de satélite EO-1 Hyperion. A princípio, esse software foi criado para disponibilizar à comunidade científi ca geral novas ferramentas de análise com- plexas da Terra. Porém, ele também passou a ser aplicado na exibição e análise de muitos outros tipos de imagens digitais não relacionadas ao espaço, como dados de imagens médicas e atividades educacionais de ensino fundamental e médio. O MultiSpec foi implementado para os sistemas operacionais Apple Macintosh e Microsoft Windows (BIEHL; LANDGREBE, 2002). O MultiSpec teve sua origem no sistema de análise de imagens multies- pectrais LARSYS, um dos primeiros sistemas de processamento de dados multiespectrais de sensoriamento remoto, criado originalmente na década de 1960. Vários sistemas em laboratórios governamentais, laboratórios de pesquisa universitários e vários produtos oferecidos comercialmente são descendentes SIG: aplicação prática16 desse sistema. O objetivo original para o desenvolvimento do MultiSpec era fornecer uma ferramenta fácil de usar que pudesse ser usada para ensino, pesquisa, mas, principalmente, para fornecer aos pesquisadores a capacidade de experimentar novas técnicas sem ter que programar os algoritmos. Ele é usado nos cursos de sensoriamento remoto em nível de pós-graduação da Universidade de Purdue para ensinar técnicas de análise de processamento de sinal (BIEHL; LANDGREBE, 2002). Embora protegido por direitos autorais, o MultiSpec e sua documentação são distribuí- dos gratuitamente. As versões para Macintosh e Windows e a documentação sobre seu uso estão disponíveis na página da internet, no link a seguir. https://qrgo.page.link/hLRto Exemplo de classificação por máxima verossimilhança usando o MultiSpec O presente tópico apresenta um exemplo de classifi cação supervisionada, ou manual, do tipo máxima verossimilhança, com etapa de treinamento de amos- tra. Para este exemplo, é necessário baixar o arquivo “ag020522_DPAC_cd.lan”, disponibilizado gratuitamente na página de tutoriais do MultiSpec (2019). É importante ressaltar que o passo a passo descrito a seguir é baseado no tutorial número 4 do MultiSpec, o qual aborda a classifi cação do tipo supervisionada. Seleção dos campos de treinamento Passo 1: com a janela do MultiSpec aberta, em File → Open image, selecione “ag020522_DPAC_cd.lan” na pasta em que este arquivo foi salvo em seu computador. Na janela Set Display Specifications, continue com as propriedades padrão do software, como apresentado na Figura 7. Ao clicar em “OK”, a imagem da Figura 8 irá aparecer na janela do MultiSpec. 17SIG: aplicação prática Figura 7. Definição das propriedades da imagem a ser adicionada ao MultiSpec. Fonte: Adaptada de Multispec (2019). Figura 8. Visualização da imagem inserida. Fonte: Adaptada de Multispec (2019). SIG: aplicação prática18 Passo 2: na barra de tarefas, clique em Processor→Statistics, o qual apresentará a janela Set Project Options. Tal como na Figura 9, clique em “OK”. Figura 9. Definição de opções do projeto. Fonte: Adaptado de Multispec (2019). Passo 3: uma nova janela denominada Project aparecerá à direita da tela que será usada (Figura 10). Para selecionar os campos de treinamento para cada classe, basta “arrastar” uma área retangular na imagem e, em seguida, Add To List. Para exemplificar, a seleção da classe “árvores” é apresentada na Figura 11. Depois de Add To List, em Define Class and/ or Field description (Figura 12), dê um nome à classe. Neste exemplo, sugere-se o termo “árvores”. Repita este passo para cada classe. Neste exemplo, as classes definidas estão apresentadas na Figura 13. Depois de definidas todas as classes, salve o projeto em Files→Save Project As. Salve o projeto no seu diretório com um título de sua preferência. 19SIG: aplicação prática Figura 10. Tela de projeto. Fonte: Adaptada deMultispec (2019). Figura 11. Selecionando classe de “árvore”. Fonte: Adaptada de Multispec (2019). SIG: aplicação prática20 Figura 12. Definição das classes do projeto. Fonte: Adaptada de Multispec (2019). Figura 13. Edição das classes do projeto. Fonte: Adaptada de Multispec (2019). 21SIG: aplicação prática Classificação por máxima verossimilhança Passo 4: no menu Processor, selecione Classify. Na caixa de diálogo Set Classification Specifications, deixe a caixa da Image selection desmarcada, pois, durante esse passo, é desejável classificar apenas os campos de treinamento para obter uma estimativa inicial da qualidade da imagem, definição e treinamento de classe (Figura 14). Clique em OK. No menu Window, selecione Text Output para apresentar os resultados da classificação (Figura 15). Figura 14. Classificação de campos de treinamento. Fonte: Adaptada de Multispec (2019). SIG: aplicação prática22 Figura 15. Resultados da classificação. Fonte: Adaptada de Multispec (2019). Passo 5: assumindo-se que os resultados são satisfatórios, dado que a avaliação da acurácia indicou uma performance maior que 98%, realiza-se a classificação da área. No menu Processor, escolha Classify e selecione as opções na caixa Set Classification Specifications, tal como na Figura 16. Clique em OK. Em seguida, salve o projeto no menu Files→Save Project. Figura 16. Menu de especificação da classificação. Fonte: Adaptada de Multispec (2019). 23SIG: aplicação prática Passo 6: em File →Open Image, selecione o arquivo salvo com extensão “.gis”. Deve aparecer uma imagem semelhante à imagem apresentada na Figura 17. Este é um mapa de classificação. Deve-se ressaltar que as cores das classes podem ser modificadas clicando-se na paleta à esquerda da classe. Figura 17. Mapa de classificação da imagem. Fonte: Adaptada de Multispec (2019). Pode-se visualizar o mapa de probabilidade de classificação (Figura 18) para avaliar quais partes da imagem têm menores e maiores probabilidades de serem classificadas corretamente. Pode haver outras classes na imagem que nossos campos de treinamento não representaram adequadamente. Figura 18. Mapa de probabilidade de classificação da imagem. Fonte: Adaptado de Multispec (2019). SIG: aplicação prática24 A cor amarela e a cor vermelha representam uma alta probabilidade de estar correta. Esses pixels estão muito próximos dos pixels de treinamento para a classe determinada. Verde escuro a azul representam uma baixa probabilidade de estar correto. Esses pixels estão muito longe dos pixels de treinamento para todas as classes. A imagem classificada ainda pode representar a área suficientemente bem para nossos propósitos. Na classificação exemplificada, provavelmente poderia ser feito um trabalho melhor ao separar a classe das ervas daninhas e a classe do trigo. Além disso, também é provável que existam mais do que as seis classes selecionadas que podem ser separadas com sucesso. Das aplicações possíveis utilizando SIG, vale ressaltar que muitos novos produtos têm surgido, com múltiplas abordagens e variadas aplicações de inú- meros algoritmos computacionais. Uma dica para aprofundar seus estudos seria basicamente buscar as funcionalidades compatíveis com os problemas que você quiser resolver. Dessa forma, definindo-se as finalidades pretendidas, várias formas para resolução podem ser aplicadas pelo usuário de um SIG qualquer. AGYEMANG, T. K. et al. Accuracy assessment of supervised classification of submersed macrophytes: the case of the Gavaraget region of Lake Sevan, Armenia. Hydrobiologia, v. 661, n. 1, 2011. Disponível em: https://pubag.nal.usda.gov/catalog/555756/. Acesso em: 16 out. 2019. BIEHL, L.; LANDGREBE, D. MultiSpec—a tool for multispectral–hyperspectral image data analysis. Computers & Geosciences, v. 28, n. 10, 2002. Disponível em: https://www. sciencedirect.com/science/article/pii/S009830040200033X/. Acesso em: 16 out. 2019. BORRA, S.; THANKI, R.; DEY, N. Satellite image analysis: clustering and classification. Heidelberg: Springer Nature, 2019. ESRI. Image classification using the ArcGIS Spatial Analyst extension. California: ESRI, 2019. Disponível em: https://desktop.arcgis.com/en/arcmap/latest/extensions/spatial-analyst/ image-classification/image-classification-using-spatial-analyst.htm. Acesso em: 17 out. 2019. INPE. SPRING: tutorial de geoprocessamento. [S. l.: s. n.], 2006. Disponível em: http:// www.dpi.inpe.br/spring/portugues/tutorial/. Acesso em: 16 out. 2019. LIU, J. G.; MASON, P. J. Image processing and GIS for remote sensing techniques and appli- cations. 2nd. ed. Oxford: Willey, 2016. L3HARRIS GEOSPATIAL SOLUTIONS. Maximum likelihood. Colorado: Harris Geospatial Solutions, 2019. Disponível em: https://www.harrisgeospatial.com/docs/MaximumLi- kelihood.html. Acesso em: 16 out. 2019. 25SIG: aplicação prática LU, D.; WENG, Q. A survey of image classification methods and techniques for improving classification performance. International Journal of Remote Sensing, v. 28, n. 5, March 2007. Disponível em: https://www.tandfonline.com/doi/full/10.1080/01431160600746 456/. Acesso em: 16 out. 2019. MULTISPEC. Some multispec tutorials/exercises. [S. l.: s. n.], 2019. Disponível em: https:// engineering.purdue.edu/~biehl/MultiSpec/tutorials.html/. Acesso em: 17 out. 2019. NORTH CAROLINA STATE UNIVERSITY. Image classification. North Carolina: GIS, 2013. Disponível em: https://cajeportfolio.weebly.com/image-classification.html. Acesso em: 16 out. 2019. PARECE, T.; CAMPBELL, J.; MCGEE, J. Remote sensing in an arcmap environment. Virginia: Virginia Polytechnic Institute and State University, 2010. SISODIA, P.S.; TIWARI, V.; KUMAR, A. Analysis of supervised maximum likelihood classification for remote sensing image. Jaipur: IEEE, 2014. STORY, M.; CONGALTON, R. G. Accuracy assessment: a user’s perspective. Photogram- metric Engineering & Remote Sensing 52(3): 397–399, 1986. Disponível em: https:// www.asprs.org/wp-content/uploads/pers/1986journal/mar/1986_mar_397-399.pdf. Acesso em 18 out 2019. Leituras recomendadas INPE. Tutorial de geoprocessamento: classificação de imagens. [S. l.: s. n.], 2006. Disponível em: http://www.dpi.inpe.br/spring/portugues/tutorial/classific.html. Acesso em: 16 out. 2019. MULTISPEC. A freeware multispectral image data analysis system. [S. l.: s. n.], 2019. Dispo- nível em: https://engineering.purdue.edu/~biehl/MultiSpec/. Acesso em: 17 out. 2019. SIG: aplicação prática26 Dica do Professor Há inúmeros SIGs que podem ser utilizados para classificação de imagens. Nesse contexto, destaca-se o software MultiSpec, que foi desenvolvido para fornecer meios rápidos e fáceis de análise de dados de imagens multiespectrais, como os obtidos pelo Landsat, com funcionalidades importantes, como a análise da normalidade das classes e de baixa sobreposição, o que aumenta a acurácia dos resultados obtidos. Ainda que sejam protegidos por direitos autorais, o MultiSpec e sua documentação são distribuídos gratuitamente no site da Universidade de Purdue (EUA). Nesta Dica do Professor, você vai aprender a realizar uma alternativa de classificação de imagens, chamada classificação supervisionada. Aponte a câmera para o código e acesse o link do conteúdo ou clique no código para acessar. Exercícios 1) Uma imagem de satélite pode ser definida como uma matriz de números digitais que são armazenados na forma de bits e cujos comprimentos de onda estão relacionados às cores, às intensidades e aos níveis de cinza usados para representar cada imagem (BORRA et al., 2019). O uso de mais bandas espectrais fornece mais informações com detalhes, mas envolve complexidade de armazenamento e transmissão. Assinale o motivo de as imagens multiespectrais propiciarem a classificação de imagens: A) As imagens com diferentes classes têm diferentes números de pixels, que possibilitam o armazenamento das informações de luz. B) Bandas espectrais armazenam informaçõesde diferentes classes de uso ou cobertura de solo de acordo com sua reflexão ou absorção. C) As energias das bandas espectrais podem ser visualizadas em imagens com a mesma cobertura e uso do solo, em qualquer região. D) Diferentes classes de uso ou cobertura do solo refletem da mesma maneira em diferentes bandas espectrais e possibilitam múltiplas análises. E) Bandas espectrais armazenam informação de diferentes classes de uso ou cobertura de solo da mesma forma em qualquer imagem. 2) A classificação de imagens de satélites pode ser realizada de forma manual, a partir de análise visual, ou de forma automática, propiciando a classificação de diferentes informações geoespaciais, empregando-se sistemas de informações geográficas (SIGs). Nesse contexto, assinale a alternativa correta: A) A criação de mapas temáticos é possível apenas utilizando-se classes já definidas anteriormente. B) A obtenção dos mapas temáticos geralmente é uma missão muito complexa e dispendiosa. C) A conversão de imagens em mapas temáticos envolve a classificação dos geodados disponíveis. D) Os mapas temáticos, muitas vezes, não podem representar as diferentes classes de uso do solo. E) A geração de mapas temáticos só é possível quando há a classificação de dados já tratados. 3) Quando um usuário consegue identificar padrões na imagem original, é possível “treinar” o SIG para identificar características similares em toda a imagem e gerar uma nova imagem a partir do padrão determinado (agrupamento em classes). Quanto a esse procedimento, assinale a alternativa mais adequada: A) Após a definição das amostras de treinamentos é que se define o procedimento a ser realizado. B) Os padrões de classificação dos pixels podem ser definidos pelo usuário ou por outras fontes. C) É dispensável o conhecimento dos dados, de classes e de algoritmos a serem aplicados. D) Se a classificação for precisa, cada classe resultante corresponde a um ou mais padrões. E) A classificação supervisionada é aquela que não demanda informações prévias de classes. 4) Podemos afirmar que a classificação é um campo muito ativo e dinâmico na pesquisa computacional até os dias atuais. O reconhecimento de padrões, a classificação por identificação de pixels ou a segmentação da imagem baseada em estatística multivariada são possibilidades viáveis e que podem ser feitas de diversas formas. Sobre a dinâmica da classificação de imagens, pode-se afirmar: A) A classificação pode ser orientada a objetos utilizando-se conjuntos de pixels para sua determinação. B) A classificação baseada em objetos é feita usando-se informações espectrais e não espaciais. C) A categorização de pixels, com base nos pixels mais distantes, permite melhor comparação. D) As técnicas mais novas são as de classificação não supervisionada, e a mais antiga, a de objetos. E) Os grupos de pixels não se assemelham entre si, diferindo com base apenas na intensidade de cor. 5) A classificação de dados detectados remotamente e a conversão das informações em um mapa temático não são processos únicos e simples. Além dos erros da própria classificação, há possibilidade de haver erros quanto à posição do registro, de interpretação ou devidos à qualidade das imagens (de treinamento ou a serem classificadas). Sobre a acurácia na classificação de imagens de satélite, podemos afirmar: A) Fatores como a paisagem da área de estudo inserem uma variável mais simples ao mapa temático. B) A classificação de dados de satélites não permite a geração de mapas temáticos bons e confiáveis. C) A matriz de contingência é muito utilizada para avaliação da acurácia da classificação da imagem. D) A precisão geral é a soma dos parâmetros de precisão do usuário, gerando o coeficiente Kappa. E) O coeficiente Kappa é uma variável que confirma a confiabilidade da busca por padrões de cores. Na prática Entre os muitos softwares que podem ser utilizados para correções de imagens, há o nacional Spring, criado pelo Instituto Nacional de Pesquisas Espaciais (INPE). O INPE vem realizando atualização de funções e mantendo a disponibilidade gratuita do software de forma coerente, possibilitando que freewares nacionais sejam respeitados e difundidos para uso didático e científico. Na Prática, confira os primeiros passos para utilização do Spring (instalar, criar de banco de dados, importar imagens e aplicar uma técnica simples de realce de imagens). Aponte a câmera para o código e acesse o link do conteúdo ou clique no código para acessar. Saiba mais Para ampliar o seu conhecimento a respeito desse assunto, veja abaixo as sugestões do professor: Metodologia de classificação de imagens multiespectrais aplicada ao mapeamento do uso da terra e cobertura vegetal na Amazônia: exemplo de caso na região de São Félix do Xingu, sul do Pará Nesta pesquisa, o autor apresenta uma metodologia de classificação de imagens multiespectrais aplicada à análise e ao mapeamento da evolução do uso da terra/cobertura vegetal em São Félix do Xingu, no sul do Pará. Aponte a câmera para o código e acesse o link do conteúdo ou clique no código para acessar. Classificação supervisionada no QGis Neste vídeo, são apresentadas algumas dicas da classificação de imagens utilizando o QGis. Aponte a câmera para o código e acesse o link do conteúdo ou clique no código para acessar. Classificação não supervisionada no QGIS Este vídeo mostra como realizar um clustering utilizando o QGis. Aponte a câmera para o código e acesse o link do conteúdo ou clique no código para acessar. INPE — Livros Neste link do DPI/INPE, você acessa uma série de materiais sobre sensoriamento remoto, banco de dados geográficos, processamento de imagens, modelagem espacial, entre outros. Aponte a câmera para o código e acesse o link do conteúdo ou clique no código para acessar.