Baixe o app para aproveitar ainda mais
Prévia do material em texto
RECONHECIMENTO DE PADRÕES Marcelo da Silva dos Santos Segmentação de imagens Objetivos de aprendizagem Ao final deste texto, você deve apresentar os seguintes aprendizados: Descrever os aspectos fundamentais da segmentação de imagens. Identificar as principais abordagens para segmentação de imagens. Demonstrar aplicações da segmentação de imagens. Introdução O processamento digital de imagens envolve técnicas que buscam melho- rar a qualidade visual da imagem para extrair o máximo de informações confiáveis. Desde o momento da captação até a interpretação imagem, o objetivo é prepará-la, ajustando e realçando suas características para que seu uso seja o mais assertivo possível. Nesse processo, encontra-se a fase de segmentação da imagem, que consiste em destacar as regiões de interesse do analista, aplicando diferentes técnicas, que dependem do resultado final esperado. Neste capítulo, você vai estudar os conceitos básicos de segmentação da imagem e processamento de imagens digitais. Vai também conhecer os métodos de avaliação por descontinuidade e similaridade de regiões, além de algumas das principais atividades que empregam segmentação de imagem e visão computacional. 1 Conceitos de segmentação de imagens digitais O processamento digital de imagens se dá em algumas etapas, entre elas a segmentação. É uma etapa importante, pois antecede os processos de clas- sifi cação e reconhecimento de padrões e pode garantir ou não o sucesso de toda a operação. Veja a seguir, resumidamente, a descrição das etapas que compreendem a área de processamento de imagens (GONZALEZ; WOODS, 2015; PEDRINI; SCHWARTZ, 2007). Aquisição de imagens: entrada de uma imagem digital e sua discreti- zação matemática. Pré-processamento: são realizados procedimentos de melhoria da ima- gem, que envolvem realce de detalhes, ajuste de contraste, dentre outras. Segmentação: particionar uma imagem em regiões que representam áreas de interesse para a classificação. Extração de características: simplificação do conjunto de dados identi- ficado para possibilitar identificação e comparação desses dados com mais precisão. Classificação: categorização da informação para reconhecer padrões e objetos homogêneos que correspondem aos temas de interesse. Reconhecimento e interpretação: etapa final, geralmente envolvendo componentes de inteligência artificial, que buscam comparar os resul- tados obtidos com bases de conhecimento, compreender e utilizar esses dados de acordo com o domínio do problema e objetivos da aplicação. A etapa de segmentação visa dividir uma imagem em regiões ou agrupa- mentos de pixels, a fim de auxiliar a interpretar as informações nela conti- das (PEDRINI; SCHWARTZ, 2007). Em geral, essa etapa pretende separar regiões significativas, que poderão ter relevância para processos posteriores, como a identificação dos objetos dessa imagem. Algumas metodologias de segmentação utilizam uma única característica para o processo, mas o nú- mero de filtros pode ser aumentado, cada um destacando uma característica procurada. Após destacar essas regiões, a imagem pode então seguir para a classificação e a identificação dos elementos. A interpretação semântica dessas regiões identificadas finaliza o processo de análise possibilitando uma tomada de decisão. Por exemplo, um sistema pode reconhecer o padrão em uma imagem de código de barras, separar as regiões e, posteriormente, interpretá-las, inferindo o número a que a imagem se refere e ligá-lo a um determinado produto, em uma loja, por exemplo. A continuidade, neste caso, pode ser a soma do produto ao valor total da compra. É possível realizar a classificação com base em uma característica extraída. No entanto, para incrementar a confiabilidade no resultado, frequentemente considera-se um número maior de características da imagem, uma para cada elemento que se quer destacar. Na próxima seção, você conhecerá melhor essas duas estratégias e algumas metodologias utilizadas por cada uma. Segmentação de imagens2 2 Abordagens para segmentação de imagens Os algoritmos de segmentação são geralmente baseados na busca de variâncias nas intensidades dos níveis de cinza em uma imagem, identifi cados pelas descontinuidades ou pelas similaridades desses níveis. Podemos defi nir esses conceitos conforme segue (GONZALEZ; WOODS, 2015). Descontinuidade: foco está na identificação de pontos isolados, linhas e bordas na imagem (edge detection), ou seja, divide a entrada com base em variações bruscas nos níveis de cinza. Similaridade: baseia-se em métodos de limiarização, crescimento de regiões (region growing) e divisão-e-união de regiões (splitand-merge). Segmentação por descontinuidade Na abordagem de segmentação por descontinuidade, a busca pelos objetos contidos na imagem é realizada utilizando três características principais: pontos, linhas e bordas. As técnicas usadas na segmentação descontínua são baseadas principalmente em operações orientadas à vizinhança de pixels. Para isso, tais técnicas utilizam o conceito de convolução, empregando fi ltros (também denominados máscaras, ou kernel). Os fi ltros são construídos para ressaltar a característica que se busca destacar. Você vai conhecer agora um pouco mais sobre os principais tipos de segmentação por descontinuidade. Detecção de pontos A detecção de pontos isolados pode ser considerada a mais simples das téc- nicas de identifi cação de regiões de interesse. Nessa abordagem, buscam-se pontos onde ocorra uma mudança drástica do valor de cinza de um pixel em comparação aos seus vizinhos. Por exemplo, utiliza-se como critério de comparação a máscara apresentada na Figura 1, com fi ltro laplaciano, ou de passa-alta, utilizado para eliminar sinais de baixa frequência e realçar os de alta frequência. 3Segmentação de imagens Figura 1. Imagem de um filtro laplaciano, ou de passa-alta. Fonte: Roncero (2005, documento on-line). Podemos inferir que um ponto será identificado na posição em que a máscara estiver posicionada, se: |R| > T onde T possui limiar não negativo e R é valor resultante de uma convolu- ção. Na prática, caso exista um pixel com alto nível de cinza isolado em uma região, o filtro passa-alta é usado para detectar esse ponto, aumentando ainda mais sua diferença em relação aos seus vizinhos. Sua aplicação então auxilia a destacar essa diferença entre esse ponto de seus vizinhos mais próximos. Detecção de linhas Também é efetuada por meio de fi ltros de passa-alta que consideram direção, ou seja, kernels construídos para realce de linhas nas direções horizontal, vertical, ângulos de +45º e −45º, por exemplo. Observe a Figura 2. Figura 2. Máscaras para detecção de linhas em uma imagem: linhas nas direções horizontal, vertical e ângulos de +45º e −45º. Fonte: Roncero (2005, documento on-line). Segmentação de imagens4 É semelhante ao processo realizado por pontos isolados; o principal dife- rencial é que o procedimento agora deve ser repetido com diferentes kernels, um kernel para cada orientação que se deseja realçar. Detecção de bordas Em imagens digitais, uma borda é o limite entre duas regiões de níveis de cinza diferentes (GONZALEZ; WOODS, 2015). Para identifi cação e realce de bordas, também aplica-se o processo de convolução com fi ltros específi cos, com o objetivo de realçar as regiões componentes da imagem e, então, avaliar se tais objetos são homogêneos e se a transição entre eles pode ser identifi - cada com base apenas na descontinuidade dos níveis de cinza (aumento ou redução abrupta na intensidade de cinza das regiões). No caso dos fi ltros, é comum dar preferência para os fi ltros de passa-alta, que destacam áreas de alta intensidade de cinza. Existe uma vasta galeria de técnicas e algoritmos para auxiliar neste tipo de detecção. Podemos citar os métodos de Roberts, Prewitt, Sobel, Canny, Rothwell, Nalwa, dentre outros, como exemplos de trabalhos que se destacaram na tarefade identificar bordas. Veja a seguir alguns dos mais implementados. Método de Roberts: calcula as diferenças de níveis de cinza por dife- renças cruzadas aplicando kernels de 2×2 em sua abordagem. Método de Prewitt: diferencia variações nas direções vertical e horizon- tal. Por utilizar kernels com dimensão 3×3, aumenta significativamente o resultado na detecção das bordas em relação à máscara de Roberts. Método de Sobel: similar aos anteriores, porém com maiores valores próximos ao pixel central. Com esse incremento, a abordagem de Sobel apresenta bordas mais destacadas em comparação a outras abordagens. Método de Canny: uma das abordagens mais eficientes no processa- mento de imagens com ruídos ou com bordas com baixa definição, mas seu custo computacional é relativamente alto, e os resultados geralmente necessitam ser pós-processados para aumentar a clareza. Como vimos, na maioria dos métodos elencados são utilizados filtros do tipo passa-alta em seu processo. Tais filtros tem a função de realçar detalhes na imagem, tais como bordas, manchas ou linhas retas e curvas, gerando uma “agudização” (sharpering) (GONZALEZ; WOODS, 2015; PEDRINI; SCHWARTZ, 2007). Porém, caso a imagem original tenha ruídos, eles tam- 5Segmentação de imagens bém serão ressaltados durante suas execuções (derivadas), como pode ser visto na Figura 3. Figura 3. Ruídos em filtragens passa-alta. Fonte: Sobral (2002, documento on-line). Note que quanto mais ruído na imagem original, maior é o efeito de distorção no resultado após cada derivação. Para minimizar esse problema, é indicado utilizar antes um filtro de passa-baixa, que tem a função de suavizar elementos da imagem, auxiliando na redução de possíveis ruídos. Segmentação de imagens6 Alguns tipos de distorções em imagens ocorridos no momento da captura, como variações aleatórias no brilho ou cor, são chamados de ruídos (GONZALEZ; WOODS, 2015; PEDRINI; SCHWARTZ, 2007). Alguns dos exemplos mais conhecidos são o ruído gaussiano, salt-and-pepper (pixels brancos e pretos na imagem), speckle, exponencial, dentre outros. Veja exemplos na Figura 4. Segmentação por similaridade É uma técnica de agrupamento de dados, em que somente as regiões adja- centes, espacialmente, podem ser agrupadas. Inicialmente, esse processo de segmentação rotula cada pixel como uma região distinta. Já a similaridade baseia-se nos métodos de limiarização, crescimento de regiões e divisão e fusão de regiões (GONZALEZ; WOODS, 2015). Segmentação por limiarização Limiares (threshold) são valores empregados em diversos momentos no pro- cessamento de imagens como um ponto de corte, um limiar que defi ne como os valores acima ou abaixo dele serão tratados. Tal limiar determina limites 7Segmentação de imagens máximos ou mínimos que uma determinada característica da imagem deve assumir para que seja identifi cada na imagem. A limiarização, também conhecida como binarização, converte os níveis de cinza da imagem original, transformando-a em uma imagem binária. Após definidos os limiares, os pixels são convertidos e selecionados para cada grupo, convertendo a imagem para binária, ou de dois níveis (KULKARNI, 2012). Nessa abordagem, o limiar é conhecido como a variável T. Quando o pixel for maior que o limiar, ele assume o valor de nível lógico 1 e, quando menor, ele assume o valor de nível lógico 0. Uma imagem limiarizada g (x, y) é definida na Equação 1 (GONZALEZ; WOODS, 2015): onde T é o valor do limiar que separa os pixels em duas classes; f (x, y) é o valor original da intensidade do pixel e g (x, y) é o valor resultante do pixel após a limiarização ter sido realizada. Os pixels tendo valor 1 ou com qualquer outro nível de cinza conveniente correspondem aos objetos, enquanto os que receberem 0 como valor corresponderão ao fundo da imagem (Figura 5). Figura 5. Destaque de regiões de interesse aplicando limiares. Fonte: Cámara-Chávez (2013, documento on-line). Para imagens com representação RGB, por exemplo, cada canal é repre- sentado por um histograma correspondente. Devem ser indicados limiares específicos para cada um deles, de forma que a faixa de cores indicada venha a compor a região segmentada (ÁLVAREZ IGLESIAS, 2008). Segmentação de imagens8 A limiarização de histogramas é uma técnica de segmentação bastante popular, que procura por picos e vales no histograma, mas só obtém bons resultados se os picos dominantes no histograma puderem ser corretamente reconhecidos, sem ruídos ou variação brusca (SIEBRA, 2013) (Figura 6). Figura 6. Valores mal ajustados para os limiares podem afetar os resultados. Fonte: Cámara-Chávez (2013, documento on-line). O processo conta com um complicador na tarefa de definir valores para um limiar ideal para determinados tipos de imagens. Limiares que podem fornecer resultados satisfatórios para uma imagem podem não reproduzir o mesmo efeito para outra. Segmentação por crescimento de regiões O método de segmentação por crescimento de regiões (region growing) con- siste em localizar grupos de pixels adjacentes com alguma propriedade de similaridade. Desse modo, identifi ca regiões formadas por pixels próximos e com nível de cinza similar. A partir de um pixel da imagem (conhecido como semente), o algoritmo verifi ca seus vizinhos próximos para decidir se eles possuem proximidade em seus níveis de cinza, conforme o critério de similaridade predefi nido. Caso identifi cada a similaridade, são marcados como uma região. Os agrupamentos crescem a partir de novos pixels sementes. Observe a Figura 7: (1) imagem original e defi nição da semente; (2) primeira identifi cação de similaridade; (3) um a um, os pixels identifi cados se tornam sementes e passam pelo processo de identifi cação; (4) depois de identifi cados os limites da região, é selecionada uma nova semente em outra posição, e o processo reinicia. 9Segmentação de imagens Figura 7. Agrupamento por regiões. Fonte: Cámara-Chávez (2013, documento on-line). Uma forma melhorada é não começar com pixels, mas com uma região da imagem em um conjunto de pequenas regiões. Um teste de uniformidade é aplicado a cada região. Se o teste falhar, a região é subdividida em elementos menores até que todas regiões fiquem uniformes. Então, as regiões se desen- volveram de regiões menores. A vantagem de usar pequenas regiões em vez de pixels é a redução da sensibilidade ao ruído (GONZALEZ; WOODS, 2015). Segmentação por divisão e fusão Esse método de segmentação (splitting and merging) divide o processo de identifi cação de crescimento de regiões em duas fases: divisão (split) e fusão (merge). A fase de divisão serve como um pré-processamento, em que a imagem é particionada em regiões quadradas conforme critérios de homogeneidade preestabelecidos e tem o objetivo de minimizar a quantidade de fusões neces- sárias (HOROWITZ; PAVLIDIS, 1974). Na sequência, é aplicada a técnica de crescimento de regiões para unir essas regiões quadradas em regiões maiores, que estejam em conformidade com os critérios de homogeneidade. Assim como outras técnicas de divisão e conquista, o objetivo é reduzir o tamanho do problema inicial e resolvê-lo em partes, reunifi cando-o logo que as pequenas partes estiverem resolvidas. Segmentação de imagens10 Segmentação por agrupamento A segmentação por agrupamento (clustering) agrupa os pixels em classes homogêneas (clusters) de forma que todos os elementos de uma mesma classe tenham a maior similaridade possível. Para identifi cação de similaridade, podem ser utilizados critérios específi cos, como distância, conectividade, intensidade, entre outras, selecionados conforme a característica que se deseja realçar (Figura 8). Figura 8. Segmentação de regiões por agrupamento. Fonte: Adaptada de Santos (2009). A segmentação por agrupamento possui diversos algoritmos amplamente aplicados, sendo alguns dos mais conhecidos o k-means, fuzzy c-means, hierarchical clustering e mixture of gaussians. Algoritmosfuzzy incluem o princípio da incerteza na identificação de cada pixel da imagem e sua possível pertinência ao grupo. O conceito fuzzy tem o objetivo de incluir, matematica- mente, conceitos subjetivos, como aproximadamente, em torno de e abaixo de. A imprecisão pode ser utilizada para definir um evento e tem sido aplicada com sucesso ao processo de segmentação de imagens. 3 Aplicações baseadas em segmentação No contexto de processamento de imagens, a qualidade dos resultados da etapa de segmentação defi ne o sucesso do resultado ou o fracasso de todo o processamento. Entre as aplicações mais conhecidas temos sensoriamento remoto, análise de imagens médicas, inspeção industrial, identifi cação de objetos tridimensionais a partir de imagens 2D, dentre outras. Para isso, téc- nicas, algoritmos e metodologias foram desenvolvidos para análise de diversos 11Segmentação de imagens aspectos das imagens pela coloração (níveis de cinza, RGB) ou estrutural (objetos sólidos ou texturizados). A automatização de tarefas realizadas por meio de funções visuais dos seres humanos é uma das principais motivações. O estudo da visão humana, como a retina decompõe a imagem em canais de frequência, noção de distância e profundidade, dentre outros conceitos, serviu de fonte de inspiração para diversas aplicações. Veja a seguir algumas das áreas de aplicação que utilizam segmentação de imagem em sua arquitetura. Análise de imagens médicas Pode auxiliar na precisão de diagnósticos. A aquisição ocorre a partir de di- versas fontes (ressonância magnética, tomografi a computadorizada, ultrassom) e é utilizada na identifi cação de lesões, tumores e outras e outras patologias, medição de volumes de tecido, cirurgia assistida por computador e diversos estudos biomecânicos e anatômicos. Podem ser encontrados como assistentes de cuidados de saúde, sensores biométricos, entre outras aplicações. Mesmo não dispensando a interpretação por especialistas, podem auxiliar em casos de subjetividade, complexidade da imagem e diferenças de interpretação (Figura 9). Figura 9. a) Imagem de ultrassom da cavidade pélvica de uma paciente e b) resultado da utilização de um algoritmo de threshold; c) resultado do operador de Canny. Fonte: Santos (2009, documento on-line). Segmentação de imagens12 Indústria Há alguma tempo, a automatização de processos envolvendo visão compu- tacional é uma realidade na indústria. Complexas inspeções de qualidade realizadas manualmente por atentos olhos humanos atualmente dão espaço para um modelo mais preciso e efi caz. As aplicações são muitas: inspeção de acabamento de superfície, avaliação do desgaste de peças e detecção de imperfeições na fabricação, classifi cação e separação de produtos, análise de cor e textura, controle de qualidade de matérias-primas e produtos, dentre outras (Figura 10). Figura 10. Imagens resultado da técnica multiflash: a) intensidade máxima, b) mapa de profundidade e c) bordas detectadas. Fonte: Morgan (2008, documento on-line). Análise documental e grafológica A segmentação também pode ser utilizada para extração de texto e de gráfi cos em documentos digitalizados, como artigos e materiais impressos. Aplicações que utilizam reconhecimento de caracteres podem ser aplicadas em reconhe- cimento de endereço postal, análise forense, comparação de assinaturas em documentos (Figura 11) e controle de fraudes. 13Segmentação de imagens Figura 11. Esquema do processo de decisão na verificação de assinaturas off-line baseado na visão pericial. Fonte: Adaptada de Santos (2004). Sensoriamento remoto Por meio de imagens adquiridas por satélites, o sensoriamento remoto é capaz de auxiliar na identifi cação e na classifi cação de regiões homogêneas com diferentes tipos de terrenos, como agrimensura e plantações, fontes de água, locais de refl orestamento e desmatamento, desertifi cação, acompanhamento da degradação de solo e a ocupação das áreas urbanas, por exemplo. Também podem avaliar fenômenos climáticos, topografi a, dentre outras, principal- mente na agricultura. Observe na Figura 12 um exemplo de classifi cação não supervisionada. Segmentação de imagens14 Figura 12. Classificação não supervisionada. Fonte: Ambiental Consulting (2014, documento on-line). Neste capítulo, você conheceu os fundamentos de segmentação de imagens e processamento de imagens digitais. Dentre suas atividades, estão o realce dos detalhes, a identifi cação de regiões de interesse e a preparação para etapas de extração de características e classifi cação. Tais dados servem de entrada para aplicações de visão computacional e de inteligência artifi cial, visando à automatização de tarefas como diferencial competitivo para empresas e trazendo mais efi cácia e padronização nos resultados. ÁLVAREZ IGLESIAS, J. C. Uma metodologia para caracterização de sínter de minério de ferro: microscopia digital e análise de imagens. 2008. Dissertação (Mestrado) – PUC-Rio, Rio de Janeiro, 2008. Disponível em: https://www.maxwell.vrac.puc-rio.br/13047/13047_1. PDF. Acesso em: 25 jul. 2020. AMBIENTAL CONSULTING. Sensoriamento remoto. São Paulo: SOS Mata Atlântica, 2014. Disponível em: https://www.sosma.org.br/wp-content/uploads/2014/05/sensoria- mento-remoto.pdf. Acesso em: 27 ago. 2020. CÁMARA-CHÁVEZ, G. Segmentação. Ouro Preto: UFOP, 2013. Disponível em: http://www. decom.ufop.br/guillermo/BCC326/slides/Processamento%20de%20Imagens%20-%20 Segmentacao.pdf. Acesso em: 27 ago. 2020. 15Segmentação de imagens GONZALEZ, R. C.; WOODS, R. E. Processamento digital de imagens. 3. ed. São Paulo: Pearson, 2015. HOROWITZ, S. L.; PAVLIDIS, T. Picture segmentation by a directed split-and-merge procedure. Copenhagen: [s. n.], 1974. KULKARNI, N. Color thresholding method for image segmentation of natural images. International Journal of Image, Graphics and Signal Processing, 2012. Disponível em: https://www.semanticscholar.org/paper/Color-Thresholding-Method-for-Image- -Segmentation-of-Kulkarni/6601a2fb1e0b9d7b729faa826be33814e9d5201c. Acesso em: 27 ago. 2020. MORGAN, J. Técnicas de segmentação de imagens na geração de programas para máqui- nas de comando numérico. 2008. Dissertação (Mestrado) – UFSM, Santa Maria, 2008. Disponível em: https://repositorio.ufsm.br/bitstream/handle/1/8071/JOLVANIMORGAN. pdf?sequence=1&isAllowed=y. Acesso em: 27 ago. 2020. PEDRINI, H.; SCHWARTZ, W. R. Análise de imagens digitais: princípios, algoritmos e apli- cações. São Paulo: Cengage Learning, 2007. RONCERO, V. G. Um estudo de segmentação de imagens baseado em um método de computação evolucionária. 2005. Dissertação (Mestrado) – Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2005. Disponível em: http://www.pee.ufrj.br/index.php/ pt/producao-academica/dissertacoes-de-mestrado/2005-1/2005062702-2005062702/ file. Acesso em: 27 ago. 2020. SANTOS, C. R. Análise de assinaturas manuscritas baseada nos princípios da grafoscopia. 2004. Dissertação (Mestrado) – Pontifícia Universidade Católica do Paraná, Curitiba, 2004. Disponível em: https://www.ppgia.pucpr.br/pt/arquivos/mestrado/disserta- coes/2004/2004_cesar_roberto_santos.pdf. Acesso em: 27 ago. 2020. SANTOS, J. A. Reconhecimento semi-automático e vetorização de regiões em imagens de sensoriamento remoto. 2009. Dissertação (Mestrado) – Universidade Estadual de Campinas, Campinas, 2009. Disponível em: https://www.researchgate.net/publica- tion/232613343_Reconhecimento_semi-automatico_e_vetorizacao_de_regioes_ em_imagens_de_sensoriamento_remoto. Acesso em: 27 ago. 2020. SIEBRA, H. A. Segmentação fuzzy de imagens coloridas com características texturais: uma aplicação a rochas sedimentares. 2013. Dissertação (Mestrado) – UFRN, Natal, 2013. Disponível em: https://repositorio.ufrn.br/jspui/handle/123456789/18687. Acesso em: 27 ago. 2020. SOBRAL, J. L. Segmentação de imagem. Braga: Universidade do Minho, 2002. Disponível em: http://gec.di.uminho.pt/lesi/vpc0304/Aula07Segmenta%C3%A7%C3%A3o.pdf. Acesso em: 27 ago.2020. Segmentação de imagens16 Leitura recomendada SOLOMON, C.; BRECKON, T. Fundamentos de processamento digital de imagens: uma abordagem prática com exemplos em Matlab. Rio de Janeiro: LTC, 2013. Os links para sites da web fornecidos neste capítulo foram todos testados, e seu fun- cionamento foi comprovado no momento da publicação do material. No entanto, a rede é extremamente dinâmica; suas páginas estão constantemente mudando de local e conteúdo. Assim, os editores declaram não ter qualquer responsabilidade sobre qualidade, precisão ou integralidade das informações referidas em tais links. 17Segmentação de imagens
Compartilhar