Buscar

Parte 1- Fundamentos de Imagens Digitais

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 30 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 6, do total de 30 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 9, do total de 30 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Parte 1- Fundamentos de Imagens Digitais
Sabrina Brandão Santiago
Processamento de Imagens
As técnicas voltadas para a análise de dados multidimensionais, adquiridos por diversos tipos de sensores recebem o nome de processamento digital de imagens, ou seja é a manipulação de uma imagem por computador de modo que a entrada e a saída do processo são imagens.
Usa-se para melhorar o aspecto visual de certas feições estruturais para o analista humano e para fornecer outros subsídios para a sua interpretação, inclusive gerando produtos que possam ser posteriormente submetidos a outros processamentos.
Formas possíveis de manipulação
 Retificação e restauração de imagens: operações realizadas para minimizar as distorções e degradações dos dados de uma imagem, com a finalidade de criar uma representação mais fiel da cena.
Realçamento de imagens: procedimentos aplicados aos dados de uma imagem com o objetivo de melhorar efetivamente a visualização da cena, para subsequente interpretação visual.
Classificação de imagens: estas operações têm a finalidade de substituir a análise visual dos dados por técnicas quantitativas de análise automática, visando a identificação das regiões presentes na cena. 
Combinação de dados (data merging): procedimentos utilizados para combinar os dados de uma imagem, referente a uma certa área geográfica, com outros conjuntos de dados referenciados geograficamente, para a mesma área.
Componentes de um sistema de processamento de imagens
Conceito de Imagem Digital:
Pode ser definida como um conjunto cujos componentes estão em Z³.
É uma função bidimensional f(x,y) , onde os valores de x e y são representados por valores pertencentes ao conjunto Z+ e representam coordenadas espaciais.
A amplitude de f representa a intensidade do brilho ou o tom de cinza. 
É chamada de imagem digital pois seus componentes são representados por valores finitos e discretos.
Uma imagem digital é uma imagem f(x, y) discretizada tanto em coordenadas espaciais quanto em brilho. 
Uma imagem digital pode ser considerada como sendo uma matriz cujos índices de linhas e de colunas identificam um ponto na imagem. 
O correspondente valor do elemento da matriz identifica o nível de cinza naquele ponto. Os elementos dessa matriz digital são chamados de elementos da imagem (pixels). 
Quanto mais pixels uma imagem tiver melhor é a sua resolução e qualidade.
f(x; y) e intensidade ou nível de cinza;
 Imagem digital = valores são quantidades finitas e discretas;
 Elementos: pixels, elementos pictóricos, elementos de imagem 
Processamento digital de imagens - computador digital;
O que é uma imagem digital?
A representação visual de um objeto recebe o nome de imagem. Esta representação pode realizar-se através de diversos procedimentos ou técnicas, como a fotografia, a pintura ou o vídeo.
Uma imagem digital é a representação de uma imagem bidimensional usando números binários codificados de modo a permitir seu armazenamento, transferência, impressão ou reprodução, e seu processamento por meios eletrônicos. Há dois tipos fundamentais de imagem digital. Uma é do tipo rastreio (raster) e outra do tipo vetorial. Uma imagem digital do tipo raster, ou bitmap, ou ainda matricial, é aquela que em algum momento apresenta uma correspondência bit-a-bit entre os pontos da imagem raster e os pontos da imagem reproduzida na tela de um monitor. A imagem vetorial não é reproduzida necessariamente por aproximação de pontos, antes era destinada a ser reproduzida por plotters de traçagem que reproduziam a imagem por deslocamento de canetas-tinteiro.
Tipicamente, as imagens raster são imagens fotográficas, e as imagens vetoriais são desenhos técnicos de engenharia, arquitetura, design, etc. 
Imagens bitmap
 Imagens bitmap são construídas com a formação de quadrados muito pequenos chamados de pixel. Para demonstrar essa construção está abaixo as ilustrações, nas quais estão demonstradas as características principais. Na grade de base, cada quadrado representa 1 pixel.
Vejamos um simples exemplo, ao criar um círculo preto com 20 pixels de diâmetro (Figura 1.2). O número de pixels determina a resolução do arquivo. O computador registra este arquivo pela gravação da exata localização e cor de cada pixel. O computador não tem ideia que isso é um círculo, somente que é um aglomerado de pequenos pontos.
A imagem consiste em centenas de linhas e colunas de pequenos elementos. Cada elemento chama-se pixel (abreviatura de picture element). O olho humano não é capaz de ver cada pixel individualmente, ficando então com a percepção de uma imagem com suaves gradações. O número de pixeis necessários para obter uma boa imagem depende do uso desta imagem.
Cada pixel tem uma coordenada, e o conteúdo deste pixel é gravado e salvo no arquivo.
Bitmap
As imagens bitmap (mapa de bits), são tal como o nome indica, uma colecção de bits. 
A imagem consiste numa matriz de pontos individuais (pixel) em que cada um tem a sua própria cor (descrita usando bits, a mais pequena unidade de informação para um computador).
Quando tentamos alargar, aumentar (em escala ou aleatóriamente) o bitmap, um problema acontece, o arquivo modificado em tamanho/imagem, somente alarga o tamanho do pixel, o que resulta no efeito de “pixelização” da imagem.
A imagem fica pixelada. No caso de imagens com 16 milhões de bits elas produzem desfoque e áreas quadriculadas, uma pixelização bem suave. De qualquer forma há perda de qualidade.
Arquivo Indexado - GIF - 256 cores
Arquivo RGB - JPG - 16 milhões
Pixel 
O pixel é a menor unidade que compõe uma imagem, seja ela uma foto ou um frame (quadro) de um vídeo. Eles estão presentes não só em filmes, animações e capturas fotográficas, como também são parte importante das telas de TVs, monitores e smartphones e de sensores de câmeras.
Cada pixel é baseado nas três cores básicas: vermelho, verde e azul. Cada cor possui 256 tonalidades, o que proporciona até 16 milhões de combinações de cores diferentes. São os agrupamentos de pixels em grande quantidade que formam imagens, fotos e frames de vídeos. A qualidade de uma imagem depende de quantos pixels a compõem. Logo, quanto mais pixels, maior a qualidade. Nós chamamos isso de resolução.
PIXEL
A organização de uma imagem em uma matriz de pixels é feita em uma simetria quadrada, na maioria das vezes, devido a facilidade de implementação eletrônica, seja dos sistemas de aquisição sou de visualização de imagens.
Essa organização levanta algumas questões no processamento de imagens:
1- O pixel é uma elemento anisotrópico, ou seja, ele não apresenta as mesmas propriedades em todas as direções.
Assim um pixel tem 4 vizinhos de borda e 4 vizinhos de diagonal. 
Gerando dois tipos de conectividade:
D4 (onde levamos em consideração apenas os vizinhos de borda) ;
D8 (onde levamos em consideração os vizinhos de borda e os de diagonal)
2- Outra questão ocorre como consequência direta da primeira, ou seja, as distâncias entre um ponto e seus vizinhos não é a mesma segundo o tipo de vizinho (ela é igual a 1 para vizinhos de borda e √2 para aqueles na diagonal).
Distância euclidiana (ou distância métrica) é a distância entre dois pontos, que pode ser provada pela aplicação repetida do teorema de Pitágoras. Aplicando essa fórmula como distância, o espaço euclidiano torna-se um espaço métrico.
Que é representada pela equação:
Imagens Line-art
São imagens que apenas contêm duas cores, normalmente o preto e o branco. Por vezes são referidas como imagens bitmap porque o computador tem de usar apenas 1 bit (on=preto, off=branco) para poder definir cada pixel.
Imagens Grayscale
Contêm várias gradações de cinzentos, também compostas por preto e branco. No sistema do computador, a gradiência é formada em sua máxima configuração de 256 linhas.
Imagens Multitônicas
Imagens que contêm gradações de duas ou mais cores. As imagens multitônicas mais conhecidas são as duotônicas, que normalmente são compostas por preto e por umasegunda cor direta (normalmente uma cor Pantone). A imagem ao lado é constituída por preto e Pantone Warm Red.
Imagens a cores
A informação de cor pode ser descrita usando determinados espaços de cor: RGB, CMYK ou Lab, por exemplo.
Vetores
A imagem vetorial é diferente do procedimente da criação em pixels individuais, são criados objetos, como por exemplo retângulos e círculos. Mas nada de coordenadas matemáticas, destas formas, o programa vetorial pode criar arquivos com uma fração do espaço utilizado pelo bitmap (imagens rastreadas), e mais importante, possuem a capacidade de serem ampliados indefinidamente sem perderem definição e detalhamento.
Diferentemente da imagem bitmap, o círculo vetorial aparece suave tanto em 100% como em 800%
Imagens Vetoriais
100%
800%
Cores
A cor não é um fenômeno físico. É um estímulo orgânico que interpreta o reflexo da luz vinda de um objeto que foi emitida por uma fonte luminosa, correspondente ao espectro visível;
Espectro visível é o comprimento das ondas eletromagnéticas, que vibram à um nível visível, entre 380 e 750 nanômetros;
Ondas mais curtas (ultravioleta, os raios-X e os raios gamas) e mais longas (infravermelho, o calor, as microondas e as ondas de rádio e televisão) emitem um nível de radiação que não podem ser percebidas pelo olho humano.
Síntese Aditiva – RGB - Cor Luz
Somam-se radiações de comprimentos de onda diversos, projetando-as simultaneamente sobre uma tela branca. Resultam assim em outras cores, por adição. Somatório das Cores Primárias: Vermelho (R) + Verde (G) + Azul (B) = Branco
Aspectos orgânicos (Tricromacia)
Um mesmo comprimento de onda pode ser percebido diferentemente por diferentes pessoas, ou seja, cor é um fenômeno subjetivo e individual;
A retina é composta por células captam informação visual que o cérebro interpreta. Nosso olho é composto por:
Cones: São responsáveis pela captação da informação luminosa vinda da luz do dia, das cores e do contraste.
Bastonetes: adaptados à luz noturna e à penumbra. 
Os cones se dividem em três tipos e respondem a comprimentos de ondas diferentes: azuis (B) e violetas, aos verdes (G) e amarelos, e aos vermelhos (R) e laranjas.
Por da adaptação evolutiva, são distribuídos de forma desequilibrada sobre a retina: 94% para R e G; apenas 6% para B.
Formação de Cores
Por que 255?
Em uma verdadeira cor RGB, cada canal de cor tem 8 bits de informação.
Oito bits podem descrever 256 níveis de luminosidade, portanto, as cores são medidas em uma escala de 0 a 255.
Síntese Subtrativa – Cor Pigmento
Os pigmentos agem como FILTROS ou selecionadores da luz incidente.
As cores básicas da cor pigmento são: amarelo, cyan e magenta.
A subtração das três cores resultam numa cor muito próxima ao preto.
Elementos de um sistema de processamento de imagens
O Processamento de Imagens envolve um conjunto de tarefas interconectadas.
O primeiro passo no processo é a aquisição da imagem, com a formação e a digitalização da imagem. 
Após a obtenção da imagem digital, o próximo passo consiste no pré-processamento da imagem da etapa anterior. O pré-processamento serve para melhorar a imagem, para que as próximas etapas sejam bem-sucedidas. 
Após o pré-processamento, vem a segmentação. O papel básico da segmentação é separar a imagem em partes ou objetos de interesse. Muitas vezes o resultado da segmentação não é adequado. 
Para corrigir esses defeitos, realiza-se o estágio de pós-processamento. A imagem de saída do pós-processamento está pronta para fornecer dados numéricos através da etapa de extração de atributos, que é a parte quantitativa da sequência. Nesta etapa, algumas características dos objetos nas imagens são extraídas, resultando em algum tipo de discriminação entre as classes de objetos.
 
Como se dividi o processamento de imagens?
Aquisição de imagens
O bloco de aquisição da imagem tem como objetivo a obtenção de uma imagem digital. Para que o leitor tenha conhecimento suficiente para o entendimento das demais etapas do processamento de imagens digitais.
O sensor poder ser uma câmera de TV monocromática ou colorida, ou também, uma câmera de varredura por linha que produza uma única linha de imagem por vez. 
Se a saída da câmera ou outro sensor de imageamento não se encontrar na forma digital, um conversor analógico-digital pode realizar a digitalização.
Pré- Processamento
O passo seguinte consiste no pré-processamento, isto é, deve-se melhorar a imagem de forma a aumentar as chances de sucesso dos processos seguintes.
O pré-processamento, tipicamente, envolve técnicas para o realce de contrastes, remoção de ruídos e isolamento de regiões cuja textura indique a probabilidade de informação alfanumérica.
Pré-processamento refere-se ao processamento inicial de dados brutos para calibração da imagem, correção de distorções geométricas e remoção de ruído.
Realce visa melhorar a qualidade da imagem, permitindo uma melhor discriminação dos objetos presentes na imagem.
Na classificação são atribuídas classes aos objetos presentes na imagem.
Realce de contrate
A técnica de realce de contraste tem por objetivo melhorar a qualidade das imagens sob os critérios subjetivos do olho humano. É normalmente utilizada como uma etapa de pré-processamento para sistemas de reconhecimento de padrões.
O contraste entre dois objetos pode ser definido como a razão entre os seus níveis de cinza médios.
A manipulação do contraste consiste numa transferência radiométrica em cada "pixel", com o objetivo de aumentar a discriminação visual entre os objetos presentes na imagem. Realiza-se a operação ponto a ponto, independentemente da vizinhança.
A escolha do mapeamento direto adequado é, em geral, essencialmente empírica. Entretanto, um exame prévio do histograma da imagem pode ser útil. 
Pode-se fazer um realce de contraste utilizando-se uma função matemática denominada transformação radiométrica. Esta função consiste em mapear as variações dentro do intervalo original de tons de cinza, para um outro intervalo desejado e é utilizado para aumentar o contraste de uma imagem, expandindo o intervalo original de níveis de cinza da imagem original.
Histograma
O histograma de uma imagem descreve a distribuição estatística dos níveis de cinza em termos do número de amostras ("pixels") com cada nível. A distribuição pode também ser dada em termos da percentagem do número total de "pixels" na imagem. Pode ser estabelecida uma analogia entre o histograma de uma imagem e a função densidade de probabilidade, que é um modelo matemático da distribuição de tons de cinza de uma classe de imagens.
A cada histograma está associado o contraste da imagem.
O histograma de uma imagem indica o número de pixels que a imagem tem em determinado nível de cinza ou cor.
A proporção de pixels é dado pela altura do histograma
O centro do histograma se refere aos tons médios de cinza ou cor.
Remoção de ruídos 
Ruídos: ruídos são informações indesejáveis em uma imagem, que podem ser causados pela variação de brilho ou por falsas informações dentro das imagens. Conforme apresentado em [Seara 1998], toda aquisição de imagens é propícia a algum tipo de ruído. Sabe-se que ruídos sempre aconteceram no ambiente digital. Ruídos são algo inevitável e não há uma forma de prevê-lós. 
Nas imagens existem dois tipos de ruídos específicos: 
Gaussian Noise (Ruído Gaussiano): é um ruído que apresenta uma distribuição de Gaus. Ruído Gaussiano é um ruído estatístico que tem uma função de densidade e de probabilidade, formado pela má iluminação, por altas temperaturas ou problemas na transmissão da imagem, deixando-a até mesmo extremamente danificada [Klein e Gal-lager 2001]. 
Salt and Pepper Noise (Ruído de Sal e Pimenta): ocorre a partir de erros na transmissão de dados. Com a transmissão da imagem, algum pixel pode se corromper, alterando os tons de cinza de cada pixel vizinho, conforme [Ribeiro 2006].
Filtros de suavização
Os filtros de suavização podem ser classificadosem dois grupos Lineares e Não Lineares.
Filtros Lineares: filtros lineares são aplicados a uma operação linear e são passíveis de análise no domínio de Fourier ou a um domínio de frequência. Eles são utilizados em diversas áreas, não somente no processamento de imagem digital. Sua finalidade é eliminar frequências ou ruídos indesejáveis. 
Os filtros de suavização Lineares podem ser classificados como filtros de passa-baixa, passa-alta, passa-banda. Um filtro de suavização tem a finalidade de criar um efeito desfocado na imagem. Com esse processo se consegue reduzir a diferença entre certo pixel e seus vizinhos. Usados em uma etapa de pré-processamento os filtros de suavização, segundo [Gonzales e Woods 2002], são utilizados tanto para a retirada de pequenos detalhes de uma imagem antes da extração de objetos maiores, como para fazer a conexão de pequenas descontinuidades, em linhas ou curvas. Após o uso de um filtro de suavização o resultado obtido no pixel que foi processado é a média entre ele e seus vizinhos, reduzindo assim os ruídos, porém, com o risco de afetar a imagem de forma que se altere muito a imagem real. 
2) Filtros Não-Lineares: diferentemente dos filtros lineares eles não possuem um operação linear e também não são passíveis da analise do domínio de Fourier domínio de frequência. Esses tipos de filtros realçam ou minimizam ruídos por meio de variância. Essa média irá variar de acordo com calda filtro e a forma como são implementados.
Tipos de filtro
Filtro de Kuwahara: é um filtro não linear e de suavização capaz de agir sobre as imagens, sem comprometer sua nitidez e as posições das bordas. Graças a isso, é conhecido por ser um tradicional filtro de preservação de bordas de desfoque. Trabalha dividindo uma janela em quatro sub-janelas que se sobrepõem. Em cada sub-janela são calculadas uma média e um variância. O valor de saída é definido como a média da sub-janela com a menor variação e esse valor será atribuído ao pixel central de cada região analisada pelo algoritmo. 
Filtro de Mediana: de acordo com [Jain et.al 1995], é o mais eficiente para eliminar ruídos do tipo Sal e Pimenta e ruídos impulsivos, retendo os detalhes da imagem porque eles não dependem dos valores que são significativamente diferentes dos valores típicos em uma vizinhança. O cálculo do filtro de Mediana é feito selecionando um determinado pixel, que será o pixel do cálculo no momento. 
Filtro de Média: é um filtro simples, intuitivo e fácil de ser desenvolvido, porém, eficiente para o propósito de filtrar imagens, pois ele reduz a quantidade de variação de intensidade entre um pixel e seus vizinhos, eliminando ruídos. A ideia é simplesmente substituir cada valor de pixel em uma imagem com o valor médio de seus vizinhos, incluindo ele mesmo, o que produz o efeito de eliminar os valores de pixels que são representativos de seus arredores. O filtro de Média é um filtro Não-Linear, sendo assim e´ baseado em torno de uma janela, que apresenta a quantidade de pixel para ser calculada a media.
Filtro Gaussiano: apresenta diferentes particularidades que o tornam útil em diferentes áreas de processamento de imagens. O filtro Gaussiano geralmente é usado como um filtro de passa-baixa por deixar passar as baixas frequências, mas elimina os valores relacionados às altas frequências apresentadas em [Pedrini 2004]. O filtro Gaussiano tem esse nome por usar a função Gaussiana para obter os valores da máscara.
Obrigada
Sabrina Brandão Santiago
 
.MsftOfcThm_Accent1_Fill {
 fill:#96A1C6; 
}
.MsftOfcThm_Accent1_Stroke {
 stroke:#96A1C6; 
}
 
 
.MsftOfcThm_Accent1_Fill {
 fill:#96A1C6; 
}
.MsftOfcThm_Accent1_Stroke {
 stroke:#96A1C6; 
}

Outros materiais