Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESSAS PROVAS SAO DO JAIME OU DO TIO CAPA? São do Cappa, da última vez que ele deu PI Prova 1 Vespertino 1. Quais são os principais componentes de um sistema de processamento de imagens digitais? Qual é a função de cada um deles? Justifique. Dispositivo de captura: sistema de lentes de câmera, microscópio. Hardware digitalizador: chips de conversão de analógico para digital. Computador: Possui recursos para realizar as operações de processamento de imagens. Software: Sequência de instruções para o computador executar. Unidades de memória: HD, RAM. Periféricos: Monitor, impressora. 2. Os sensores de linha para aquisição de imagens são amplamente utilizados em scanners de mesa e em máquinas fotocopiadoras. Explique quais seriam os eventuais desafios e vantagens de se utilizar este tipo de sensor na aquisição de imagens espaciais por meio de telescópios. E no caso de imagens de microscopia eletrônica? Justifique. Vantagens poderiam ser, por exemplo, o custo e facilidade de uso Desvantagens: precisão do dispositivo e talvez seja necessário o deslocamento do satelite. Tem que elaborar melhor esta resposta 3. Quando o histograma de uma imagem é bem comportado, isto é, possui variações suaves entre intensidades adjacentes, o procedimento de detecção de picos e vales é uma tarefa relativamente simples. Entretanto, é muito comum que histogramas de imagens de sensoreamento remoto sejam quase suaves, ou seja, esporadicamente a frequência de alguma intensidade seja discrepante em relação à maioria das intensidades vizinhas. Explique que procedimento você adotaria para que os picos e vales sejam detectados com precisão, ignorando eventuais frequências discrepantes. Justifique. A aplicação de uma operação potência suaviza a vizinhança de modo a diminuir as discrepâncias existentes no histograma da imagem. A operação potencia não iria deixar ainda mais acentuado as frequencias discrepantes? Esta operação não suaviza... 4. Considere o diagrama de cromaticidade, onde o eixo x determina a cor vermelha (R Є [0,1]), o eixo y determina a cor verde (G Є [0,1]) e a cor azul (B = 1 – R – G). Deduza a expressão para calcular as porcentagens relativas das cores C1 (R=0.4, G=0.1) e C2 (R=0.2, G=0.6) necessárias para compor uma determinada cor que sabemos estar posicionada no segmento de reta que une C1 ey C2. C1: x = 0.4, y = 0.1 C2: x = 0.2, y = 0.6 m = (y2 y1) / (x2 x1) = (0.6 0.1) / (0.2 0.4) = 0.5 / (0.2) = 2.5 y y0 = m (x x0) y 0.1 = 2.5 (x 0.4) y 0.1 = 2.5x + 1 y = 2.5x + 1.1 => G = 2.5R + 1.1 5. Suponha que um projeto de pesquisa de reconhecimento de espécies marinhas tenha te contratado para analisar imagens fotográficas do fundo do oceano. Em um primeiro momento, é desejável que os animais nas imagens sejam separados dos vegetais, minerais e da água, gerando uma imagem binária, onde os animais estão em regiões de intensidade 1. Que procedimento você adotaria para fazer esta separação? Explique e justifique o que foi assumido no seu procedimento. Aplicaria um descritor de textura, onde através das propriedades de regularidade, suavidade e rugosidade seria possível distinguir o que é animal das outras regiões, assumindo que um objeto é animal quando este assumir um valor maior na propriedade rugosidade. 6. Dando continuidade à questão anterior, suponha agora que, dados os animais segmentados nas imagens binárias, qual procedimento morfológico poderia ser utilizado para diferenciar peixes, estrelas do mar e ouriços do mar? Justifique. Deste caso, aplicaria um outro descritor (de borda) utilizando da esqueletonização para distinguir cada objeto. Prova 1 Noturno 1. Parecida com a questão 1 da Prova 1 do vespertino. 2. Uma imagem de ressonância magnética é composta tipicamente de pixels cujas intensidades variam entre 0 e 4095. Sabendo disto e levandose em conta o alcance da visão humana, com respeito à quantidade de níveis de cinza percebidos em um mesmo instante, você aconselharia a inspeção humana como uma ferramenta confiável no desenvolvimento de ferramentas para a segmentação destas imagens em regiões de textura semelhante? Explique. Sim. Textura (rugosidade, regularidade, suavidade). 3. Dados os histogramas I e J referentes a duas imagens representados da forma (intensidade:frequência; intensidade:frequência; …), calcule a tabela de mapeamento do histograma de I para J. Justifique. I: (0:10; 1:20; 2:21; 3:12; 4:2; 5:5; 6:17; 7:21; 8:4; 9:12; 10:13; 11:12; 12:1; 13:0; 14:0; 15:0) J: (0:1; 1:0; 2:2; 3:5; 4:12; 5:15; 6:4; 7:19; 8:14; 9:16; 10:11; 11:22; 12:31; 13:11; 14:14; 15:7) *Questão mal formulada I: N = 10+20+21+12+2+5+17+21+4+12+13+12+1+0+0+0 = 150 p0 = 10 / 150 = 0,06 p1 = 20 / 150 = 0,13 p2 = 21 / 150 = 0,14 p3 = 12 / 150 = 0,08 p4 = 2 / 150 = 0,02 p5 = 5 / 150 = 0,03 p6 = 17 / 150 = 0,11 p7 = 21 / 150 = 0,14 p8 = 4 / 150 = 0,02 p9 = 12 / 150 = 0,08 p10 = 13 / 150 = 0,09 p11 = 12 / 150 = 0,08 p12 = 1 / 150 = 0,01 p13 = p14 = p15 = 0 / 150 = 0 G(z0) = (L1) sum(i=00) p(i) = 15 * 0,06 = 0,9 G(z1) = (L1) sum(i=01) p(i) = 15 * [0,06 + 0,13] = 2,85 G(z2) = (L1) sum(i=02) p(i) = 15 * [0,06 + 0,13 + 0,14] = 4,95 G(z3) = (L1) sum(i=03) p(i) = 15 * [0,06 + 0,13 + 0,14 + 0,08] = 6,15 G(z4) = (L1) sum(i=04) p(i) = 15 * [0,06 + 0,13 + 0,14 + 0,08 + 0,02] = 6,45 G(z5) = (L1) sum(i=05) p(i) = 15 * [0,06 + 0,13 + 0,14 + 0,08 + 0,02 + 0,03] = 6,9 G(z6) = (L1) sum(i=06) p(i) = 15 * [0,06 + 0,13 + 0,14 + 0,08 + 0,02 + 0,03 + 0,11] = 8,55 G(z7) = (L1) sum(i=07) p(i) = 15 * [0,06 + 0,13 + 0,14 + 0,08 + 0,02 + 0,03 + 0,11 + 0,14] = 10,65 G(z8) = (L1) sum(i=08) p(i) = 15 * [0,06 + 0,13 + 0,14 + 0,08 + 0,02 + 0,03 + 0,11 + 0,14 + 0,02] = 10,95 G(z9) = (L1) sum(i=09) p(i) = 15 * [0,06 + 0,13 + 0,14 + 0,08 + 0,02 + 0,03 + 0,11 + 0,14 + 0,02 + 0,08] = 12,15 G(z10) = (L1) sum(i=010) p(i) = 15 * [0,06 + 0,13 + 0,14 + 0,08 + 0,02 + 0,03 + 0,11 + 0,14 + 0,02 + 0,08 + 0,09] = 13,5 G(z11) = (L1) sum(i=011) p(i) = 15 * [0,06 + 0,13 + 0,14 + 0,08 + 0,02 + 0,03 + 0,11 + 0,14 + 0,02 + 0,08 + 0,09 + 0,08] = 14,7 G(z12) = (L1) sum(i=012) p(i) = 15 * [0,06 + 0,13 + 0,14 + 0,08 + 0,02 + 0,03 + 0,11 + 0,14 + 0,02 + 0,08 + 0,09 + 0,08 + 0,01] = 14,85 = G(z13) = G(z14) = G(z15) zq G(zq) 0 1 1 3 2 5 3 6 4 6 5 7 6 9 7 11 8 11 9 12 10 14 11 15 12 15 13 15 14 15 15 15 (Acho) Calcular p/ J e depois comparar os resultados das imagens I e J 4. Em uma aplicação de uma linha de montagem automatizada, três tipos de peças são identificadas automaticamente pelas suas cores. No entanto, só uma câmera de TVmonocromática foi disponibilizada para adquirir as imagens digitais. Proponha uma técnica, utilizando essa câmera, para detectar as três cores diferentes. Justifique. "Use color filters sharply tuned to the wavelengths of the colors of the three objects. Thus, with a specific filter in place, only the objects whose color corresponds to that wavelength will produce a predominant response on the monochrome camera. A motorized filter wheel can be used to control filter position from a computer. If one of the colors is white, then the response of the three filters will be approximately equal and high. If one of the colors is black, the response of the three filters will be approximately equal and low.” 5. O operador morfológico hitormiss pode ser utilizado para procurar um determinado objeto em uma imagem binária. Quais são as limitações desta metodologia? Escreva algumas idéias para que o método seja aperfeiçoado, com respeito a estas limitações. Justifique sua resposta. Não aceita variação na rotação e escala. Acerta somente se a máscara bater 100%. Solução: score ou nota de mapeamento ou usar posições na máscara com don't care, ou usar várias máscaras. 6. Um museu contratou os seus serviços para identificar falsificações em obras de arte. Sabese que cada pintor possui um tipo bem específico de traçados. Assim, o modo como o pincel foi utilizado em uma obra de arte pode ser utilizado para identificar o seu autor. Dada uma coleção de fotos de quadros comprovadamente de autoria de Francisco José de Goya y Lucientes, um famoso pintor espanhol do século XVIII, e algumas fotos tiradas de outras pinturas, descreva um procedimento para que um algoritmo retorne a probabilidade de um quadro ser da autoria de Goya. Explique as suposições e os procedimentos adotados. Descritor de textura: Solução ex. 1) Extrair descritores de textura dos elementos ou regiões que aparecem com frequência nas obras de arte. 2) Extrair descritores das imagens de teste. 3) Calcular uma distância entre os descritores dos quadros verdadeiros e os de teste. 4) Definir um limiar de corde para as distâncias para classificar. Prova 2 Vespertino 1. Explique o que é o efeito anel e com o ele pode ser evitado em uma transformada discreta de Fourier? Ele é causado através da aplicação de um filtro ideal ou Butterworth, onde seu sinal de entrada é caracterizado como uma “onde quadrada” que, após sua aplicação, resulta em frequências negativas de forma que estas são ignoradas no resultado da filtragem. Esse efeito pode ser evitado aplicando outro filtro de suavização, como o Gaussiano ou também diminuindo a frequência utilizada no filtro ideal, de forma a perder menos informações, ou seja, que as ondas resultantes oscilem menos. 2. Calcule a transformada inversa de Fourier de uma imagem de 4x4 pixels, cujas dimensões vertical e horizontal de 0.05mm^1 e 0.125mm^1, respectivamente. Dados os dígitos do seu RA d1d2d3d4d5, os pixels da imagem possuem as intensiades dadas abaixo. Veja também o exemplo. Calcule também os intervalos de amostragem da imagem no domínio espacial. Obs. As exponenciais não precisam ser calculadas. Deixe os cálculos indicados. A imagem original deve possuir dimensões 2x2. D3+1 D3+5 13D3 11D3 Exemplo: RA = 55432. Imagem: 5 9 9 7 D4+2 D4+3 11D4 13D4 5 6 8 10 D5+2 D5+3 11D5 13D5 4 5 9 11 D3/2 D4/3 10/(D5+1) 11/(D4+2) 2 1 3 2 /\x = 1 / (4 * /\u) = 1 / (4 * 0.125) = 1/ (0.5) = 2 mm /\y = 1 / (4 * /\u) = 1 / (4 * 0.05) = 1/ (0.02) = 50 mm 3. Dada uma imagem com alguns ruídos aleatórios de distribuição aproximada de Erlang (ou gamma) e com ruídos de saturação pontuais, qual sequência de filtragens você indicaria como a mais apropriada para restaurála? Justifique. Nesse caso, poderia aplicar primeiramente um filtro média contraharmônica (que é bom para pimenta). Em seguida, aplicar um filtro adaptativo de mediana afim de remover os picos restantes. 4. Dado o filtro g0(n) = {0.2, 0.7, 0.6, 0.1}, para n = {0, 1, 2, 3}, calcule um nível da codificação em subbanda a partir da imagem de 4 linhas e 4 colunas, gerada por uma progressão aritmética cujo primeiro elemento é dado por d3d4, ou seja, o terceito e quarto dígitos do seu RA. A razão da PA é dada por: d5+2 se d5 < 5. d53 se d5 >= 5. onde d5 é o quinto dígito do seu RA. Exemplo: RA = 55432. Imagem: 43 47 51 55 59 63 67 71 75 79 83 87 91 95 99 103 Encontrar os vetores g1, h0 e h1; Calcular para as linhas, criando duas matrizes (uma a partir de h0 e a outra a partir de h1). A partir dessas duas matrizes, criar outras duas matrizes (totalizando 4), calculando para as colunas, usando novamente os filtros h0 e h1. 5. Cite duas aplicações da transformada Wavelets. Justifique sua resposta. Compressão de uma imagem: armazenando somente os resíduos de cada nível e deixandoa em uma resolução menor facilita no processo pelo fato de que haverá muito mais 0’s do que outros valores. Obtenção de objetos de diferentes tamanhos: Aumentando a resolução de uma imagem através da transformada Wavelets auxilia na identificação de pequenos objetos em uma imagem. Diminuindoa facilita no processo de eliminação de pequenos objetos, e consequentemente, facilita na identificação de grandes objetos. 6. Para que serve o algoritmo de Huffman? Dê um exemplo de uma imagem em que ele é eficiente e outro em que ele não é eficiente. Justifique matematicamente. O algoritmo de Huffman serve para a realização de compressão de imagem. Ele remove redundâncias de codificação, alterando a quantidade de bits que representam determinadas intensidade numa imagem. Imagem 1: 255 127 255 127 127 255 127 255 255 127 255 127 127 255 127 255 Funciona, pois só há duas intensidade representadas de modo que cada uma possa ser representada por um único bit. Imagem 2: 11 155 126 23 99 100 123 77 54 32 22 1 7 55 112 127 Não funciona direito pois a quantidade de bits que alguns serão representados será similar aos 8 existentes. Prova 2 Noturno 1. Caso desejemos transladar uma imagem no domínio da frequência, que operação poderia ser realizada no domínio espacial que geraria o mesmo resultado? Uma translação no dominio espacial alteraria a magnitude do espéctro da frequência? Justifique. Devese multiplicar a funçãono domínio espacial pelo fator imaginário do domínio da frequência. Não afetaria pelo fato da função transformada ser periódica. Essa caracteristica permite que a magnitude do espectro da frequência não seja alterado. 2. Calcule a transformada rápida de Fourier de uma imagem de 2x2 pixels, cujas dimensões vertical e horizontal de 5mm e 2mm, respectivamente. Dados os dígitos do seu RA d1d2d3d4d5, os pixels da imagem possuem as intensidades dadas abaixo. Veja também o exemplo. Calcule também os intervalos de amostragem da imagem transformada. Obs. As exponenciais não precisam ser calculadas. Deixe os cálculos indicados. D5+2 D4+3 Exemplo: RA = 55432. Imagem: 4 6 11D4 13D3 8 9 3. Você recebeu uma imagem de aquisição desconhecida que contém um alto nível de ruídos. Como você faria para modelar a densidade de probabilidade dos ruídos? Como determinaria a distribuição mais apropriada? Obteria amostras de diferentes regiões, encontraria a média e a variância de cada uma e, a partir desses valores, seria possível modelar qual tipo de ruído já modelado a imagem reproduz. 4. Calcule um nível da transformada wavelet de Haar 2x2 a partir da imagem de 4 linhas e 4 colunas, gerada por uma progressão aritmética cujo primeiro elemento é dado por d3d4, ou seja, o terceiro e quarto dígitos do seu RA. A razão da PA é dada por: d5+2 se d5 < 4. d53 se d5 >= 4. onde d5 é o quinto dígito do seu RA. Exemplo: RA = 55432. Imagem: 43 47 51 55 59 63 67 71 75 79 83 87 91 95 99 103 Os coeficientes da matriz de Haar 2x2 são: hφ(n) = ½^0.5 se n=0,1; hφ(n) =0 caso contrário. hψ(n) = ½^0.5 se n=0; hψ(n) = 1/2^0.5 se n=1; hψ(n) = 0 c.c. Encontrar h0’s e h1’s para preenchimento da matriz de Haar H 2x2. Calcular T = HFHtransposta. (? F é 4x4) 5. Seja uma imagem piramidal de resíduos de 5 níveis, em qual (ou quais) dos níveis você realizaria um processamento para que os detalhes pequenos da imagem fossem eliminados? Qual processamento seria apropriado para este objetivo? Nos níveis mais abaixo da pirâmide. Inicialmente, aplicar um filtro média faria com que esses objetos assumissem menor destaque na imagem, os borrando. 6. Caso uma imagem contenha sistematicamente repetições de intensidades nas linhas verticais, qual algoritmo de compressão seria o mais eficaz na eliminação destas redundâncias? Justifique e apresente um pequeno exemplo utilizando o algoritmo indicado e um pequeno contraexemplo utilizando outro algoritmo. O algoritmo RunLength é o mais indicado para essa situação, onde esse armazena o valor do pixel juntamente com o número de repetições em sequência deste. A varredura pode ser vertical, horizontal ou em todas as frentes. Exemplo: 10 10 10 10 20 20 20 20 30 30 30 30 40 40 40 40 => 4 10 4 20 4 30 4 40 Um contraexemplo seria o algoritmo de codificação LZW, onde ele armazena uma sequência de posições de um dicionário. Esse dicionário contém informações sobre as sequências existentes nos pixels da imagem. 10 10 10 10 20 20 20 20 30 30 30 30 40 40 40 40 Passo 1: Processa 10 Passo 2: Processa: 10 Buffer:10 Saida 10 Dicionário: 256: 1010 Passo 3: Processa: 10 Buffer: 10 10 Saida 10 Dicionário: 256: 1010 Passo 4: Processa: 10 Buffer: 10 10 10 Saida: 10 256 Dicionário: 256: 1010 257: 101010 Passo 5: Processa: 20 Buffer: 10 20 Saida: 10 256 10 Dicionário: 256: 1010 257: 101010 . . . Prova Substitutiva 1. Sob quais circunstâncias as operações morfológicas de dilatação e erosão são reversíveis? Justifique e dê um exemplo. Quando o objeto possui uma simetria (como um quadrado ou um círculo) e o elemento estruturante possui forma de modo que, quando aplicado a determinado, este não tenha sua forma afetada, ou seja, suas dimensões continuam simétricas. 2. Descreva os tipos de interpolação vistos durante o curso. Diga quais são as principais vantagens e desvantagens de cada um deles. Vizinho mais próximo: ● Vantagem: custo computacional baixo. ● Desvantagem: resultado final as vezes não satisfatório (bordas com efeito “escada”, por exemplo). Bilinear: ● Vantagem: resultado melhor que o do vizinho mais próximo. ● Desvantagem: custo computacional relativamente alto. Bicúbica: ● Vantagem: resultado final excelente, superando os dois tipos acima. ● Desvantagem: custo computacional muito alto (necessidade da resolução de um sistema linear com 16 variáveis, excesso no número de cálculos, podendo causar em um resultado inesperado); 3. Processamento de imagens médicas requerem um cuidado maior do que o de costume. Um processamento da imagem mal conduzido pode gerar artefatos ou esconder detalhes importantes. Isto, por sua vez, pode implicar em diagnósticos de patologias inexistentes ou camuflar um sério problema de saúde. Suponha que um paciente com câncer no fígado constatado tire uma imagem de tomografia computadorizada da região de interesse. A imagem de tomografia possui alto nível de ruídos e baixo contraste, o que impede o cirurgião de estimar corretamente o volume necessário a ser removido do fígado. É sabido que o tecido cancerígena apresenta intensidade mais clara que o restante do fígado. Quais operações de processamento de imagens você realizaria para que o tecido cancerígena não seja em hipótese alguma subestimado ao tratar os problemas da imagem de tomografia? Justifique sua resposta. Para remover os ruidos podemos utilizar um filtro de média ou mediana. Depois aplicar o algoritmo para limiarização por contornos. 4. Dada uma imagem de um telescópio que foi colorida artificialmente e que contém intensidades de luz nos espéctros infravermelho, ultravioleta e raiosgama em canais separados. Qual dos modelos de representação de cores você utilizaria para segmentar os astros de maior magnitude nos três canais ao mesmo tempo? E no caso de cada canal ser tratada separadamente? Justifique. O modelo HSI é o mais apropriado para representar os astros de maior magnitude dos três canais ao mesmo tempo, através da propriedade I. Em canais separados, o RGB seria mais indicado. 5. O algoritmo de watershed é um dos mais conhecidos para a segmentação de imagens em regiões. O comportamento padrão deste método é de gerar uma região para cada mínimo regional da imagem. Sobre o algoritmo de watershed, responda: Quais são os préprocessamentos importantes a serem realizados para que as regiões segmentadassigam as bordas e arestas da imagem de entrada? O que você faria caso quisesse diminuir a quantidade de regiões segmentadas? Justifique. Suavizar a imagem para remoção de ruídos, em seguida aplicar um filtro passa alta (como o Laplaciano) para detecção de arestas a fim de resultar no gradiente que será utilizado no algoritmo. Para diminuir a quantidade de regiões segmentadas, adicionar marcadores no gradiente ou suavizar este pode diminuir significativamente a quantidade de regiões segmentadas pois o crescimento das regiões só seria aplicado em locais onde há a existência de um marcador. 6. Descreva quais são os procedimentos adotados para que a Transformada de Fourier seja processada de maneira rápida, na chamada Transformada Rápida de Fourier? Justifique. Devese separar o cálculo de cada valor da matriz, de forma a realizar os calculos primeiramente para as linhas/colunas e em seguida calcular para as colunas/linhas. Feito a separabilidade, o cálculo é distinguido para os indices pares dos ímpares, fazendo assim com que seja evitado o cálculo de valores repetidos. 7. Um detetive deseja criar um equipamento munido de um pequeno processador e uma câmera para diferenciar notas falsas das verdadeiras das novas notas de R$50 e R$100. Em uma escala pequena é natural que haja diferenças até mesmo entre notas verdadeiras. Por outro lado, o equipamento não precisa detectar diferenças grotescas, facilmente detectadas ao olho nu. O detetive deseja apenas que o seu equipamento detecte as diferenças entre notas falsas e verdadeiras numa escala intermediária. Indique qual seria um bom processamento a ser realizado pelo equipamento. Justifique, incluindo as hipóteses consideradas. Através de uma transformada wavelets permite que uma imagem seja processada em múltiplas resoluções, com a criação de uma pirâmide residual. Nesse caso, diminuir a resolução da imagem numa escala a não perder tantas informações seria o recomendável nessa situação.
Compartilhar